Google研發(fā)實時索引系統(tǒng) 網(wǎng)頁更新數(shù)秒即可搜到
目前Google公司正在開發(fā)一套網(wǎng)頁實時索引系統(tǒng),未來小型網(wǎng)站在更新網(wǎng)頁幾秒鐘之后,Google將會自動進(jìn)行索引并讓網(wǎng)民查詢到。美國搜索行業(yè)專家丹尼 蘇利文(Danny Sullivan)表示這將讓Google掀起新的“篇章”。
去年秋天,Google負(fù)責(zé)PubSubHubbub (PuSH)實時分發(fā)協(xié)議開發(fā)的工程師布雷特 斯拉特金(Brett Slatkin)曾表示,希望有朝一日Google能夠使用PuSH協(xié)議索引互聯(lián)網(wǎng)網(wǎng)頁,而不是目前已經(jīng)使用了多年的順藤摸瓜、抓取鏈接的方式。Google高級產(chǎn)品經(jīng)理迪蘭 凱西(Dylan Casey)日前在加州由蘇利文所在公司舉辦的“搜素營銷展會”上表示,Google很快將發(fā)布一個標(biāo)準(zhǔn),讓網(wǎng)站管理員能夠參加未來的實時索引計劃。
PuSH是一套基于ATOM格式的內(nèi)容分發(fā)系統(tǒng),網(wǎng)站出版商對外界公開一個Hub,一旦網(wǎng)站網(wǎng)頁有所更新,Hub將會即使發(fā)出通知。訂閱者將會對Hub反饋:“如果網(wǎng)站方發(fā)布新內(nèi)容,請直接發(fā)送給我們”。這樣,訂閱者無需像過去那樣隨時查看網(wǎng)站是否有更新,只需要坐等Hub的通知。整個過程只需要在幾秒鐘內(nèi)即可完成。
一旦Google采用PuSH模式索引網(wǎng)頁,該公司可能會要求所有的網(wǎng)站實施這項技術(shù),并向Google告知網(wǎng)站Hub信息,就好象Google之前從網(wǎng)站那里獲得的RSS源文件。這樣,Google將可以快速知曉哪些網(wǎng)站的內(nèi)容進(jìn)行了更新。
媒體分析認(rèn)為,PuSH模式不會完全取代傳統(tǒng)的抓取,實際上Google需要依靠抓取過程發(fā)現(xiàn)PuSH文件,而這種實時索引將極大增強(qiáng)Google的網(wǎng)頁數(shù)據(jù)庫。蘇利文也指出,Google在實施這項技術(shù)之前還需要進(jìn)行垃圾信息控制,不能讓所有新發(fā)布的內(nèi)容都被立刻索引到。
Google的斯拉特金表示,這種技術(shù)將給大量的小型網(wǎng)站帶來改觀?,F(xiàn)在,Google針對小網(wǎng)站一般每周索引一次。而在PuSH技術(shù)下,小網(wǎng)站的內(nèi)容將立刻被Google用戶搜索到。需要指出的是,PuSH帶來的益處將被Google之外的所有搜索引擎享受到,它屬于開放協(xié)議,網(wǎng)站的Hub除了Google之外,也能被雅虎或者必應(yīng)等搜索看到。
【編輯推薦】