迅雷在HTML 5的SEO方面探索
但是,Googlebot,Bidubot等其他搜索引擎呢?可以抓取HTML5嗎?引擎是否會由于HTML5這任何額外因素,在搜索結(jié)果中優(yōu)先推薦您的網(wǎng)站嗎?另一方面,少數(shù)搜索引擎會認為所有這些額外的H1標記的是垃圾網(wǎng)站嗎?
這牽涉到搜索引擎是否正確讀取內(nèi)容,做出對關(guān)鍵字有利排名,搜索引擎是如何理解這些新代碼的,它能否分析語義標記而進行相應(yīng)的排名。
或許時機還不成熟,google還未準備好,百度更不用說了,因為HTML5的標記是尚未盡可能廣泛使用(正確使用),現(xiàn)在它只是我們更好理解網(wǎng)站內(nèi)容的手段,至少現(xiàn)在,不會因為您用上了HTML5取代舊代碼而有所改變。
不是真的,這只是一個開始!HTML5在普及,我們更接近W3C的一個完整的規(guī)范,搜索引擎會采取更多的關(guān)注。搜索引擎優(yōu)化,我也認為訪問一個擁有正確編碼,語義的網(wǎng)站總是比一個較不良的網(wǎng)站有優(yōu)勢。至少比使用算法和垃圾技術(shù)的改善搜索引擎優(yōu)化來得容易吧。
最終用戶優(yōu)先(Priority of Constituencies)
“In case of conflict, consider users over authors over implementors over specifiers over theoretical purity.” 一旦遇到?jīng)_突,最終用戶優(yōu)先,其次是作者,其次是實現(xiàn)者,其次標準制定者,***才是理論上的完滿。
當HTML5提供了一些令用戶興奮的東西,其次產(chǎn)品得到更好的展現(xiàn),其次我們可以放心地使用它們,其次元素被更謹慎的方式定義,嘿,***搜索引擎也不再淡定。
HTML5雖然有了語義化結(jié)構(gòu)化的標簽,如果并不是很清楚這些標簽的明確含義和使用方法, 這會使標簽亂用更加嚴重到大的文檔結(jié)構(gòu)的混亂。也許會導(dǎo)致機器不能更好的理解文檔含義。
這對我們重構(gòu)提出了更高的要求,在接到產(chǎn)品的需求時要理解其內(nèi)容間的聯(lián)系,比如內(nèi)容脫離了整體是不是還能作為一個完整的、獨立的存在,這部分在頁面是擔任什么角色等。
嗯……迅雷看看主頁,它的頂部有頁眉(header),底部有頁腳(footer),數(shù)個展示區(qū)域(section、article)、導(dǎo)航區(qū)(nav)和邊欄(aside)。
HTML4圖1

HTML5圖2

可以看出HTML5代碼的可讀性更高了,也更簡潔了。
結(jié)構(gòu)
header:頁面上顯示的頁眉,包含了logo,導(dǎo)航,登錄信息。
nav:包含了一組指向其他頁面的鏈接,這里是一組指向其他頻道頁面的鏈接。
footer:頁腳,包含了copyright和nav。
section:一般帶有標題的專題性內(nèi)容,但只屬于組成整體的一部分。根據(jù)主題的不同劃分為電影、電視劇、動漫、綜藝、娛樂、視頻快報。
article:內(nèi)容可以脫離上下文的其他部分,作為完整的獨立存在的。
語義性的塊元素
aside:標簽定義 article 以外的內(nèi)容,這里的兩側(cè)分類導(dǎo)航和視頻排行列表的內(nèi)容均與 article 的內(nèi)容相關(guān)
figure:標簽用于對元素進行組合。請使用figcaption 元素為元素組添加標題。
例如logo的swf:


用上figure元素,瀏覽器(尤其是屏幕閱讀器)可以明確地將圖和說明聯(lián)系在一起,有利于搜索引擎理解內(nèi)容。
HTML5新增加了不少內(nèi)聯(lián)元素,不過主流瀏覽器均支持的情況比較少,下次再細談,這里先放一放。
結(jié)語:隨著youtube推薦用戶嘗鮮HTML5的視頻播放,國內(nèi)視頻網(wǎng)站自然也不能獨善其身。好吧,先從自己做起,迅雷看看擁抱HTML5的一小步,或許牽起國內(nèi)視頻網(wǎng)站的HTML5風暴。
原文:http://cued.xunlei.com/log011
【編輯推薦】