自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

十大總結(jié) 教你如何避免蜘蛛陷阱

開發(fā) 前端
蜘蛛要找到網(wǎng)站,首先要讓蜘蛛發(fā)現(xiàn)網(wǎng)站的首頁(yè),所以需要外部鏈接到首頁(yè),然后蜘蛛會(huì)沿著首頁(yè)上的鏈接爬行到內(nèi)容頁(yè)面。所以,網(wǎng)站首頁(yè)應(yīng)該有非常不錯(cuò)的布局,更加關(guān)鍵的是,網(wǎng)站所有的頁(yè)面都應(yīng)該可以通過(guò)html鏈接和首頁(yè)聯(lián)系起來(lái),否則蜘蛛到達(dá)首頁(yè)后沒(méi)有途徑爬行到內(nèi)容頁(yè),就無(wú)法收錄內(nèi)容頁(yè)了。來(lái)看本文。

SEO的人們都知道,網(wǎng)站被搜索引擎收錄是關(guān)鍵,如果你的站點(diǎn)沒(méi)有被搜索引擎收錄,那么SEO就無(wú)從談起。所以要想網(wǎng)站能夠被搜索引擎發(fā)現(xiàn)且網(wǎng)頁(yè)能夠被搜索引擎正常收錄,那么首先就得使自己的站點(diǎn)便于蜘蛛的爬行。搜索引擎爬取網(wǎng)頁(yè)的工具被稱之為蜘蛛或爬蟲機(jī)器人,英文名即robot。

這些蜘蛛沿著超鏈接爬取我們的眾多頁(yè)面,但是有些頁(yè)面是爬不到的,有的是因?yàn)榫W(wǎng)站自身存在一些不利于蜘蛛爬行,導(dǎo)致其對(duì)應(yīng)的頁(yè)面很難被搜索引擎收錄,這樣就形成了“蜘蛛陷阱”,一般指的是對(duì)搜索引擎不友好的網(wǎng)站制作技術(shù),這些技術(shù)不利于蜘蛛爬取我們的頁(yè)面,為了避免這種情況,小無(wú)名總結(jié)了如下因素,防止蜘蛛進(jìn)入陷阱。

1:采用session id的頁(yè)面

有的銷售類站點(diǎn)為了分析用戶的某些信息會(huì)采用會(huì)話ID來(lái)跟蹤用戶,訪問(wèn)站點(diǎn)的時(shí)候每個(gè)用戶訪問(wèn)都會(huì)增加一次session id而加入到URL中,同樣蜘蛛的每一次訪問(wèn)也會(huì)被當(dāng)做為一個(gè)新用戶,每次蜘蛛來(lái)訪問(wèn)的URL中都會(huì)加入一個(gè)session id,這樣就會(huì)產(chǎn)生了同一個(gè)頁(yè)面但URL不同的情況,這種的一來(lái)會(huì)產(chǎn)生復(fù)制內(nèi)容頁(yè)面,造成了高度重復(fù)的內(nèi)容頁(yè),同時(shí)也是最常見(jiàn)的蜘蛛陷阱之一。比如說(shuō)有的網(wǎng)站的為了提高銷售業(yè)績(jī),而進(jìn)行彈窗會(huì)話等,比如說(shuō)您好來(lái)自XXX地的朋友等。

2:常識(shí)性的蜘蛛陷阱,采用強(qiáng)制注冊(cè)或登錄才能訪問(wèn)的頁(yè)面

這種的對(duì)于蜘蛛來(lái)說(shuō)就相當(dāng)為難了,因?yàn)橹┲霟o(wú)法提交注冊(cè)更無(wú)法輸入用戶名和密碼登錄查看內(nèi)容,對(duì)于蜘蛛來(lái)說(shuō)我們直接點(diǎn)擊查看到的內(nèi)容也是蜘蛛所能看到的內(nèi)容。

3:喜歡采用flash的站點(diǎn)

之所以說(shuō)是喜歡采用flash的站點(diǎn)是因?yàn)閷?duì)于一些中小型企業(yè)來(lái)說(shuō),因?yàn)閒lash本身可以做很多種效果,尤其是放在導(dǎo)航上視覺(jué)效果強(qiáng),所以不少企業(yè)站喜歡弄個(gè)flash來(lái)展示自己公司的實(shí)力,文化,產(chǎn)品等,甚至一些企業(yè)站點(diǎn)的網(wǎng)站首頁(yè)就是一個(gè)flash,要么是在多長(zhǎng)時(shí)間后通過(guò)flash跳轉(zhuǎn)到另外一個(gè)頁(yè)面,要么就是通過(guò)flash上的鏈接讓用戶自己點(diǎn)擊后進(jìn)入一個(gè)新的頁(yè)面,但是對(duì)于蜘蛛來(lái)說(shuō)一來(lái)是很難讀取flash中的內(nèi)容,所以蜘蛛也很難點(diǎn)擊flash上的鏈接。

4:動(dòng)態(tài)URL

在url中加入過(guò)多的符號(hào)或者網(wǎng)址參數(shù)等,這種蜘蛛陷阱我在url優(yōu)化中曾經(jīng)有提到,雖然說(shuō)隨著搜索引擎的的技術(shù)發(fā)展,動(dòng)態(tài)url對(duì)于蜘蛛的抓取已經(jīng)越來(lái)越不是問(wèn)題了,但是從搜索引擎友好度上來(lái)講,靜態(tài)哪怕是偽靜態(tài)url相對(duì)來(lái)說(shuō)都比動(dòng)態(tài)url要好,可以看下很多SEO同行對(duì)于url中的處理方式。

5:框架

在早期框架到處被泛濫使用,而現(xiàn)在框架網(wǎng)頁(yè)很多網(wǎng)站已經(jīng)很少使用了,一是因?yàn)楝F(xiàn)在隨著各大CMS系統(tǒng)的開發(fā)問(wèn)世,網(wǎng)站維護(hù)相對(duì)也越來(lái)越簡(jiǎn)單了,早期網(wǎng)站使用框架是因?yàn)閷?duì)網(wǎng)站頁(yè)面的維護(hù)有一定的便利性了,現(xiàn)在已經(jīng)大可不必了,而且不利于搜索引擎收錄也是框架越來(lái)越少被使用的原因之一。

6:JS

雖然現(xiàn)在搜索引擎對(duì)于javascript里的鏈接是可以跟蹤甚至在嘗試拆解分析的,但是我們最好不要寄望于搜索引擎自己克服困難,雖然說(shuō)通過(guò)js可以做一些效果不錯(cuò)的導(dǎo)航,但是css同樣可以做到;為了提高網(wǎng)站對(duì)搜索引擎的友好度建議使網(wǎng)頁(yè)能夠更好的蜘蛛爬行,就盡量不要采用js,當(dāng)然在seo中,js有一個(gè)好處就是站長(zhǎng)不希望被收錄的頁(yè)面或者友情鏈接可以采用js。還有一種方法可以消除JavaScript 蜘蛛程序陷阱,即使用< noscript >標(biāo)簽。< noscript >標(biāo)簽是為不支持JavaScript 的瀏覽器提供備選的代碼。蜘蛛程序不會(huì)執(zhí)行JavaScript, 因此他們通過(guò)處理< noscript >代碼來(lái)代替。

7:深層次的網(wǎng)頁(yè)

有的網(wǎng)頁(yè)沒(méi)有入口,而且距離網(wǎng)站的首頁(yè)又很遠(yuǎn),這種頁(yè)面就相對(duì)較難被蜘蛛爬行到,當(dāng)然對(duì)于那些權(quán)重高的網(wǎng)站可能會(huì)另當(dāng)別論了。網(wǎng)站的頁(yè)面要被收錄,首先要需要基本的權(quán)重,首頁(yè)的權(quán)重一般是最高的,然后首頁(yè)的權(quán)重是可以傳遞到內(nèi)頁(yè)的,當(dāng)內(nèi)部頁(yè)面的權(quán)重上升到可以被收錄的門檻,頁(yè)面就會(huì)被收錄,按照這種理論,頁(yè)面之間的權(quán)重傳遞是會(huì)遞減的,因此,內(nèi)頁(yè)和首頁(yè)的點(diǎn)擊距離越近,越容易得到更多的首頁(yè)權(quán)重傳遞。良好的網(wǎng)站結(jié)構(gòu)可以讓網(wǎng)站更多的頁(yè)面被收錄。

8:強(qiáng)制使用cookies

對(duì)于搜索引擎來(lái)說(shuō)是相當(dāng)于直接禁用了cookies的,而有些網(wǎng)站為了實(shí)現(xiàn)某些功能會(huì)采取強(qiáng)制cookies,比如說(shuō)跟蹤用戶訪問(wèn)路徑,記住用戶信息,甚至是盜取用戶隱私等,如果用戶在訪問(wèn)這類站點(diǎn)時(shí)沒(méi)有啟用cookies,所顯示的頁(yè)面就會(huì)不正常,所以對(duì)于蜘蛛來(lái)講同樣的網(wǎng)頁(yè)無(wú)法正常訪問(wèn)。

9:各種形式的跳轉(zhuǎn)

對(duì)于301重定向相信很多seo童鞋已經(jīng)非常熟悉了,但是對(duì)于其他302,或者meta refresh,javascript,flash等跳轉(zhuǎn),蜘蛛是很反感的,而且301也是不到萬(wàn)不得已的時(shí)候采用,任何跳轉(zhuǎn)都會(huì)在一定程度上給蜘蛛的爬行帶來(lái)障礙,所以你你懂得。

10:robots.txt書寫錯(cuò)誤和各種各樣的作弊手法

比如說(shuō)隱藏文字,隱藏鏈接等,采用偽裝網(wǎng)頁(yè)在判斷來(lái)訪者是蜘蛛還是普通瀏覽器者而顯示不同的網(wǎng)頁(yè),使用默認(rèn)錯(cuò)誤的404頁(yè)面等,同樣會(huì)給蜘蛛帶來(lái)爬行障礙。

本文來(lái)源:http://www.zhsem.com/  

【編輯推薦】

  1. 搜索引擎不收錄網(wǎng)站頁(yè)面的常見(jiàn)16個(gè)原因
  2. 網(wǎng)站優(yōu)化之如何在網(wǎng)站中插入關(guān)鍵詞
  3. 網(wǎng)站更新對(duì)seo優(yōu)化推廣的影響
  4. 淺談關(guān)于SEO診斷優(yōu)化服務(wù)的優(yōu)越性
  5. 網(wǎng)站排名因素詳解之網(wǎng)頁(yè)描述

 

責(zé)任編輯:于鐵 來(lái)源: 小無(wú)名
相關(guān)推薦

2024-03-04 13:23:00

數(shù)字化轉(zhuǎn)型

2013-04-27 17:09:29

安全管理IT技術(shù)

2010-01-26 15:32:43

Scala用法錯(cuò)誤

2021-03-01 15:52:14

開源開源軟件陷阱

2014-02-13 11:06:52

系統(tǒng)架構(gòu)移動(dòng)互聯(lián)網(wǎng)

2014-02-14 16:23:03

移動(dòng)互聯(lián)網(wǎng)系統(tǒng)架構(gòu)

2016-11-09 21:33:29

2018-03-12 13:25:51

2024-07-29 15:07:16

2020-04-29 14:37:24

JavaScript前端技術(shù)

2021-04-22 11:22:12

云計(jì)算數(shù)據(jù)遷移混合云

2018-06-11 15:26:47

云計(jì)算企業(yè)云陷阱

2015-02-05 08:48:07

云遷移云資源管理

2013-02-25 14:08:56

Windows Ser

2009-11-11 16:37:50

ADO.NET新增特性

2017-10-20 10:19:49

Kotlin語(yǔ)言陷阱

2025-01-09 08:15:11

2009-10-22 09:52:37

2022-07-04 10:12:37

商業(yè)智能人工智能

2017-01-04 15:34:58

光通信5G光纖傳輸
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)