實戰(zhàn)應對三種因素引起的交換故障
一般來說,新投入使用的交換機設(shè)備工作性能往往比較穩(wěn)定,很少會發(fā)生交換故障;可是,隨著工作時間的延長,以及網(wǎng)絡應用的不斷變化,交換機出現(xiàn)故障的機率也在逐漸增大。
為了提高交換故障的解決效率,保證局域網(wǎng)網(wǎng)絡能夠始終高效運行,本文現(xiàn)在就從實戰(zhàn)角度出發(fā),來對常見的三種交換故障進行還原解讀,希望大家能夠從中得到一些啟發(fā)!
1.應對緩存溢出故障
某單位局域網(wǎng)共有兩臺普通交換機,每臺交換機都通過百兆雙絞線連接到單位的CISCO路由器 target=_blank>路由器設(shè)備上,并通過該設(shè)備訪問Internet網(wǎng)絡。平時每臺交換機都連接有大約10臺計算機,每臺計算機都能通過交換機順利地上網(wǎng)訪問;最近不知道怎么回事,單位局域網(wǎng)中有的計算機可以正常上網(wǎng),有的計算機卻不能上網(wǎng)。
起初的時候,網(wǎng)絡管理員還以為是計算機自身的因素,可是,在對計算機系統(tǒng)的上網(wǎng)設(shè)置以及網(wǎng)絡病毒進行檢查后,發(fā)現(xiàn)都沒有問題,使用ping命令測試本地IP地址也是正常的,但是在ping局域網(wǎng)的網(wǎng)關(guān)地址時,發(fā)現(xiàn)不正常,看來故障計算機到交換機之間的這段線路存在問題。
會不會是物理線路的連通性存在問題呢?
想到這一點,網(wǎng)絡管理員立即使用網(wǎng)絡測試儀 target=_blank>測試儀,對連接計算機與交換機的雙絞線連通性進行測試,結(jié)果發(fā)現(xiàn)它們的連通狀態(tài)很正常。
在排除了網(wǎng)絡線路以及計算機自身因素后,網(wǎng)絡管理員準備檢查一下交換機的工作狀態(tài)是否正常;當他來到交換機設(shè)備現(xiàn)場時,他發(fā)現(xiàn)其中一臺交換機的所有端口信號燈狀態(tài)都處于點亮但不閃爍狀態(tài);按理來說,交換機如果能夠正常處理數(shù)據(jù)信息的話,那么對應交換端口的數(shù)據(jù)信號燈也應該處于閃爍狀態(tài),很明顯現(xiàn)在交換端口點亮但不閃爍,這說明了該交換機的工作狀態(tài)不正常。而反觀另外一臺交換機設(shè)備,網(wǎng)絡管理員發(fā)現(xiàn)它們的交換端口只要被點亮,基本上都能處于閃爍狀態(tài),這說明這臺交換機能夠正常交換數(shù)據(jù)。經(jīng)過進一步檢查,網(wǎng)絡管理員看到那些不能上網(wǎng)的計算機,基本上都是連接到那臺工作狀態(tài)不正常的交換機上的,看來局域網(wǎng)中部分計算機不能上網(wǎng)的故障現(xiàn)象是由交換機引起的。
那么究竟是什么因素造成故障交換機的端口信號燈顯示不正常呢?
一般來說,造成這種端口信號燈狀態(tài)顯示不正?,F(xiàn)象的原因主要有兩方面,一方面就是交換機系統(tǒng)存在問題,例如受到網(wǎng)絡病毒的攻擊,或者工作時間長了之后出現(xiàn)了系統(tǒng)緩存溢出錯誤等,另外一方面就是交換機設(shè)備存在硬件問題,例如交換機服役時間比較長之后,它內(nèi)部的性能元件容易發(fā)生老化現(xiàn)象,這些老化的元件也容易造成交換機工作狀態(tài)不正常。
通常,交換機的設(shè)置不發(fā)生變化,出現(xiàn)的一些“軟”故障往往都能通過重新啟動的方法來解決,依照這樣的思路,網(wǎng)絡管理員立即重新啟動了一下故障交換機系統(tǒng),沒有多長時間,網(wǎng)絡管理員觀察到該故障的交換機端口工作狀態(tài)已經(jīng)恢復了正常;再次從故障計算機系統(tǒng)中嘗試進行上網(wǎng)訪問時,以前不能上網(wǎng)的故障現(xiàn)象立即消失了,這說明故障交換機的確存在類似緩存溢出這樣的“軟”故障,這樣的故障造成了交換機的工作狀態(tài)無法正常。
如果每重新啟動一段時間后,交換機又出現(xiàn)相同的故障現(xiàn)象時,那問題很可能是由局域網(wǎng)中的網(wǎng)絡病毒引起的,因為有的網(wǎng)絡病毒可能在一定時間內(nèi),會對交換機系統(tǒng)的內(nèi)存或其他系統(tǒng)資源進行不停占用,最終導致交換機系統(tǒng)的資源全部被消耗殆盡,從而會引發(fā)局域網(wǎng)中的計算機不能上網(wǎng)的故障現(xiàn)象;為了避免網(wǎng)絡病毒對交換機系統(tǒng)的沖擊,我們應該在組建網(wǎng)絡之前,認真選用質(zhì)量可靠、性能穩(wěn)定、緩存較大的設(shè)備,同時注意對局域網(wǎng)網(wǎng)絡定期執(zhí)行病毒清除操作。 #p#
2.應對ARP病毒故障
某一天,筆者接到一個故障申請電話,說618房間的計算機突然不能上網(wǎng),并且系統(tǒng)托盤區(qū)域處的網(wǎng)絡連接圖標上有紅色叉號標記出現(xiàn);起初筆者以為肯定是網(wǎng)絡線纜出現(xiàn)了松動,要求該用戶自行將網(wǎng)線拔下來重新插一下,確保網(wǎng)絡線纜與墻上的上網(wǎng)插口以及網(wǎng)卡接口之間連接牢靠,可是該用戶按照筆者要求重新插拔了網(wǎng)絡線纜后,還是出現(xiàn)相同的故障現(xiàn)象。
筆者不放心,立即登錄到618房間所使用的交換機系統(tǒng)上,查看了對應交換端口的工作狀態(tài),發(fā)現(xiàn)目標端口處于“up”狀態(tài),這說明交換端口的工作狀態(tài)也是正常的。后來,筆者懷疑618房間的計算機使用的IP地址可能與其他計算機的IP地址發(fā)生了沖突,于是建議那位上網(wǎng)用戶換一個IP地址試試,果然在重新更換IP地址后,618房間的計算機又能正常上網(wǎng)了。
然后,沒有多長時間,618隔壁房間的計算機又打來電話向筆者求援說,他們的計算機也不能正常上網(wǎng)了;筆者經(jīng)過查閱檔案資料,發(fā)現(xiàn)出現(xiàn)故障的計算機基本都處于相同的虛擬工作子網(wǎng)中,看來這種故障現(xiàn)象并不簡單是由人工修改IP地址造成沖突引起的,很可能是對應虛擬工作子網(wǎng)中出現(xiàn)了ARP病毒。
我們知道,現(xiàn)在ARP病毒非常瘋狂,局域網(wǎng)中的計算機很容易感染該病毒,而該病毒往往會欺騙局域網(wǎng)中所有計算機以及網(wǎng)絡設(shè)備,并強制目標計算機通過特定的病毒主機進行上網(wǎng)訪問。很多計算機被感染了ARP病毒后,之所以不能上網(wǎng)或者訪問網(wǎng)絡的速度會下降,主要是由于在正常狀態(tài)下目標計算機的網(wǎng)卡IP地址與物理地址是一一對應的,當目標計算機的網(wǎng)卡設(shè)備從DHCP服務器 target=_blank>服務器那里申請得到IP地址后,該地址就會被臨時與網(wǎng)卡設(shè)備的物理地址“捆綁”在一起,并且還會被自動記憶存儲 target=_blank>存儲到本地系統(tǒng)的ARP映射表中;當局域網(wǎng)中有計算機被意外感染了ARP病毒后,ARP病毒就會強行把病毒計算機的網(wǎng)卡物理地址映射到局域網(wǎng)的交換機或路由器設(shè)備上,并且還會自動向網(wǎng)絡中發(fā)送大量的ARP廣播信息,局域網(wǎng)中的其他計算機收到廣播信息后,往往會錯誤地認為病毒計算機就是局域網(wǎng)的網(wǎng)關(guān)地址,這樣一來其他計算機就會自動把上網(wǎng)請求轉(zhuǎn)發(fā)到病毒計算機上,而病毒計算機實際上并不是真正的網(wǎng)關(guān)地址,所以其他計算機自然也就不能正常上網(wǎng),即使能夠上網(wǎng)速度也不會很快了。
為了查清楚究竟是哪臺計算機感染了ARP病毒,筆者立即以系統(tǒng)管理員身份登錄進入到目標交換機系統(tǒng),進入該系統(tǒng)的全局配置狀態(tài),利用“display dia”命令,查看目標交換機各個交換端口的工作狀態(tài),結(jié)果發(fā)現(xiàn)網(wǎng)卡物理地址為0016-173d-43eb的計算機與對應虛擬工作子網(wǎng)的網(wǎng)關(guān)地址存在沖突現(xiàn)象;為了追查出網(wǎng)卡物理地址為0016-173d-43eb的計算機究竟位于哪個房間,筆者立即在交換機的全局配置命令行狀態(tài)下,執(zhí)行字符串命令“display mac”,從其后出現(xiàn)的結(jié)果界面中,筆者看到網(wǎng)卡物理地址為0016-173d-43eb的計算機使用了43交換端口。
為了防止ARP病毒繼續(xù)影響局域網(wǎng)的工作狀態(tài),筆者在交換機的后臺管理界面中,執(zhí)行字符串命令“interface e0/43”,進入43交換端口的視圖配置狀態(tài),并且在該狀態(tài)下繼續(xù)執(zhí)行字符串命令“shutdown”,將43交換端口暫時關(guān)閉掉,這樣一來病毒計算機就不能通過該交換端口向局域網(wǎng)網(wǎng)絡發(fā)送ARP病毒信息了,此時與病毒計算機同處一個虛擬工作子網(wǎng)的其他計算機立即都能正常上網(wǎng)了。
臨時關(guān)閉43交換端口的工作狀態(tài)后,筆者立即又查看了組網(wǎng)時完善起來的檔案記錄,發(fā)現(xiàn)43交換端口被分配給了563房間使用上網(wǎng)了;于是,筆者立即電話聯(lián)系563房間的上網(wǎng)用戶,告訴他的計算機已經(jīng)感染了ARP病毒,目前已經(jīng)被強行從網(wǎng)絡中斷開,并且要求該用戶必須使用最新版本的殺毒軟件對其使用的計算機進行病毒查殺操作;在查殺完病毒之后,筆者在對應交換端口的視圖配置狀態(tài)下,又執(zhí)行了“undo shutdown”字符串命令,重新將43交換端口的工作狀態(tài)激活,之后再次執(zhí)行“display dia”命令,發(fā)現(xiàn)局域網(wǎng)中已經(jīng)不存在地址沖突現(xiàn)象了,這說明局域網(wǎng)中的ARP病毒故障已經(jīng)被成功解決了。 #p#
3.應對網(wǎng)絡環(huán)路故障
某大樓網(wǎng)絡共包含12個虛擬工作子網(wǎng),每一樓層的所有計算機都通過1000M六類雙絞線連接到華為系列的可管理交換機設(shè)備上,各個樓層中的二層交換機全部通過1000M級別的光纖線路連接到大樓網(wǎng)絡的華為S8500核心路由交換機上,核心路由交換機再使用千兆光纖線路連接到單位的天融信硬件防火墻上,最后通過本地的電信線路訪問Internet網(wǎng)絡,平時大樓內(nèi)各個樓層的計算機都能正常上網(wǎng),遇到一些極個不能上網(wǎng)的現(xiàn)象時,網(wǎng)絡管理員經(jīng)過控制交換機系統(tǒng),都能快速找到故障原因,并能快速恢復網(wǎng)絡故障。
然而好景不長,某天上午,網(wǎng)絡管理員先是接到來自10樓上網(wǎng)用戶的故障保修電話,說是該樓層中的所有計算機瞬間都不能上網(wǎng)了;剛開始的時候,網(wǎng)絡管理員估計夏天到了,肯定是樓層交換機工作時間長了,內(nèi)部無法及時散發(fā)出來的熱量造成了交換機的工作狀態(tài)不正常了,對于這樣的現(xiàn)象,往往只要讓交換機稍微休息一會,再重新啟動一下就能解決問題了。剛準備按照這樣的思路進行操作,誰曾想到,在短短的幾分鐘了,其他樓層的上網(wǎng)用戶也不停向網(wǎng)絡管理員進行電話“求援”,并且申請解決的故障現(xiàn)象幾乎都是相同的,顯然這樣的現(xiàn)象肯定不是由于交換機自身散熱不良引起的,畢竟在相同的時間段內(nèi)不可能有這么多樓層交換機同時出現(xiàn)散熱不好的現(xiàn)象,看來問題很可能是大樓網(wǎng)絡的核心交換機或硬件防火墻遇到了意外。
網(wǎng)絡管理員立即以特權(quán)賬號登錄進入核心交換機后臺管理系統(tǒng),在該系統(tǒng)的命令行狀態(tài),使用ping命令測試了硬件防火墻的IP地址,測試結(jié)果發(fā)現(xiàn)ping命令可以測試成功,不過響應時間明顯有點偏長;既然硬件防火墻能夠被正常ping通,那就意味著該設(shè)備的工作狀態(tài)是正常的,于是筆者決定還是先來查看一下核心交換機的工作狀態(tài)是否正常。想到做到,網(wǎng)絡管理員在核心交換機的后臺管理界面,執(zhí)行“system”字符串命令,將交換機系統(tǒng)切換到系統(tǒng)全局配置狀態(tài),在該狀態(tài)下輸入字符串命令“display cpu”,單擊回車鍵后,筆者發(fā)現(xiàn)核心交換機每一塊插卡上的CPU消耗率都達到了50%以上,而在正常工作狀態(tài)下,每塊交換插卡的CPU消耗率都應該在20%左右,顯然大樓網(wǎng)絡內(nèi)的上網(wǎng)流量出現(xiàn)了異常,正是這些大容量的數(shù)據(jù)交換信息在不停沖擊核心交換機的插卡,才導致了核心交換機的系統(tǒng)CPU資源被大量消耗,最終造成了核心交換機工作狀態(tài)不正常。
那么究竟是什么因素造成了大樓網(wǎng)絡內(nèi)的上網(wǎng)流量出現(xiàn)了明顯異常呢?是惡意使用BT下載?是網(wǎng)絡病毒?還是網(wǎng)絡環(huán)路呢?
筆者立即在核心交換機的后臺系統(tǒng)使用“display dia”命令,對核心交換機的各個光纖端口狀態(tài)進行了掃描診斷,結(jié)果發(fā)現(xiàn)與硬件防火墻保持連接的那個光纖端口數(shù)據(jù)流量竟然達到了19000M/s左右,而這樣大的數(shù)據(jù)流量BT下載應用是不可能達到的,而網(wǎng)絡病毒也沒有這樣的能力,很顯然這么大的數(shù)據(jù)流量只有網(wǎng)絡環(huán)路才能做得到。為了驗證自己的猜測,網(wǎng)絡管理員立即使用“display interface”字符串命令,來查看核心交換機每一個光纖端口的輸入、輸出流量,對于那些輸入、輸出流量同時達到1000M/s以上級別時,繼續(xù)不停執(zhí)行“display interface”字符串命令,看看輸出廣播包數(shù)量每秒鐘增加的幅度有沒有超過500M/s左右大小,如果超過這個大小,那就說明對應交換端口下的虛擬工作子網(wǎng)中存在網(wǎng)絡風暴現(xiàn)象。經(jīng)過對每一個交換端口的輸入、輸出流量進行詳細檢查,網(wǎng)絡管理員終于找到“g0/1/6”這個光纖端口數(shù)據(jù)流量不正常,輸入流量竟然也達到了5000M/s左右,經(jīng)過反復執(zhí)行“display interface g0/1/6”字符串命令,網(wǎng)絡管理員最終確認連接到“g0/1/6”這個光纖端口下的虛擬工作子網(wǎng)中存在網(wǎng)絡風暴現(xiàn)象。
為了弄清楚究竟是硬件設(shè)備損壞還是網(wǎng)絡環(huán)路引起了網(wǎng)絡風暴現(xiàn)象,網(wǎng)絡管理員立即來到與“g0/1/6”這個光纖端口保持連接的樓層交換,以系統(tǒng)管理員權(quán)限登錄進入該樓層交換機的后臺管理系統(tǒng),并使用ping命令測試核心交換機的IP地址時,發(fā)現(xiàn)ping命令根本無法測試成功,很顯然該樓層交換機工作狀態(tài)不正常。不得已,網(wǎng)絡管理員只好使用“display interface”字符串命令,對該交換機的每一個以太交換端口進行檢查,結(jié)果看到“e0/35”這個交換端口的輸入、輸出流量竟然達到了10000M/s級別,立即進入“e0/35”這個交換端口的視圖配置狀態(tài),執(zhí)行字符串命令“shutdown”,將“e0/35”交換端口的工作狀態(tài)臨時關(guān)閉;之后,網(wǎng)絡管理員重新ping了一下核心交換機的IP地址,這一次測試竟然成功了,這說明該樓層交換機的工作狀態(tài)已經(jīng)恢復正常。
完成上面的檢查工作后,網(wǎng)絡管理員隨即又聯(lián)系了剛才報修故障的幾位上網(wǎng)用戶,請他們配合進行一下上網(wǎng)測試,沒有多長時間,所有上網(wǎng)用戶的回復都說網(wǎng)絡訪問已經(jīng)正常,這說明大樓各個樓層不能上網(wǎng)的故障已經(jīng)被成功解決了。
后來,網(wǎng)絡管理員又查閱了相關(guān)的檔案資料,發(fā)現(xiàn)使用“e0/35”交換端口的上網(wǎng)用戶是1613房間,網(wǎng)絡管理員立即火速趕到該房間現(xiàn)場,對他們的上網(wǎng)線路進行了檢查,結(jié)果發(fā)現(xiàn)該房間下掛了一臺普通的集線器,而恰好該房間當天有人在維修窗戶,在維修期間工作人員將所有網(wǎng)絡線纜全部拔了下來,在窗戶修好之后,工作人員由于不熟悉網(wǎng)絡連接操作,就隨意地進行了網(wǎng)絡連接操作,最終引起了網(wǎng)絡環(huán)路現(xiàn)象,從而造成了整個大樓網(wǎng)絡上網(wǎng)出現(xiàn)了故障。
【編輯推薦】