案例解析:路由器頻繁啟動故障診斷
案例解析:路由器頻繁啟動故障診斷,關(guān)于路由器頻繁啟動故障里的配置問題,下面是兩個比較有代表性的問題,今天就從這兩個問題著手。讓大家能夠觸類旁通。
筆者所處的市局科技網(wǎng)絡(luò)與各個縣市、區(qū)的科技網(wǎng)絡(luò),通過本地電信部門的2Mb光纖信道連接在一起架設(shè)成了全市科技系統(tǒng)的廣域網(wǎng),最近一段時間廣域網(wǎng)遭遇了一則離奇的網(wǎng)絡(luò)故障,所有各個縣市、區(qū)的科技網(wǎng)絡(luò)都無法訪問市局的科技網(wǎng)絡(luò)。
當(dāng)時正趕上在線申報市級星火項目計劃,不少基層單位都在各個縣市、區(qū)的科技網(wǎng)絡(luò)中心等著在線申報市級星火項目計劃,由于廣域網(wǎng)出現(xiàn)意外,全市的在線申報業(yè)務(wù)不得不暫時停止下來,這在當(dāng)時造成了不小的影響,局長立即批示要求網(wǎng)絡(luò)中心必須全力以赴、迅速解決這起離奇的網(wǎng)絡(luò)故障;故障就是命令,我們網(wǎng)絡(luò)中心的幾名同志一接到這樣的命令后,就開始了對故障現(xiàn)象的排查與分析。
考慮到各個縣市、區(qū)的科技網(wǎng)絡(luò)都無法訪問市局的科技網(wǎng)絡(luò),我們估計這則故障肯定與各個縣市、區(qū)的科技網(wǎng)絡(luò)無關(guān),多半是市局的相關(guān)連接線路或網(wǎng)絡(luò)設(shè)備發(fā)生了故障;順著這一思路,我們在市局網(wǎng)絡(luò)中心找了一臺能夠正常上網(wǎng)的工作站,在該工作站系統(tǒng)環(huán)境下我們打開了系統(tǒng)運(yùn)行對話框,并在其中執(zhí)行了Ping命令,來測試一下廣域網(wǎng)的路由器頻繁啟動故障IP地址是否能夠Ping通。
結(jié)果發(fā)現(xiàn)的確無法Ping通核心路由器的IP地址,接下來我們又Ping了一下局域網(wǎng)中的其他普通工作站的IP地址,結(jié)果發(fā)現(xiàn)到局域網(wǎng)其他工作站的網(wǎng)絡(luò)連接很正常,從上面的測試操作來看我們幾乎就斷定廣域網(wǎng)故障是擔(dān)負(fù)信息中轉(zhuǎn)“角色”的核心路由器頻繁啟動故障引起的。
市局的科技網(wǎng)絡(luò)使用了Cisco 7507型號的路由器設(shè)備作為整個廣域網(wǎng)系統(tǒng)的核心路由器頻繁啟動故障,檢查該路由器的信號燈工作狀態(tài)時,我們發(fā)現(xiàn)該設(shè)備控制面板中的system信號燈總處于不停地閃爍狀態(tài),很明顯該設(shè)備工作狀態(tài)不正常,同時發(fā)現(xiàn)核心路由器過一段時間就會進(jìn)行重新啟動。
案例解析:灰塵惹禍
為了檢查路由器頻繁啟動故障究竟發(fā)生了什么故障,我們使用Console控制線將核心路由器直接和本地局域網(wǎng)中的一臺工作站相連,并依次執(zhí)行該工作站系統(tǒng)中的“開始”/“程序”/“附件”/“通訊”/“超級終端”命令,打開了如圖1所示的窗口,在該窗口中創(chuàng)建了一條與核心路由器直接連接的超級終端連接。
路由器頻繁啟動故障解決
進(jìn)入超級終端控制窗口后我們發(fā)現(xiàn)核心路由器遇到了啟動故障,同時系統(tǒng)還出現(xiàn)了“system received a Bus Error exception”這樣的錯誤提示,通過這個提示我們確認(rèn)核心路由器在啟動過程中發(fā)生了一個總線故障,該故障引起了核心路由器不斷重復(fù)啟動。
考慮到總線常常位于設(shè)備的主板中,因此我們推測核心路由器的故障發(fā)生在主板中。于是一不做、二不休,我們迅速找來了“十”字形螺絲刀,將核心路由器背面的螺絲釘全部擰開,然后抽出其中的業(yè)務(wù)板卡,發(fā)現(xiàn)該板卡表面覆蓋了一層厚厚的灰塵,再看看核心路由器內(nèi)置的主板時,我們頓時驚呆了。
該主板表面竟然也覆蓋了一層灰塵,難道是灰塵的覆蓋引起了路由器發(fā)生了總線故障?想起以前從網(wǎng)上看到的許多故障解決案例,都提醒我們在解決網(wǎng)絡(luò)故障的過程中不要忽視一些細(xì)小的環(huán)節(jié),特別是灰塵能導(dǎo)致網(wǎng)絡(luò)設(shè)備發(fā)生各種莫名其妙的故障,于是我們也對灰塵進(jìn)行了懷疑。
為了檢驗(yàn)灰塵是否是引起核心路由器發(fā)生故障的“罪槐禍?zhǔn)?rdquo;,我們立即開始了灰塵清潔干凈。網(wǎng)絡(luò)中心的幾位同事分頭行動,找來了柔軟的小毛刷,專門用于電子設(shè)備的吸塵器,然后使用工具將核心路由器頻繁啟動故障中的所有板卡全部抽取了出來,并通過小毛刷和吸塵器將核心路由器的主板和所有板卡表面的灰塵全部清潔干凈了。
清潔掉灰塵之后,我們又對主板中的各個芯片和電子元件進(jìn)行了認(rèn)真而詳細(xì)的檢查,以便看看主板中的電子部件是否存在燒毀現(xiàn)象,經(jīng)過一番仔細(xì)檢查后,我們并沒有發(fā)現(xiàn)電子元件被燒壞的任何跡象。
于是抱著試一試的心態(tài),我們將各塊板卡恢復(fù)到原位,然后重新將核心路由器接入到網(wǎng)絡(luò)中,并接通電源、按下開關(guān)進(jìn)行重新啟動,待路由器系統(tǒng)啟動穩(wěn)定后,我們重新Ping了一下核心路由器的IP地址,結(jié)果這一次發(fā)現(xiàn)Ping命令測試成功,再嘗試進(jìn)行在線申報項目時,發(fā)現(xiàn)操作也正常了。至此,廣域網(wǎng)無法訪問的故障就被徹底排查了,而引起該故障的“罪槐禍?zhǔn)?rdquo;也被確認(rèn)是讓人容易忽視的灰塵。
總結(jié)上面的故障發(fā)生原因,我們認(rèn)為灰塵覆蓋在核心路由器主板以及電子元件表面后,不但會導(dǎo)致核心路由器頻繁啟動故障在長時間工作后散熱不良,引發(fā)路由器工作不穩(wěn)定現(xiàn)象的發(fā)生,而且在雨水多發(fā)的季節(jié)里,太多的灰塵特別容易吸收空氣中的水分,這樣一來潮濕的灰塵覆蓋在電子元件表面時很容易導(dǎo)致核心路由器發(fā)生莫名其妙的故障。
所以,從上面的故障現(xiàn)象中,我們不難看出灰塵對網(wǎng)絡(luò)設(shè)備的工作影響是多么巨大;為了確保網(wǎng)絡(luò)始終處于穩(wěn)定、高效運(yùn)行狀態(tài),我們建議網(wǎng)絡(luò)管理人員平時一定要做好網(wǎng)絡(luò)設(shè)備的清潔維護(hù)工作,同時確保為網(wǎng)絡(luò)設(shè)備提供一個干凈、整潔的工作環(huán)境,只有這樣才能提高廣域網(wǎng)或局域網(wǎng)的網(wǎng)絡(luò)運(yùn)行效率。