撥開迷霧 解惑間歇性斷網(wǎng)故障
無論多么大規(guī)模的局域網(wǎng)網(wǎng)絡,遇到這種或那種稀奇古怪的網(wǎng)絡故障是不可避免的事情,其中最讓單位網(wǎng)管員感覺麻煩的就是Internet網(wǎng)絡訪問的間歇性中斷了,畢竟隨著網(wǎng)絡技術的不斷發(fā)展以及逐步成熟,很多單位的員工特別是從事網(wǎng)絡服務單位的員工幾乎已經到了一時一刻也無法離開網(wǎng)絡的地步了。要是單位局域網(wǎng)與Internet網(wǎng)絡的連接頻繁發(fā)生中斷的話,那么許多單位的員工基本上就將無法正常開展工作了。最近筆者所在單位的局域網(wǎng)曾經遭受過這樣一則離奇的歇性斷網(wǎng)故障,現(xiàn)在筆者就將處理該網(wǎng)絡故障的詳細過程貢獻出來和大家分享,希望大家能夠從中受到一點啟發(fā)!
故障回放
筆者單位所在的局域網(wǎng)網(wǎng)絡規(guī)模不是很大,所有工作站數(shù)量加起來總共不超過30臺,這些工作站全部連接到二層交換機上,寬帶路由器通過雙絞線與二層交換機的Uplink端口直接相連,而ADSL撥號上網(wǎng)線路與寬帶路由器的外部WAN端口直接相連,局域網(wǎng)中的所有工作站通過這條ADSL線路來訪問Internet網(wǎng)絡。
最近筆者單位負責局域網(wǎng)維護與管理的同事突然離開了工作崗位,剛接手這方面工作的新同事或許由于不熟悉環(huán)境或者其他方面的原因,一進入工作崗位就在很短的時間內碰到了不少網(wǎng)絡故障,特別是其中一則網(wǎng)絡故障讓他頭疼不已。該網(wǎng)絡故障的具體現(xiàn)象表現(xiàn)為單位局域網(wǎng)上網(wǎng)時差不多每隔三個小時就會發(fā)生一次掉線現(xiàn)象,之后過幾分鐘,局域網(wǎng)又能自動重新訪問Internet網(wǎng)絡了;盡管中途掉線的時間只有幾分鐘,不過考慮到單位很多處室的工作都是在線完成的,與市政府直接相連的電子政務系統(tǒng)也對網(wǎng)絡連接的通暢性要求很高,即使網(wǎng)絡連接發(fā)生偶爾斷開現(xiàn)象,也會明顯影響電子政務等工作的正常開展。筆者的這位新同事對局域網(wǎng)中的所有工作站系統(tǒng)進行了詳細檢查,發(fā)現(xiàn)所有工作站系統(tǒng)運行狀態(tài)一切正常,而且都沒有任何網(wǎng)絡病毒的襲擊,并且局域網(wǎng)中的所有工作站系統(tǒng)都成功啟用了Windows Update服務,這樣保證了所有系統(tǒng)安全補丁程序都能得到及時的安裝;再仔細對所有網(wǎng)絡連接線纜的端口以及連通性進行測試時,新同事也沒有找到任何物理性的故障。
故障排查
在萬般無奈之下,這位新同事及時向筆者發(fā)出了“求援”,聽了新同事對網(wǎng)絡故障的詳細敘述后,筆者立即根據(jù)他的描述進行了詳細分析,并及時得出了三點結論:***點就是局域網(wǎng)網(wǎng)絡發(fā)生了掉線現(xiàn)象,第二點就是該網(wǎng)絡掉線現(xiàn)象屬于間歇性行為,第三點就是網(wǎng)絡掉線故障發(fā)生之后很短的時間內能夠自動恢復正常。
從以往經驗來看,筆者認為網(wǎng)絡要是頻繁發(fā)生掉線的話,那可能有兩個方面的原因,一個方面的原因就是網(wǎng)絡線路自身連接不穩(wěn)定,另外一個方面的原因就是局域網(wǎng)中可能存在蠕蟲病毒,這個蠕蟲病毒或許就是導致網(wǎng)絡頻繁發(fā)生掉線故障的原因。由于筆者單位的局域網(wǎng)是通過本地電信部門的ADSL設備進行共享上網(wǎng)的,于是筆者立即與本地電信部門進行了聯(lián)系,懇請他們能夠對本單位的ADSL撥號上網(wǎng)線路進行檢查,結果他們回復說沒有任何問題,本單位的ADSL撥號上網(wǎng)線路一切正常,于是筆者排除了網(wǎng)絡線路自身連接不穩(wěn)定因素,并且將故障解決的重點放到了網(wǎng)絡蠕蟲病毒身上;因為當局域網(wǎng)環(huán)境中蠕蟲數(shù)據(jù)包非常多的話,很可能導致寬帶路由器設備發(fā)生“假死”現(xiàn)象,從而可能會將相關的網(wǎng)絡端口關閉掉,如此一來可能就會導致網(wǎng)絡掉線故障,而當網(wǎng)絡蠕蟲病毒不發(fā)作時,那些被關閉的網(wǎng)絡接口又會自動打開,這樣一來網(wǎng)絡掉線現(xiàn)象過一段時間后就能自動恢復了。
既然筆者已經認定間歇性斷網(wǎng)故障是由網(wǎng)絡蠕蟲病毒引起的,那么筆者就準備開始認真重新排除局域網(wǎng)中是否真的有病毒。大家知道,目前網(wǎng)絡中流行的許多蠕蟲病毒,特別是ARP類型的網(wǎng)絡欺騙病毒,它們的傳播速度是非常快的,并且破壞力非常強,只要局域網(wǎng)中任意一臺工作站被ARP類型的網(wǎng)絡欺騙病毒感染,那么局域網(wǎng)中所有工作站的網(wǎng)絡連接操作都會受到明顯的影響。依照這樣的分析,筆者對局域網(wǎng)中所有同事使用的工作站系統(tǒng)又重新檢查了一遍,的確沒有找到任何可疑問題。而且在局域網(wǎng)發(fā)生網(wǎng)絡掉線現(xiàn)象時,筆者通過“arp -a”字符串命令查詢了本地網(wǎng)絡的ARP緩存表,結果發(fā)現(xiàn)緩存表中列寫出來的網(wǎng)關MAC地址信息與局域網(wǎng)處于正常上網(wǎng)狀態(tài)時的是一致的,這個結果表明局域網(wǎng)網(wǎng)絡掉線故障并不是由于ARP病毒欺騙造成的。
故障解決
根據(jù)上面的各種理論分析與實際檢查,筆者基本已經推翻了間歇性斷網(wǎng)故障是由網(wǎng)絡蠕蟲病毒引起的這個結論了,那么究竟還有哪些因素可能導致單位局域網(wǎng)網(wǎng)絡每隔一段時間就會自動發(fā)生一次掉線故障呢,而且要不了多長時間后又能自動重新恢復連接呢?
為了更好、更快地將網(wǎng)絡故障原因找到,筆者打算采用最簡單、最常用的故障排查方法來解決難題,那就是采用分割法尋找故障原因,換句話說就是將局域網(wǎng)中各個工作區(qū)域分別隔離開來進行檢查。首先筆者先將局域網(wǎng)中所有工作站的電源全部關閉,讓所有工作站都從局域網(wǎng)中斷開,并且只連接一臺筆記本電腦到局域網(wǎng)中,可是該筆記本電腦在上網(wǎng)的時候仍然出現(xiàn)了相同的網(wǎng)絡掉線故障。很明顯,間歇性斷網(wǎng)故障不是出現(xiàn)在局域網(wǎng)工作站上,筆者估計問題很可能發(fā)生在局域網(wǎng)的交換機設備或路由器設備,或者出現(xiàn)在與這些設備相連的網(wǎng)絡連接線路上。
為了檢驗局域網(wǎng)中的交換機設備是否能夠正常工作,筆者索性將筆記本電腦直接連接到局域網(wǎng)的路由器設備上,之后在筆記本電腦上重新進行了上網(wǎng)測試,可是最終的測試結果還是讓筆者非常失望,筆記本電腦仍然過一段時間就發(fā)生了網(wǎng)絡掉線現(xiàn)象,而且沒有多長時間又能自動恢復正常;根據(jù)這一測試結果,筆者認為間歇性斷網(wǎng)故障與交換機設備沒有任何關系,而多半與路由器設備或與路由器相連的物理線路有關系。
之后筆者又將筆記本電腦與ADSL設備直接相連,而跳過了局域網(wǎng)中的路由器設備;緊接著筆者又在筆記本電腦中采用手工方法重新創(chuàng)建了撥號上網(wǎng)連接,再用鼠標雙擊該撥號連接圖標嘗試進行上網(wǎng)訪問,結果筆者看到網(wǎng)絡自動掉線現(xiàn)象一直沒有再出現(xiàn),這就意味著網(wǎng)絡撥號上網(wǎng)線路是正常的,并且這也驗證了ADSL設備不存在任何故障。在逐步排查、篩選之后,筆者認為間歇性斷網(wǎng)故障肯定是由寬帶路由器自身設置不當引起的,當然也可能是由寬帶路由器自身質量不穩(wěn)定引起的。
正常情況下,寬帶路由器設備質量上面一般不會有什么問題,問題很可能發(fā)生在參數(shù)設置上。于是筆者打開IE瀏覽器窗口,并在該窗口地址欄中輸入寬帶路由器設備默認的IP地址,之后又輸入該設備系統(tǒng)管理員帳號與密碼,登錄進該設備的后臺管理界面,在該后臺界面中筆者認認真真地檢查了各項設置參數(shù),結果看到在“網(wǎng)絡參數(shù)”處,“WAN口設置”下面的撥號設置參數(shù)被修改為了“按需連接,在有訪問時自動連接,自動斷線等待時間5分鐘”了,這一參數(shù)設置說明當單位局域網(wǎng)中有用戶要訪問Internet網(wǎng)絡時,寬帶路由器設備才會自動進行撥號上網(wǎng),而且當局域網(wǎng)網(wǎng)絡在5分鐘之內沒有任何用戶使用時就會自動發(fā)生掉線故障。找到故障原因后,筆者立即將“WAN口設置”下面的撥號設置參數(shù)修改為“自動連接,在開機和斷線后自動連接”,并重新啟動了一下寬帶路由器設備,結果單位局域網(wǎng)中再也沒有發(fā)生間歇性掉線故障。
故障小結
總結上面的故障排除過程,筆者認為許多事情千萬不能想當然,否則很容易多走彎路。這不,在本則故障的排除過程中,筆者認為寬帶路由器設備的工作參數(shù)一般沒有人會隨便去改動的,于是就沒有想到要對該設備的參數(shù)進行檢查,可誰曾想到這則網(wǎng)絡故障竟然是由寬帶路由器設備上的WAN口撥號連接參數(shù)設置錯誤引起的,于是筆者懷疑是前任同事離開單位時做的手腳。當單位局域網(wǎng)在五分鐘之內沒有任何用戶訪問外部網(wǎng)絡時,寬帶路由器設備就會自動將連接外網(wǎng)的線路切斷了,當有人嘗試進行網(wǎng)絡訪問并發(fā)現(xiàn)無法上網(wǎng)時,寬帶路由器設備又會根據(jù)“按需連接”方式自動將斷開的網(wǎng)絡線路恢復成功,這樣就出現(xiàn)了過幾分鐘后網(wǎng)絡又能重新正常工作的現(xiàn)象。
【編輯推薦】