網(wǎng)管經(jīng)驗(yàn):瞬間脫網(wǎng) 源自水晶頭損壞
幾乎是一瞬間的工夫,單位局域網(wǎng)中的所有工作站幾乎是同步脫網(wǎng),數(shù)據(jù)傳輸流量立即下降為零,使用Ping命令測(cè)試重要網(wǎng)絡(luò)設(shè)備的IP地址時(shí),無(wú)一例外地發(fā)現(xiàn)都存在非常嚴(yán)重的數(shù)據(jù)丟包現(xiàn)象。在追查該故障現(xiàn)象的原因之前,還是先向各位朋友簡(jiǎn)單介紹一下單位局域網(wǎng)的組網(wǎng)情況吧。
單位大樓內(nèi)共有六個(gè)弱電間,分布在每一樓層中,每個(gè)弱電間中的普通二層交換機(jī)通過(guò)寬帶光纖線路連接到位于主機(jī)房中的核心交換機(jī)上,當(dāng)瞬間脫網(wǎng)故障發(fā)生時(shí),筆者恰好在其中一個(gè)弱電間中進(jìn)行例行設(shè)備檢查。接到故障求援電話后,筆者立即檢查了所在弱電間中的普通二層交換機(jī)工作狀態(tài),結(jié)果發(fā)現(xiàn)該設(shè)備控制面板中的數(shù)據(jù)信號(hào)燈瘋狂地閃爍,瞬間流量竟然達(dá)到了八個(gè)加號(hào),而其極限數(shù)值只有十個(gè)加號(hào);當(dāng)筆者嘗試將寬帶光纖接口從其拔下時(shí),對(duì)應(yīng)信號(hào)燈立即停止了跳動(dòng),其速度自然也跟著下降了下來(lái)。后來(lái),筆者連著檢查了其他幾個(gè)弱電間,發(fā)現(xiàn)這些普通二層交換機(jī)的工作狀態(tài)幾乎都是一樣的。
追查故障原因
從二層交換機(jī)上找不到蛛絲馬跡,筆者立即趕到主機(jī)房,準(zhǔn)備對(duì)核心交換機(jī)的工作狀態(tài)進(jìn)行認(rèn)真檢查。筆者先以telnet命令遠(yuǎn)程登陸到核心交換機(jī)的后臺(tái)管理界面,檢查其峰值速度,發(fā)現(xiàn)該參數(shù)一切正常,也沒(méi)有發(fā)現(xiàn)廣播數(shù)據(jù)或大包數(shù)據(jù)攻擊本地內(nèi)網(wǎng),為此筆者推斷本地內(nèi)網(wǎng)存在病毒攻擊的可能性不是很大。
會(huì)不會(huì)是本地內(nèi)網(wǎng)中,有人將其他一些計(jì)算機(jī)或網(wǎng)絡(luò)設(shè)備的IP地址修改成與核心交換機(jī)的IP地址一樣,導(dǎo)致局域網(wǎng)出現(xiàn)了IP地址沖突現(xiàn)象呢?為了排除這種可能因素,筆者在核心交換機(jī)的后臺(tái)修改了它的IP地址,再重新啟動(dòng)了一下核心交換機(jī)系統(tǒng),結(jié)果發(fā)現(xiàn)上述故障現(xiàn)象一切依舊。
考慮到局域網(wǎng)中經(jīng)常會(huì)出現(xiàn)ARP欺騙現(xiàn)象,為了檢驗(yàn)該現(xiàn)象是否是瞬間脫網(wǎng)現(xiàn)象的“罪槐禍?zhǔn)住保P者開(kāi)通了安裝在幾臺(tái)服務(wù)器系統(tǒng)中的ARP防火墻,并讓其持續(xù)運(yùn)行一個(gè)小時(shí)左右,結(jié)果沒(méi)有發(fā)現(xiàn)ARP欺騙現(xiàn)象;后來(lái),筆者借助專(zhuān)業(yè)工具,對(duì)交換機(jī)幾個(gè)重要光口進(jìn)行了依次掃描,以便對(duì)各個(gè)工作子網(wǎng)中的MAC地址進(jìn)行檢查,結(jié)果證實(shí)本地局域網(wǎng)也不存在非法地址入侵現(xiàn)象。
由于核心交換機(jī)支持雙主控單元,筆者打算更換其中一塊主控單元看看,于是切斷核心交換機(jī)的連接電源,更換掉另外一塊主控單元,再將該交換機(jī)系統(tǒng)重新啟動(dòng)一下,在開(kāi)始啟動(dòng)的時(shí)候,筆者發(fā)現(xiàn)網(wǎng)絡(luò)通信好象恢復(fù)正常了,可是時(shí)間不長(zhǎng)相同的故障現(xiàn)象又出現(xiàn)了,這說(shuō)明瞬間脫網(wǎng)故障與交換機(jī)的主控單元無(wú)關(guān)。
到了這里,筆者對(duì)核心交換機(jī)該做的檢查都已經(jīng)做了,可以肯定的是,核心交換機(jī)自身不存在任何問(wèn)題,本地局域網(wǎng)中也不存在發(fā)包病毒,ARP欺騙現(xiàn)象也被證實(shí)不存在,這么一來(lái)能出問(wèn)題的地方看來(lái)只有通信線路了。
解決故障現(xiàn)象
為了弄清楚究竟是哪條通信線路出了問(wèn)題,筆者先將連接到核心交換機(jī)設(shè)備上的所有光纖接口全部拔掉,僅保留了主機(jī)房中的幾臺(tái)服務(wù)器系統(tǒng)與核心交換機(jī)直接相連,此時(shí)筆者使用Ping命令進(jìn)行大包測(cè)試,發(fā)現(xiàn)Ping命令測(cè)試操作一切正常,幾臺(tái)服務(wù)器系統(tǒng)也能正常訪問(wèn)網(wǎng)絡(luò)了,這說(shuō)明核心交換機(jī)的工作狀態(tài)的確是正常的。
接著,筆者依次將每一個(gè)光纖接口正確連接到核心交換機(jī)上,并且每次連接一個(gè)光纖接口,都進(jìn)行一次大包ping命令測(cè)試,當(dāng)測(cè)試到連接到四樓弱電間的光線接口時(shí),筆者發(fā)現(xiàn)故障現(xiàn)象再次出現(xiàn)了,看來(lái)整個(gè)局域網(wǎng)網(wǎng)絡(luò)出現(xiàn)瞬間脫網(wǎng)現(xiàn)象,是由于這個(gè)地方的問(wèn)題引起的。查閱光纖接口資料,筆者很快找到了這條線路是連接到四樓,專(zhuān)門(mén)用于對(duì)外培上網(wǎng)訓(xùn)使用的,順藤摸瓜,筆者沒(méi)有費(fèi)多大工夫就找到了連接該光纖線纜的二層交換機(jī);先是觀察該交換機(jī)的信號(hào)燈狀態(tài),發(fā)現(xiàn)果然存在問(wèn)題,于是借助專(zhuān)業(yè)的線纜測(cè)試工具,對(duì)網(wǎng)絡(luò)線路的連通性進(jìn)行了測(cè)試,結(jié)果發(fā)現(xiàn)這段線路竟然存在短路現(xiàn)象,看來(lái)該現(xiàn)象就是造成瞬間脫網(wǎng)故障的“罪槐禍?zhǔn)住薄?/P>
經(jīng)過(guò)更進(jìn)一步調(diào)查,筆者發(fā)現(xiàn)連接交換機(jī)的某條普通雙絞線接口出現(xiàn)了水晶頭金屬片插腳變形現(xiàn)象,該現(xiàn)象直接導(dǎo)致了物理連接線路短路,看來(lái)水晶頭變壞肯定是其他網(wǎng)絡(luò)管理員平時(shí)插拔不當(dāng)引起的,重新更換新的水晶頭,故障現(xiàn)象果然立刻消失了。
最后的總結(jié)
到了這里,瞬間脫網(wǎng)的故障現(xiàn)象終于被解決了,不過(guò)總結(jié)上面的故障排除過(guò)程,筆者發(fā)現(xiàn)自己犯了經(jīng)驗(yàn)主義錯(cuò)誤;遇到局域網(wǎng)中出現(xiàn)不通的故障現(xiàn)象,總會(huì)下意識(shí)認(rèn)為本地網(wǎng)絡(luò)中存在網(wǎng)絡(luò)病毒或其他不安全攻擊,或者認(rèn)為網(wǎng)絡(luò)中的一些重要設(shè)置被修改了,而忽略了對(duì)一些物理因素的檢查,而事實(shí)上,一些物理因素平時(shí)很難引起我們各級(jí)網(wǎng)絡(luò)管理員的注意。
【編輯推薦】