路由器故障:城域網(wǎng)出口兩臺(tái)NE5000E同時(shí)停止轉(zhuǎn)發(fā)
城域網(wǎng)出口兩臺(tái)NE5000E同時(shí)停止轉(zhuǎn)發(fā)的故障解決步驟如下:
網(wǎng)絡(luò)環(huán)境
全省城域網(wǎng)出口為兩臺(tái)NE5000E,上行至國(guó)干C廠家設(shè)備,NE5000E將城域網(wǎng)路由聚合后,在本地配置黑洞路由,再發(fā)布國(guó)干;NE5000E向城域網(wǎng)內(nèi)部發(fā)布缺省路由。故障時(shí)兩臺(tái)NE5000E全部停止轉(zhuǎn)發(fā),全省流量中斷,該故障共發(fā)生兩次,***次未做任何操作30分左右自動(dòng)恢復(fù),第二次中斷通過(guò)重啟其中一臺(tái)NE5000E后恢復(fù)。
圖城域網(wǎng)出口兩臺(tái)NE5000E同時(shí)停止轉(zhuǎn)發(fā)故障組網(wǎng)圖
故障分析
該問(wèn)題發(fā)生兩次,都是國(guó)干設(shè)備停止轉(zhuǎn)發(fā)導(dǎo)致,我司兩臺(tái)設(shè)備同時(shí)出現(xiàn)問(wèn)題的可能性很小,排除硬件原因。
結(jié)合城域網(wǎng)網(wǎng)管對(duì)NE5000E上行接口和下行接口流量監(jiān)控的結(jié)果、以及城域網(wǎng)頻繁路由振蕩,判斷該問(wèn)題是由于城域網(wǎng)內(nèi)部存在路由振蕩,觸發(fā)國(guó)干設(shè)備對(duì)路由進(jìn)行抑制,導(dǎo)致故障發(fā)生。
操作步驟
步驟 1 使用trace操作發(fā)現(xiàn)流量終結(jié)到NE5000E。
步驟 2 檢查NE5000E各表項(xiàng)狀態(tài)均正常,而且有出流量。
步驟 3 NE5000E入流量幾乎為零。
可能的原因如下:
兩臺(tái)NE5000E同時(shí)出現(xiàn)故障。
上行國(guó)干設(shè)備沒(méi)有轉(zhuǎn)發(fā)。
步驟 4 通過(guò)省內(nèi)網(wǎng)管監(jiān)控接口的流量圖發(fā)現(xiàn),兩臺(tái)NE5000E上行接口的入流量經(jīng)常切換,兩臺(tái)設(shè)備的入流量均為零時(shí)則出現(xiàn)事故。通過(guò)流量圖發(fā)現(xiàn),第二次事故時(shí)通過(guò)重啟一臺(tái)NE5000E恢復(fù),重啟后城域網(wǎng)所有流量全部切換到重啟這臺(tái)設(shè)備,再過(guò)30分鐘左右,整個(gè)城域網(wǎng)流量恢復(fù)到正常模型。
步驟 5 可以排除兩臺(tái)NE5000E同時(shí)出現(xiàn)故障,故障原因與國(guó)干設(shè)備收斂相關(guān)。
步驟 6 檢查NE5000E的BGP路由更新報(bào)文的統(tǒng)計(jì)結(jié)果,發(fā)出的update報(bào)文比正常情況高出10多倍,存在路由振蕩,隨即檢查NE5000E日志,發(fā)現(xiàn)有ospf路由撤銷(xiāo)記錄。
步驟 7 再詳細(xì)檢查NE5000E路由條目發(fā)現(xiàn),NE5000E發(fā)布給國(guó)干的是ospf路由,并不是手工配置的黑洞路由,ospf路由引入bgp后,震蕩導(dǎo)致國(guó)干路由抑制。
步驟 8 調(diào)整黑洞路由的優(yōu)先級(jí)高于OSPF路由,故障不再發(fā)生。
步驟 9 導(dǎo)致路由振蕩的原因是NE5000E配置的黑洞路由與R廠家設(shè)備沖突。
----結(jié)束
案例總結(jié)
處理問(wèn)題要從全網(wǎng)整體考慮,當(dāng)存在多種路由時(shí),要規(guī)劃好路由優(yōu)先級(jí)的配置。
【編輯推薦】