路由器故障:A個平面業(yè)務中斷
網(wǎng)絡環(huán)境
承載網(wǎng)有主備兩個平面,A平面流量模型為:UMG1-CE1-AR1-BR1-AR3-CE3,回來路徑相同。
但在對B平面的AR2設備進行主備倒換時,發(fā)現(xiàn)A平面流量有少量丟包現(xiàn)象(1秒左右)。同樣,對A平面AR1做主備倒換時,發(fā)現(xiàn)B平面也有丟包現(xiàn)象。
承載網(wǎng)主備雙平面組網(wǎng)圖
故障分析
從現(xiàn)網(wǎng)拓撲和路由情況來分析,主備平面是相互獨立的,不可能出現(xiàn)一個平面主備倒換影響到另一個平面的情況。
經(jīng)過分析配置發(fā)現(xiàn),在現(xiàn)網(wǎng)所有相關AR路由器上,OSPF多實例下都配置了路由聚合命令:
步驟 1 在所有AR路由器上執(zhí)行display current-configuration檢查配置文件。發(fā)現(xiàn)所有AR路由器上的OSPF多實例都配置了路由聚合:
ospf 1 vpn-instance 123
asbr-summary 10.0.0.0 255.0.0.0
步驟 2 然后在BGP上通過network方式把路由發(fā)布出去。這樣,到遠端路由會被聚合成一條10.0.0.0/8的路由。根據(jù)OSPF ABR的聚合原則,聚合后的路由的cost值為所有被聚合具體路由中cost值最大者(我司ASBR和ABR聚合后一樣選cost值最大的下發(fā))。舉例說明,假設有如下三條路由:10.1.1.1/24 cost 10;10.2.1.1/24 cost 100;10.3.1.1/24 cost 1000;那么聚合后路由為:10.0.0.0/8 cost 1000 。
步驟 3 在備用平面主備倒換后,AR2上的私網(wǎng)路由將重新收斂;假設AR2先收到一條cost值小于200的10.x.x.x的路由,此時AR2向CE2發(fā)布的10.0.0.0/8的聚合路由的cost值就會比原來的小,通過ospf擴散到CE1。這時,主平面的流量模型變?yōu)椋篣MG1-CE1-CE2-AR2-BR2-AR4-CE4,但由于網(wǎng)絡規(guī)模較大,這時AR2還未完全收斂,也就是AR2還沒有目的地對應的明細路由,就發(fā)生如上現(xiàn)象。
----結(jié)束
操作步驟
步驟 1 在系統(tǒng)視圖下執(zhí)行ospf process-id vpn-instance vpn-instance-name。
步驟 2 輸入命令abr-summary ip-address mask cost cost,配置OSPF的ASBR路由聚合及cost值。
步驟 3 輸入命令quit返回到系統(tǒng)視圖。
步驟 4 保存配置。
配置如上命令后,CE1與CE2之間的鏈路上不再有流量經(jīng)過,主平面的流量能夠一直保持在主平面轉(zhuǎn)發(fā)。另外,如果在AR上向CE下發(fā)明細路由也不會遇到這樣的問題。
----結(jié)束
案例總結(jié)
網(wǎng)絡部署時注意避免雙平面相互影響的隱患,比如ISIS的checksum-error問題,ospf cost值問題,ISIS的cost值問題等。
【編輯推薦】