CCNP:OSPF NSSA區(qū)域默認(rèn)路由發(fā)布引發(fā)的問(wèn)題
一、關(guān)鍵術(shù)語(yǔ)
OSPF,NSSA,METRIC類(lèi)型
二、設(shè)備類(lèi)型和版本
設(shè)備類(lèi)型 版本 備注
ZXR10 T128 與版本無(wú)關(guān)
ZXR10 T64G 與版本無(wú)關(guān)
三、網(wǎng)絡(luò)拓?fù)?/STRONG>
![]() |
組網(wǎng)介紹:
某省的NE80或T128都屬于OSPF骨干區(qū)域,每個(gè)地市都有一個(gè)獨(dú)立的NSSA區(qū)域,由該地市NE80或T128充當(dāng)該區(qū)域的ABR.按照規(guī)劃:核心NE80向整個(gè)OSPF域下發(fā)缺省路由;各地市ABR向所在NSSA區(qū)域下發(fā)缺省路由;另外,各地市的T64G由于特殊的原因也需要通告一條默認(rèn)路由(需要在ABR失效時(shí)候給其他設(shè)備通告默認(rèn)路由,做為備份,圖中沒(méi)有表示);
四、故障現(xiàn)象描述
運(yùn)營(yíng)商反映:A市,B市和D市的流量全部中斷,但C地市的業(yè)務(wù)都沒(méi)有問(wèn)題;問(wèn)題出現(xiàn)時(shí),出現(xiàn)故障的地市T128的缺省路由都指向了本市的核心交換機(jī)T64G。通過(guò)在三臺(tái)ABR上添加默認(rèn)路由指到骨干區(qū)域,故障得以恢復(fù);經(jīng)檢查,C地市之所以沒(méi)有出現(xiàn)故障是因?yàn)門(mén)128上配置了靜態(tài)的默認(rèn)路由;
五、處理方法
為什么出現(xiàn)問(wèn)題時(shí),作為ABR的NE80和T128,其默認(rèn)路由會(huì)指到T64G?讓我們先看一下做為ABR的T128以及T64G的配置是怎樣的:
T64G:
router ospf 1 |
注:OSPF協(xié)議并沒(méi)有規(guī)定NSSA內(nèi)部路由器不能發(fā)布缺省路由
T128:
T128-R1#sh run | be router ospf |
在故障恢復(fù)后,我們查看T128的database,發(fā)現(xiàn)了兩條默認(rèn)路由的LSA:
Type-5 AS External Link States LS age: 1493
LS age: 968 |
從上面的結(jié)果來(lái)看,核心NE80所發(fā)布的默認(rèn)路由LSA并沒(méi)有丟失,那為什么在故障發(fā)生時(shí),T128卻將默認(rèn)路由指向了T64G呢?經(jīng)過(guò)仔細(xì)比對(duì)兩條LSA,見(jiàn)上面紅色標(biāo)注部分:
核心NE80發(fā)布 T64G發(fā)布
LSA類(lèi)型 LSA 5 LSA 7
Metric Type 類(lèi)型2 類(lèi)型2
Metric 1000 1
發(fā)現(xiàn),兩個(gè)LSA的類(lèi)型不同,那個(gè)更優(yōu)先呢?經(jīng)過(guò)咨詢(xún)研發(fā),答案是沒(méi)有差別,優(yōu)先級(jí)一樣!那Metric Type又一樣,只有Metric不同,T64G發(fā)布的默認(rèn)路由的Metric更低;這就解釋了為什么T128的默認(rèn)路由指向了T64G!
但另外一個(gè)問(wèn)題隨之而來(lái),之前業(yè)務(wù)一切正常時(shí)候,T128的默認(rèn)為什么會(huì)指向骨干域呢?難道是核心NE80在故障發(fā)生時(shí)修改了配置?又或者核心NE80通告的默認(rèn)路由Metric發(fā)生了變化?根據(jù)已知的信息和局方溝通,局方排查網(wǎng)絡(luò)后,問(wèn)題原來(lái)另有原因:
實(shí)際上,在之前網(wǎng)絡(luò)一切正常的時(shí)候,T128上面應(yīng)該能看到三條LSA,除了上述兩條之外,還有一條:
Type-5 AS External Link States Routing Bit Set on this LSA |
原來(lái),作為A地市ABR的NE80之前也一直在通告默認(rèn)路由,我們不妨再將三條默認(rèn)路由的LSA做一下比較:
核心NE80發(fā)布 T64G發(fā)布 A地市NE80發(fā)布
LSA類(lèi)型 LSA 5 LSA 7 LSA 5
Metric Type 類(lèi)型2 類(lèi)型2 類(lèi)型1
Metric 1000 1 1000
經(jīng)過(guò)咨詢(xún)研發(fā),由于OSPF 外部路由引入類(lèi)型1要比類(lèi)型2優(yōu)先,因此之前各地市的默認(rèn)路由實(shí)際上是由A地市的NE80通告產(chǎn)生的,那為什么流量沒(méi)有因?yàn)樗偷紸地市NE80通告的默認(rèn)路由而繼續(xù)將數(shù)據(jù)發(fā)送到A地市的NE80呢?這是由現(xiàn)場(chǎng)的組網(wǎng)環(huán)境所決定的,由于其他地市ABR到達(dá)A地市NE80都要經(jīng)過(guò)省核心NE80,流量一旦到了核心NE80就直接走靜態(tài)默認(rèn)路由出去了,而不會(huì)送到宜春NE80;
當(dāng)天出現(xiàn)故障的時(shí)候,由于宜春NE80發(fā)生了異常,導(dǎo)致其宣告的默認(rèn)路由失效,因此才會(huì)導(dǎo)致故障的出現(xiàn);可見(jiàn),原先表面上看起來(lái)是正常工作的網(wǎng)絡(luò)實(shí)際上暗藏許多問(wèn)題。
目前,局方已經(jīng)將T64G上通告的默認(rèn)路由取消,NSSA區(qū)域內(nèi)部的冗余性改由其他方式提供;
當(dāng)然,也可以通過(guò)修改T64G上通告默認(rèn)路由的Metric值來(lái)規(guī)避故障(改大),但還是建議取消其通告的默認(rèn)路由
六、故障處理總結(jié)
1、用戶(hù)業(yè)務(wù)正常不代表網(wǎng)絡(luò)運(yùn)行正常;
2、合理的路由規(guī)劃非常重要;
3、故障出現(xiàn)時(shí),第一是恢復(fù)用戶(hù)業(yè)務(wù),其次才是查找故障原因;
七、備注
介紹下默認(rèn)路由的比較規(guī)則:
3型 > ext1 5/7 >ext2 5/7
如果ext-type 相同
metric 小的優(yōu)先
如果還區(qū)分不開(kāi)
nssa +p(7型) > ase(5型) >nssa no p(7型)
p是NSSA LSA上的是否翻譯的選項(xiàng)
關(guān)于ext-type(就是metric type),1型是骨干網(wǎng)上最經(jīng)常使用的,因?yàn)樗€能計(jì)算出OSPF區(qū)域內(nèi)部的cost值,為路由的靈活控制和優(yōu)化提供了可能;
另外,當(dāng)一個(gè)OSPF區(qū)域有兩個(gè)ASBR的時(shí)候,他們通告的默認(rèn)路由一定要保持ext-type一致。
【編輯推薦】