高端路由器設(shè)備可靠性能全解
高端路由器設(shè)備有很多值得學(xué)習(xí)的地方,這里我們主要介紹設(shè)備級可靠性技術(shù),包括介紹電源風(fēng)扇冗余、不間斷轉(zhuǎn)發(fā)技術(shù)NSF/GR等方面。隨著IP技術(shù)的飛速發(fā)展,各種增值業(yè)務(wù)在互聯(lián)網(wǎng)上得到了廣泛的應(yīng)用。新興的NGN/3G、IPTV流媒體、大客戶專線和VPN互聯(lián)等重要的電信級業(yè)務(wù),對IP電信網(wǎng)的可靠性提出了很高的要求。電信級業(yè)務(wù)對于IP網(wǎng)絡(luò)的可靠性主要包括三個層面:設(shè)備可靠性、鏈路可靠性和網(wǎng)絡(luò)可靠性。在承載網(wǎng)中,網(wǎng)絡(luò)設(shè)備的可用性要求達到99.999%,大致相當(dāng)于設(shè)備在一年的連續(xù)運行中因各種可能原因造成停機維護的時間少于5分鐘。高可靠性是電信級設(shè)備的基本要求,是電信運營商建設(shè)網(wǎng)絡(luò)的基本出發(fā)點。
設(shè)備級可靠性技術(shù)主要包括:
熱插拔技術(shù),是指在設(shè)備不關(guān)機運行時,直接插拔部件或單板,而不影響其他部件或單板的業(yè)務(wù)。熱插拔功能包括:往機框中新增或去掉單板而不影響在用單板;在線更換單板,即拔出單板換一塊新單板(或原單板重新插入)時,新單板能繼承原來的配置,并且不影響其他單板的工作。對于分布式設(shè)備,在添加或插拔單板時,F(xiàn)IB(Forwarding Information Base)表能同步到單板。華為NE系列高端路由器設(shè)備所有組件支持熱插拔功能,包括主控板、交換網(wǎng)板、電源、風(fēng)扇和各種業(yè)務(wù)單板。通過熱插拔功能,用戶可以在不影響業(yè)務(wù)的情況下,對組件進行維護更新,擴展更多業(yè)務(wù),增加更多用戶,提供更多的功能等。
電源風(fēng)扇冗余
電源是設(shè)備運行保障的基礎(chǔ)。一旦電源出現(xiàn)問題,設(shè)備將無法正常啟動,所以電源冗余是必需的。電源冗余包括電源輸入的冗余和設(shè)備電源模塊的冗余。為了保證設(shè)備電源輸入的穩(wěn)定,高端路由器設(shè)備一般提供雙路或多路電源輸入。當(dāng)一路電源輸入出現(xiàn)故障時,能自動切換到其他電源輸入,不影響設(shè)備正常運行。另外,高端路由器設(shè)備還采用多個電源模塊供電,采取N+1備份方式,一個電源模塊與其他N個電源模塊同時工作并為其提供備份,在某一個電源模塊出現(xiàn)故障時,其它電源立即分擔(dān)故障電源的負載,從而保證始終提供足夠的電源功率,保證設(shè)備正常運行。風(fēng)扇作為散熱的重要手段,對設(shè)備穩(wěn)定運行有著直接的影響。當(dāng)風(fēng)扇出現(xiàn)故障,如果不能及時散熱,設(shè)備內(nèi)部會產(chǎn)生高溫高熱,可能會發(fā)生芯片、板卡燒毀等現(xiàn)象。所以風(fēng)扇冗余也是非常重要的,高端路由器設(shè)備一般提供多個風(fēng)扇框,可以在線更換其中的風(fēng)扇框,不影響設(shè)備功能。
主控冗余
主控板MPU(Main Processing Unit)是整個路由器的核心,承擔(dān)整個系統(tǒng)的路由處理、資源管理、狀態(tài)監(jiān)測、網(wǎng)管代理等全局功能。一般還集成了三級時鐘、CF(Compact Flash)卡等功能模塊,有些設(shè)備的MPU甚至還包含了交換網(wǎng)模塊,為整個高端路由器設(shè)備提供交換平面。主控板冗余意味著同時也實現(xiàn)了時鐘冗余、存儲設(shè)備冗余和交換網(wǎng)冗余等功能,這里主要介紹主控冗余技術(shù)。
在設(shè)備只有單主控的情況下,如果主控板故障,重起主控板需要加載映象文件、初始化配置、重新注冊業(yè)務(wù)板,然后重建控制平面和轉(zhuǎn)發(fā)平面表項,整個過程需要耗費數(shù)分鐘的時間。這個時間對于電信網(wǎng)絡(luò)來說是無法忍受的,尤其是對于網(wǎng)絡(luò)中處于單點故障的節(jié)點來說更是如此,因為業(yè)務(wù)在這個過程中會完全中斷,將會造成巨大的損失。所以為了縮短主控重啟時間,減少業(yè)務(wù)中斷帶來的損失,高端路由器設(shè)備必須采用主控冗余技術(shù)。主控冗余是指設(shè)備提供兩塊主控板,互為備份。其中一塊為主用主控板(Master),處于工作狀態(tài),另一塊作為備用主控板(Slave),處于備份狀態(tài)。主用主控板運行過程中,將所有靜態(tài)配置信息和一部分動態(tài)信息備份到備用主控板,使得備用主控板具有和主用主控板相同的配置信息。當(dāng)主控板因為硬件或軟件失效出現(xiàn)故障時,備用主控板接管失效主控板的工作,重新啟動控制平面和管理平面工作,保證路由器在較短的時間內(nèi)能恢復(fù)正常。主用主控板(Master)與備用主控板(Slave)之間的切換檢測手段可以采用硬件心跳,也可以使用IPC通道或其他方式。
和單主控相比,雙主控的收斂性能要好得多。因為在雙主控情況下,Slave已經(jīng)預(yù)先完成映象文件的加載和配置的初始化工作,主備切換時業(yè)務(wù)板不需要重新注冊,二三層接口也不會出現(xiàn)up/down。另外,Slave上也已經(jīng)備份有轉(zhuǎn)發(fā)表項,可以立即承擔(dān)轉(zhuǎn)發(fā)任務(wù),在一定程度上可以避免業(yè)務(wù)中斷。
不過,由于新的Master在主備切換前不參與控制平面的處理,在切換后需要重新和鄰居進行會話協(xié)商,所以雖然保存了完整的轉(zhuǎn)發(fā)表項,但只能避免部分流量不中斷。比如,二層業(yè)務(wù)以及從本設(shè)備往外發(fā)送的流量不會中斷;另外,如果和鄰居之間配置的是靜態(tài)路由或靜態(tài)LSP的話,流量也不會中斷。但如果和鄰居之間是動態(tài)路由協(xié)議或動態(tài)標(biāo)簽分發(fā)協(xié)議,和鄰居之間的流量就會發(fā)生中斷,這是因為控制平面會話重置的情況下,鄰居的控制平面會重新計算,選擇它認為合適的路徑。以O(shè)SPF協(xié)議為例,新Master在發(fā)出的Hello報文中沒有原來鄰居的RID,會導(dǎo)致鄰居把OSPF會話狀態(tài)重置,并把和發(fā)生切換的高端路由器設(shè)備相關(guān)的LSA刪除,導(dǎo)致路由重新計算。如果有其他可選路徑,流量會繞開發(fā)生主備切換的設(shè)備,如果沒有可選路徑,則需要等待OSPF重新收斂,在收斂完成之前,鄰居不會把流量發(fā)給發(fā)生主備切換的高端路由器設(shè)備。
不間斷轉(zhuǎn)發(fā)技術(shù)NSF/GR
從以上分析中可以看出,路由器進行主備切換時,在路由協(xié)議層面會與鄰居之間發(fā)生震蕩。這種鄰居關(guān)系的震蕩將最終導(dǎo)致路由震蕩的出現(xiàn),使得主備切換路由器在一段時間內(nèi)出現(xiàn)路由黑洞或者導(dǎo)致鄰居將數(shù)據(jù)業(yè)務(wù)進行旁路,進而會導(dǎo)致業(yè)務(wù)出現(xiàn)暫時中斷。不間斷轉(zhuǎn)發(fā)NSF(None Stop Forwarding)是一項重要的高可靠性技術(shù),它可以保證路由器控制層面出現(xiàn)故障(如故障重啟或路由震蕩)時,數(shù)據(jù)轉(zhuǎn)發(fā)不間斷地正常進行,從而保護網(wǎng)絡(luò)各種流量幾乎不受影響。首先要求路由器具有分布式體系結(jié)構(gòu),數(shù)據(jù)轉(zhuǎn)發(fā)與控制分離,支持雙主控設(shè)計,在發(fā)生主備切換時,備板必須能成功保存IP/MPLS轉(zhuǎn)發(fā)表項(轉(zhuǎn)發(fā)平面)。
其次,根據(jù)需要,可能需要部分保存協(xié)議的狀態(tài)(控制平面)。對于OSPF、IS-IS、BGP、 LDP這些比較復(fù)雜的協(xié)議來說,完全備份其控制平面復(fù)雜的狀態(tài),從實現(xiàn)上來說代價太大或根本就不可行。相反,通過對目前的協(xié)議在盡量保持前向兼容的情況下進行一定程度的擴展,可以較為簡單的通過部分備份(或根本不用備份)協(xié)議狀態(tài),并借助鄰居高端路由器設(shè)備的幫助,實現(xiàn)發(fā)生主備切換時控制平面的會話連接不重置,轉(zhuǎn)發(fā)不中斷的目的。
這些實現(xiàn)控制層面不重置的技術(shù)統(tǒng)稱為路由協(xié)議的Graceful Restart擴展,簡稱GR。GR技術(shù)是避免在重啟主備倒換的時候鄰居關(guān)系發(fā)生震蕩(flap),一旦重啟后,重啟路由器盡快完成與鄰居路由器的路由信息的同步,然后更新本地路由信息。目前GR實現(xiàn)一般都需要鄰居路由器的協(xié)助(Helper),要求Helper能夠感知到鄰居發(fā)生GR,并能輔助鄰居完成GR,這樣對網(wǎng)絡(luò)中的Helper也提出很高的要求。目前具備GR能力的路由協(xié)議主要有OSPF、IS-IS、BGP、LDP等,雖然各個協(xié)議都有自己獨特的實現(xiàn),但基本原理是相似的。