自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

構(gòu)建高可用的廣域網(wǎng)絡(luò)

網(wǎng)絡(luò) 網(wǎng)絡(luò)優(yōu)化 網(wǎng)絡(luò)運(yùn)維
隨著網(wǎng)絡(luò)的快速普及和應(yīng)用的日益深入,各種核心及增值業(yè)務(wù)在網(wǎng)絡(luò)廣泛部署,網(wǎng)絡(luò)與業(yè)務(wù)的結(jié)合越來越深入。因此,短時間的網(wǎng)絡(luò)中斷將可能影響核心業(yè)務(wù)處理,給企業(yè)帶來巨大損失。在這種背景下,從運(yùn)營商到各種類型的企業(yè)客戶,在構(gòu)建生產(chǎn)網(wǎng)絡(luò)(production network)時,5個9的網(wǎng)絡(luò)可用性(一年中不能提供服務(wù)的時間在5分鐘左右),已經(jīng)成為通常建網(wǎng)的追求。但在實際的網(wǎng)絡(luò)建設(shè)中,由于影響網(wǎng)絡(luò)系統(tǒng)可用性的因素眾多,往往很難滿足這一理論目標(biāo),其中尤其以廣域網(wǎng)的高可用性最難控制。

【51CTO.com綜合報道】構(gòu)建高可用性網(wǎng)絡(luò)是一個復(fù)雜的系統(tǒng)工程,如何不斷向著5個9的目標(biāo)邁進(jìn),是所有網(wǎng)絡(luò)產(chǎn)品和解決方案提供者和使用者所面臨的永恒課題。

隨著網(wǎng)絡(luò)的快速普及和應(yīng)用的日益深入,各種核心及增值業(yè)務(wù)在網(wǎng)絡(luò)廣泛部署,網(wǎng)絡(luò)與業(yè)務(wù)的結(jié)合越來越深入。因此,短時間的網(wǎng)絡(luò)中斷將可能影響核心業(yè)務(wù)處理,給企業(yè)帶來巨大損失。在這種背景下,從運(yùn)營商到各種類型的企業(yè)客戶,在構(gòu)建生產(chǎn)網(wǎng)絡(luò)(production network)時,5個9的網(wǎng)絡(luò)可用性(一年中不能提供服務(wù)的時間在5分鐘左右),已經(jīng)成為通常建網(wǎng)的追求。但在實際的網(wǎng)絡(luò)建設(shè)中,由于影響網(wǎng)絡(luò)系統(tǒng)可用性的因素眾多,往往很難滿足這一理論目標(biāo),其中尤其以廣域網(wǎng)的高可用性最難控制。

度量網(wǎng)絡(luò)的可用性

首先,高可用的網(wǎng)絡(luò)肯定不能頻繁出現(xiàn)故障。IP承載網(wǎng)即使只出現(xiàn)很短時間的中斷,都會影響業(yè)務(wù)運(yùn)營,特別是時性強(qiáng)、對丟包和時延敏感的業(yè)務(wù),如語音、視頻和在線游戲等。

其次,高可用性的網(wǎng)絡(luò)即使出現(xiàn)故障,也應(yīng)該能很快恢復(fù)。如果一個網(wǎng)絡(luò)一年僅出一次故障,但這次故障需要幾個小時,甚至幾天才能恢復(fù),那么這個網(wǎng)絡(luò)也算不上一個高可用的網(wǎng)絡(luò)。

故障次數(shù)少、恢復(fù)時間短兩個特征基本概括了高可用網(wǎng)絡(luò)的特點(diǎn),再加入統(tǒng)計學(xué)的概念,就可以用“可靠性(Availability)”這一參數(shù)來度量網(wǎng)絡(luò)的可用性:

MTBF:平均無故障時間(Mean Time Between Failures)

MTTR:平均修復(fù)時間(Mean Time To Repair)                

可見,如果要提高網(wǎng)絡(luò)可用性,提高M(jìn)TBF或者降低MTTR都是有效的方法。MTBF取決于網(wǎng)絡(luò)設(shè)備硬件和軟件本身的質(zhì)量,而這一手段的作用是有極限的,無法一味的通過提高M(jìn)TBF數(shù)值來獲得高可用性,因此通過減小MTTR來實現(xiàn)網(wǎng)絡(luò)高可靠性成為必然的選擇。

從MTTR的構(gòu)成來看,要想減小其數(shù)值需要從兩方面入手,一是以最快的速度發(fā)現(xiàn)故障,二是快速從故障狀態(tài)中恢復(fù)出來。因此構(gòu)建高可靠性網(wǎng)絡(luò)的基礎(chǔ)就是要實現(xiàn)快速故障檢測和快速故障恢復(fù)。

在實際的網(wǎng)絡(luò)運(yùn)行環(huán)境下,依靠以上的理論公式很難精確計算,因此網(wǎng)絡(luò)采用更具實際意義的工程經(jīng)驗公式來表示網(wǎng)絡(luò)系統(tǒng)的可用性,舉例來說:

某企業(yè)共n個分支節(jié)點(diǎn),為5000用戶提供7*24接入,分支3在3月份網(wǎng)絡(luò)中斷10分鐘,分支9在同月網(wǎng)絡(luò)中斷5分鐘,現(xiàn)計算三月份的網(wǎng)絡(luò)可用性:

#p#

網(wǎng)絡(luò)高可用設(shè)計框架

構(gòu)建高可用性網(wǎng)絡(luò)是一個復(fù)雜的系統(tǒng)工程,必須從多方面入手,不僅要提升網(wǎng)元本身可用性,同時要縮短故障發(fā)生后的恢復(fù)時間。系統(tǒng)性的來看,在網(wǎng)絡(luò)規(guī)劃和設(shè)計階段如圖1所示。

圖1 高可用網(wǎng)絡(luò)設(shè)計架構(gòu)圖

網(wǎng)絡(luò)組件:網(wǎng)絡(luò)組件是構(gòu)成網(wǎng)絡(luò)系統(tǒng)的基本元素,核心的網(wǎng)絡(luò)組件完成網(wǎng)絡(luò)的基本連接,數(shù)據(jù)包的路由轉(zhuǎn)發(fā),典型代表為各種交換機(jī)、路由器等網(wǎng)絡(luò)設(shè)備。網(wǎng)絡(luò)組件的可用性是決定整個網(wǎng)絡(luò)系統(tǒng)可用性的關(guān)鍵,因此在網(wǎng)絡(luò)設(shè)計時這部分內(nèi)容往往是最優(yōu)先考慮的部分。

網(wǎng)絡(luò)架構(gòu):網(wǎng)絡(luò)架構(gòu)表明了網(wǎng)絡(luò)組件的連接關(guān)系,不同的連接方式影響到網(wǎng)絡(luò)系統(tǒng)可用性的計算方法選擇。對于廣域網(wǎng)鏈路,雖然單條鏈路會受各種自然條件的限制,但良好的拓?fù)湓O(shè)計可以最大程度的彌補(bǔ)這一不足。

網(wǎng)絡(luò)協(xié)議與配置:僅僅關(guān)注物理聯(lián)通的網(wǎng)絡(luò)可用性是無意義的,一個完善的網(wǎng)絡(luò)系統(tǒng)會部署大量的邏輯協(xié)議,如路由、鏈路檢測、VPN隧道等等,這些協(xié)議的部署也影響著網(wǎng)絡(luò)系統(tǒng)的可用性,尤其是對于網(wǎng)絡(luò)業(yè)務(wù)的快速回復(fù)方面。

網(wǎng)絡(luò)運(yùn)維:由于各種因素影響,網(wǎng)絡(luò)故障總是難免發(fā)生的,在發(fā)生事故時,高素質(zhì)的運(yùn)維水平,可以使影響范圍和恢復(fù)時間縮小到最小范圍,彌補(bǔ)對業(yè)務(wù)造成的影響,因此網(wǎng)絡(luò)的運(yùn)維對整體的高可用性至關(guān)重要。

網(wǎng)絡(luò)基礎(chǔ)支撐:網(wǎng)絡(luò)設(shè)備的運(yùn)行環(huán)境為網(wǎng)絡(luò)系統(tǒng)的正常運(yùn)轉(zhuǎn)提供電力、空調(diào)、防雷等各種支撐,良好的基礎(chǔ)支撐可以進(jìn)一步提升整體網(wǎng)絡(luò)的可用性。

針對廣域網(wǎng)我們著重強(qiáng)調(diào)前三個方面的設(shè)計考慮,并不是說其他方面不重要,只不過這些內(nèi)容不是本文的重點(diǎn)而已。 #p#

廣域網(wǎng)網(wǎng)絡(luò)組件的高可用設(shè)計

網(wǎng)絡(luò)組件的高可用設(shè)計硬件結(jié)構(gòu)的高可用和軟件系統(tǒng)的高可用兩個層面。其結(jié)構(gòu)如圖2所示。

 

圖2 網(wǎng)絡(luò)組件高可用設(shè)計架構(gòu)圖

硬件高可用性主要技術(shù)點(diǎn)

主控冗余

主控冗余在控制和轉(zhuǎn)發(fā)分離的架構(gòu)下才能發(fā)揮最大的效用。在控制和轉(zhuǎn)發(fā)分離的架構(gòu)中,控制平面負(fù)責(zé)各種協(xié)議,如路由協(xié)議(如RIP/OSPF/IS-IS/BGP)、標(biāo)簽分發(fā)協(xié)議(如LDP/RSVP-TE/BGP)等的處理,形成路由信息表(RIB)和標(biāo)簽信息表(LIB),從中選擇最優(yōu)者,加上必要的二層信息,形成路由轉(zhuǎn)發(fā)信息表(FIB)和標(biāo)簽轉(zhuǎn)發(fā)信息表(LFIB),下發(fā)到轉(zhuǎn)發(fā)平面,轉(zhuǎn)發(fā)平面據(jù)此實現(xiàn)快速轉(zhuǎn)發(fā)??刂破矫娴奶幚碓谥骺匕迳线M(jìn)行,轉(zhuǎn)發(fā)平面的處理在業(yè)務(wù)板上。這樣,即使控制平面出現(xiàn)故障,轉(zhuǎn)發(fā)平面的轉(zhuǎn)發(fā)表項的內(nèi)容在短時間內(nèi)不會失效,因此可以繼續(xù)轉(zhuǎn)發(fā)數(shù)據(jù)而不會出現(xiàn)問題(如環(huán)路)。當(dāng)然,控制平面必須能快速恢復(fù)并重新和鄰居建立協(xié)議會話,收斂后再對轉(zhuǎn)發(fā)平面進(jìn)行檢查,對表項作必要更新,刪除在新的會話環(huán)境下不再正確的轉(zhuǎn)發(fā)表項。主控冗余是指設(shè)備配置兩塊主控板,互為備份,一塊為Master,另一塊備用,稱為Slave。只有Master進(jìn)行控制平面的處理,并生成轉(zhuǎn)發(fā)表項。Slave上的映像文件雖然也充分啟動,配置也從Master實時備份,但Slave不參與控制平面的處理。Master轉(zhuǎn)發(fā)平面的各種表項會以實時增量備份和定期完整備份相結(jié)合的方式持續(xù)備份到Slave上。雖然Slave上的控制平面對網(wǎng)絡(luò)狀況一無所知,但由于其在轉(zhuǎn)發(fā)平面上和Master同步,基本能反映當(dāng)時的網(wǎng)絡(luò)轉(zhuǎn)發(fā)狀態(tài),因此隨時可以替換Master承擔(dān)起轉(zhuǎn)發(fā)任務(wù),這就是轉(zhuǎn)發(fā)和控制分離帶來的效果。

設(shè)備實時檢測Master是否正常工作,檢測手段可以是檢測主備板之間的硬件心跳,也可以使用IPC通道或用其他方式進(jìn)行檢測。一旦發(fā)現(xiàn)Master異常,立即啟動主備切換,由Slave接管Master的工作,Master和Slave的角色互換。和單主控相比,雙主控的收斂性能要好得多,因為在雙主控情況下,Slave已經(jīng)預(yù)先完成映象文件的加載和配置的初始化工作,主備切換時業(yè)務(wù)板不需要重新注冊,二三層接口也不會出現(xiàn)up/down。另外,因為Slave上已經(jīng)備份有轉(zhuǎn)發(fā)表項,可以立即承擔(dān)轉(zhuǎn)發(fā)任務(wù),在一定程度上可以避免業(yè)務(wù)中斷。

不過,因為新的Master在主備切換前不參與控制平面的處理,切換后需要重新和鄰居進(jìn)行會話協(xié)商,所以雖然保存了完整的轉(zhuǎn)發(fā)表項,但只能避免部分流量不中斷,如二層以及從本設(shè)備往外發(fā)送的流量;如果和鄰居之間配置的是靜態(tài)路由或靜態(tài)LSP的話,鄰居會繼續(xù)向進(jìn)行主備倒換的設(shè)備發(fā)送流量,流量也不會中斷。但如果和鄰居之間是動態(tài)路由協(xié)議或動態(tài)標(biāo)簽分發(fā)協(xié)議,則和鄰居之間的流量會中斷,這是因為在控制平面會話重置的情況下,鄰居的控制平面會重新計算,選擇它認(rèn)為合適的路徑。以O(shè)SPF協(xié)議為例,新Master在發(fā)出的Hello報文中沒有原來鄰居的RID,會導(dǎo)致鄰居把OSPF會話狀態(tài)重置,并把和發(fā)生切換的設(shè)備相關(guān)的LSA刪除,導(dǎo)致路由重新計算。如果有其他可選路徑的話,流量會繞開主備切換的設(shè)備;如果沒有可選路徑,則需要等待OSPF重新收斂,在重新收斂之前,鄰居不會把流量發(fā)給該設(shè)備。

主備切換的前提條件,是檢測到Master故障。在Master故障但沒有被檢測到的時間內(nèi),會導(dǎo)致報文丟失。其次,主備切換期間也會丟一部分報文。最后,主備切換完成后,設(shè)備需要和和鄰居重建協(xié)議會話,這也需要一定時間。總的來說,主備切換的收斂時間為:Master故障檢測時間+切換時間+信令收斂時間。

單板熱插拔

單板熱插拔,是指在設(shè)備正常運(yùn)行時,在線插拔單板,而不影響其他單板的業(yè)務(wù)。一般的中高端機(jī)架式設(shè)備,均支持單板熱插拔。單板熱插拔功能包括:

往機(jī)框中新增單板不影響在線的單板業(yè)務(wù);

可在線更換單板(即拔出老單板換一塊新單板或老板重新插入時,新單板能繼承原來的配置,并且不影響其他單板的工作;

對于分布式設(shè)備,在添加或插拔單板時,F(xiàn)IB表能同步到單板。

單板熱插拔和跨板的鏈路捆綁技術(shù)相結(jié)合,一定程度上提供了單板間的1:N備份功能。

單板熱插拔的收斂時間不好衡量,就以配置繼承和生效為例,收斂時間和配置的類型及配置的多少有極大的關(guān)系。如果和鏈路捆綁結(jié)合,收斂時間還和鏈路捆幫的收斂時間相關(guān)。

電源風(fēng)扇冗余

為了保證設(shè)備電源收入的穩(wěn)定,中高端設(shè)備一般提供雙路電源輸入,當(dāng)一路輸入出現(xiàn)故障時,能自動切換到另一路,不影響設(shè)備功能。另外,中高端設(shè)備一般通過多個電源模塊供電,采取1:N備份方式,一個電源模塊為其他N個提供備份,在拔出某一個電源模塊時,其他模塊能提供足夠電源功率。

風(fēng)扇作為散熱的重要手段,中高端設(shè)備也提供風(fēng)扇冗余,一般提供多個風(fēng)扇框,可以在線更換其中的風(fēng)扇框,不影響產(chǎn)品功能。

電源和風(fēng)扇的切換和更換不應(yīng)該影響產(chǎn)品的轉(zhuǎn)發(fā)功能,可以認(rèn)為其收斂時間為0。

軟件系統(tǒng)高可用性主要技術(shù)點(diǎn)

動態(tài)熱補(bǔ)丁

1.熱補(bǔ)丁原理

補(bǔ)丁是計算機(jī)軟件系統(tǒng)和軟件工程學(xué)中的一個術(shù)語,一般是為了對系統(tǒng)中的某些錯誤進(jìn)行修正而發(fā)布的獨(dú)立的軟件單元。它能夠在不影響系統(tǒng)正常運(yùn)行的情況下完成對系統(tǒng)錯誤的修正,也就是對系統(tǒng)進(jìn)行動態(tài)升級。

其基本原理就是在系統(tǒng)中保留一段內(nèi)存空間,將新的函數(shù)實體以補(bǔ)丁文件的方式加載其中,根據(jù)要被替換函數(shù)的入口地址找到被替換函數(shù)的第一條執(zhí)行指令,將其改為一條跳轉(zhuǎn)指令,跳轉(zhuǎn)地址為新函數(shù)的入口地址;這樣當(dāng)其他函數(shù)要調(diào)用被替換函數(shù)時,CPU根據(jù)跳轉(zhuǎn)指令就會執(zhí)行新的函數(shù)實體。

2.熱補(bǔ)丁狀態(tài)轉(zhuǎn)換

各廠商實現(xiàn)熱補(bǔ)丁的基本原理大體相同,但具體實現(xiàn)上有一定差別。下面以H3C公司熱補(bǔ)丁技術(shù)為例簡單介紹狀態(tài)機(jī)轉(zhuǎn)換和各狀態(tài)的作用。

補(bǔ)丁存在四種狀態(tài):

空閑(IDLE):初始狀態(tài),補(bǔ)丁沒有被加載

去激活(DEACTIVE):補(bǔ)丁已經(jīng)加載,但未被激活

激活(ACTIVE):補(bǔ)丁處于試運(yùn)行狀態(tài)

運(yùn)行(RUNNING):補(bǔ)丁處于正式運(yùn)行狀態(tài)

激活態(tài)與運(yùn)行態(tài)的最大區(qū)別在于系統(tǒng)重啟后,激活態(tài)的補(bǔ)丁轉(zhuǎn)換為去激活態(tài),不再發(fā)揮作用,而運(yùn)行態(tài)的補(bǔ)丁在系統(tǒng)重啟后仍然保持為運(yùn)行態(tài),繼續(xù)發(fā)揮作用。補(bǔ)丁的激活態(tài)主要是提供一個緩沖帶,以防止因為補(bǔ)丁錯誤而導(dǎo)致系統(tǒng)連續(xù)運(yùn)行故障。補(bǔ)丁的狀態(tài)只有在用戶命令的干預(yù)下才會發(fā)生切換,命令與補(bǔ)丁狀態(tài)的切換關(guān)系如圖3所示

圖3 命令與補(bǔ)丁狀態(tài)切換關(guān)系#p#

廣域網(wǎng)網(wǎng)絡(luò)架構(gòu)高可用設(shè)計

物理拓?fù)鋵W(wǎng)絡(luò)可用性的影響

物理拓?fù)涞倪B接狀況決定了網(wǎng)絡(luò)可用性的計算方法。如圖4所示,f1和f2是網(wǎng)絡(luò)設(shè)備自身的可用性指標(biāo),當(dāng)網(wǎng)絡(luò)設(shè)備串行連接時,其組成的部分網(wǎng)絡(luò)系統(tǒng)的計算為兩設(shè)備可靠性指標(biāo)相乘;當(dāng)網(wǎng)絡(luò)設(shè)備并行連接時,其組成部分網(wǎng)絡(luò)系統(tǒng)的計算為1減去設(shè)備可靠性指標(biāo)相乘后的反值。多條鏈路對網(wǎng)絡(luò)可用性的提升是顯而易見的,但對于廣域網(wǎng)來說,鏈路資源是非常寶貴的,因此實際的部署方案是結(jié)合具體情況綜合考慮的結(jié)果。

圖4 不同拓?fù)溥B接方式的可用性計算方法

在條件允許的情況,一般都選用雙點(diǎn)雙歸的拓?fù)溥B接方式。其可用性指標(biāo)對比如表1所示:

表1 不同拓?fù)溥B接方式的典型可用性計算值#p#

廣域網(wǎng)路由協(xié)議部署高可用設(shè)計

廣域網(wǎng)網(wǎng)絡(luò)協(xié)議基本以路由協(xié)議為主,同時根據(jù)廣域網(wǎng)拓?fù)溥B接和鏈路種類,會附加部署不同的鏈路檢測協(xié)議。以典型的金融雙中心網(wǎng)絡(luò)為例,如圖5所示

 

圖5 金融雙中心網(wǎng)絡(luò)路由部署示意圖

設(shè)計原則:路由的高可用設(shè)計和所選擇的鏈路種類息息相關(guān),對于大型分支之間鏈路連接一般選用高帶寬的SDH鏈路,鏈路的穩(wěn)定性較高,很少出現(xiàn)閃斷和震蕩的情況,而且分支之間作為骨干鏈路,承載著主要的業(yè)務(wù)流量,需要非常靈活的流量控制策略,因此可部署eBGP協(xié)議;對于小型分支與總部互聯(lián)這種情況,鏈路種類復(fù)雜,鏈路狀況不穩(wěn)定,因此在部署收斂時間相對較快的路由協(xié)議(如OSPF)時,通常會啟用BFD、NQA等輔助協(xié)議,完成對鏈路狀況的檢測,以提高路由協(xié)議的收斂速度。

結(jié)束語

構(gòu)建高可用性廣域網(wǎng)絡(luò),需要從網(wǎng)絡(luò)組件、網(wǎng)絡(luò)架構(gòu)、網(wǎng)絡(luò)協(xié)議部署、網(wǎng)絡(luò)運(yùn)維及網(wǎng)絡(luò)基礎(chǔ)支撐等方面全盤考慮,所涉及的內(nèi)容及其豐富。本文僅針對前三個部分進(jìn)行部分重點(diǎn)的框架性描述,具體實踐還要根據(jù)不同的網(wǎng)絡(luò)使用場景做有針對性的部署。

責(zé)任編輯:林琳 來源: 51CTO.com
相關(guān)推薦

2016-07-23 14:06:31

SDN廣域網(wǎng)解決方案

2011-05-05 10:56:18

深信服廣域網(wǎng)加速

2012-03-22 10:32:30

VoIP廣域網(wǎng)

2011-09-29 10:52:44

廣域網(wǎng)虛擬網(wǎng)絡(luò)

2011-11-03 09:23:54

深信服宏圖三胞廣域網(wǎng)優(yōu)化

2010-12-02 10:33:52

廣域網(wǎng)加速深信服海關(guān)

2015-10-19 11:37:04

物聯(lián)網(wǎng)廣域網(wǎng)低功耗

2016-08-26 12:45:31

華為廣域網(wǎng)敏捷廣域

2010-11-23 14:41:24

2010-04-27 14:06:57

廣域網(wǎng)優(yōu)化思博

2018-10-07 23:27:03

2016-10-11 15:14:11

廣域網(wǎng)企業(yè)廣域網(wǎng)企業(yè)級

2010-02-03 15:11:33

2015-07-02 09:42:51

軟件定義軟件定義廣域網(wǎng)

2015-11-19 09:58:47

藍(lán)牙ZigBee低功耗廣域網(wǎng)絡(luò)

2022-05-09 08:00:00

5G廣域網(wǎng)數(shù)字化轉(zhuǎn)型

2022-06-02 12:56:25

容器網(wǎng)絡(luò)云原生

2009-06-24 15:20:00

廣域網(wǎng)優(yōu)化應(yīng)用

2011-08-29 10:08:09

2012-01-11 09:28:35

網(wǎng)絡(luò)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號