網(wǎng)絡(luò)冗余設(shè)計中需要考慮的七個因素
譯文【51CTO.com快譯】當(dāng)網(wǎng)絡(luò)出現(xiàn)故障時,很多企業(yè)的業(yè)務(wù)就會中止。對于某些人來說,幾分鐘的停機(jī)時間無關(guān)緊要。對于那些業(yè)務(wù)面向客戶的企業(yè)來說,幾分鐘的停機(jī)時間意味著損失大量收入,甚至可能會失去客戶。對于這些企業(yè)來說,設(shè)計一個即使出現(xiàn)組件故障也能保持正常運行的網(wǎng)絡(luò)至關(guān)重要。
對于即使出現(xiàn)短暫的停機(jī)也會產(chǎn)生重大影響的企業(yè)來說,必須添加冗余設(shè)備,并簽訂冗余服務(wù)合同。但是添加網(wǎng)絡(luò)冗余設(shè)備將會增加成本和復(fù)雜性,因此必須對停機(jī)成本與添加設(shè)備和服務(wù)的成本進(jìn)行權(quán)衡。
以下是企業(yè)的網(wǎng)絡(luò)團(tuán)隊在網(wǎng)絡(luò)冗余設(shè)計時需要考慮的七個因素:
1.交換機(jī)和路由器
交換機(jī)和路由器通常非常可靠,但它們有時會出現(xiàn)故障。一些企業(yè)會在機(jī)架上保留一臺額外的交換機(jī)或路由器,這樣他們就可以快速更換出現(xiàn)故障的設(shè)備。而具有更關(guān)鍵需求的企業(yè)必須在網(wǎng)絡(luò)中啟動并運行冗余設(shè)備。
2.網(wǎng)絡(luò)協(xié)議
網(wǎng)絡(luò)標(biāo)準(zhǔn)機(jī)構(gòu)開發(fā)了網(wǎng)絡(luò)協(xié)議,可以在發(fā)生故障時快速切換到備份的設(shè)備。在第二層添加冗余時需要IT團(tuán)隊將多個交換機(jī)連接到每個子網(wǎng)段。
但這些冗余的交換機(jī)如在網(wǎng)絡(luò)中創(chuàng)建了多條路徑,可能導(dǎo)致網(wǎng)絡(luò)泛濫,每個數(shù)據(jù)包并產(chǎn)生多個副本。生成樹算法提供了一種確定通過網(wǎng)絡(luò)單條路徑的方法。不幸的是,生成樹可能需要將近一分鐘的時間才能確定一條新路徑。雖然此這一段時間對于某些網(wǎng)絡(luò)來說可能是可以接受的,但其他網(wǎng)絡(luò)需要更快速的恢復(fù)。
如今,已經(jīng)開發(fā)出多系統(tǒng)鏈路聚合(MLAG)、多鏈路透明互連(TRILL)和最短路徑橋接(SPB) 的新協(xié)議以支持更快的恢復(fù)。設(shè)計網(wǎng)絡(luò)冗余并需要更快恢復(fù)的網(wǎng)絡(luò)團(tuán)隊必須確定哪種選項更適合他們的網(wǎng)絡(luò)。
在網(wǎng)絡(luò)設(shè)計中添加冗余時不要忘記的七個因素
3.子網(wǎng)連接
添加冗余的下一步是子網(wǎng)連接。同樣,企業(yè)有必要在子網(wǎng)之間提供多條路徑。路由器將網(wǎng)絡(luò)內(nèi)的子網(wǎng)連接到外部目的地。每個子網(wǎng)必須連接到多個路由器以提供冗余。開放最短路徑優(yōu)先(OSPF)和增強(qiáng)型內(nèi)部網(wǎng)關(guān)路由協(xié)議(EIGRP)等協(xié)議定義了路由器如何相互通知到每個目的地的當(dāng)前最佳路徑。
路由器在幾秒鐘內(nèi)未收到來自該路由器的更新時,可以確定相鄰路由器已關(guān)閉。但是,開放最短路徑優(yōu)先(OSPF)和增強(qiáng)型內(nèi)部網(wǎng)關(guān)路由協(xié)議(EIGRP)都需要比某些網(wǎng)絡(luò)可以接受的更多時間來恢復(fù)。熱備用路由器協(xié)議(HSRP)和虛擬路由器冗余協(xié)議(VRRP)可用于減少從路由器故障中恢復(fù)所需的時間。
網(wǎng)絡(luò)連接斷開的原因有很多——例如,有人拔錯了線纜,或添加新線纜時連接松動,或者在移動設(shè)備時不小心碰到線纜。IEEE802.3ad鏈路聚合定義了如何將兩條網(wǎng)線用于單個連接。只要都已經(jīng)連接,就可以在兩條網(wǎng)線之間共享流量,但當(dāng)一條網(wǎng)線斷開連接時,其流量并不會中斷。
4.備份
導(dǎo)致數(shù)據(jù)丟失的磁盤故障會使企業(yè)的業(yè)務(wù)癱瘓。對于某些企業(yè)來說,每天備份一次就足夠了,而其他企業(yè)則無法接受一天的數(shù)據(jù)丟失和恢復(fù)所需的時間。
獨立磁盤冗余陣列(RAID)可防止一塊磁盤出現(xiàn)故障,并提供多種級別的保護(hù)。每一項數(shù)據(jù)都可以寫入兩塊不同的磁盤。更高的保護(hù)級別定義了添加額外磁盤和奇偶校驗信息的方法,這使IT團(tuán)隊能夠在應(yīng)該包含相同數(shù)據(jù)的兩個磁盤在不同的情況下恢復(fù)正確的數(shù)據(jù)。
連續(xù)云備份優(yōu)于最高的RAID級別,因為將每個數(shù)據(jù)更新發(fā)送到云中意味著不會丟失任何數(shù)據(jù)。單個RAID磁盤安裝在一臺機(jī)柜中,這意味著如果機(jī)柜受損可能會導(dǎo)致里面的磁盤損壞。與此同時,用戶仍然需要定期備份陣列,但最近一次備份后積累的數(shù)據(jù)可能會丟失。
5.處理器
處理器也會像其他組件一樣出現(xiàn)故障,因此在網(wǎng)絡(luò)冗余設(shè)計中也要考慮出現(xiàn)故障的可能性,處理器還必須為最新的系統(tǒng)軟件版本定期更新。企業(yè)需要有足夠的額外處理器資源來保證網(wǎng)絡(luò)的連續(xù)運行。
將所有處理和存儲工作移至公共云可以簡化冗余設(shè)計任務(wù)。云平臺中有很多處理器和存儲單元,如果應(yīng)用程序發(fā)生故障可以快速移動到另一個處理器進(jìn)行處理,并且可以配置冗余存儲。如果發(fā)生某個事件導(dǎo)致整個設(shè)施關(guān)閉,則處理過程可能會轉(zhuǎn)移到其他的云計算基礎(chǔ)設(shè)施。
6.電源
顯然,IT設(shè)備沒有電源就無法工作,由于暴風(fēng)雨、電線桿被汽車撞倒或其他突生事件,數(shù)據(jù)中心的電力可能會中斷。發(fā)生故障時,數(shù)據(jù)中心的備用電源可以快速接管,對于大型數(shù)據(jù)中心設(shè)施來說,需要配備適當(dāng)?shù)腢PS電源。
由于切換到柴油發(fā)電機(jī)需要一些時間,但如果停電的持續(xù)時間超過UPS電源的電池容量,可以啟動備用柴油發(fā)電機(jī)為負(fù)載提供電力。在某些情況下,數(shù)據(jù)中心還可以連接兩條不同的電力線路,以防止其中一條電力線路損壞而斷電。
7.廣域網(wǎng)和SD-WAN
WAN連接一直很重要,但云計算的增長和遠(yuǎn)程用戶的重要性使得WAN的可靠性變得越來越重要。企業(yè)的一種選擇是獲得與兩家不同網(wǎng)絡(luò)服務(wù)提供商的連接。雖然這會增加運營費用,但它可以防止連接到網(wǎng)絡(luò)服務(wù)提供商的鏈路發(fā)生故障以及提供商網(wǎng)絡(luò)內(nèi)的故障。
軟件定義WAN(SD-WAN)提供了一種額外的方式來添加網(wǎng)絡(luò)冗余。多協(xié)議標(biāo)簽交換(MPLS)線路非常可靠,可以保證指定的服務(wù)質(zhì)量(QoS)水平,但它們也可能出現(xiàn)故障。SD-WAN控制器可以在發(fā)生故障時將流量切換到公共互聯(lián)網(wǎng)。公共互聯(lián)網(wǎng)并不提供相同級別的可靠性或服務(wù)質(zhì)量(QoS)保證,但它提供了一種將數(shù)據(jù)傳送到目的地的方法。SD-WAN的另一個優(yōu)勢是它可以在負(fù)載峰值期間將不太重要的流量轉(zhuǎn)移到公共互聯(lián)網(wǎng),而不是促使IT團(tuán)隊訂購最高的MPLS帶寬水平。
添加冗余設(shè)備將會增加費用和復(fù)雜性,網(wǎng)絡(luò)設(shè)計人員不應(yīng)設(shè)計超過必要的網(wǎng)絡(luò)冗余,但也不能設(shè)計低于要求的網(wǎng)絡(luò)冗余,因為即使是短暫的中斷也可能決定業(yè)務(wù)的成敗。
原文標(biāo)題:7 factors to consider in network redundancy design,作者:David Jacobs
【51CTO譯稿,合作站點轉(zhuǎn)載請注明原文譯者和出處為51CTO.com】