S12500全面打造數(shù)據(jù)中心級的可靠性
【51CTO.com 綜合報道】對數(shù)據(jù)中心使用的交換機而言,高可靠性毋庸置疑是一項基本需求,設(shè)備中所有功能和特性都是建立于可靠性基礎(chǔ)之上的,脫離高可靠性而談其他特性,就像建在沙子上面高樓,好看不實用。一個缺乏高可靠性設(shè)計的網(wǎng)絡(luò)系統(tǒng),輕則使得維護工作量增加,重則帶來巨大的經(jīng)濟損失和政治影響。
尤其在當今,互聯(lián)網(wǎng)已滲透到社會中各個領(lǐng)域的時代中,網(wǎng)絡(luò)是否穩(wěn)定可用,決定著生產(chǎn)業(yè)務(wù)是否可以有序的進行,特別是IT系統(tǒng)的核心位置--數(shù)據(jù)中心的網(wǎng)絡(luò)設(shè)備,高可靠性更是必須重點考慮的特性。
那么面對數(shù)據(jù)量飛漲和服務(wù)質(zhì)量要求不斷提升的現(xiàn)狀,數(shù)據(jù)中心級的設(shè)備究竟應該具備怎樣的高可靠性?在這一點上,H3C于今年發(fā)布的國內(nèi)首款基于100G平臺的數(shù)據(jù)中心級核心交換機S12500,全力打造數(shù)據(jù)中心的高可靠性,給我們提供了有力的參考依據(jù)。
不丟包——可靠性“最高境界”
要弄清楚網(wǎng)絡(luò)設(shè)備應該具備怎樣的高可靠性,我們首先要明確網(wǎng)絡(luò)的可靠性應該如何衡量。H3C網(wǎng)絡(luò)產(chǎn)品線副總裁孫德和介紹,一個令人放心的網(wǎng)絡(luò)首先不能頻繁出現(xiàn)故障,IP承載網(wǎng)即使只出現(xiàn)很短時間的中斷,都會影響業(yè)務(wù)運營,特別是時性強、對丟包和時延敏感的業(yè)務(wù),如語音、視頻和在線游戲等。其次,高可靠性的網(wǎng)絡(luò)即使出現(xiàn)故障,也應該能很快恢復。如果一個網(wǎng)絡(luò)一年僅出一次故障,但這次故障需要幾個小時,甚至幾天才能恢復,那么這個網(wǎng)絡(luò)也算不上一個高可靠的網(wǎng)絡(luò)。
因此,故障次數(shù)少、恢復時間短兩個特征是高可靠性網(wǎng)絡(luò)的重要特點,我們一般用平均無故障時間(MTBF:Mean Time Between Failures)和平均修復時間(MTTR:Mean Time To Repair)這兩個概念來對其分別加以對應。也就是說,如果要提高網(wǎng)絡(luò)的可靠性,一方面要提高網(wǎng)絡(luò)設(shè)備硬件和軟件本身的質(zhì)量,另一方面,以最快的速度發(fā)現(xiàn)故障,并快速從故障狀態(tài)中恢復出來,從而減小MTTR來實現(xiàn)網(wǎng)絡(luò)高可靠性。
但孫德和強調(diào),無論是提高MTBF或者降低MTTR,都無法完全保證網(wǎng)絡(luò)不出現(xiàn)任何故障,對于網(wǎng)絡(luò)可靠性的“終極目標”來說,要讓用戶對網(wǎng)絡(luò)系統(tǒng)徹底放心,只有實現(xiàn)數(shù)據(jù)轉(zhuǎn)發(fā)的丟包率實現(xiàn)“0”,才能讓系統(tǒng)能夠始終保持穩(wěn)定,保證業(yè)務(wù)的連續(xù)性。這是網(wǎng)絡(luò)可靠性的“最高境界”,也是所有網(wǎng)絡(luò)設(shè)備力求達到的目標。
提高可靠性“三條大道”
明確了網(wǎng)絡(luò)可靠性衡量標準,那么具體到網(wǎng)絡(luò)設(shè)備而言,究竟要朝哪些方向努力,才能盡可能得到更高的可靠性衡量值呢?作為IP網(wǎng)絡(luò)領(lǐng)軍者的H3C在這個問題上,有著十分明確而嚴格的答案。H3C網(wǎng)絡(luò)產(chǎn)品線副總裁孫德和表示,要想提高網(wǎng)絡(luò)設(shè)備的高可靠性,主要需要圍繞著以下四個方面來展開。
首先是網(wǎng)絡(luò)架構(gòu)的高可靠性,一個普通的二、三層網(wǎng)絡(luò)和一個虛擬化網(wǎng)絡(luò)架構(gòu)相比,其整體的可靠性、可用性是有天壤之別的。S12500作為網(wǎng)絡(luò)核心,其組網(wǎng)形式?jīng)Q定了整個網(wǎng)絡(luò)的基礎(chǔ)架構(gòu)。目前包括S12500在內(nèi)的H3C全系列交換機都支持IRF2虛擬化特性,通過IRF2架構(gòu)一個全新的虛擬化網(wǎng)絡(luò),不僅擴展了設(shè)備的端口數(shù)量和交換能力,提高了的可擴展性和可管理性,更是大大增強了整個網(wǎng)絡(luò)的可靠性、可用性。
其次是單設(shè)備的高可靠性,主要是指網(wǎng)絡(luò)設(shè)備在系統(tǒng)設(shè)計和硬件架構(gòu)上具備整體的高可靠能力,具備硬件的物理可靠性和系統(tǒng)部件的冗余能力,面對復雜環(huán)境能保持“不壞金身”,S12500產(chǎn)品在設(shè)計之初就旨在給客戶提供數(shù)據(jù)中心級的高可靠保證,各個關(guān)鍵部件都支持1+1,甚至N+M的冗余。。另一方面,S12500系列交換機采用創(chuàng)新的交換矩陣與路由引擎相分離的多級交換架構(gòu),路由引擎1+1冗余,專用于系統(tǒng)控制和協(xié)議計算,交換矩陣N+1冗余,專用于數(shù)據(jù)轉(zhuǎn)發(fā)。把交換機最重要的兩個關(guān)鍵部分硬件分離,各司其職,避免相互影響,整個系統(tǒng)可靠性極高。
第三是設(shè)備的軟件可靠特性,S12500通過BFD高可靠檢測技術(shù)可以和VRRP/RIP/OSPF/ISIS/BGP等網(wǎng)絡(luò)協(xié)議聯(lián)動,支持IP FRR、MPLS TE FRR,均實現(xiàn)50ms的快速收斂;同時S12500還支持NSF技術(shù)、GR技術(shù)以及物理層和鏈路層高可靠性技術(shù),使得S12500能為各種復雜業(yè)務(wù)提供保障。
最后是軟件維護的高可靠性,主要是指設(shè)備在軟件bug修復或者版本升級過程中,不會影響到設(shè)備的正常運行,在保證軟件正常升級的同時,確保設(shè)備運行的穩(wěn)定性,提高軟件維護的易用性。在S12500的可靠性特性中,就是通過在線熱補丁技術(shù)來提升軟件維護的可靠程度,避免可靠性“短板”的出現(xiàn)。
H3C孫德和表示,一直以來,H3C對設(shè)備的可靠性都十分重視,并配備了專門的研發(fā)團隊對產(chǎn)品的可靠性設(shè)計進行“攻關(guān)”,并取得了十分顯著的成績。例如在歷次的思博倫測試中,H3C的各種網(wǎng)絡(luò)設(shè)備在可靠性方面均有著突出的表現(xiàn),就充分證明了這一點。
S12500:高可靠性的標桿
在上面我們從理論上討論了提高網(wǎng)絡(luò)設(shè)備可靠性的方法,而最能證明這些理論的,就是高端網(wǎng)絡(luò)設(shè)備的實際表現(xiàn)。我們可以以主要針對數(shù)據(jù)中心核心應用的交換設(shè)備S12500為例,來實際感受一下網(wǎng)絡(luò)的可靠性可以達到何種程度。
“100%吞吐量和零丟包,這是S12500在高可靠性方面最突出的表現(xiàn)。”H3C網(wǎng)絡(luò)產(chǎn)品線副總裁孫德和介紹,在2009年6月H3C基于業(yè)內(nèi)權(quán)威的思博倫平臺對S12500進行的性能測試中,S12500極高的可靠性令所有人驚嘆。“測試結(jié)果證明,S12500在二層單播、三層IPv4單播、三層IPv6單播、三層MPLS轉(zhuǎn)發(fā)等多種情況下,均能實現(xiàn)100%吞吐量和零丟包,一舉創(chuàng)造了業(yè)界核心交換機MPLS整機全線速轉(zhuǎn)發(fā)的測試記錄!”
我們知道,在數(shù)據(jù)中心等核心網(wǎng)絡(luò)應用中,網(wǎng)絡(luò)設(shè)備面臨的數(shù)據(jù)壓力非常之大,在這種工作狀態(tài)下設(shè)備是否能夠“頂住壓力”,是維持網(wǎng)絡(luò)正常狀態(tài)的關(guān)鍵因素。S12500的高可靠性正是應對了這一需求。
值得一提的是,H3C在保障網(wǎng)絡(luò)高可靠性的一個重要“殺手锏”——第二代智能彈性架構(gòu)技術(shù)IRF2。這是是H3C在第一代智能彈性架構(gòu)技術(shù)基礎(chǔ)上持續(xù)優(yōu)化和開發(fā)所推出的新一代技術(shù)。它可以通過虛擬化將多臺互聯(lián)的物理設(shè)備視為一臺邏輯設(shè)備,為用戶帶來簡化管理,簡化網(wǎng)絡(luò)業(yè)務(wù)、彈性擴展、1:N可靠、性能加倍提升和增值業(yè)務(wù)擴展等諸多好處。
除了在性能上帶來的提升之外,IRF2的一項重要意義就在于網(wǎng)絡(luò)可靠性的進一步提高。由于實現(xiàn)了1:N的冗余備份,IRF2可以在一臺設(shè)備出現(xiàn)故障的時候,其它設(shè)備可以照常運行并迅速接管故障設(shè)備的功能。此時,域內(nèi)路由協(xié)議不會隨之出現(xiàn)中斷;通過跨越設(shè)備的聚合,通信鏈路也得到了完善的保護;轉(zhuǎn)發(fā)流量和大部分業(yè)務(wù)都不會出現(xiàn)中斷。在流量中斷丟包時長測試結(jié)果表明:當模擬一條鏈路中斷時,采用了IRF2技術(shù)后,原來由路由收斂的鏈路變成了簡單的聚合鏈路收斂,丟包時間從未采用IRF2技術(shù)時的十幾秒乃至數(shù)十秒以上,縮短到了亞毫秒級,在實際應用中,即便是在進行對網(wǎng)絡(luò)要求較高的視頻流量傳輸時,也不會產(chǎn)生出過大的影響。
通過測試結(jié)果可以看出,S12500在提高網(wǎng)絡(luò)設(shè)備平均無故障時間,和縮短平均修復時間兩個方面,與其他同類型產(chǎn)品相比均略勝一籌。
H3C網(wǎng)絡(luò)產(chǎn)品線副總裁孫德和表示,由于許多行業(yè)的數(shù)據(jù)中心提供的都是1年365天每天24小時的不間斷服務(wù),應該盡量消除設(shè)備與服務(wù)的臨時中斷,因此,對于網(wǎng)絡(luò)設(shè)備的可靠性也必然有著更高要求,S12500的設(shè)計也正是瞄準了這一目標來完成的。事實上,S12500在可靠性方面的突出表現(xiàn),也給整個網(wǎng)絡(luò)設(shè)備領(lǐng)域樹立了一個標桿,未來的網(wǎng)絡(luò)設(shè)備可靠性參數(shù)勢必將朝這一方向繼續(xù)靠攏。
結(jié)束語
高可靠性并不僅僅是一個概念,它能夠給用戶帶來實實在在的商業(yè)價值。對于用戶來說,網(wǎng)絡(luò)的穩(wěn)定可用可以節(jié)省維護費用,提高企業(yè)的工作效率,節(jié)省企業(yè)的生產(chǎn)成本,增強企業(yè)競爭力,對用戶在快速變化的環(huán)境中取得成功來說都非常關(guān)鍵。
隨著H3C S12500的推出,網(wǎng)絡(luò)設(shè)備的可靠性也上到了一個新的臺階。在萬兆乃至100G網(wǎng)絡(luò)正逐漸成為核心網(wǎng)絡(luò)主流配置的趨勢下,進一步提升網(wǎng)絡(luò)的可靠性已是刻不容緩之事。相信在包括H3C在內(nèi)的各方共同努力之下,網(wǎng)絡(luò)的可靠性也將“水漲船高”,邁入一個新的層次。