10Gb以太網(wǎng)——數(shù)據(jù)中心的未來
10 Gigabit Ethernet (GbE)正逐漸成為新寵兒,至少對數(shù)據(jù)中心而言是這樣的。從10 Mbps到100 Mbps 快速以太網(wǎng)以及從快速以太網(wǎng)到千兆以太網(wǎng)的轉(zhuǎn)變模式都是一樣的:數(shù)據(jù)中心和網(wǎng)絡(luò)經(jīng)理在交換器之間安裝高昂的光纖端口來消除瓶頸。同時隨著技術(shù)價格的下降,他們能夠開始用這些技術(shù)來連接服務(wù)器。最后,高性能連接被廣泛采用。但是,由于之前的以太網(wǎng)轉(zhuǎn)變主要是在速度上,因此遷移到10 GbE將意味著要實(shí)現(xiàn)更高的速度。
目前,大多數(shù)的數(shù)據(jù)中心都是針對不同用途運(yùn)行的多種網(wǎng)絡(luò)。服務(wù)器通過專用光纖通道網(wǎng)絡(luò)訪問存儲列陣,而用戶則是通過單獨(dú)且獨(dú)立管理的以太網(wǎng)網(wǎng)絡(luò)訪問相同的服務(wù)器。以太網(wǎng)網(wǎng)絡(luò)可以通過物理或者虛擬LAN更進(jìn)一步劃分為用戶訪問、管理、安全和備份網(wǎng)絡(luò)。大多數(shù)運(yùn)行VMware、Xen或 Hyper-V虛擬軟件的虛擬服務(wù)器主機(jī)必須連接到這幾種網(wǎng)絡(luò)。這意味著每臺服務(wù)器主機(jī)將有多一對1 GbE端口以支持每種網(wǎng)絡(luò)。調(diào)查顯示,數(shù)據(jù)中心經(jīng)理在虛擬服務(wù)器主機(jī)上平均設(shè)置6至10個以太網(wǎng)連接。
由于有更大的可用帶寬,一對10 GbE連接就能夠滿足一個典型虛擬服務(wù)器主機(jī)的所有輸入和輸出(I/O)需求。但是,網(wǎng)絡(luò)和數(shù)據(jù)中心經(jīng)理所面臨的挑戰(zhàn)并不只是提供帶寬。他們還必須確保網(wǎng)絡(luò)中的每個系統(tǒng)、功能和應(yīng)用程序有實(shí)現(xiàn)互操作性和避免瓶頸所需要的帶寬數(shù)量和網(wǎng)絡(luò)服務(wù)質(zhì)量。
10 GbE使數(shù)據(jù)和存儲網(wǎng)絡(luò)融合成為可能
大多數(shù)關(guān)于10 GbE的爭論都是關(guān)于其支持?jǐn)?shù)據(jù)和存儲網(wǎng)絡(luò)融合的能力。在過去的10年中,F(xiàn)iber Channel存儲區(qū)網(wǎng)絡(luò)(SAN)的帶寬已經(jīng)增長到平均速度4或8 Gbps,而iSCSI (Internet Small Computer System Interface) SAN一般仍只運(yùn)行在1Gbps以太網(wǎng)上。
更為突出的是,行業(yè)已經(jīng)開發(fā)了SAN管理工具,它雖然并不適用于iSCSI,但是它具有可見性,管理員可用來控制光纖通道網(wǎng)絡(luò)。
Fibre Channel over Ethernet (FCoE)協(xié)議已經(jīng)允許IT組織在保留光纖通道安全性和管理模型的同時將SAN和數(shù)據(jù)流融合到10 GbE。FCoE將Fibre Channel Protocol (FCP)數(shù)據(jù)包封裝在以太網(wǎng)幀中,這樣服務(wù)器可以通過一個以太網(wǎng)連接來訪問它的Fibre Channel SAN存儲。
FCoE的設(shè)計者詳細(xì)說明了為何FCP數(shù)據(jù)包必須封裝在以太網(wǎng)中,但是還有一個突出的問題需要解決。以太網(wǎng)和光纖通道處理網(wǎng)絡(luò)擁擠的方式差別很大。實(shí)際上,在數(shù)據(jù)傳輸之前,光纖通道設(shè)備會通過使用緩沖區(qū)計數(shù)來協(xié)商它們預(yù)期通過一個鏈路發(fā)送的數(shù)據(jù)總數(shù)。直到接受者反饋具備足夠保存數(shù)據(jù)的可用內(nèi)存時,發(fā)送者才會將數(shù)據(jù)傳輸過去。
另一方面,以太網(wǎng)系統(tǒng)只是發(fā)送數(shù)據(jù)。如果線路過于繁忙,導(dǎo)致另外一端的交換機(jī)內(nèi)存太滿無法保存數(shù)據(jù),那么數(shù)據(jù)包就會被丟棄。
解決丟包問題
在常規(guī)的實(shí)現(xiàn)中,光纖通道固有的問題是缺少恢復(fù)機(jī)制來重傳丟失的數(shù)據(jù)包。而實(shí)現(xiàn)一個重傳會給存儲流造成不可接受的延遲。所以FCoE在設(shè)計上利用了以太網(wǎng)的一系列擁塞管理改進(jìn)方法,所有這些方法一般統(tǒng)稱為數(shù)據(jù)中心橋接(DCB)。
DCB最突出的新功能是基于優(yōu)先級的暫停。這個功能允許一個以太網(wǎng)交換機(jī)要求某臺服務(wù)器停止發(fā)送低優(yōu)先級數(shù)據(jù),直到它能夠從內(nèi)存中清除一些數(shù)據(jù),而不是等到緩沖區(qū)用光而出現(xiàn)丟包。優(yōu)先級可能有8個,而FCoE使用的是最高優(yōu)先級,因此存儲數(shù)據(jù)在網(wǎng)絡(luò)繁忙的時候也可以傳輸。DCB解決的丟包問題同樣可以提高其它協(xié)議的性能,例如iSCSI。
雖然FCoE能夠通過無所不在的以太網(wǎng)連接來發(fā)送存儲流,但是組成該網(wǎng)絡(luò)的交換機(jī)必須包含特定的FCoE支持。有些交換機(jī),例如Cisco Nexus 5000和Brocade 8000,在設(shè)計時是部署在每個服務(wù)器機(jī)架的頂部的,同時具有連接現(xiàn)有SAN的光纖通道端口。支持FCoE的交換機(jī)價格與其它支持DCB的10 GbE交換機(jī)大致相同,但是設(shè)備制造商會索要額外的FCoE支持功能價格。還不需要FCoE功能的企業(yè)現(xiàn)在可以使用它們作為標(biāo)準(zhǔn)的頂級機(jī)架交換機(jī),將來再增加SAN支持。
FCoE的支持者希望盡可能多地保留Fibre Channel體驗,因此他們創(chuàng)建了融合網(wǎng)絡(luò)適配器(CNA),它可以使用以太網(wǎng)驅(qū)動器實(shí)現(xiàn)數(shù)據(jù)傳輸網(wǎng)絡(luò),以及單獨(dú)的Fibre Channel驅(qū)動器和管理軟件處理FCoE流量。CAN允許宿主機(jī)操作系統(tǒng),或虛擬機(jī)管理程序查看單獨(dú)的存儲和數(shù)據(jù)連接,而存儲管理員則可以查看他們所習(xí)慣的界面,例如QLogic SANsurfer或Emulex ONEconnect。CAN也可以將FCoE協(xié)議處理或者iSCSI處理負(fù)載從服務(wù)器的主要處理器卸掉。這在一個典型的8個內(nèi)核的服務(wù)器上可以節(jié)省大約3至5%的負(fù)載,雖然比例不是很大,但是累積效果會很明顯。
實(shí)現(xiàn)多路徑網(wǎng)絡(luò)
具有10GbE功能的交換機(jī)也可以啟用2層協(xié)議的多路徑。傳統(tǒng)的以太網(wǎng)交換機(jī)使用生成樹協(xié)議來防止可能通過廣播和其它數(shù)據(jù)包而堵塞網(wǎng)絡(luò)的網(wǎng)絡(luò)回路。生成樹的工作原則是,在交換機(jī)之間啟用唯一一條路徑。因此,如果您的頂級機(jī)架交換機(jī)和核心交換機(jī)之間有兩條上行鏈路,那么生成樹會禁用其中一條。
2層協(xié)議多路徑使用TRILL(Transparent Interconnection of Lots of Links)協(xié)議來獲悉網(wǎng)絡(luò)上兩點(diǎn)之間的所有路徑,然后以每次發(fā)送一個數(shù)據(jù)包的方式來尋找最佳的路徑?;赥RILL的網(wǎng)絡(luò)并不需要采用生成樹網(wǎng)絡(luò)那樣的分層結(jié)構(gòu)(如,邊緣、聚集和核心),而且可以用任意類型的光纖進(jìn)行連接。它們也會使用所有可能的連接,從而會增加任意兩個交換機(jī)之間的可用帶寬。
顯然,我們正在步入10 GbE數(shù)據(jù)中心網(wǎng)絡(luò)時代。通過更快的傳輸速度和諸如DCB和TRILL的新特性,我們可以建立更大、更快和更具彈性的網(wǎng)絡(luò),它不僅僅可以輸送傳統(tǒng)的數(shù)據(jù)流,還可以通過FCoE傳輸存儲數(shù)據(jù)。設(shè)備制造商仍只是剛開始推出新產(chǎn)品,而且還會繼續(xù)開發(fā)額外的功能和特性。在您的數(shù)據(jù)中心網(wǎng)絡(luò)實(shí)現(xiàn)這個變革所投入的時間將一定是值得的。