分析100G網(wǎng)絡(luò)對于云計算網(wǎng)絡(luò)的重要性
1 重新認識100G對于云計算網(wǎng)絡(luò)的重要性
1.1 大規(guī)模運營的云計算需要100G網(wǎng)絡(luò)
云計算的服務(wù)供應(yīng)從技術(shù)和運營的角度看擁有近乎無限的計算、存儲、數(shù)據(jù)通信能力,那么提供云計算服務(wù)的IT架構(gòu)必然是集結(jié)了大規(guī)?;A(chǔ)資源的數(shù)據(jù)中心"超級航母"。
云計算IT資源的大規(guī)模集中運營,可極大優(yōu)化基礎(chǔ)資源的分布與調(diào)度。所以,理想的業(yè)務(wù)模型是,對于使用云計算服務(wù)的企業(yè)或個人,能夠滿足IT業(yè)務(wù)的最佳方式為計算能力按需增長、應(yīng)用部署快速實現(xiàn)、工作負載可動態(tài)調(diào)整、投入成本規(guī)劃可控。對于云計算服務(wù)供應(yīng)商而言,為滿足大量客戶(個人或企業(yè))的IT資源需求,其運營的IT基礎(chǔ)架構(gòu)需要有一個大規(guī)模的資源池,可基于服務(wù)客戶數(shù)量的增長、客戶業(yè)務(wù)負載增長的需求變化情況提供匹配的IT資源支持能力。
大規(guī)模的IT集中建設(shè)與運營還帶來了大幅度的成本節(jié)約效應(yīng),來自國外的一份數(shù)據(jù)展示(如圖1所示),在大規(guī)模IT服務(wù)環(huán)境下,網(wǎng)絡(luò)、存儲、服務(wù)器/管理等各方面的投入都會在單位資源尺度內(nèi)極大降低,從而在大規(guī)模經(jīng)營條件下可以使得單位資源帶來更大的產(chǎn)出。
圖1 大規(guī)模運營云計算的成本效益
在大規(guī)模云計算環(huán)境下,性能無疑成為最為關(guān)注的核心要素。當(dāng)前以千兆/萬兆為主流(廣域網(wǎng)很多企業(yè)還處在155/622M)的常規(guī)基礎(chǔ)網(wǎng)絡(luò)或許能夠滿足云計算服務(wù)初期或者小規(guī)模云服務(wù)的要求,但隨著云計算資源和規(guī)模的不斷擴大,量變必然導(dǎo)致質(zhì)變,云計算數(shù)據(jù)中心成為信息計算服務(wù)的核反應(yīng)中樞,以100G為基礎(chǔ)接口的網(wǎng)絡(luò)分發(fā)將很快成為大規(guī)模云計算的必然選擇。
以國內(nèi)某互聯(lián)網(wǎng)公司為例,單個數(shù)據(jù)中心規(guī)模超過萬臺服務(wù)器,在實現(xiàn)多個數(shù)據(jù)中心的后端網(wǎng)絡(luò)連接后,發(fā)現(xiàn)內(nèi)部業(yè)務(wù)量隨著整體規(guī)模的擴大(數(shù)據(jù)中心規(guī)模擴大、數(shù)據(jù)中心數(shù)量增加)上升很快,單個數(shù)據(jù)中心到內(nèi)部業(yè)務(wù)網(wǎng)絡(luò)的鏈路已經(jīng)擴至16根10G,因此,尋求N*400G/1000G超高速互聯(lián)的是高性價比的方案選擇。
1.2 流量激增的云計算內(nèi)部
云計算的服務(wù)模式,架構(gòu)上從低至高一般分為IaaS/PaaS/SaaS三種(通稱I-P-S模式),如圖2所示。云計算的著眼點在于"計算",以不同的計算形式來支撐云的服務(wù),通常情況下,我們將云計算的計算技術(shù)分成兩種:虛擬化技術(shù)和集群技術(shù)。
圖2 I-P-S模式云計算
虛擬化技術(shù)
虛擬化本質(zhì)在于對物理服務(wù)器的計算能力(當(dāng)然還包括IO、內(nèi)存、存儲空間等)進行邏輯的顆粒化分割,每個分割單元都可以作為獨立的計算單元運行,這樣使得一臺物理服務(wù)器上虛擬出多個邏輯服務(wù)器,也就是虛擬機,這種方式也稱為1:N的虛擬化(如圖3所示)。
由于大多數(shù)物理服務(wù)器CPU利用率低下,大量可用計算資源處于閑置,為了提高服務(wù)器的利用率,采用虛擬化技術(shù)將多個應(yīng)用集中到單臺服務(wù)器上(當(dāng)前的集中比例可達到15:1,將來的集中比可達到40:1~60:1),大幅有效提升計算資源利用率。但這樣帶來的另一個效果是,多個應(yīng)用的IO疊加使得服務(wù)器的吞吐量密集提升(如圖3所示),單位網(wǎng)絡(luò)內(nèi)數(shù)據(jù)流量十幾甚至數(shù)十倍的增長,開始挑戰(zhàn)網(wǎng)絡(luò)轉(zhuǎn)發(fā)、傳送性能上限,密集計算的吞吐導(dǎo)致現(xiàn)有的千兆網(wǎng)絡(luò)接入開始形成瓶頸。
圖3 虛擬化的密集流量
在云計算特別是IaaS的服務(wù)模式下,廣泛采用虛擬化技術(shù)來進行計算資源的調(diào)度服務(wù),同時服務(wù)器多核技術(shù)迅速發(fā)展,而且服務(wù)器的網(wǎng)卡進一步向高速萬兆接口演進,這使得云計算在服務(wù)器接入的IO處理層面不僅帶寬擴大,而且流量激增,這直接對骨干網(wǎng)絡(luò)層面提出了超萬兆或面向40G/100G的基本要求。
大規(guī)模集群技術(shù)
集群技術(shù)的目的,是將大量的服務(wù)器通過集群方式整合起來,形成一個具有大規(guī)模計算處理能力的"巨型計算機",從而完成巨大的計算處理任務(wù),這也是一種N:1的虛擬化技術(shù)(如圖4所示)。在這樣的計算應(yīng)用中,幾乎每一臺服務(wù)器都處在重負荷的計算與吞吐環(huán)境,并且由于大型集群內(nèi)子群之間的密集數(shù)據(jù)交換,導(dǎo)致了網(wǎng)絡(luò)上各個方向大規(guī)模的數(shù)據(jù)傳輸,性能要求已經(jīng)超越100G規(guī)模。
圖4 大規(guī)模集群的密集流量
萬臺級服務(wù)器無阻塞交換(10000GE=100*100G)已經(jīng)成為互聯(lián)網(wǎng)行業(yè)云計算業(yè)務(wù)的基本要求。當(dāng)前對高密、超高密萬兆端口的需求已經(jīng)達到了目前技術(shù)的門限,向100G帶寬過渡、并繼續(xù)提出高密40G/100G端口的挑戰(zhàn)需求是大勢所趨。#p#
2 100G云網(wǎng)方案
40G/100G已經(jīng)標(biāo)準化,各設(shè)備廠商均已進入產(chǎn)品交付的實質(zhì)開發(fā)階段,因此,以10G接入、40G/100G為骨干的云計算網(wǎng)絡(luò)逐步會形成系統(tǒng)性的解決方案。
針對云計算網(wǎng)絡(luò),H3C已在實踐一個全面配套路由、交換、安全的云網(wǎng)解決方案(如圖5所示)。通過100G的超高速云內(nèi)部交換網(wǎng)絡(luò)、云間100G高速專線、100G擴展性安全,從而構(gòu)建整個云計算100G全端網(wǎng)絡(luò)架構(gòu)。
圖5 云網(wǎng)方案分布圖
云數(shù)據(jù)中心內(nèi)部網(wǎng)絡(luò)的關(guān)鍵要素(如圖6所示)
虛擬機感知與精確控制:基于標(biāo)準化EVB、EVPA的虛擬機(VM)接入網(wǎng)絡(luò),將云中每個虛擬計算單元VM映射到交換網(wǎng)絡(luò)上,創(chuàng)建虛擬端口(vPort)對應(yīng),并通過虛擬通道vChannel關(guān)聯(lián)和控制(在EVB VEPA中的Multi Channel技術(shù),H3C通過vChannel+vPort方式來實現(xiàn))。對應(yīng)于VM的創(chuàng)建、遷移、釋放,網(wǎng)絡(luò)上也有相應(yīng)的vChannel和vPort的創(chuàng)建、遷移、釋放,從而網(wǎng)絡(luò)對虛擬計算的感知可控制轉(zhuǎn)換為對自身虛擬端口的操作,從而實現(xiàn)精確控制。
統(tǒng)一交換架構(gòu):在萬兆接入,40G/100G骨干的數(shù)據(jù)中心無損交換網(wǎng)(Lossless Ethernet),統(tǒng)一承載計算流量和存儲流量,實現(xiàn)基礎(chǔ)架構(gòu)的精簡和布線的簡化,在保證網(wǎng)絡(luò)性能、計算能力、存儲效率的同時,降低云計算關(guān)鍵網(wǎng)絡(luò)的購買成本與運維成本。
無阻塞L2/L3并行多路徑FAT Tree 100G網(wǎng)絡(luò):云計算不論是虛擬化部署還是大規(guī)模集群的實施,對交換網(wǎng)絡(luò)性能要求極高,單接口的100G帶寬并不能完全滿足業(yè)務(wù)要求,因此提出了通過無阻塞的組網(wǎng)方式來滿足超大規(guī)模計算能力的連接。目前業(yè)內(nèi)實現(xiàn)計算的連接方式有L2(二層)、L3(路由)或其混合方式,不論哪種方式,都要求充分利用核心的N*100G,在云的內(nèi)部形成多路徑傳輸計算結(jié)構(gòu)。對路由模式傳統(tǒng)上稱為ECMP(即通常理解的等價路由);對二層模式稱為L2MP(二層多路徑)。在北美地區(qū),更流行FAT Tree的說法,不論使用L2還是L3技術(shù),構(gòu)建一個大規(guī)模的無阻塞網(wǎng)絡(luò)結(jié)構(gòu)。在H3C的解決方案中,充分利用IRF2 (智能彈性架構(gòu))技術(shù),結(jié)合當(dāng)前的新標(biāo)準(如TRILL/L2VPN)等,在100G的核心網(wǎng)絡(luò)上提供一個可同時支持L2/L3多路徑,使得計算通信具備更好的靈活性和擴展性。
圖6 云計算數(shù)據(jù)中心內(nèi)網(wǎng)絡(luò)
高速云專線:100G的可分散、可聚合的云間聯(lián)網(wǎng)、云內(nèi)傳送網(wǎng)
圖7給出了一種比較復(fù)雜的云服務(wù)模式,企業(yè)A分別從SP-A和SP-B獲得云計算服務(wù),在每個SP內(nèi)部,又從不同地理位置的IDC獲得服務(wù),而用戶除了構(gòu)建自身的私有云,還在用運營商的公共云服務(wù),這里就存在云計算服務(wù)靈活供應(yīng)的多重模式要求,我們稱之為可分散、可聚合的云結(jié)構(gòu)。
可分散、可聚合: 對于整體云計算服務(wù)而言,用戶的業(yè)務(wù)訪問和服務(wù)體驗是完全不依賴于計算所在的物理位置的,然而企業(yè)或機構(gòu)在實際部署云計算數(shù)據(jù)中心時的地址選擇必然又受實際環(huán)境如光纖線路、地理位置、能源供應(yīng)等基礎(chǔ)設(shè)施的影響,使得云數(shù)據(jù)中心規(guī)?;虼蠡蛐?,或集中或分散,或分布在一個園區(qū),或分散在多個地域。這就要求網(wǎng)絡(luò)不僅有效支持每個云中心的計算服務(wù),還需要整合各地域的云中心,形成一個聚合后的服務(wù)整體,因此靈活的DCI(Data center interconnection)和CSI(Cloud service interconnection)方案是實現(xiàn)可分散、可聚合云專線的基礎(chǔ),這將由H3C的100G路由器結(jié)合云路由軟件操作系統(tǒng)平臺來實現(xiàn)。
圖7 可分散、可聚合的云間網(wǎng)/云內(nèi)網(wǎng)
集成與可擴展的統(tǒng)一安全控制
在H3C的100G云網(wǎng)方案中,基于交換集成的安全結(jié)構(gòu),融合IRF2的統(tǒng)一管理方式,在每個交換槽位提供N*10G的防火墻安全性能如圖8所示,并實現(xiàn)一個IRF交換系統(tǒng)上所有防火墻模塊的統(tǒng)一虛擬化和管理控制,從而形成云網(wǎng)安全的單系統(tǒng)200G級別安全處理性能資源池,根據(jù)性能需要可部署多套系統(tǒng)以滿足更高性能處理的需求,而在統(tǒng)一安全中心的管理下,可實現(xiàn)云網(wǎng)安全的整體監(jiān)控與管理策略,使得云計算的安全控制可管理易運維。
圖8 虛擬化可擴展安全防護
云計算的大規(guī)模運營,給傳統(tǒng)網(wǎng)絡(luò)架構(gòu)和傳用應(yīng)用部署經(jīng)驗都帶來了挑戰(zhàn),將來只能是全端的100G網(wǎng)絡(luò)支撐這種巨型的計算服務(wù),不論是技術(shù)革新還是架構(gòu)變化,都需要服務(wù)于云計算的性能要求,滿足動態(tài)、彈性、靈活,并實現(xiàn)網(wǎng)絡(luò)部署的簡捷化。