傳統(tǒng)數(shù)據(jù)中心如何實現(xiàn)向云的平滑升級
1.引言
眾所周知,云計算是近年來發(fā)展最快的互聯(lián)網(wǎng)技術,被稱為第四次IT革命。據(jù)權威機構預測,到2016年,2/3的IT應用服務將建立在云架構上 [1]。作為云計算核心的基礎承載設施,數(shù)據(jù)中心在網(wǎng)絡中所扮演的角色也愈加重要。目前,新一代的云數(shù)據(jù)中心正逐漸取代傳統(tǒng)數(shù)據(jù)中心,并成為互聯(lián)網(wǎng)業(yè)務和流量的主要源頭。在中國,工信部電信研究院發(fā)布的《2014年云計算白皮書》[2]顯示我國公共云服務市場仍處于低總量,高增長的產(chǎn)業(yè)初期階段。2013 年我國公共云服務市場規(guī)模已達47.6 億人民幣,增速36%,遠高于全球平均水平。
云計算市場旺盛需求,帶動了IDC產(chǎn)業(yè)的高速增長。對于通信運營商而言,IDC業(yè)務正逐漸成為其業(yè)務收入增長的新的重要源動力。2005-2012年間,中國IDC市場規(guī)模增長了6倍,且預計未來5年仍將保持25.5%的年均增長率[3]。

圖1 2011-2016年中國數(shù)據(jù)中心市場總體預測
為把握這一機遇,中國電信和中國聯(lián)通先后成立了專門運營云計算業(yè)務的云公司。中國移動也在多個省市開展云計算相關業(yè)務的試驗??梢灶A見,云計算業(yè)務將成為運營商未來業(yè)務增長、競爭的主要熱點之一。
2.現(xiàn)有數(shù)據(jù)中心組網(wǎng)現(xiàn)狀及問題
目前,國內(nèi)主要運營商在全國已建有數(shù)百個數(shù)據(jù)中心,年收入達上百億元。但這些數(shù)據(jù)中心大多從數(shù)據(jù)機房演變而來,主要提供機架出租和主機托管等附加值較低的業(yè)務。與業(yè)界領先者相比,運營商IDC存在以下問題:
2.1 組網(wǎng)技術落后,擴展性受限。
虛擬機的大規(guī)模使用是云數(shù)據(jù)中心區(qū)別于傳統(tǒng)數(shù)據(jù)中心的一個最主要特點。由于虛擬機遷移要求,遷移前后的網(wǎng)絡要屬于同一個二層網(wǎng)絡。因此,新一代的數(shù)據(jù)中心組網(wǎng)技術如Trill、SPB等都專注于構建數(shù)據(jù)中心內(nèi)部的大二層網(wǎng)絡。而運營商現(xiàn)有數(shù)據(jù)中心的網(wǎng)絡拓撲如下圖所示:

圖2 傳統(tǒng)數(shù)據(jù)中心網(wǎng)絡拓撲
其中,運營商只負責提供接入層以上的設備。租戶需要通過自備的網(wǎng)絡設備匯接其所有服務器,然后再通過配置靜態(tài)路由將流量導入接入層交換機。在路由協(xié)議配置上,接入交換機為二三層網(wǎng)絡分界線,接入層以上的設備運行三層網(wǎng)絡協(xié)議,包括ospf和BGP。在這種方式下,二層被限制在網(wǎng)絡邊緣。整個數(shù)據(jù)中心分割成相互獨立的多個煙囪式的業(yè)務網(wǎng)絡,極大的限制了虛擬機遷移的范圍和用戶網(wǎng)絡的擴展性。同時由于各業(yè)務網(wǎng)絡彼此隔離、無法復用,降低了網(wǎng)絡資源(如:接入帶寬和端口資源等)的利用效率。
2.2 運營模式粗放,業(yè)務開通速度慢。
業(yè)界領先的亞馬遜、阿里巴巴等互聯(lián)網(wǎng)公司已為客戶提供PaaS,SaaS等云服務,對用戶技術要求低,且業(yè)務開通僅需幾分鐘。而運營商數(shù)據(jù)中心機房目前還多以提供機房、機架出租等低附加值業(yè)務服務為主。用戶開通新業(yè)務需要通過提交申請、網(wǎng)絡劃分、逐臺設備配置等繁瑣的步驟,平均業(yè)務開通時間通常在幾周甚至幾個月左右。
#p#
2.3 高端資源不足,低端資源無法整合。
作為互聯(lián)網(wǎng)行業(yè)的基礎服務體系,數(shù)據(jù)中心站點正在向大規(guī)模、集群化方向發(fā)展。谷歌、微軟、騰訊等互聯(lián)網(wǎng)公司新建的數(shù)據(jù)中心站點都已擁有上萬臺物理服務器。國內(nèi)調研數(shù)據(jù)顯示,2012年被調查IDC服務商機房擁有服務器數(shù)量在5000臺以上所占比例與2011年沒有多大變化;被調查IDC服務商機房擁有服務器數(shù)量在1000-3000臺的所占比例下降到23%,說明這兩年行業(yè)進行重組整合,較小的IDC服務商已經(jīng)被重組或者淘汰[4]。

圖3 2012年中國IDC公司的機房服務器數(shù)量
而運營商現(xiàn)有的IDC機房中,五***、四***機房僅占20%左右。這無疑難以滿足用戶對資源需求的增長趨勢,不適于未來IDC業(yè)務的長期發(fā)展。同時,由于設備和組網(wǎng)技術的限制,無法將多個數(shù)據(jù)中心資源整合在同一個二層網(wǎng)絡中形成一個邏輯資源池。這樣,當面對網(wǎng)絡資源需求較大的用戶時,一方面各機房都無力單獨滿足用戶的使用規(guī)模需求;另一方面,大量資源被閑置、浪費的矛盾現(xiàn)象。
2.4 IDC資源利用率不均,分布不合理。
由于不同種類的業(yè)務對網(wǎng)絡時延的要求不同,各用戶對IDC機房地理位置的敏感度也存在差異。如提供頁面訪問業(yè)務的用戶,對機房位置的要求不太敏感;而金融和政府用戶則多要求部署在一、二線城市;中小用戶則要求就近部署在本地。
目前,運營商在一線城市機房的機架利用率和出口帶寬利用率也基本飽和。而三、四線城市機房的機架和帶寬利用率尚有可利用空間。但由于不支持虛擬化功能和統(tǒng)一的管理調度平臺,使得無法通過業(yè)務調度的方式,實現(xiàn)對現(xiàn)有網(wǎng)絡資源的整合。
2.5 缺乏多數(shù)據(jù)中心協(xié)作機制,難以發(fā)揮固網(wǎng)資源優(yōu)勢。
目前運營商不同等級數(shù)據(jù)中心間缺乏協(xié)同工作機制與熱點流量推送機制;與Google,F(xiàn)acebook等公司的數(shù)據(jù)中心互聯(lián)模式相比,用戶體驗上還有差距。
此外,隨著云計算、移動互聯(lián)網(wǎng)和服務器虛擬化的大規(guī)模使用,對數(shù)據(jù)中心網(wǎng)絡提出了更高的要求:
(1)無阻塞網(wǎng)絡,并具備近似***的高擴展性。
(2)能夠感知虛擬機,并支持虛機在單數(shù)據(jù)中心內(nèi)部和多數(shù)據(jù)中心之間的漂移,并保證相關網(wǎng)絡策略隨之遷移。
(3)支持多業(yè)務、多租戶。能在同一物理網(wǎng)絡上,根據(jù)業(yè)務需求自由構建業(yè)務網(wǎng)絡并保證網(wǎng)絡安全性。
(4)網(wǎng)絡統(tǒng)一運維,高度自動化、智能化管理。
以上這些需求是現(xiàn)有的數(shù)據(jù)中心網(wǎng)絡難以實現(xiàn)的。
為滿足上述需求,業(yè)界主流廠家推出了一系列新的技術解決方案,如Trill、SPB、VEPA等。但這些技術都需要新的網(wǎng)絡硬件,即各級交換機設備。顯然,對于已建有數(shù)百數(shù)據(jù)中心的運營商而言,這一成本十分高昂,且是否值得也有待考驗。
此時,SDN和NFV技術的適時出現(xiàn),為利用現(xiàn)有網(wǎng)絡設備,整合數(shù)據(jù)中心網(wǎng)絡資源,實現(xiàn)云化升級,提供一條解決思路。
3.SDN&NFV技術
SDN(Software Defined Network)即軟件定義網(wǎng)絡,它起源于美國斯坦福大學,是繼云計算之后,業(yè)界最關注的網(wǎng)絡新技術[5]。2012年,谷歌在其數(shù)據(jù)中心網(wǎng)絡上的成功應用SDN,標志著SDN進入到商用化階段。同時也使得數(shù)據(jù)中心成為業(yè)界公認的SDN技術應用的***場景。
控制轉發(fā)分離、邏輯集中控制、開放可編程是SDN區(qū)別于傳統(tǒng)網(wǎng)絡的主要特征。正是這些特征使得SDN能夠良好的滿足數(shù)據(jù)中心網(wǎng)絡的使用需求。SDN 的控制轉發(fā)分離,為實現(xiàn)集中管理創(chuàng)造了條件。而管理集中化正是提高網(wǎng)絡管理和業(yè)務部署的自動化程度的必要前提。開放可編程接口則為將業(yè)務需求轉化為網(wǎng)絡需求提供了途徑。
目前,SDN有三種實現(xiàn)方案,即基于openflow協(xié)議的解決方案、基于overlay技術的解決方案和混合型解決方案。其中基于overlay 技術的解決方案是目前主流的發(fā)展趨勢。這種方案通過使用vxlan或nvgre等協(xié)議,在報文進入接入層設備前將二層報文封裝在三層報文中進行傳輸,***在接收側解封裝還原二層報文。這樣就是實現(xiàn)了在三層網(wǎng)絡之上建立一張邏輯二層網(wǎng)絡的目的。該方案對承載網(wǎng)要求低,IP可達即可,不需要改變現(xiàn)有網(wǎng)絡架構和協(xié)議,具有良好的適用性。
NFV(Network FunctionVirtualization)即網(wǎng)絡功能虛擬化[6]。該技術源自于電信運營商,其的最終目標是以軟件方式虛擬化IT資源,讓虛擬化部署能夠提供重要的網(wǎng)絡功能,而不再需求專業(yè)的物理設備。這些虛擬設備在網(wǎng)絡中將像物理設備那樣工作,且無需特定設備即可實現(xiàn)多種專業(yè)功能。此外,由于 NFV可以采用虛擬機的方式提供,再結合SDN的流量控制功能,可以輕易實現(xiàn)功能網(wǎng)元的按需彈性部署及service chain功能。
SDN的集中管理控制與NFV的快速彈性部署相結合,構成了一條網(wǎng)絡硬件的通用性和軟件的開放性越來越高的發(fā)展道路。
#p#
4.云化演進方案
利用SDN技術和NFV技術,我們可以通過軟件方式實現(xiàn)對現(xiàn)有數(shù)據(jù)中心的云化升級,具體可分為以下幾個階段進行:
***階段,對服務器實施虛擬化改造,并使用支持vxlan的開源OVS虛擬交換機構造大二層網(wǎng)絡。

圖4 傳統(tǒng)數(shù)據(jù)中心在服務器虛擬化改造后的效果
已有大量實踐證明,通過使用虛擬化技術可以將服務器的資源利用率提高30%以上。同時,由于將原來需要多臺服務器承載的業(yè)務集中到一臺服務器上的多臺虛擬機處理,大幅降低了所需服務器的數(shù)量。這樣也節(jié)省了網(wǎng)絡接口資源,使業(yè)務網(wǎng)絡實現(xiàn)“瘦”化,提高數(shù)據(jù)中心的整體承載能力。
同時由于使用了vxlan技術,使得不同的IDC站點只要IP可達,就可以在邏輯上構成大二層overlay網(wǎng)絡,從而實現(xiàn)整合多個數(shù)據(jù)中心網(wǎng)絡資源的目的,提高了資源利用率。且由于使用的是開源軟件,升級成本十分低廉。
第二階段,利用NFV技術提供防火墻、負載均衡、私有云等業(yè)務。
在傳統(tǒng)數(shù)據(jù)中心的組網(wǎng)方式下,為提供防火墻和負載均衡等增值業(yè)務,有兩種方式。一種是用戶自備相關硬件,串接或旁觀在其與接入交換機相連的網(wǎng)絡設備上。另一種則需要將相應的硬件旁掛在核心路由兩側,供所有業(yè)務共用。前一種方式,由于用戶網(wǎng)絡規(guī)模有限,容易導致資源浪費。后一種方式,難以針對具體各業(yè)務私網(wǎng)提供定制服務。
NFV技術出現(xiàn)后,通過在虛擬機上安裝防火墻、虛擬路由器等功能鏡像,實現(xiàn)了針對各業(yè)務網(wǎng)絡的資源彈性部署。在降低組網(wǎng)成本的同時,提高了服務種類、處理精度。
第三階段,增加controller,并通過controller與OVS和NFV管理平臺的對接實現(xiàn)對ovs和NFV設備的統(tǒng)一控制,提高業(yè)務的按需自動化彈性部署能力。
通過增加controller,并將其與OVS、NFV管理平臺實現(xiàn)對接。引入SDN集中控制功能,實現(xiàn)service chain的自動化部署,可以大大提高業(yè)務開通的自動化程度和速度。這里為了降低成本可以使用開源的controller,如opendaylight的產(chǎn)品——Hydrogen。
第四階段,當網(wǎng)絡規(guī)模和流量足夠大時,通過將現(xiàn)有接入交換機更換為支持vxlan封裝的交換機,提高業(yè)務處理能力。
由于OVS仍屬于軟件范疇,相對硬件存在性能瓶頸。在改造初期,由于運營商現(xiàn)有數(shù)據(jù)中心的網(wǎng)絡規(guī)模大多較小,對性能的要求也相對較低,OVS還能滿足使用需求。但隨著互聯(lián)數(shù)據(jù)中心站點數(shù)量的增加,對OVS的性能要求(如流表數(shù)量)也直線上升,其性能問題就可能成為業(yè)務發(fā)展的瓶頸。此時,原有的接入交換機已基本接近使用年限??山柚鼡Q新型接入交換機的時機,將OVS對數(shù)據(jù)包的部分處理功能,如vxlan封裝,轉移到硬件的接入交換機側。從而降低OVS的性能壓力,滿足業(yè)務的使用需求。
通過以上幾個步驟,實現(xiàn)了在盡可能利舊現(xiàn)有網(wǎng)絡設備的情況下,用最小的代價完成傳統(tǒng)數(shù)據(jù)中心向云數(shù)據(jù)中心的升級。
結論
本文在分析數(shù)據(jù)中心發(fā)展趨勢和運營商數(shù)據(jù)中心現(xiàn)狀及問題的基礎上,結合SDN和NFV技術特點,提出了一種傳統(tǒng)數(shù)據(jù)中心向云數(shù)據(jù)中心的過渡方案。該方案為集團整合現(xiàn)有數(shù)據(jù)中心資源,發(fā)展云相關業(yè)務提供技術參考。