誰將主宰行業(yè)云數(shù)據(jù)中心?首選大服務(wù)器
浪潮將行業(yè)云的技術(shù)架構(gòu)分為三層:最下面的基礎(chǔ)設(shè)備層,中間的云計算系統(tǒng)軟件,即提供資源虛擬化、資源調(diào)度管理、數(shù)據(jù)管理等功能的云計算中心操作系統(tǒng),最上面是各種云計算應(yīng)用。那么,行業(yè)云數(shù)據(jù)中心里的服務(wù)器存儲設(shè)備應(yīng)該符合什么樣的要求呢?是不是象谷歌、亞馬遜一樣用一大堆低價服務(wù)器做成集群就可以了呢?
▲浪潮行業(yè)云的技術(shù)架構(gòu)
云計算不是服務(wù)器農(nóng)場 要打造大服務(wù)器
早在今年6月份,浪潮集團高級副總裁王恩東就曾撰文指出,云計算后臺用海量的低端服務(wù)器做計算中心,其實是無奈之舉,也不適合所有的云計算應(yīng)用。從計算技術(shù)上看,“服務(wù)器農(nóng)場”只適合分布式計算。比如谷歌,它提供的是搜索、新聞等類型的服務(wù),這些服務(wù)依賴的都是一些分散數(shù)據(jù),沒什么關(guān)聯(lián)性,可以分布到多個地點和設(shè)備上進行存儲,計算也可以拆分成多個任務(wù)由上千臺的低端服務(wù)器一起完成。但是在未來,面向一些關(guān)聯(lián)性很強的數(shù)據(jù)和運算,例如OLTP業(yè)務(wù)(聯(lián)機事務(wù)處理),才是更為廣泛的商業(yè)計算模式,而分布式技術(shù)受制于數(shù)據(jù)同步問題,在這種應(yīng)用上就很困難。比如銀行的業(yè)務(wù)系統(tǒng),其業(yè)務(wù)數(shù)據(jù)是強耦合的關(guān)系型數(shù)據(jù),必須建立統(tǒng)一的數(shù)據(jù)庫系統(tǒng),這也是為什么銀行一直是大服務(wù)器的忠實客戶。未來將會有越來越多的OLTP業(yè)務(wù)遷移到云計算中,發(fā)展面向OLTP的云計算業(yè)務(wù)會成為重要趨勢。
因此,浪潮認為,大型服務(wù)器終將成為云計算硬件基礎(chǔ)的核心,中國應(yīng)該繼續(xù)發(fā)展自主的“大服務(wù)器”產(chǎn)業(yè),為中國云計算提供適應(yīng)未來發(fā)展特征的、具備競爭力的自主核心裝備,不但是我國服務(wù)器產(chǎn)業(yè)自身發(fā)展的需要,更是實現(xiàn)云計算自主可控的關(guān)鍵。
在此次云計算戰(zhàn)略發(fā)布會上,張東進一步從行業(yè)云數(shù)據(jù)中心的實際需求出發(fā),詳細闡述了為什么大服務(wù)器才是云計算,尤其是行業(yè)云計算數(shù)據(jù)中心里的硬核?
行業(yè)云數(shù)據(jù)中心六大技術(shù)要求
張東指出,從需求特征來看,對行業(yè)云的技術(shù)要求體現(xiàn)在“高效率、大規(guī)模、高可用、易管理、低耗節(jié)能、安全”幾個方面。
▲浪潮系統(tǒng)軟件總監(jiān)兼云計算產(chǎn)品研發(fā)部總經(jīng)理張東
首先,由于行業(yè)數(shù)據(jù)非常龐大,而且對于數(shù)據(jù)處理的時效性要求很高,因此要求行業(yè)云里要有強大、高效的大規(guī)模數(shù)據(jù)存儲和處理能力。
其次,由于行業(yè)云要對外提供服務(wù),對服務(wù)質(zhì)量的要求非常高,因此對行業(yè)云的高可用性要求也很高,要達到99.999%,也就是每年的服務(wù)中斷不能超過5分鐘。
再次,由于行業(yè)云數(shù)據(jù)中心非常寵大,涉及幾千上萬臺計算機、存儲和網(wǎng)絡(luò)設(shè)備,因此對易管理的要求也很高,比如要有集中管理、遠程管理等,以降低管理成本。
第四,大規(guī)模數(shù)據(jù)中心的能耗問題也很突出,因此要求數(shù)據(jù)中心采取低耗節(jié)能的技術(shù)。
最后,安全是永恒的話題,把所有的數(shù)據(jù)放到網(wǎng)上,如何保護這些數(shù)據(jù)的安全,如何保證個人數(shù)據(jù)的隱私,以及這些數(shù)據(jù)的完整性,都是非常重要的課題。大服務(wù)器和海量存儲是云計算硬核
基于上述六個方面的需求分析,張東指出,行業(yè)云數(shù)據(jù)中心里的核心硬件設(shè)備非高端服務(wù)器和海量存儲莫屬,因為只有這樣的基礎(chǔ)硬件才能滿足“高性能、高可靠、易管理、易拓展”的要求。
首先,從數(shù)據(jù)處理能力來看,行業(yè)云需要更多更復(fù)雜、關(guān)聯(lián)性極強的結(jié)構(gòu)化數(shù)據(jù)和大量的非結(jié)構(gòu)化數(shù)據(jù),需要計算機系統(tǒng)的多線程并發(fā)、緊耦合共享內(nèi)存技術(shù)的支撐。比較來看,公眾云服務(wù)如搜索、共享等,數(shù)據(jù)之間的相關(guān)性是比較低的,比如搜索一個網(wǎng)頁和另一個網(wǎng)頁,不需要做關(guān)聯(lián)檢查,因此很多廠商采用低廉的服務(wù)器。但在行業(yè)云中,很多核心應(yīng)用的數(shù)據(jù)關(guān)聯(lián)性非常復(fù)雜,低端服務(wù)器就不適用了。另外,在大規(guī)模數(shù)據(jù)處理中,I/O瓶頸問題一直很突出,因此需要大共享內(nèi)存、高內(nèi)部互聯(lián)的“胖節(jié)點”來支撐。比如,浪潮曾經(jīng)測試過,對于數(shù)據(jù)庫應(yīng)用,16臺低端服務(wù)器集群的處理能力還不如一臺8路高端服務(wù)器。
▲浪潮兩款高端服務(wù)器,右下角是正在研制的32路高端容錯計算機
其次,從系統(tǒng)可用性方面看,行業(yè)云數(shù)據(jù)中心為了提供連續(xù)穩(wěn)定的服務(wù),往往需要99.999%以上的可用性,因此需要計算機系統(tǒng)的容錯技術(shù)和高可用技術(shù)的支撐。采用低端服務(wù)器集群,雖然通過冗余方式也可以提高可用性,但要達到99.999%至少需要3路冗余,設(shè)備利用率非常低。而且,如果采用備份-恢復(fù)方式恢復(fù)系統(tǒng),系統(tǒng)恢復(fù)時間要長達幾分鐘,也無法滿足應(yīng)用服務(wù)99.999%的要求。從管理的角度看,就算1臺服務(wù)器的MTBF是三年,那1000臺服務(wù)器加在一起的MTBF也就1天,即每天都有設(shè)備要更換,系統(tǒng)管理維護的難度可想而知。
▲浪潮海量存儲產(chǎn)品
第三,從系統(tǒng)高密度、低能耗、易管理角度看,大規(guī)模數(shù)據(jù)中心的占地和能耗越來越大,需要硬件設(shè)備單位性能占用更小的體積,消耗更少的能源;同時大規(guī)模數(shù)據(jù)中心的管理和維護難度及成本逐步提高,需要系統(tǒng)提供智能化、集中式的遠程管理技術(shù)。這些都使得簡單地堆積低成本服務(wù)器的方式很難滿足要求。
為此,浪潮已經(jīng)在布局高端服務(wù)器和海量存儲設(shè)備的研發(fā)。在服務(wù)器方面,浪潮上半年推出了8路服務(wù)器天梭TS850,目前正在研制天梭32路高端服務(wù)器。其共同特點是高性能,8-32路緊耦合體系結(jié)構(gòu),支持1TB以上的物理內(nèi)存;通過軟硬件結(jié)合的高可用技術(shù),單臺設(shè)備的可靠性可以達到99.999%;易拓展,集成硬件分區(qū)、虛擬化分區(qū)等,可以大大提高設(shè)備的利用率;集成帶外管理功能,即使在關(guān)機情況下也可以對設(shè)備進行監(jiān)控和管理,大大減輕管理數(shù)據(jù)中心的難度。在海量存儲方面,最高容量可以達到1PB,并發(fā)帶寬非常高,可以實現(xiàn)多路冗余,整體可靠性達到99.999%,同時還支持遠程鏡像、快照、快速復(fù)制等高級功能。