九層之臺起于壘土 ——講述承載5G和邊緣計算的服務(wù)器平臺
導(dǎo)語:5G的腳步越來越近,伴隨而來的NFV和邊緣計算也發(fā)展的如火如荼,部分移動省公司和互聯(lián)網(wǎng)公司的合作試點已經(jīng)紛紛落地。大家都在關(guān)注5G和邊緣計算在高帶寬、大連接、低延時等諸多優(yōu)勢為上層應(yīng)用帶來的革命,但是這一“優(yōu)勢”給底層硬件基礎(chǔ)設(shè)施帶來了巨大的挑戰(zhàn),特別是將在傳統(tǒng)數(shù)據(jù)中心的開放能力搬到邊緣側(cè),必將帶來機房及服務(wù)器設(shè)備的適配和優(yōu)化改造需求。
01運營商邊緣機房現(xiàn)狀
運營商有大量的匯聚、綜合接入、基站等邊緣機房,與核心機房或傳統(tǒng)數(shù)據(jù)中心相比條件十分特殊,選址靈活度、機房條件和基礎(chǔ)設(shè)置保障能力等方面受到限制。
首先,由于主要用來放置傳輸設(shè)備,機架深度通常只有600mm(少量800mm),這種條件下,與之對比,通用X86服務(wù)器的深度一般為700~800mm;
其次,絕大部分邊緣機房無固定油機,空調(diào)的制冷穩(wěn)定性無法得到保證,在制冷系統(tǒng)故障或長時間停電時,機房溫度可能會達到40℃甚至45℃以上。未來隨著業(yè)務(wù)下沉,機房內(nèi)部署設(shè)備逐漸增多,溫升問題將會更加嚴重;
再次,大量邊緣機房為居民樓、商鋪、寫字樓等普通民用建筑,同時空調(diào)過濾效果有限,所以承重和空氣潔凈度都無法跟數(shù)據(jù)中心相比。
此外,邊緣機房的選址很難避開地震烈度高的區(qū)域,也無法保證周圍沒有施工、重型運輸設(shè)備等導(dǎo)致的振動,設(shè)備將面臨抗震方面的要求。傳統(tǒng)數(shù)據(jù)中心,可以綜合考慮自然條件和電力資源等諸多因素,邊緣業(yè)務(wù)的特點決定了邊緣計算能力就在附近,這導(dǎo)致邊緣機房分布廣泛,選址相對不自由。總之,邊緣機房條件各異,與核心數(shù)據(jù)中心相比差異巨大。
02 定制針對邊緣的服務(wù)器方案
傳統(tǒng)CT設(shè)備可以理解為針對邊緣機房條件進行了定制,兩者可以相互適配,但如果直接在邊緣機房部署通用服務(wù)器,會存在很多問題。另外,邊緣機房數(shù)量巨大,統(tǒng)一按滿足通用服務(wù)器要求進行改造和擴建也是不可能的。
最有效的邊緣計算部署方案就是利用現(xiàn)有的邊緣機房資源,并對服務(wù)器進行定制設(shè)計。2011年11月,我公司聯(lián)合中國電信、中國聯(lián)通、信通院和Intel公司在ODCC中發(fā)起了OTII(Open Telecom IT Infrastructure)項目。計劃定制一款面向5G及邊緣計算的深度定制、開放標準、統(tǒng)一規(guī)范的服務(wù)器方案。
03 OTII服務(wù)器規(guī)格設(shè)計
為適應(yīng)邊緣機房的環(huán)境并滿足邊緣計算業(yè)務(wù)的需求,OTII服務(wù)器做了如下方面的定制,當然很多方面的規(guī)格和設(shè)計還將根據(jù)試點的推進不斷更新。
首先需要改造的是尺寸。目前市面上的通用服務(wù)器的深度一般為700~800mm。為滿足600mm的機架深度,我們將服務(wù)器的深度定義在450mm左右,最大不超過470mm。而其寬度與標準的服務(wù)器機架無異,為19英寸。在高度方面,經(jīng)過對通用服務(wù)器市場、應(yīng)用需求的調(diào)研,決定將服務(wù)器的高度定義為2U,基本能夠同時滿足存儲(配置2.5寸硬盤)、計算和少量GPU的需求。對于未來一些大存儲和異構(gòu)計算的應(yīng)用會考慮采用JBOD、JBOF等一系列擴展性方案
由于邊緣機房的制冷設(shè)備遠未達到數(shù)據(jù)中心的水平,如果出現(xiàn)故障會導(dǎo)致機房溫度過高,因此需要服務(wù)器能夠在45攝氏度溫度下長期運行(通用服務(wù)器多要求35度)。并且這一設(shè)計要求不會帶來過多的成本投入。
由于邊緣的空氣質(zhì)量無法有效保證,服務(wù)器的風(fēng)扇需要能夠及時清理,所以我們將風(fēng)扇從服務(wù)器機箱內(nèi)放到了后面板,并支持熱插拔。
傳統(tǒng)的電信設(shè)備需要有抗震的要求,邊緣機房可能在任何地點,包括地震頻發(fā)的地方,根據(jù)國標要求,需滿足7烈度以上,這對服務(wù)器來說是極高的,需要制定機架與服務(wù)器的協(xié)同設(shè)計方案。
核心機房設(shè)備通常要求7*24小時運維,但是很多邊緣機房地處偏遠分布廣泛,很難達到這樣的級別。這就對服務(wù)器本身提高了要求,我們將為OTII定制統(tǒng)一的IPMI和Redfish接口,統(tǒng)一上層管理平臺的開發(fā),提升集成的速度,并且能夠有全面的硬件故障檢測和診斷功能,保證能提前預(yù)警、及時上報、快速定位等。
從上層業(yè)務(wù)的角度,最重要的是能夠滿足配置和性能方面的要求。目前OTII服務(wù)器能夠滿足Xeon SP雙路和Xeon-D兩種CPU平臺,支持16條內(nèi)存,6~8塊硬盤以及6個PCIe插槽的擴展性,并且能夠支持至少2塊GPU。另外對于Xeon SP雙路服務(wù)器,還將采用NUMA balance的設(shè)計,有助于提高網(wǎng)絡(luò)及邊緣應(yīng)用的性能穩(wěn)定性。
04 項目影響力不斷提升
自2011年11月立項以來,OTII項目受到業(yè)界的廣泛關(guān)注。目前已經(jīng)有29家成員公司,包括運營商、互聯(lián)網(wǎng)公司、服務(wù)器和配件供應(yīng)商,甚至部分非ODCC成員的供應(yīng)商,因為這個項目而申請加入ODCC。OTII項目已經(jīng)成為具有影響力的5G和邊緣計算硬件開源項目。
在今年2月25日的巴展上基于Intel新一代Cascade Lake平臺的OTII邊緣服務(wù)器正式發(fā)布,早于Intel新平臺4月3日的正式發(fā)布時間,這種特殊安排也表明了Intel對OTII項目的重視。該產(chǎn)品專為5G設(shè)計,可承擔物聯(lián)網(wǎng)、MEC和NFV等5G應(yīng)用場景,適合于邊緣機房的物理環(huán)境。在展會期間,北美和歐洲運營商表現(xiàn)了對OTII服務(wù)器的極大興趣。
目前有3家供應(yīng)商已經(jīng)有基于Cascade Lake平臺的產(chǎn)品,另外還有若干家供應(yīng)商正在開發(fā),預(yù)計在Q2或Q3會有產(chǎn)品。JBOD等產(chǎn)品也在規(guī)劃中,會根據(jù)試點的推動情況決定具體的樣機生產(chǎn)時間。另外,OTII服務(wù)器已經(jīng)到達浙江公司某機房開始支撐邊緣計算試點。2019年將會進一步推動OTII服務(wù)器的生態(tài)發(fā)展以及試點工作,為2020年全面商用奠定基礎(chǔ)。
5G時代的多元化應(yīng)用催生了邊緣計算的快速發(fā)展,傳統(tǒng)的數(shù)據(jù)中心將向邊緣側(cè)延伸,電信的核心業(yè)務(wù)在實時性、穩(wěn)定性、管理便利性等方面都對服務(wù)器提出了更高的要求,OTII服務(wù)器未來還將會面臨諸多挑戰(zhàn)。
作者簡介:
高從文:中國移動研究院網(wǎng)絡(luò)與IT技術(shù)研究所 技術(shù)與方案研究員
2011年入職中國移動研究院,一直參與服務(wù)器方面的工作,負責集采服務(wù)器配置模型制定和服務(wù)器深度定制等方面的工作,對服務(wù)器技術(shù)和市場趨勢有比較深入的理解。
徐忠宇:中國移動研究院網(wǎng)絡(luò)與IT技術(shù)研究所 技術(shù)與方案研究員
主要從事數(shù)據(jù)中心基礎(chǔ)設(shè)施架構(gòu)方面的研究。
【本文為51CTO專欄作者“移動Labs”原創(chuàng)稿件,轉(zhuǎn)載請聯(lián)系原作者】