2017開放數(shù)據(jù)中心峰會亮點之:天蝎3.0最新進展
【天蝎3.0項目是在ODCC的組織下,由騰訊公司牽頭,18家會員單位共同組建的項目,共同探索服務(wù)器的架構(gòu)演進方向,瞄準(zhǔn)服務(wù)器部件資源的解耦與池化的架構(gòu)和解決方案,用于解決和優(yōu)化在海量服務(wù)器使用過程中,服務(wù)器的各部件資源(CPU、內(nèi)存、磁盤、SSD、網(wǎng)絡(luò)IO、GPU、FPGA等)的利用率不均衡造成的浪費,以及這些部件資源各自升級換代周期不同造成的服務(wù)器硬件頻繁升級問題?!?/p>
項目研究過程中,進行了很多技術(shù)方向、關(guān)鍵技術(shù)和應(yīng)用場景的嘗試,近期完成了硬盤、GPU的解耦和資源池化方案研究并落地應(yīng)用。
把硬盤從服務(wù)器中解耦出來,并使用SAS互連技術(shù)再將硬盤資源池和計算資源池互連起來,通過靈活的計算與存儲的數(shù)量搭配,不僅解決了計算與存儲的利用率均衡問題,還帶來了計算和存儲的冗余優(yōu)點。這種結(jié)構(gòu)為不同存儲密度、不同存儲熱度的應(yīng)用場景提供了靈活的選擇方案。

圖1 硬盤存儲資源池化解決方案
把GPU從服務(wù)器中解耦出來,并使用PCIe互連技術(shù)再將GPU資源池和計算資源池互連起來,通過不同的計算與GPU數(shù)量搭配,可以靈活的滿足不同AI應(yīng)用下對不同的GPU密度的需求,也為更大規(guī)模的GPU密度提供了解決方案。

圖2 GPU資源池化解決方案
天蝎3.0項目在硬件資源解耦和資源池化上的探索,不僅為國內(nèi)互聯(lián)網(wǎng)企業(yè)的應(yīng)用提供了創(chuàng)新的解決方案,幫助國內(nèi)企業(yè)優(yōu)化硬件成本,節(jié)約能源,也進一步推進了整個服務(wù)器產(chǎn)業(yè)向更加節(jié)能、環(huán)保的方向演進。
更多天蝎3.0項目的***詳細進展,請關(guān)注2017開放數(shù)據(jù)中心峰會!