擊敗剩下的0.02%人類選手
今年10月30日
DeepMind在《自然》雜志上
發(fā)表的一篇論文
仿佛又一次把人們的視線
拉回了兩年前的那場(chǎng)
“世紀(jì)大戰(zhàn)”之中
不過,這回的主角不是
“阿爾法狗”(AlphaGo)
而是AlphaStar
這位《星際爭(zhēng)霸2》玩家
在歐洲服務(wù)器擊敗了
99.8%人類選手
有同學(xué)聽后不以為然
“也沒有掃遍天下無(wú)敵手嘛。”
然而事實(shí)是
一局典型《星際爭(zhēng)霸》游戲的
搜索空間大約是一盤典型
圍棋棋局的101799640倍
而要擊敗剩下的0.02%人類選手
也只是個(gè)時(shí)間問題
從深藍(lán)到AlphaGo
再到AlphaStar
過去10年,人工智能在機(jī)器視覺、
深度學(xué)習(xí)、自然語(yǔ)言處理
等領(lǐng)域取得了重大突破
而在這條道路上
計(jì)算力是重要的推動(dòng)力
OpenAI在2018年一份研究報(bào)告顯示:2012年起,AI消耗的計(jì)算力平均每3.43個(gè)月增長(zhǎng)一倍,過去6年時(shí)間內(nèi)已經(jīng)增長(zhǎng)30萬(wàn)倍。GPU計(jì)算是當(dāng)下AI深度學(xué)習(xí)訓(xùn)練和推理計(jì)算的首選架構(gòu),F(xiàn)PGA與ASIC亦在積蓄力量。
戴爾科技集團(tuán)持續(xù)投入到AI計(jì)算解決方案研究,并將我們的研究成果、效能測(cè)試、技術(shù)白皮書,分享給用戶及TensorFlow、Caffe、MXNet等主流開源框架社區(qū)。戴爾易安信在DSS8440、C4140、R740、R740xd、R940xa、R840、R7425、T640、XR2等多款服務(wù)器上,提供超過50種AI GPU加速配置方案支持,總有一款可以滿足您的需求。
全方位的AI GPU加速配置方案
總有一款可以滿足您
DSS8440
DSS8440是戴爾易安信設(shè)計(jì)的一款動(dòng)態(tài)機(jī)器學(xué)習(xí)加速平臺(tái),4U機(jī)箱可以支持最多10張Nvidia當(dāng)前性能最高的V100加速卡或者8張戴爾投資AI芯片企業(yè)GraphcoreIPU ASIC加速卡,適合于各種AI計(jì)算環(huán)境下深度學(xué)習(xí)模型訓(xùn)練。DSS8440提供更強(qiáng)的環(huán)境適應(yīng)能力,支持在35℃環(huán)境下205W CPU以及GPU加速器。
C4140是戴爾易安信為AI計(jì)算精心打造的另外一款智能計(jì)算神器。C4140機(jī)箱只有1U,卻可以在有限的空間內(nèi)支持4張最高性能的雙寬GPU加速卡、本地NVMe SSD硬盤以及100Gb低延遲網(wǎng)卡,為用戶提供極佳的數(shù)據(jù)中心空間GPU計(jì)算密度。
R940xa
當(dāng)前很多復(fù)雜的AI應(yīng)用場(chǎng)景,往往使用多種算法的集成學(xué)習(xí),以達(dá)到更好的模型精度,解決小數(shù)據(jù)樣本下的機(jī)器學(xué)習(xí),比如工業(yè)產(chǎn)品外觀缺陷檢測(cè)。而不同算法可能會(huì)選擇不同的計(jì)算介質(zhì),比如深度學(xué)習(xí)選擇GPU,經(jīng)典機(jī)器學(xué)習(xí)使用CPU。此時(shí),戴爾易安信R940xa四路計(jì)算加速服務(wù)器,可以提供CPU與GPU 1:1的計(jì)算配比,幫助用戶應(yīng)對(duì)復(fù)雜集成學(xué)習(xí)環(huán)境下模型訓(xùn)練加速。
R740
同時(shí),隨著AI產(chǎn)業(yè)化不斷深入,推理計(jì)算需求增速明顯。戴爾易安信R740服務(wù)器也在AI推理計(jì)算場(chǎng)景中廣泛采用,2U機(jī)箱可以支持8張T4或P4 GPU。R740提供多矢量散熱技術(shù),可針對(duì)不同GPU卡運(yùn)行工作負(fù)載智能調(diào)節(jié)風(fēng)扇轉(zhuǎn)速。
此外,隨著AI計(jì)算朝向邊緣端進(jìn)展,很多場(chǎng)景下如工業(yè)生產(chǎn)線、移動(dòng)通信基站、變電站等,對(duì)散熱、防塵等環(huán)境參數(shù)要求更加苛刻。而戴爾易安信XR2服務(wù)器搭載NvidiaT4,采用工業(yè)加固型服務(wù)器設(shè)計(jì),提供臟亂、多塵環(huán)境下的過濾擋板,機(jī)箱深度僅為20英寸,復(fù)合嚴(yán)格的海事和軍用標(biāo)準(zhǔn),可以適應(yīng)復(fù)雜嚴(yán)苛環(huán)境下AI邊緣計(jì)算需求。
戴爾易安信聯(lián)合驅(qū)動(dòng)科技
為用戶構(gòu)建數(shù)據(jù)中心級(jí)AI資源池
IT軟件及硬件,一文一武,相得益彰。好的硬件設(shè)施,也需要好的資源管理與調(diào)度軟件,以實(shí)現(xiàn)AI計(jì)算資源的按需分配和隨需擴(kuò)展。戴爾易安信聯(lián)合AI計(jì)算平臺(tái)合作伙伴趨動(dòng)科技,基于獵戶座AI軟件實(shí)現(xiàn)GPU虛擬化,為用戶構(gòu)建數(shù)據(jù)中心級(jí)AI資源池,應(yīng)用無(wú)需修改即可透明共享和使用數(shù)據(jù)中心內(nèi)任何服務(wù)器上的AI加速器。
“化整為零”
支持將一塊物理GPU細(xì)粒度分割為多塊虛擬GPU,分配給多個(gè)虛擬機(jī)或容器同時(shí)使用,實(shí)現(xiàn)GPU資源的高效共享,提高AI計(jì)算資源利用率。有別于傳統(tǒng)GPU虛擬化只切割顯存,CUDA核心只能時(shí)分復(fù)用方式,獵戶座AI計(jì)算平臺(tái)可以實(shí)現(xiàn)虛擬GPU顯存和算力的獨(dú)立配置和限制。顯存和算力,既支持顯存和CUDA計(jì)算核心的等比例分配,也支持非等比例分配,從而提高資源利用率,降低成本。
“化零為整”
支持將單臺(tái)以及多臺(tái)服務(wù)器的GPU資源提供給一個(gè)虛擬機(jī)或容器使用,AI應(yīng)用無(wú)需修改代碼。用戶可以將多臺(tái)物理服務(wù)器計(jì)算資源聚合后提供給單一應(yīng)用使用,為用戶的AI應(yīng)用提供數(shù)據(jù)中心級(jí)超級(jí)算力,同時(shí)對(duì)應(yīng)用透明。
“隔空取物”
支持將虛擬機(jī)或容器運(yùn)行在一臺(tái)沒有物理GPU的服務(wù)器上,透明地使用另外一臺(tái)服務(wù)器上的GPU資源,而無(wú)需修改AI應(yīng)用代碼。借助這項(xiàng)功能,用戶可以構(gòu)建數(shù)據(jù)中心級(jí)GPU資源池,應(yīng)用可以無(wú)障礙地部署到數(shù)據(jù)中心內(nèi)的任意服務(wù)器,并能夠透明地使用任意服務(wù)器之上的GPU資源。
“隨需應(yīng)變”
支持用戶在虛擬機(jī)或者容器的生命周期內(nèi),動(dòng)態(tài)分配和釋放GPU計(jì)算資源,實(shí)現(xiàn)真正的GPU資源動(dòng)態(tài)伸縮,極大提升了GPU資源調(diào)度的靈活度。
獵戶座AI計(jì)算平臺(tái),可以在極少性能損耗下,實(shí)現(xiàn)GPU計(jì)算資源虛擬化,按需分配,靈活擴(kuò)展和應(yīng)用透明。
在之前進(jìn)行的一項(xiàng)基于Nvidia Tesla P40的測(cè)試中,用例運(yùn)行在物理GPU、虛擬GPU容器環(huán)境、虛擬GPUKVM虛擬機(jī)環(huán)境,以及通過25Gb ROCE網(wǎng)卡使用遠(yuǎn)程虛擬GPU資源,運(yùn)行VGG16、ResNet50、ResNet152、Inception3主流圖像分類模型訓(xùn)練,虛擬GPU與物理GPU性能差距幾乎可以忽略不計(jì)。
通過適用于不同場(chǎng)景、不同AI應(yīng)用負(fù)載的AI加速服務(wù)器硬件,以及提供創(chuàng)新AI虛擬化技術(shù)的獵戶座軟件平臺(tái),我們?yōu)閿?shù)據(jù)科學(xué)家提供一套高效經(jīng)濟(jì)的AI計(jì)算平臺(tái)。未來的AI計(jì)算平臺(tái),將如同我們兒時(shí)手中的魔方,隨著數(shù)據(jù)科學(xué)家的需要,快速變換出應(yīng)用所需的AI計(jì)算資源,為拓展人工智能邊界提供有利的計(jì)算利器。