華為云最強(qiáng)計(jì)算系列:異構(gòu)計(jì)算 軟硬結(jié)合 釋放超強(qiáng)算力
隨著信息化的普及,數(shù)據(jù)量暴增對(duì)互聯(lián)網(wǎng)產(chǎn)生了新的挑戰(zhàn),同時(shí),機(jī)器學(xué)習(xí)、人工智能、無(wú)人駕駛、工業(yè)仿真等領(lǐng)域的崛起,使得通用CPU在處理海量計(jì)算、海量數(shù)據(jù)/圖片時(shí)遇到越來(lái)越多的性能瓶頸,如并行度不高、帶寬不夠、時(shí)延高等。目前***的解決方法就是特定的事情讓特定的硬件去做,因此越來(lái)越多的場(chǎng)景開(kāi)始引入GPU、FPGA等硬件進(jìn)行加速,異構(gòu)計(jì)算應(yīng)運(yùn)而生。
華為云于2017年推出異構(gòu)計(jì)算服務(wù),包含GPU、FPGA多款實(shí)例滿(mǎn)足客戶(hù)不同場(chǎng)景需求。華為云異構(gòu)計(jì)算理念是不做單純的堆砌硬件,提倡深入硬件、聯(lián)合軟件做深度優(yōu)化,讓異構(gòu)計(jì)算的性能提升達(dá)到***,從而提供無(wú)短板的異構(gòu)計(jì)算服務(wù)。近日,在2018年首屆中國(guó)高性能云計(jì)算創(chuàng)新大賽中,華為云GPU P1型云主機(jī)以高出競(jìng)品40%的性能優(yōu)勢(shì)摘得《性能優(yōu)秀獎(jiǎng)》,同時(shí)首批獲得GPU云主機(jī)可信云認(rèn)證,再次向業(yè)界證明了華為云異構(gòu)計(jì)算的硬實(shí)力!
二十余載的技術(shù)積淀與創(chuàng)新,構(gòu)筑企業(yè)級(jí)全棧能力
為了讓異構(gòu)計(jì)算發(fā)揮***性能優(yōu)勢(shì),需要對(duì)硬件設(shè)計(jì)特定的算法以及軟件優(yōu)化,才能夠***化硬件能力,就是業(yè)界常說(shuō)的軟硬結(jié)合。要做到真正的軟硬結(jié)合,需要同時(shí)具備硬件、軟件、算法、調(diào)優(yōu)等多方面的積累,而華為正是少數(shù)同時(shí)具備此能力的廠商,華為有20多年的硬件積累,在虛擬化領(lǐng)域也有超過(guò)十年的積累。
下面通過(guò)兩個(gè)小例子,看看華為怎么做到真正意義上的軟硬結(jié)合:
- 硬件平臺(tái):華為云使用專(zhuān)為云環(huán)境優(yōu)化的Atlas智能硬件平臺(tái),Atlas平臺(tái)能夠針對(duì)異構(gòu)場(chǎng)景進(jìn)行定向優(yōu)化。比如在某些HPC或深度學(xué)習(xí)訓(xùn)練等的場(chǎng)景下,不僅需要超強(qiáng)的計(jì)算能力,還需要在GPU/FPGA之間傳輸大量的數(shù)據(jù),多個(gè)GPU/FPGA之間的拓?fù)浣Y(jié)構(gòu)對(duì)傳輸帶寬和時(shí)延的影響至關(guān)重要。Atlas 智能平臺(tái)可以對(duì)GPU/FPGA的拓?fù)浣Y(jié)構(gòu)動(dòng)態(tài)編排,根據(jù)實(shí)際客戶(hù)業(yè)務(wù)選擇最適合的拓?fù)浣Y(jié)構(gòu),使整個(gè)系統(tǒng)的綜合性能發(fā)揮到***。
- 虛擬化平臺(tái):虛擬化是云計(jì)算的基石,直接影響著客戶(hù)實(shí)際的性能體驗(yàn)。硬件經(jīng)過(guò)虛擬化之后,性能下降在所難免, 尤其像NVMe、GPU、FPGA這些超高性能的器件,在虛擬化下的性能損失非常嚴(yán)重。華為云虛擬化專(zhuān)家團(tuán)隊(duì)在Atlas硬件平臺(tái)的基礎(chǔ)上,通過(guò)優(yōu)化硬件直通能力,能夠做到性能無(wú)損。例如GPU p2p能力,友商虛擬化后的性能損失74%,而華為可以做到性能無(wú)損。
同等的硬件,領(lǐng)先的技術(shù)能力
***的GPU云服務(wù)器,不只是提供市面上***的GPU這么簡(jiǎn)單,只有真正做到軟硬結(jié)合,才能讓用戶(hù)有***的性能體驗(yàn)。以GPU互聯(lián)為例,從下圖我們可以對(duì)比不同的技術(shù)帶來(lái)的巨大性能差異。選取同等規(guī)格P100卡的雙GPU實(shí)例,華為云GPU互聯(lián)帶寬是友商的2.5倍,而這個(gè)性能差異對(duì)實(shí)際業(yè)務(wù)影響巨大,以生物分子仿真業(yè)務(wù)Amber數(shù)據(jù)來(lái)看,高帶寬能力能夠?qū)?*GPU的計(jì)算能力進(jìn)一步提升151%。
GPU p2p互聯(lián)帶寬對(duì)比圖
華為云異構(gòu)計(jì)算集合了整個(gè)華為的全棧優(yōu)勢(shì),并集結(jié)了華為芯片、硬件、FPGA、GPU、虛擬化、算法等各個(gè)領(lǐng)域?qū)<业闹腔?,真正做到了軟硬結(jié)合,對(duì)公有云的全棧優(yōu)化,讓客戶(hù)真正體驗(yàn)到軟硬結(jié)合的優(yōu)勢(shì)。
性能狀態(tài)了然于心
P1型云服務(wù)器接入華為云監(jiān)控服務(wù),能夠詳細(xì)監(jiān)控云服務(wù)器的各項(xiàng)性能指標(biāo)。除了CPU、內(nèi)存等各項(xiàng)指標(biāo)外,用戶(hù)能夠在云監(jiān)控服務(wù)平臺(tái)上查看詳細(xì)的GPU性能狀態(tài),比如GPU占用率等。用戶(hù)還可以根據(jù)需要設(shè)置告警,例如GPU占用率持續(xù)沖高告警。
如下圖,用戶(hù)能獲取指定時(shí)間段內(nèi)的GPU性能狀態(tài),根據(jù)這些性能趨勢(shì)對(duì)業(yè)務(wù)作進(jìn)一步的性能調(diào)優(yōu)。也能夠看出性能的忙閑程度,對(duì)業(yè)務(wù)做更好的規(guī)劃。
GPU性能狀態(tài)監(jiān)控圖
匠心打造,只做精品
華為云異構(gòu)計(jì)算從成立之初,就立志打造業(yè)界精品,P1型云服務(wù)器于2017年8月30日公測(cè)上線(xiàn),公測(cè)期間異構(gòu)計(jì)算的專(zhuān)家團(tuán)隊(duì)不斷傾聽(tīng)客戶(hù)的反饋意見(jiàn),貼合客戶(hù)場(chǎng)景對(duì)產(chǎn)品進(jìn)行持續(xù)優(yōu)化,最終為用戶(hù)呈現(xiàn)滿(mǎn)意的產(chǎn)品。
在2018年首屆中國(guó)高性能云計(jì)算創(chuàng)新大賽中,華為云GPU P1型云主機(jī)以高出競(jìng)品40%的性能優(yōu)勢(shì)摘得《性能優(yōu)秀獎(jiǎng)》,******異構(gòu)計(jì)算,再一次用實(shí)踐證明了用匠心打造的華為云異構(gòu)計(jì)算服務(wù)才是真真正正的精品。
穩(wěn)扎穩(wěn)打,做新計(jì)算時(shí)代的佼佼者
華為云異構(gòu)計(jì)算的宗旨是穩(wěn)扎穩(wěn)打只做精品,針對(duì)圖像圖像、人工智能、基因測(cè)序、視頻轉(zhuǎn)碼、圖片壓縮等領(lǐng)域打造新計(jì)算時(shí)代的爆款。而華為云的精品策略也確實(shí)打動(dòng)了一大批客戶(hù),以至于在免費(fèi)公測(cè)期間就已經(jīng)有了付費(fèi)客戶(hù)。
華為云異構(gòu)計(jì)算服務(wù)的理念就是不堆硬件,提供無(wú)短板的異構(gòu)計(jì)算服務(wù),我們也非常愿意把十余年的積累開(kāi)放出來(lái),幫助客戶(hù)將軟硬結(jié)合應(yīng)用到實(shí)際業(yè)務(wù)中,將客戶(hù)體驗(yàn)提升到新的高度。
點(diǎn)擊了解華為云GPU加速云服務(wù)器:https://www.huaweicloud.com/product/gpu.html