華為云全球率先引入GPU加速型容器,助AI算力高效運(yùn)轉(zhuǎn)
1月25日,華為云·云容器實(shí)例(CCI)全球首發(fā)基于K8S的serverless GPU加速型容器實(shí)例。這是繼華為云在全球首發(fā)基于K8S的容器實(shí)例后,為容器實(shí)例服務(wù)提供更豐富的計(jì)算選擇,給關(guān)注AI、視頻處理等高性能計(jì)算的企業(yè)和開發(fā)者帶來(lái)更多的玩法。
AI算力需求迎來(lái)爆發(fā)式增長(zhǎng)
以AI場(chǎng)景為例,OpenAI發(fā)布研究報(bào)告,透露2012年到2018年6年間單次AI訓(xùn)練的計(jì)算量增加30萬(wàn)倍,這意味著訓(xùn)練計(jì)算量每3.5個(gè)月翻倍,是摩爾定律的5倍。同時(shí),AI正在向各行各業(yè)普及,因此AI算力的需求會(huì)出現(xiàn)爆炸式增長(zhǎng)。公有云因?yàn)榈统杀镜挠布?、無(wú)需關(guān)注基礎(chǔ)設(shè)施、0交付周期的優(yōu)勢(shì),是客戶在有AI算力需求時(shí)是更好的選擇。
隨著容器技術(shù)逐漸被各個(gè)領(lǐng)域開發(fā)者接受,大家發(fā)現(xiàn)容器技術(shù)可以提供標(biāo)準(zhǔn)化的容器打包,解決AI場(chǎng)景中不同工具對(duì)環(huán)境的依賴。用戶在搭建深度學(xué)習(xí)訓(xùn)練環(huán)境,需要準(zhǔn)備帶GPU的機(jī)器,安裝python,tensorflow,GPU驅(qū)動(dòng)等,如果要從開發(fā)環(huán)境到測(cè)試環(huán)境,再?gòu)臏y(cè)試環(huán)境到生成環(huán)境,涉及環(huán)境遷移過(guò)程中如何保證環(huán)境的一致性。然而容器帶來(lái)的標(biāo)準(zhǔn)化打包能力可以提供了***的解決方案,可以極大降低AI平臺(tái)的復(fù)雜度,做到多訓(xùn)練框架并存、大幅簡(jiǎn)化生產(chǎn)環(huán)境部署。
目前K8S已經(jīng)成為業(yè)界最主流的容器管理平臺(tái),它提供靈活的編排調(diào)度系統(tǒng),可以滿足大規(guī)模、高并發(fā)的AI分布式訓(xùn)練,大幅提高訓(xùn)練速度。因此,公有云GPU容器實(shí)例對(duì)AI用戶的吸引力越來(lái)越高。
華為云·GPU加速型云容器實(shí)例
華為云·云容器實(shí)例本次發(fā)布的GPU加速型容器實(shí)例本質(zhì)是在Serverless K8S的基礎(chǔ)上提供GPU算力,這兩個(gè)技術(shù)的結(jié)合給AI、基因、視頻處理等場(chǎng)景帶來(lái)不一樣的體驗(yàn)。
- 免運(yùn)維。相比傳統(tǒng)租用云服務(wù)器、甚至自建IDC,GPU加速型容器實(shí)例無(wú)需客戶維護(hù)集群、考慮集群的升級(jí)、社區(qū)bug修復(fù)、集群資源利用率等問(wèn)題,直接購(gòu)買和管理GPU容器實(shí)例。同時(shí),CCI提供了可視化的pod CPU/MEM/GPU監(jiān)控功能,可以實(shí)時(shí)監(jiān)控處理過(guò)程,極大的簡(jiǎn)化運(yùn)維成本.
- 高性能。華為云GPU加速型云容器實(shí)例支持秒級(jí)伸縮和高并發(fā),kata容器啟動(dòng)速度實(shí)測(cè)600ms,集群規(guī)模高達(dá)上十萬(wàn)容器實(shí)例,讓客戶快速利用GPU實(shí)例實(shí)現(xiàn)分布式計(jì)算。例如,華為云EI使用該GPU容器實(shí)例,在斯坦福大學(xué)DAWNBench測(cè)試中取得前兩名的好成績(jī),并達(dá)到0.8+的GPU線性加速比。
- 低成本。很多高性能計(jì)算時(shí)長(zhǎng)非常靈活,以AI訓(xùn)練為例,很多場(chǎng)景下,客戶需要快速、多次計(jì)算進(jìn)行迭代。華為云GPU加速型云容器實(shí)例提供按需按秒計(jì)費(fèi),讓客戶真正按業(yè)務(wù)計(jì)算市場(chǎng)進(jìn)行消費(fèi),避免包年包月帶來(lái)的高成本。
華為云·GPU加速型云容器實(shí)例在Serverless K8S上展現(xiàn)了免運(yùn)維、高性能、低成本算力的優(yōu)勢(shì),逐步成為解決AI場(chǎng)景中各種環(huán)境問(wèn)題的利器。未來(lái)也將在AI、基因、視頻處理等行業(yè),為高性能計(jì)算的企業(yè)和開發(fā)者提供更加高效,安全、低成本的公有云服務(wù)。