降低人工智能成本50% 阿里云推出新一代異構(gòu)實例GN5i
9月12日,阿里云正式推出***一代GPU實例GN5i。這款產(chǎn)品主要適用于深度學(xué)習(xí)的在線推理(Inference)階段,可一鍵部署TensorFlow等主流深度學(xué)習(xí)框架,提供智能調(diào)度、自動運維、實時擴容等服務(wù)。人工智能產(chǎn)業(yè)用戶可通過GN5i搭建微秒級響應(yīng)的AI服務(wù),在線服務(wù)成本減少50%以上。
阿里云官網(wǎng)顯示,GN5i采用了英偉達(dá)Pascal架構(gòu)P4圖形處理器,提供***45Tops INT8整型計算能力和11TFlops FP32單精度浮點計算能力,在滿足數(shù)據(jù)處理吞吐的基礎(chǔ)上,時延***可達(dá)微秒級。支持小時付費,也支持包月包年。
此外,針對自建GPU服務(wù)器經(jīng)常會遇到的擴容難、適配難的問題,GN5i規(guī)格族提供了靈活彈性的系列化配置,可以根據(jù)深度學(xué)習(xí)計算力的要求,按需選擇合適的規(guī)格,分鐘級即可完成實例的創(chuàng)建,并可根據(jù)運算力需求進(jìn)行GPU實例的“Scale-out”水平擴容或“Scale-up”垂直變配。
阿里云高級技術(shù)專家龍欣介紹,在面向AI深度學(xué)習(xí)在線推理場景時,GN5i實例能夠給客戶帶來以下價值:
· 穩(wěn)定的企業(yè)級GPU計算能力,保障深度學(xué)習(xí)推理任務(wù)處理效率;
· 全面兼容主流深度學(xué)習(xí)框架,如TensorFlow、Caffe、MXNet、CNTK等;
· 配備阿里云高性能SSD云存儲,加速數(shù)據(jù)的讀取性能;搭配阿里云的OSS存儲服務(wù),能達(dá)到***的存儲性價比;
· 在滿足數(shù)據(jù)處理吞吐的基礎(chǔ)上,時延***可達(dá)微秒級;
· 推理型專用GPU,大幅降低AI在線服務(wù)建設(shè)成本;
· GN5i的推出進(jìn)一步豐富了阿里云異構(gòu)計算家族的產(chǎn)品線。針對模型訓(xùn)練學(xué)習(xí),阿里云在今年5月推出了高性能GPU實例GN5,單實例最多可提供8個英偉達(dá) P100 GPU、2萬多個并行處理核心,***75TFLOPS FP32單精度浮點、150 TFLOPS FP16半精度浮點和37 TFLOPS FP64雙精度浮點運算能力,每個P100搭配的16GB HBM2 3D堆疊內(nèi)存提供了高達(dá)732GB每秒的數(shù)據(jù)傳輸速率,配合GN5i可有效保障深度學(xué)習(xí)的處理效率。
除了產(chǎn)品層面,阿里云還提供了全方位的人工智能產(chǎn)業(yè)服務(wù),包括智能語音交互、圖像/視頻識別、交通預(yù)測、情感分析等技術(shù)服務(wù),這些技術(shù)正通過阿里云ET對外輸出。過去一年,阿里云推出ET城市大腦、ET工業(yè)大腦、ET醫(yī)療大腦等行業(yè)垂直的人工智能系統(tǒng),為工廠或者醫(yī)院創(chuàng)造更多利潤或者更高的診斷準(zhǔn)確率。