您看我們還有機(jī)會嗎?
我這話一問出口,電話那頭的老客戶陳工明顯沉默了幾秒……
看來陳工也忙里偷閑的看了最近大火的《隱秘的角落》??!
陳工之所以托我推薦設(shè)備,是因為他們公司準(zhǔn)備做AI訓(xùn)練場景的項目,正在做設(shè)備選型。市面上形形色色的設(shè)備太多,陳工第一時間還是想到了有過合作的戴爾易安信。
我了解到,前期項目是用于研發(fā)測試。研發(fā)用了之前的PowerEdge R740服務(wù)器,并配置了一塊NVIDIA V100的顯卡。雖說V100的單卡AI效能分析能夠滿足本次的AI模型,但研發(fā)提出,希望能用更多卡的機(jī)型來進(jìn)行AI訓(xùn)練。
▐ 多卡NVIDIA V100的機(jī)型?這說的不就是我們戴爾易安信的DSS 8440嗎!于是我當(dāng)即給陳工發(fā)送了單臺DSS 8440放10張V100的配置。
只可惜研發(fā)很滿意,采購卻嫌貴。如果減少卡的數(shù)量?研發(fā)又不同意。
于是,陳工就又給我打了電話。
有沒有機(jī)會,當(dāng)然要看能不能提供讓研發(fā)和采購都滿意的方案。
那么,它會不會適合這個場景呢?
我打開了RTX6000與V100常用AI模型訓(xùn)練與推理效能對比測試。
基于POC數(shù)據(jù),針對主流AI圖像分類模型訓(xùn)練,RTX6000性能為V100的70%-80%,V100的單卡性能更強(qiáng)。
針對主流AI圖像分類模型推理,小數(shù)據(jù)量加載情況下(如batchsize=1或2,batchsize代表一次加載到GPU顯存的圖片數(shù)據(jù)),RTX6000性能更好,考慮原因是RTX6000峰值主頻更高;大數(shù)據(jù)量加載情況下(如batchsize=16),V100性能更好,考慮原因是V100的顯存帶寬性能更好。
▲RTX6000和V100的參數(shù)對比
▲RTX6000 vs V100 AI效能對比
顯然,有了上面的對比,我這心里就踏實多了。對于需要高性能機(jī)器學(xué)習(xí)但不需要絕對高性能的用戶來說,RTX6000是一套高性價比的機(jī)器學(xué)習(xí)訓(xùn)練替代方案。
此時,符合陳工需要的替代方案已經(jīng)呼之欲出,于是我立即編輯郵件發(fā)給陳工。
方案郵件發(fā)出去沒多久,我就接到了陳工的來電:
關(guān)于戴爾易安信HPC
如今,GPU在PC、工作站和服務(wù)器的運用越來越重要。而隨著5G建設(shè)帶來的更多大規(guī)模并行計算場景,也讓GPU有了更多的用武之地。
而隨著人工智能,深度學(xué)習(xí)的訓(xùn)練和推理等場景的廣泛需求,企業(yè)越來越需要能夠適應(yīng)多卡GPU場景的服務(wù)器。這也為戴爾易安信PowerEdge創(chuàng)造了更多一展身手的舞臺。
戴爾易安信PowerEdge多款服務(wù)器都支持多卡GPU,比如塔式最經(jīng)典的T640系列,機(jī)架式R740、R740XA、R840、R940xa,包括AMD平臺的R6515、R6525、R7515、R7525,模塊化服務(wù)器C6525,以及特別的兩款機(jī)型C4140和DSS 8440。
戴爾易安信PowerEdge系列具有以下三大特點:
1
DSS 8440是業(yè)界唯一支持8*Graphcore IPU、10*V100S/RTX8000/RTX6000或16*T4的加速器平臺。
DSS 8440 IPU服務(wù)器是雙插槽4U服務(wù)器,能夠為機(jī)器智能應(yīng)用提供卓越的性能,8個Graphcore C2 卡(雙IPU)可提供高達(dá)1.6PetaFLOP的混合精度機(jī)器智能計算能力。
▲DSS 8440-8個Graphcore C2 卡(雙IPU)
為什么要創(chuàng)建智能處理業(yè)務(wù)單元IPU?
這是因為客戶需要一種新型處理器,以便更有效地支持更復(fù)雜的知識模型,快速進(jìn)行訓(xùn)練和推導(dǎo),讓CPU和GPU為機(jī)器智能領(lǐng)域的創(chuàng)新者提供更多支持。
2
首發(fā)V100S在戴爾易安信PowerEdge 8款服務(wù)器平臺(C4140/DSS 8440/R7525/R740/R740xd/R940xa/R840/T640)。V100S的機(jī)型目前多數(shù)友商還沒有搭載RTS。
▲DSS 8440拓?fù)?ndash; 多達(dá) 10個V100S GPU
3
戴爾易安信PowerEdge是支持RTX6000/8000最多的Server/HCI平臺,共有7款(DSS 8440/R7525/R740/R740xd/T640/VxRail V570/570F)。對于需要高性能機(jī)器學(xué)習(xí)但不需要絕對高端性能的V100S GPU的客戶來說,RTX6000/8000提供了成本更低的機(jī)器學(xué)習(xí)訓(xùn)練替代方案。
這兩個加速器的成本比V100 GPU 低約30%,同時仍有其大約70%的性能,目前業(yè)界只有兩個友商的各自一款機(jī)架式機(jī)型能夠滿足。
▲比較Nvidia現(xiàn)售GPU規(guī)格
尊敬的讀者
說到GPU在AI方面的重要作用
下面這個課程
正是為您準(zhǔn)備的
特別帶來AI培訓(xùn)課程系列
本次課程
戴爾科技集團(tuán)
大中華區(qū)人工智能企業(yè)架構(gòu)師 吳躍
將和您探討當(dāng)今GPU計算優(yōu)化技術(shù)
并闡述IO瓶頸的關(guān)鍵節(jié)點
縱覽當(dāng)前主流AI深度學(xué)習(xí)存儲方案
歡迎掃描下圖二維碼
參加我們的課堂
相關(guān)內(nèi)容推薦:倒計時1天︱又一款Power新品破浪而來!
相關(guān)產(chǎn)品:PowerEdge R740 機(jī)架式服務(wù)器