Nvidia公布首批14款AI工作負載認證服務器系統(tǒng)
Nvidia今天公布了第一批所謂的“ Nvidia認證系統(tǒng)”,主要針對那些希望大規(guī)模運行人工智能工作負載的企業(yè)組織。
Nvidia表示,已經(jīng)與戴爾、HPE、技嘉、浪潮、超微等服務器制造商展開合作,為這些這些系統(tǒng)進行認證證明其符合最佳設(shè)計實踐,并可以為最高級的機器學習和數(shù)據(jù)分析任務提供最佳性能。
這些新系統(tǒng)將采用Nvidia最高端的A100 GPU,并配合Mellanox高速網(wǎng)絡適配器,為企業(yè)在企業(yè)數(shù)據(jù)中心內(nèi)或者網(wǎng)絡邊緣運行AI工作負載提供更多不同選擇。
Nvidia GPU云產(chǎn)品管理總監(jiān)Adel El Hallak在新聞發(fā)布會上表示:“人工智能已經(jīng)成為主流”,客戶正在尋找有保障的功能、性能、可擴展性和安全性。
El Hallak說:“大規(guī)模部署AI很難,到目前為止都還是手動操作的。”他補充說,這些新認證的系統(tǒng)將有助于“將以前很復雜的東西變成交鑰匙型方案”。
Nvidia解釋說,每個經(jīng)過認證的系統(tǒng)都已經(jīng)在各種AI工作負載上進行了測試,從需要多個計算節(jié)點的工作負載,到只需要單個GPU一小部分資源的工作負載,其中每一個都經(jīng)過了優(yōu)化,可以運行Nvidia NGC目錄中的AI應用(該目錄針對GPU優(yōu)化AI應用的中心)。
Nvidia解釋說,這次認證涉及使用NGC目錄中最受歡迎的AI框架對AI工作負載進行測試,包括深度學習訓練和推理、機器學習算法、智能視頻分析、網(wǎng)絡和存儲的卸載等等。
El Hallak說:“我們正在對人們實際使用的工作負載進行測試,而且測試規(guī)模是很大的。“
Constellation Research分析師Holger Mueller表示,Nvidia的軟硬件都在AI方面逐步取得成功,“認證系統(tǒng)”正式一種典型的、行之有效的策略。
Mueller說:“企業(yè)高管喜歡得到平臺認證的系統(tǒng),因為這樣可以確??尚行院涂蛇w移性。更重要的是,這讓企業(yè)有可能以一種面向未來的方式在本地運行AI,因為Nvidia設(shè)法在所有主流公有云中也都支持Nvidia的平臺。這促使Nvidia成為一種AI的計算平臺,從而為下一代應用實現(xiàn)了本地系統(tǒng)和公有云之間的工作負載可遷移性。”
Nvidia表示,截止發(fā)布時已經(jīng)有14款系統(tǒng)通過認證可提供加速計算,包括Dell EMC PowerEdge R7525和R740機架服務器;技嘉R281-G30、R282-Z96、G242-Z11、G482-Z54、G492-Z51系統(tǒng);HPE Apollo 6500 Gen10系統(tǒng)和HPE ProLiant DL380 Gen10服務器;浪潮NF5488A5服務器以及Supermicro A+Server AS -4124GS-TNR和AS -2124GQ-NART。
這些系統(tǒng)中的每一款都帶有“Nvidia認證系統(tǒng)”的標識,證明它們是符合Nvidia最佳設(shè)計規(guī)范的,可以處理最苛刻的AI工作負載。在整個軟件堆棧中都可獲得企業(yè)支持,包括對開源代碼的支持。
Nvidia表示,目前有來自11個系統(tǒng)制造商的約70個系統(tǒng)正在參與該計劃,預計不久將宣布更多經(jīng)過Nvidia認證的系統(tǒng)。