“HPC和AI創(chuàng)新實驗室”,為戴爾科技提供不斷創(chuàng)新的源動力
少林寺的藏經(jīng)閣
逍遙派的靈鷲宮
在武俠世界中
各大門派總有一處秘密“基地”
存放著秘籍至寶
戴爾科技也有這樣一個
“殿堂級”實驗室
那里有高性能計算領(lǐng)域
最先進的IT設(shè)備和技術(shù)
今天小編決定自爆“家底”
跟大家嘮嘮關(guān)于戴爾科技
HPC和AI創(chuàng)新實驗室的二三事
前一段時間全球芯片荒鬧得沸沸揚揚,美國、日本占據(jù)了半導(dǎo)體產(chǎn)業(yè)鏈第一梯隊,其實歐洲有一個國家在芯片制造領(lǐng)域也擁有很高的話語權(quán),那就是風(fēng)車之國荷蘭。
除了芯片等高端設(shè)備制造和機械產(chǎn)業(yè),荷蘭在醫(yī)療信息、生物制藥等生命科學(xué)與健康領(lǐng)域也擁有很強的技術(shù)地位。而這一優(yōu)勢得益于企業(yè)、學(xué)術(shù)協(xié)會和政府之間的良好合作。
風(fēng)車之國的“酷炫”項目
更快、更高、更強是奧林匹克運動的口號,而高性能計算也在追求更快的運算速度、更高的性能以及更強的可擴展性。當(dāng)荷蘭的科學(xué)家需要獲得高性能計算系統(tǒng)和先進的數(shù)據(jù)服務(wù)時,他們通常會向Surfsara超級計算中心尋求幫助。
該中心隸屬于荷蘭教育和研究機構(gòu)的合作協(xié)會——Surf,運營著荷蘭國家超級計算機和其他高性能計算系統(tǒng)。
Surfsara與研發(fā)新藥、改進太陽能電池、研究天氣系統(tǒng)以及執(zhí)行其他計算和數(shù)據(jù)密集型研究計劃的團隊展開合作,為研究人員提供廣泛的支持,包括計算、數(shù)據(jù)存儲、可視化、網(wǎng)絡(luò)和云服務(wù)等。同時,它還致力于幫助組織利用深度學(xué)習(xí)能力來實現(xiàn)新的人工智能應(yīng)用。
比如說,在2018年開始實施的一個項目中,Surfsara的一個研究小組就利用戴爾科技HPC和AI創(chuàng)新實驗室的資源,訓(xùn)練出一個能夠從胸部X光片中診斷出肺炎、肺氣腫和其他胸腔病癥的AI模型。
具體說來,這個項目堪稱“酷炫”。團隊將HPC和AI創(chuàng)新實驗室的戴爾易安信Zenith超級計算機和256個英特爾®至強®可擴展處理器節(jié)點一起投入使用,利用并行計算的力量加速訓(xùn)練過程。
通過優(yōu)化網(wǎng)絡(luò)拓撲結(jié)構(gòu)、提高訓(xùn)練吞吐量,并使用全尺寸的X射線圖像,研究人員能夠快速對數(shù)據(jù)集進行處理,以便建立更高精度的模型。
Surfsara高級HPC顧問Valeriu Codreanu博士表示:
“一般來說,在HPC中強擴展是很難實現(xiàn)的,但我們在強擴展的情況下,用200多個節(jié)點成功實現(xiàn)了121倍的性能。在單個節(jié)點上訓(xùn)練一個變壓器模型需要一個多月的時間,通過使用這些節(jié)點,我們成功地將訓(xùn)練時間縮減到只需六個小時。”
在提高準(zhǔn)確率方面,結(jié)果也是令人滿意的。與最初的模型相比,利用Zenith和英特爾節(jié)點訓(xùn)練的AI模型提高了14種胸部病癥中10種病癥的診斷準(zhǔn)確率,有幾個類別甚至達到近90%的準(zhǔn)確率。
創(chuàng)新實驗室的三大“金剛”
在AI模型訓(xùn)練方面如此給力的戴爾科技HPC和AI創(chuàng)新實驗室,坐落于德克薩斯州首府奧斯汀市。它擁有一個占地約13000平方英尺的數(shù)據(jù)中心,容納了數(shù)以千計的服務(wù)器、存儲和網(wǎng)絡(luò)系統(tǒng)。
該實驗室承擔(dān)了戴爾科技大量的創(chuàng)新工作,從硬件體系結(jié)構(gòu)的設(shè)計到深度學(xué)習(xí)系統(tǒng)的應(yīng)用,從各種HPC與AI的研究到售前與售后服務(wù),可以說這個實驗室無所不包,也成為了戴爾科技不斷創(chuàng)新的源動力。
HPC和AI創(chuàng)新實驗室常見項目包括:
01
集群比較。在三個不同的集群上測試工作負載,看哪一個能夠提供最好的性能。
02
系統(tǒng)參數(shù)掃描。建立一個系統(tǒng)測試平臺,找出核心數(shù)量、內(nèi)存和處理器速度的組合,以優(yōu)化應(yīng)用性能。
03
加速器測試比較。找出哪個加速器最符合需要。
04
效率調(diào)整。為應(yīng)用確定最佳的基本輸入/輸出系統(tǒng)(BIOS)和其它設(shè)置和配置。
05
網(wǎng)絡(luò)測試。弄清哪種HPC網(wǎng)絡(luò)最適合應(yīng)用性能要求。
06
存儲系統(tǒng)優(yōu)化。建立和測試HPC存儲和文件系統(tǒng),不管是分層的還是其它的,以獲得最佳性能。
說起來,戴爾科技HPC和AI創(chuàng)新實驗室最吸引人的,就是Zenith、Rattler和Minerva這三個強大的高性能計算集群。讓我們來“康康”這三大“金剛”有何過人之處?
Zenith
Zenith集群是戴爾科技和英特爾之間合作的成果。團隊使用它來進行基準(zhǔn)測試、工作負載評估以及廣泛的人工智能、高性能數(shù)據(jù)分析和高性能計算項目。
Zenith包括英特爾®至強®可擴展處理器、數(shù)據(jù)中心存儲解決方案、FPGA、適配器、軟件和工具。項目包括圖像分類以識別X射線中的疾病,建立更快的神經(jīng)網(wǎng)絡(luò)以驅(qū)動推薦引擎等。
Rattler
Rattler集群是戴爾科技和NVIDIA之間合作的成果。該系統(tǒng)旨在通過利用GPU與NVLINKTM來展示極強的可擴展性。Rattler不僅可以加速服務(wù)器內(nèi)部GPU之間的流量,還可以通過InfiniBand互連在服務(wù)器之間進行加速。團隊使用該系統(tǒng)進行特定應(yīng)用的基準(zhǔn)測試和工作負載特性分析。
Minerva
Minerva集群是戴爾科技與AMD合作的成果,采用PowerEdge C6525服務(wù)器,配備第二代AMD EPYC™處理器、InfiniBand HDR200和BeeGFS存儲。這個集群突出了最新的服務(wù)器工程,旨在利用最新的內(nèi)核、內(nèi)存帶寬和PCIe Gen4吞吐量技術(shù)。
敲黑板,這些集群可不是一成不變的,實驗室團隊會不斷對集群進行擴展和改進,使它們保持巔峰性能。比方說,基于戴爾易安信PowerEdge C6420和PowerEdge R740服務(wù)器而構(gòu)建的Zenith,未來將升級到由新一代PowerEdge C6520和PowerEdge R750服務(wù)器組合而成。
20多年來,戴爾科技在HPC領(lǐng)域不斷創(chuàng)新,除了成立了HPC和AI創(chuàng)新實驗室,作為首家提供HPC打包的方案廠商,持續(xù)推出高密度、高性能GPU計算服務(wù)器,以及存儲加速器(DAC)等。未來,戴爾科技將通過在產(chǎn)品和解決方案方面的不斷創(chuàng)新,繼續(xù)滿足各界對高性能計算方面的需求。
所有大朋友們 兒童節(jié)快樂!
這里還有一份驚喜等著你們
即日起
戴爾科技618企業(yè)購機節(jié)
精彩開啟!
新品0元試用、千元優(yōu)惠券
每日整點秒殺、曬單領(lǐng)好禮……
特惠狂歡 只等你來
快來點擊文末閱讀原文
速速參與活動
相關(guān)內(nèi)容推薦:戴爾科技參展世界頂級超算會議,并榮膺大獎
文章來自公眾號戴爾易安信解決方案