華為成功為瑞士洛桑聯(lián)邦理工學(xué)院升級(jí)HPC系統(tǒng)
空氣動(dòng)力學(xué)、空間技術(shù)的開(kāi)發(fā);長(zhǎng)期氣候預(yù)測(cè)、高精度天氣預(yù)報(bào)、海洋環(huán)流計(jì)算、空氣與水污染的模擬分析、洪水與地震等災(zāi)害的預(yù)報(bào);發(fā)動(dòng)機(jī)設(shè)計(jì)、模具設(shè)計(jì)、生物新藥設(shè)計(jì)、風(fēng)洞試驗(yàn)仿真、石油地質(zhì)勘探及新材料研究……所有這些與HPC(High Performance Computing,高性能計(jì)算)都緊密相關(guān)。
發(fā)展速度極快、應(yīng)用愈發(fā)廣泛,這就是HPC當(dāng)前的現(xiàn)狀。之所以會(huì)呈現(xiàn)這樣的態(tài)勢(shì),主要是出于兩方面的原因。一是需求促使,當(dāng)下是數(shù)據(jù)社會(huì),數(shù)據(jù)量越來(lái)越大、再加上人們對(duì)數(shù)據(jù)分析效率的追求越來(lái)越高,需要更強(qiáng)大的計(jì)算力做支撐;二是技術(shù)進(jìn)步,信息技術(shù)這些年發(fā)展很快,HPC資源的獲取之前需要大量的人力、物力投入,而現(xiàn)在以比較小的代價(jià)就能享受其強(qiáng)大的能力。
二者相互交織、促進(jìn),使得越來(lái)越多的行業(yè)開(kāi)始使用HPC,感受HPC帶來(lái)的變革。這其中,高等教育行業(yè)絕對(duì)是一個(gè)典型。粗略統(tǒng)計(jì)了一下今年6月發(fā)布的全球高性能計(jì)算機(jī)(HPC)TOP500榜單,其中有41套歸屬于大學(xué),占比超過(guò)8%,分量可想而知。
為什么高教行業(yè)對(duì)HPC的需求那么強(qiáng)烈?與HPC快速普及的原因一脈相承,但高教的特點(diǎn)更突出。
拿汽車(chē)制造業(yè)來(lái)說(shuō),汽車(chē)生產(chǎn)企業(yè)會(huì)利用HPC進(jìn)行車(chē)輛設(shè)計(jì),而高校也會(huì)有相應(yīng)的課程,也會(huì)用到HPC,二者都有需求。所不同的是汽車(chē)制造商只利用HPC干汽車(chē)制造這一件事,而高校還會(huì)有物理、化學(xué)、生物等其它學(xué)科需要HPC的能力。也就是說(shuō),相比企業(yè),高校在HPC領(lǐng)域的應(yīng)用范疇更廣。到此,也就不難理解為什么HPC能在高教行業(yè)發(fā)展如此之快了。
EPFL出難題
為了更進(jìn)一步探討高教對(duì)HPC的使用情況,這里舉一個(gè)實(shí)際案例,瑞士洛桑聯(lián)邦理工學(xué)院(EPFL) 。
EPFL,世界***高校,QS世界大學(xué)排名第12,工程技術(shù)領(lǐng)域和自然科學(xué)領(lǐng)域享有極高的聲望,擁有來(lái)自全球120個(gè)國(guó)家和地區(qū)的學(xué)生、教授和職員。為了保持業(yè)界領(lǐng)先的科研水平,EPFL一直在加強(qiáng)HPC系統(tǒng)的建設(shè),早在2008年就建設(shè)了***套HPC系統(tǒng)服務(wù)于全校師生。
著眼于未來(lái)的競(jìng)爭(zhēng)力提升,從去年開(kāi)始EPFL就計(jì)劃對(duì)其HPC系統(tǒng)進(jìn)行升級(jí)擴(kuò)容。升級(jí)的理由很簡(jiǎn)單,資源不夠用了。在EPFL給出的需求表中,最顯眼的一欄是應(yīng)用需求,HPC benchmark、HPL、HPCG等基準(zhǔn)測(cè)試要滿足;科學(xué)、工程、生物、醫(yī)療等各種應(yīng)用,其中既有EPFL自行開(kāi)發(fā)的也包括開(kāi)源的都要能運(yùn)行。
除此之外,還有很多硬性條件,比如理論計(jì)算能力≥475TFlops,共享存儲(chǔ)≥340TB,讀寫(xiě)帶寬40G/s,整個(gè)系統(tǒng)不能超過(guò)8個(gè)機(jī)柜,單機(jī)柜功耗不能高于25kw;系統(tǒng)要開(kāi)放、易管理、易擴(kuò)展,而且合作伙伴要有足夠的技術(shù)前瞻性,能為EPFL未來(lái)5年建設(shè)5PF HPC集群的總目標(biāo)提供足夠的支撐力。
華為見(jiàn)招拆招
單獨(dú)看某一方面的需求可能還比較好滿足,但如果把所有需求都集中在一起,會(huì)發(fā)現(xiàn)這塊骨頭并不好啃。沒(méi)有壓力也就沒(méi)有動(dòng)力,華為和當(dāng)?shù)叵到y(tǒng)集成商Transtec迎難而上,經(jīng)過(guò)多次詳細(xì)分析,最終給出了現(xiàn)在的方案,拓?fù)鋱D如下:
其中,計(jì)算節(jié)點(diǎn)采用408個(gè)FusionServer XH620,每個(gè)節(jié)點(diǎn)是兩路至強(qiáng)E5-2690 v4處理器,理論計(jì)算峰值475.2TFlops,網(wǎng)絡(luò)采用2層Fat-Tree組網(wǎng),Infiniband高速網(wǎng)絡(luò),存儲(chǔ)系統(tǒng)是6套OceanStor 5800+GPFS并行文件系統(tǒng),容量計(jì)350TB。
在這套方案中,華為采用了很多領(lǐng)先的產(chǎn)品和技術(shù),帶來(lái)的效果也十分顯著。比如華為X6800高密度服務(wù)器的應(yīng)用,使得單機(jī)柜計(jì)算能力提升70%的同時(shí),機(jī)柜的部署數(shù)量也節(jié)省了40%。因?yàn)閄6800在4U空間內(nèi)能***容納8個(gè)計(jì)算節(jié)點(diǎn)、16路處理器,而采用普通的1U雙路服務(wù)器則需要8U空間。這樣一來(lái),408個(gè)計(jì)算節(jié)點(diǎn)只需要6個(gè)機(jī)柜就能滿足,而不是10個(gè)。
再比如,X6800中采用的散熱工程設(shè)計(jì),再加上DEMT動(dòng)態(tài)節(jié)能技術(shù),使得能耗比傳統(tǒng)機(jī)架服務(wù)器降低10%-20%。
更多特性不再一一列舉。憑借高效、高性能、高可擴(kuò)展性、易管理等特性,華為的這套方案受到認(rèn)可并得以部署。而從現(xiàn)在的實(shí)際應(yīng)用情況看,這套方案完全滿足用戶需求,402TFLOPS的實(shí)測(cè)數(shù)據(jù),計(jì)算效率達(dá)到89.3%。
今年6月,EPFL與華為共同宣布其科學(xué)IT和應(yīng)用支持(SCITAS)部的Fidis HPC集群成功上線。
EPFL SCITAS執(zhí)行董事Vittoria Rezzonico女士在接受采訪時(shí)對(duì)華為給予高度評(píng)價(jià)。她說(shuō):“Transtec和華為緊密合作,為EPFL提供了一個(gè)***高質(zhì)量的系統(tǒng),很好地滿足了我們?cè)诟咝阅苡?jì)算學(xué)術(shù)領(lǐng)域的需求。華為技術(shù)工程師為我們介紹的出色的硬件解決方案以及Transtec專(zhuān)業(yè)的規(guī)劃、安裝和配置服務(wù),讓我們印象非常深刻。”
目前,華為的產(chǎn)品和解決方案已經(jīng)應(yīng)用于170多個(gè)國(guó)家和地區(qū),服務(wù)全球1/3的人口。在全球財(cái)富500強(qiáng)中有172家,全球財(cái)富100強(qiáng)中有43家領(lǐng)先企業(yè)選擇了華為作為數(shù)字化轉(zhuǎn)型的伙伴。