劍橋大學超級計算機,用的是PowerEdge服務(wù)器
當超級計算機的數(shù)據(jù)處理能力飛速向前發(fā)展,存儲I/O卻成為了瓶頸,制約著那些運行數(shù)據(jù)密集型工作負載的人員更快獲取洞察的可能。而現(xiàn)在,劍橋大學已經(jīng)解決了該問題。為此,他們在Virtual Institute公布的2019I/O-500榜單中,以620.69的得分位列第一,領(lǐng)先第二名290分!
談到這一話題時,劍橋大學高性能計算主任Paul Calleja表示:“通過獨特的數(shù)據(jù)加速器,我們已經(jīng)破解了HPC存儲問題。”
而這個數(shù)據(jù)加速器的背后,正是由戴爾科技提供技術(shù)支撐。
助力世界頂尖學府
加速前沿科學研究
坐落于英國劍橋的劍橋大學建立于1209年,乃是世界上最古老的大學之一,也是備受尊崇的學術(shù)中心。其開展的均為前沿的科學研究,這也是大學使命的一部分,即通過追求國際最高水平的教育、學習和研究為社會做出貢獻。
這些原則指導著劍橋大學研究計算服務(wù)部的工作,該服務(wù)部為學校所有學科以及英國科學界和工業(yè)界等領(lǐng)域提供計算服務(wù)。如今,為了幫助他們保持在人工智能(AI)和科學研究領(lǐng)域的領(lǐng)先優(yōu)勢,研究計算服務(wù)部啟動了英國最大的學術(shù)超級計算機“Cumulus–英國科學云”。
Cumulus采用搭載英特爾®至強®處理器和英特爾®Omni-Path架構(gòu)的戴爾易安信PowerEdge服務(wù)器,其性能可達每秒超過2千萬億次浮點運算。該系統(tǒng)集成了OpenStack軟件,以控制計算、存儲和網(wǎng)絡(luò)資源池,并使用戶可以通過云界面隨時訪問這些資源。
Cumulus還集成了高度創(chuàng)新的戴爾數(shù)據(jù)加速器(Dell Data Accelerator:DAC)。DAC系統(tǒng)由戴爾易安信PowerEdge R740xd服務(wù)器構(gòu)建。Cumulus使用了24臺這樣的服務(wù)器,每臺服務(wù)器有12個NVMe驅(qū)動器。為了平衡系統(tǒng)(基于評估NVMe的峰值性能和網(wǎng)絡(luò)帶寬),24臺服務(wù)器中的每一臺都有兩個英特爾OPA適配器。
戴爾易安信PowerEdgeR740xd
除了優(yōu)化單個DAC服務(wù)器配置外,研究計算服務(wù)部還與戴爾易安信、英特爾、StackHPC(一家致力于HPC和云融合的英國初創(chuàng)公司)密切合作,優(yōu)化網(wǎng)絡(luò)拓撲結(jié)構(gòu),并利用Lustre文件系統(tǒng)中的數(shù)據(jù)加速器和分布式名稱空間(DNE)功能來優(yōu)化Cumulus集群的頂級I/O性能。
而在OpenStack方面,該系統(tǒng)利用戴爾易安信服務(wù)器中嵌入的iDRAC功能來進行集群的調(diào)配和管理,特別是在Ansible驅(qū)動的基礎(chǔ)設(shè)施作為代碼方面。
聯(lián)網(wǎng)的數(shù)據(jù)加速器節(jié)點是Cumulus集群的核心
正是在領(lǐng)先科技力量的共同合作之下,使得Cumulus超級計算機在I/O-500基準測試中取得了令人震驚的成績。根據(jù)研究計算服務(wù)部的數(shù)據(jù),DAC加速器可提供超過500GB/秒的I/O讀取性能,使其成為英國最快的HPCI/O平臺,為研究人員提供閃電般快速的吞吐量。
深耕HPC 20余年
助力探索人類知識邊界
劍橋大學高性能計算主任Paul Calleja介紹,人工智能項目需要非常高的速度處理大量數(shù)據(jù),Cumulus有能力幫助用戶解決極其困難的數(shù)據(jù)驅(qū)動、模擬和AI挑戰(zhàn),許多涉及劍橋研究人員的人工智能項目已經(jīng)在進行中。
“在生命科學領(lǐng)域,我們正在研究醫(yī)學成像分析和基因組學,在天文學領(lǐng)域,科學家們正在利用AI研究繪制系外行星圖,”他說,“我們還圍繞基因組學開展了一些相當具有突破性的工作,其中有英國10K項目,研究人員正在使用Hadoop數(shù)據(jù)分析引擎,圍繞非常大的人群基因組研究推動突破性成果。”
事實上,不僅是劍橋大學,戴爾科技長期處于推動客戶采用最新HPC技術(shù)的一線,大力推動廣泛的科學發(fā)現(xiàn)和研究工作。
例如德州大學奧斯汀分校的德州超算中心(TACC)選擇與戴爾科技合作,在去年6月最新公布的TOP500榜單當中,戴爾科技為TACC設(shè)計并制造的Frontera超級計算機獲得了第五名的成績,其速度在美國排名第三,并且也是所有大學中規(guī)模最大的系統(tǒng)。
還有密歇根大學正在部署Great Lakes計算集群,用于模擬、建模、人工智能、機器學習、數(shù)據(jù)科學、基因組學等等。這個新系統(tǒng)采用了基于戴爾易安信PowerEdge服務(wù)器的HPC基礎(chǔ)設(shè)施。Great Lakes是業(yè)內(nèi)第一個受益于Mellanox HDR 200Gb/s InfiniBand網(wǎng)絡(luò)的系統(tǒng),實現(xiàn)了更快的數(shù)據(jù)傳輸速度和更高的應(yīng)用性能。
在國內(nèi),戴爾科技也與很多高校成功實施部署了規(guī)模不等的HPC平臺,包括清華大學生命科學與技術(shù)學院、北京大學生命科學聯(lián)合中心、西湖大學生命科學學院、哈爾濱工業(yè)大學生命科學與技術(shù)學院等,助力探索人類知識邊界。
客戶引言
“傳統(tǒng)HPC集群技術(shù)提供預(yù)配置的靜態(tài)資源池,能夠在很大程度上滿足數(shù)量有限但非常重要的用戶群。通過實現(xiàn)云模式,包含在裸機環(huán)境中,軟件定義基礎(chǔ)設(shè)施的優(yōu)勢在于包含傳統(tǒng)HPC集群,無需犧牲性能,并在支持現(xiàn)代混合云工作負載方面提供更高的敏捷性。
我們看到此類新工作負載的用戶大幅增長,而Cumulus讓我們的用戶可以在安全且靈活的環(huán)境中更輕松地進行HPC和HPDA級計算。與戴爾易安信等合作伙伴攜手,我們打造了英國計算能力最強、I/O效率最高的資源之一。”
——PaulCalleja,劍橋大學高性能計算主任
相關(guān)內(nèi)容推薦:方總嘆了口氣,我有了個主意
相關(guān)產(chǎn)品:Dell EMC PowerStore T 系列存儲