全球第一臺(tái)?美國(guó)超級(jí)計(jì)算機(jī)完全沒(méi)有DRAM內(nèi)存!
得克薩斯州先進(jìn)計(jì)算中心(TACC)宣布,正在打造第三代超級(jí)計(jì)算機(jī)“Stampede3”,計(jì)劃今年秋天上線,明年初滿(mǎn)血釋放全部性能,服役到2029年。
Stampede3將由戴爾建造,擁有560個(gè)節(jié)點(diǎn),每個(gè)節(jié)點(diǎn)配備兩顆Sapphire Rapids四代至強(qiáng)Max處理器,56核心,集成64GB HBM2E內(nèi)存,總計(jì)接近6.3萬(wàn)個(gè)核心、70PB HBM2E,雙精度浮點(diǎn)峰值性能每秒約4千萬(wàn)億次。
令人吃驚的是,這臺(tái)超算完全運(yùn)行在HBM模式,沒(méi)有任何傳統(tǒng)的DRAM內(nèi)存——這似乎還是第一臺(tái)?
全球第一臺(tái)?美國(guó)超級(jí)計(jì)算機(jī)完全沒(méi)有DRAM內(nèi)存!
TACC還計(jì)劃安裝10臺(tái)戴爾PowerEdge XE9640服務(wù)器,共有40塊Intel Ponte Vecchio GPU Max加速器,用于AI、ML負(fù)載。
要知道,如今的頂級(jí)超算都是CPU+GPU的組合配置,Stampede3幾乎純粹依賴(lài)CPU,對(duì)于Intel GPU加速器正在進(jìn)行評(píng)估,未來(lái)可能擴(kuò)大采購(gòu)規(guī)模,但最多也會(huì)用100塊左右。
TACC目前主要在“Lone Star”系統(tǒng)上處理AI任務(wù),它用的是NVIDIA A100加速器,接下來(lái)需要好好研究如何遷移到Intel GPU之上。
有趣的是,TACC現(xiàn)有的第二代Stampede2并不會(huì)被直接淘汰,而是將集成于Stampede3,增強(qiáng)其對(duì)內(nèi)存敏感性應(yīng)用的處理能力。
兩代聯(lián)合之后,整套系統(tǒng)將有1858個(gè)計(jì)算節(jié)點(diǎn)、14多萬(wàn)個(gè)CPU核心、330TB內(nèi)存、13PB硬盤(pán),峰值性能接近1億億次。