NVIDIA CUDA開放支持ARM架構(gòu)!沖擊百億億次超算
在德國法蘭克福的國際超算大會(huì)上,NVIDIA宣布其獨(dú)有的CUDA編程架構(gòu)開放支持ARM CPU架構(gòu),為高性能計(jì)算行業(yè)開辟了一條全新途徑,可打造擁有極高能效的百億億次AI超級(jí)計(jì)算機(jī)。
NVIDIA將在今年年底前,向ARM生態(tài)系統(tǒng)提供全堆棧的AI、HPC軟件,可支持所有AI框架、600多個(gè)HPC應(yīng)用程序的加速,其中包括所有NVIDIA CUDA-X AI和HPC庫、GPU加速的AI框架和軟件開發(fā)工具,比如支持OpenACC的PGI編譯器和性能分析器。
堆棧優(yōu)化完成后,NVIDIA將為所有主流CPU架構(gòu)提供加速,包括x86、POWER、ARM。
而根據(jù)***公布的Green500綠色超級(jí)計(jì)算機(jī)排行榜,在全球最節(jié)能的25款超算中,有多達(dá)22款都得益于NVIDIA的支持。
這其中的關(guān)鍵在于,采用NVIDIA GPU的超級(jí)計(jì)算機(jī)能夠?qū)⒎敝氐奶幚碜鳂I(yè)卸載至更為節(jié)能的并行處理CUDA GPU之上,NVIDIA與Mellanox合作優(yōu)化整體超級(jí)計(jì)算集群的處理,NVIDIA發(fā)明的SXM 3D封裝和可實(shí)現(xiàn)極密集型擴(kuò)展節(jié)點(diǎn)的NVIDIA NVLink互連技術(shù)。
NVIDIA與ARM的合作已經(jīng)超過10年,對(duì)于基于ARM HPC系統(tǒng)的支持也非常深入,同時(shí)NVIDIA的幾款用于便攜式游戲、自動(dòng)駕駛汽車、機(jī)器人、嵌入式AI計(jì)算的系統(tǒng)級(jí)芯片產(chǎn)品也都采用了ARM架構(gòu)。
對(duì)于NVIDIA CUDA架構(gòu)向ARM的開放,超算中心、系統(tǒng)提供商、系統(tǒng)級(jí)芯片制造商等都表達(dá)了支持,包括Ampere Computing、Atos、Cray、CSC、EPI、HPE、Julich、Marvell、Mellanox、日本理化學(xué)研究所計(jì)算科學(xué)研究中心等等。