自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<blockquote id="6oegz"></blockquote>

<style id="6oegz"></style>

^{<thead id="6oegz"></thead>}

<legend id="6oegz"><abbr id="6oegz"></abbr></legend>

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

賬號(hào)設(shè)置退出

蘇媽殺瘋了：移動(dòng)端最強(qiáng)NPU算力達(dá)50TOPS，最強(qiáng)AI芯片挑戰(zhàn)英偉達(dá)

作者：機(jī)器之心 2024-06-04 13:00:07

人工智能新聞

英偉達(dá)現(xiàn)場(chǎng)拿出了量產(chǎn)版 Blackwell 芯片，還公布了未來三年的產(chǎn)品路線，包括下一代 Rubin AI 平臺(tái)。

一年一度的 Computex 科技大會(huì)成為了 GPU 廠商們秀肌肉的舞臺(tái)，其中當(dāng)屬英偉達(dá)和 AMD 最為亮眼。英偉達(dá)現(xiàn)場(chǎng)拿出了量產(chǎn)版 Blackwell 芯片，還公布了未來三年的產(chǎn)品路線，包括下一代 Rubin AI 平臺(tái)。

AMD 當(dāng)然也不甘示弱，CEO 蘇姿豐亮出了旗下的 CPU、GPU 產(chǎn)品及路線圖，包括全新 Zen 5 架構(gòu)的桌面端 Ryzen 9000系列 CPU、AI PC 芯片、數(shù)據(jù)中心芯片和 GPU。

蘇姿豐

全新 Zen 5 架構(gòu)

銳龍 9000 桌面系列芯片首次亮相

蘇姿豐在演講中著重介紹了基于 Zen 5 架構(gòu)的全新桌面端 Ryzen CPU，它們經(jīng)過優(yōu)化可以通過神經(jīng)網(wǎng)絡(luò)處理器來加速 AI 工作負(fù)載。

下圖為下一代高性能 CPU 核心 Zen 5 的各項(xiàng)規(guī)格，它不僅是當(dāng)前 Ryzen 9000 系列處理器的核心，也將成為今年下半年推出的 Turin Epyc 霄龍服務(wù)器 CPU 的核心。

蘇姿豐表示，Zen 5 是 AMD 迄今設(shè)計(jì)的性能和能效均最高的核心，而且它是從頭開始設(shè)計(jì)的。其中，該核心擁有一個(gè)新的并行雙管道前端，旨在提高分支預(yù)測(cè)準(zhǔn)確性并減少延遲，并能夠在每個(gè)時(shí)鐘周期提供更高的性能。

此外，Zen 5 具有更寬的 CPU 引擎指令窗口，可以并行運(yùn)行更多指令，以實(shí)現(xiàn)領(lǐng)先的計(jì)算吞吐量和效率。與 Zen 4 相比，Zen 5 的指令帶寬增加了一倍，緩存和浮點(diǎn)單元之間的數(shù)據(jù)帶寬增加了一倍，AI 性能增加了一倍，同時(shí)具有完整的 AVX 512 吞吐量。

蘇姿豐現(xiàn)場(chǎng)首次展示了采用 Zen 5 架構(gòu)的 Ryzen 9 9950X。

Ryzen 9 9950X 擁有 16 個(gè)核心和 32 個(gè)線程，加速后運(yùn)行速度可以高達(dá) 5.67 GHz。Zen 5 的平均每個(gè)核心指令比之前的 Ryzen 芯片以及「Genoa」Epyc 9000 系列處理器中使用的 Zen 4 核心多 16%。此外，TDP 為 170W，L2+L3 緩存為 80MB。

下圖為 Ryzen 9000 全系列 CPU，包括了 Ryzen 9 9950X、Ryzen 9 9900X、Ryzen 7 9700X、Ryzen 5 9600X 以及規(guī)格比較。這些產(chǎn)品預(yù)計(jì)今年 7 月上市。

AMD 給出的內(nèi)部游戲測(cè)試數(shù)據(jù)顯示，Ryzen 9 9950X 對(duì)游戲性能的提升幅度不一。比如在《無主之地 3》中的表現(xiàn)僅比英特爾 Core i9-14900K 高出 4%，在《殺手 3》中高出 6%，在《賽博朋克 2077》中高出 13%。此外，Ryzen 9 9950X 在《F1 2023》中的表現(xiàn)較英特爾提升了 16%，在《DOTA 2》中提升了 17%，在《地平線零之曙光》中提升了 23%。

50TOPS

AMD 最強(qiáng)移動(dòng)端 NPU 算力

蘇姿豐展示了下一代 AI PC 芯片 —— 銳龍 AI 300 系列 APU（第三代）。

下圖為銳龍 AI 300系列芯片實(shí)拍。

銳龍 AI 300 系列芯片旨在提供下一代 AI PC 體驗(yàn)，因而要求 NPU、CPU 和 GPU 均要達(dá)到最佳。

銳龍 AI 300 系列首發(fā)提供了兩款型號(hào)，銳龍 AI 9 HX 370 和銳龍 AI 9 365。下圖為銳龍 AI 9 HX 370 的參數(shù)規(guī)格。

銳龍 AI 300 系列采用了 XDNA AI NPU，號(hào)稱移動(dòng)端最強(qiáng) NPU，算力達(dá) 50TOPS，不僅達(dá)到了微軟對(duì)新一代 AI PC「NPU 算力 40TOPS 以上」的標(biāo)準(zhǔn)，還超過了高通驍龍 X Elite 的 45TOPS、英特爾 Lunar Lake 的 40-45TOPS。

AMD 表示，搭載銳龍 AI 300 系列的筆記本將于今年 7 月起陸續(xù)上市。

最高 192 核心 384 線程

第五代 EPYC 霄龍問鼎數(shù)據(jù)中心芯片

蘇姿豐現(xiàn)場(chǎng)也展示了第五代「Turin」EPYC 霄龍芯片，它號(hào)稱全球最強(qiáng)數(shù)據(jù)中心 CPU。

下圖為第五代 AMD 霄龍 Turin 芯片的參數(shù)規(guī)格。目前沒有透露太多細(xì)節(jié)，從基礎(chǔ)信息參數(shù)來看，Turin 具有 192 個(gè) Zen 5 核心和 384 個(gè)線程，采用與 Genoa Epyc 9004s 相同的 SP5 插槽適配。

Turin 芯片可能會(huì)被命名為「Epyc 9005s」?？梢云诖氖?，在 IPC 方面，它與 Ryzen Zen 5 芯片相近。相較于 Zen 4 核心，IPC 改進(jìn)可能在 15% 到 20% 之間。蘇姿豐展示了 Turin 芯片的一些早期基準(zhǔn)測(cè)試數(shù)據(jù)。

如下圖所示，圖上為具有 128 個(gè)核心的 Turin 芯片在 NAMD 分子動(dòng)力學(xué)應(yīng)用程序中運(yùn)行 STMV 基準(zhǔn)測(cè)試的性能。Turin 芯片模擬了 2000 萬個(gè)原子，并計(jì)算了計(jì)算引擎在 24 小時(shí)內(nèi)可以處理多少納秒的分子相互作用?？梢钥吹剑?28 核心的 Turin 芯片是 64 核心英特爾「Emerald Rapids」Xeon SP-8592 + 工作量的約 3.1 倍。

圖下為基于 Meta Llama 2 7B 模型的 AI 吞吐量基準(zhǔn)測(cè)試，該模型以 INT4 數(shù)據(jù)格式處理，推理 token 生成設(shè)置為 50 毫秒。128 核心的 Turin 芯片是英特爾競(jìng)品 CPU 性能的 2.5 倍到 5.4 倍之間，具體數(shù)值取決于工作負(fù)載。

對(duì)標(biāo)英偉達(dá)

AMD 的 Instinct GPU 也一年一更

講完了 CPU，接下來的重頭戲就是 Instinct GPU 了，它將是 AMD 未來產(chǎn)品戰(zhàn)略的一個(gè)重要抓手。

蘇姿豐表示，「Antares」MI300 系列是 AMD 歷史上增長(zhǎng)最快的產(chǎn)品，在 HPC 和 AI 工作負(fù)載方面的可用性看起來有點(diǎn)像英偉達(dá) GPU，不過其所提供的性能優(yōu)勢(shì)以及 HBM 內(nèi)存容量、帶寬優(yōu)勢(shì)較為突出。

比如在推理工作負(fù)載方面，通過對(duì) Llama 3（具有 700 億參數(shù)）進(jìn)行推理檢驗(yàn)性能的結(jié)果來看，一臺(tái)配備 8 個(gè) MI300X GPU 的服務(wù)器性能約為一臺(tái)配備 8 個(gè) H100 GPU 加速器的英偉達(dá) HGX 性能的 1.3 倍。而在 Mistral 7B 模型上，單個(gè) MI300X 的性能則是英偉達(dá) H100 GPU 的約 1.2 倍。

隨后，蘇姿豐公布了 2024-2026 年的 Instinct GPU 路線圖，今年推出 MI325X，2025 年推出 MI350，2026 年推出 MI400。

MI325X 將具有更大的算力規(guī)模，并轉(zhuǎn)向 HBM3E 內(nèi)存。下圖為 MI325X 的基礎(chǔ)性能規(guī)格，內(nèi)存增加了 2 倍，最高可達(dá) 288GB；帶寬增加了 30%，達(dá)到了 6TB / 秒。

下圖為 MI325X 的數(shù)據(jù)傳輸速度與英偉達(dá) H200（141GB 內(nèi)存）比較的結(jié)果。值得一提的是，1 萬億參數(shù)的模型將適配一臺(tái)配有八個(gè) MI325X 的系統(tǒng)主板，每個(gè) GPU 都有 288GB 的 HBM3E 內(nèi)存容量。

據(jù)悉，MI325X 最快將在今年第四季度推出。不過到那時(shí)，英偉達(dá)將在該領(lǐng)域中憑借 B100 占據(jù)一席之地，并將大規(guī)模量產(chǎn) H200。因此，AMD 感受到了危機(jī)，并且迅速行動(dòng)。

這也是為什么 AMD 提前推出 MI350X 的原因，它采用了全新 CDNA 4 架構(gòu)、臺(tái)積電 3 納米工藝、288 GB 的 HBM3E 內(nèi)存以及 FP6、FP4 數(shù)據(jù)類型。MI350X 也將成為 AMD Instinct MI350 系列的第一款產(chǎn)品。

在推理性能方面，CDNA 4 架構(gòu)是 CDNA 3 的 35 倍。

MI350 的內(nèi)存容量將是英偉達(dá) 2025 年推出的 B200（Blackwell Ultra 架構(gòu)）芯片的 1.5 倍，AI 計(jì)算能力是后者的 1.2 倍。

AMD 這波就是奔著英偉達(dá)去的，到時(shí)候有好戲看了。

責(zé)任編輯：張燕妮來源：機(jī)器之心

英偉達(dá)芯片

點(diǎn)贊

51CTO技術(shù)棧公眾號(hào)

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營(yíng)

^{<thead id="najp1"></thead>}