自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

谷歌TPU訓(xùn)練BERT只要23秒,華為AI芯片超英偉達(dá)V100

新聞 前端
今天,人工智能行業(yè)權(quán)威“跑分”MLPerf訓(xùn)練v0.7出爐,這是該跑分推出以來第三次放榜。

 本文經(jīng)AI新媒體量子位(公眾號ID:QbitAI)授權(quán)轉(zhuǎn)載,轉(zhuǎn)載請聯(lián)系出處。

今天,人工智能行業(yè)權(quán)威“跑分”MLPerf訓(xùn)練v0.7出爐,這是該跑分推出以來第三次放榜。

谷歌TPU訓(xùn)練BERT只要23秒,華為AI芯片超英偉達(dá)V100,MLPerf出爐

英偉達(dá)剛發(fā)布的A100 GPU、谷歌即將推出的TPUv4,兩個冤家的AI芯片性能孰強(qiáng)孰弱,在這份榜單里都能看到。

除了兩家AI巨頭相爭,此次也是中國芯片首次在榜單中亮相,來自華為的昇騰910芯片實(shí)測成績曝光,性能一度超越了英偉達(dá)同類產(chǎn)品。

MLPerf測試內(nèi)容

隨著AI技術(shù)的進(jìn)步,今年的測試基準(zhǔn)進(jìn)一步加大了難度。

MLPerf訓(xùn)練測試基準(zhǔn)包括圖像分類、翻譯、推薦系統(tǒng)圍棋等8個機(jī)器學(xué)習(xí)任務(wù)中,最終結(jié)果是這8項(xiàng)任務(wù)的訓(xùn)練時間,速度越快則性能越強(qiáng)。

具體的8項(xiàng)任務(wù)內(nèi)容如下:

谷歌TPU訓(xùn)練BERT只要23秒,華為AI芯片超英偉達(dá)V100,MLPerf出爐

其中后三項(xiàng)是新加入或重新制定的標(biāo)準(zhǔn):

1、BERT:用Wikipedia語料庫訓(xùn)練BERT,這是首次將BERT引入MLPerf測試基準(zhǔn)。

2、DLRM:用Criteo AI Lab的Terabyte點(diǎn)擊率數(shù)據(jù)集訓(xùn)練的深度學(xué)習(xí)推薦模型(DLRM),廣泛用于在線購物推薦、搜索結(jié)果和社交媒體內(nèi)容排序。

3、Mini-Go:之前的MLPerf v0.5和v0.6也有訓(xùn)練圍棋的強(qiáng)化學(xué)習(xí)任務(wù),但卻是迷你棋盤,此次v0.7將棋盤擴(kuò)大為19x19全尺寸,這更能反映研究成果。

了解過測試內(nèi)容后,我們來看看各家的跑分成績。

BERT訓(xùn)練刷新紀(jì)錄

今年英偉達(dá)和谷歌兩家公司都拿出了自己最強(qiáng)的硬件參與競爭。

英偉達(dá)方面,他們打破了16項(xiàng)AI訓(xùn)練測試紀(jì)錄,而谷歌則表示,自己在全部8項(xiàng)任務(wù)中有6項(xiàng)獲得了最高成績。

谷歌TPU訓(xùn)練BERT只要23秒,華為AI芯片超英偉達(dá)V100,MLPerf出爐

得益于兩家的激烈競爭,AI訓(xùn)練速度有了飛速發(fā)展。有一些在5年前還需要訓(xùn)練3周的任務(wù),現(xiàn)在只需不到1分鐘即可完成,幾乎是一年提高一個數(shù)量級。

令人印象最深刻的還是BERT,這個NLP模型在剛推出時需要訓(xùn)練3天時間。

去年,谷歌用1024塊TPUv3將訓(xùn)練時間縮短到76分鐘,英偉達(dá)又用1472個V100 GPU將訓(xùn)練時間進(jìn)一步減少到53分鐘。

在最新的MLPerf中,英偉達(dá)只花了49秒就完成了BERT的訓(xùn)練,他們用了一臺包含2048個A100 GPU的超級計(jì)算機(jī)SuperPOD。

谷歌TPU訓(xùn)練BERT只要23秒,華為AI芯片超英偉達(dá)V100,MLPerf出爐

作為對比,英偉達(dá)還表示,谷歌用16個TPUv3訓(xùn)練了56.7分鐘才完成。(看看,我們才用了不到1分鐘?。?/p>

然而,實(shí)際上谷歌比他們的速度更快,谷歌的一個研究項(xiàng)目使用了4096塊TPU芯片,在訓(xùn)練BERT上獲得了絕對最高的成績——23秒!

需要注意的是,這次訓(xùn)練BERT的數(shù)據(jù)集和去年并不相同,但是把BERT訓(xùn)練時間縮短到半分鐘內(nèi)已經(jīng)足夠驚人。

谷歌聲稱,快速訓(xùn)練BERT用的是世界上最快的機(jī)器學(xué)習(xí)訓(xùn)練超算,其內(nèi)部有4096個TPU v3芯片和數(shù)百個CPU主機(jī),所有芯片都通過超快速、超大規(guī)模的定制互連進(jìn)行連接,可提供430PFLOP的峰值性能。

谷歌TPU訓(xùn)練BERT只要23秒,華為AI芯片超英偉達(dá)V100,MLPerf出爐

這臺超算在4項(xiàng)任務(wù)中都把訓(xùn)練時間縮到半分鐘內(nèi)。

谷歌TPU訓(xùn)練BERT只要23秒,華為AI芯片超英偉達(dá)V100,MLPerf出爐

華為芯片首次亮相

另外,在訓(xùn)練芯片榜單上,我們首次看到了國產(chǎn)芯片的身影。

中科院深圳先進(jìn)技術(shù)研究所提供了華為昇騰910的測試成績,雖然僅測試了ResNet-50一項(xiàng),但是相同規(guī)模的情況下,其速度已經(jīng)超過了英偉達(dá)的V100 GPU。

谷歌TPU訓(xùn)練BERT只要23秒,華為AI芯片超英偉達(dá)V100,MLPerf出爐

同樣使用128個至強(qiáng)白金CPU和512個AI加速芯片,昇騰910在ImageNet任務(wù)中,訓(xùn)練ResNet-50只需1.59分鐘,而英偉達(dá)V100需要2.35分鐘。

華為昇騰910不僅可以運(yùn)行自研的MindSpore框架,也能運(yùn)行谷歌的TensorFlow框架。兩者性能差距很小,后者的訓(xùn)練時間為1.53分鐘,比在MindSpore框架上運(yùn)行時間稍短。

谷歌TPU訓(xùn)練BERT只要23秒,華為AI芯片超英偉達(dá)V100,MLPerf出爐

不過,從這份榜單中可以看出,國產(chǎn)AI芯片任重道遠(yuǎn),英偉達(dá)仍在商業(yè)領(lǐng)域占據(jù)主導(dǎo)地位。

參與測試的多家公司使用的均是英偉達(dá)GPU,不久前推出的A100 GPU也迅速得到商用。戴爾、阿里、富士通、騰訊、浪潮,甚至連谷歌自己,都是英偉達(dá)的客戶。

而且臺積電將停止為華為代工芯片,使華為自研AI芯片的未來蒙上了一層陰影。

谷歌TPUv4泄露

此次MLPerf跑分還泄露了谷歌新一代TPU的性能指標(biāo)。

相比兩年前的TPUv3,谷歌的TPUv4帶來平均2.7倍的性能提升。

谷歌TPU訓(xùn)練BERT只要23秒,華為AI芯片超英偉達(dá)V100,MLPerf出爐

更可怕的是,谷歌23秒訓(xùn)練完BERT使用的是TPUv3,而使用256塊TPUv4訓(xùn)練BERT的時間是1.82分鐘。

至于更大規(guī)模的TPUv4計(jì)算集群會帶來怎樣恐怖的成績,或許只能等谷歌正式發(fā)布后才能知曉。

關(guān)于MLPerf

MLPerf是業(yè)內(nèi)首套衡量機(jī)器學(xué)習(xí)軟硬件性能的通用基準(zhǔn),由圖靈獎得主David Patterson聯(lián)合谷歌和幾所著名高校于2018年發(fā)起。

MLPerf基準(zhǔn)聯(lián)盟現(xiàn)有83家成員,包括谷歌、英偉達(dá)、微軟、Facebook、阿里巴巴等73家企業(yè)和斯坦福、哈佛、多倫多大學(xué)等10所高校。

谷歌TPU訓(xùn)練BERT只要23秒,華為AI芯片超英偉達(dá)V100,MLPerf出爐

2018年,MLPerf發(fā)布了首個AI訓(xùn)練測試基準(zhǔn)v0.5,v0.7是第三個AI訓(xùn)練跑分榜單。去年,該組織還發(fā)布過AI推理測試基準(zhǔn)v0.5,國產(chǎn)芯片阿里含光800曾獲得多項(xiàng)第一。

榜單地址:

https://mlperf.org/training-results-0-7

 

責(zé)任編輯:張燕妮 來源: 量子位
相關(guān)推薦

2023-04-06 09:37:22

谷歌AI

2025-04-22 09:47:07

2021-08-20 15:32:14

機(jī)器人人工智能系統(tǒng)

2023-04-11 08:37:30

TPUAI芯片

2023-10-18 13:17:12

AI芯片英偉達(dá)美國

2023-04-05 14:31:49

AI超算人工智能

2024-02-20 12:30:53

AI訓(xùn)練

2023-09-28 08:04:39

GPU芯片AI芯片

2024-08-14 13:50:00

模型訓(xùn)練

2023-05-26 17:15:45

2024-04-10 09:28:23

2022-04-22 15:20:16

AI顯卡芯片

2023-11-14 07:37:21

芯片英偉達(dá)

2024-01-10 11:10:36

英偉達(dá)AI芯片

2019-07-18 08:54:42

谷歌Android開發(fā)者

2023-07-13 23:16:19

英偉達(dá)GPU

2023-03-14 09:19:02

微軟OpenAIChatGPT

2020-12-30 11:13:03

Graphcore

2023-11-17 17:02:21

微軟AI芯片

2023-02-06 10:25:13

AI模型
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號