自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

特斯拉前AI總監(jiān)Karpathy瘋狂點(diǎn)贊:?jiǎn)螐圓100,10秒訓(xùn)練CIFAR-10,破世界紀(jì)錄!

人工智能
這位小哥在單張A100上,10秒完成了CIFAR-10訓(xùn)練,打破了世界紀(jì)錄,還引來(lái)了Karpathy嘖嘖稱(chēng)贊。

刷新世界紀(jì)錄!

用600行代碼,在單張A100上,不到10秒,就完成了CIFAR-10數(shù)據(jù)集的訓(xùn)練,并且精度高達(dá)94%。

特斯拉前AI總監(jiān)Andrej Karpathy連發(fā)3條推特,瘋狂點(diǎn)贊。

圖片

Karpathy之所以如此激動(dòng),是因?yàn)?2年前,他試過(guò)手動(dòng)對(duì)CIFAR-10進(jìn)行分類(lèi),得到的也是94%!而當(dāng)時(shí)的SOTA只有80%。

項(xiàng)目介紹

圖片

項(xiàng)目地址:https://github.com/tysam-code/hlb-CIFAR10

git clone https://github.com/tysam-code/hlb-CIFAR10 && cd hlb-CIFAR10 && python -m pip install -r requirements.txt && python main.py

這段代碼可以在Colab上直接使用,事實(shí)上——其中大部分是在Colab中開(kāi)發(fā)的。

這位叫Tysam的小哥,給自己定下的目標(biāo)是——

  • 簡(jiǎn)單
  • 初學(xué)者友好
  • 只需torch和python的常用代碼
  • 幾乎不用外部依賴(lài)(目前只有torch和torchvision)
  • 破世界紀(jì)錄的單GPU訓(xùn)練時(shí)間(此前在A100上的世界紀(jì)錄是18.1秒,而Tysam打破了世界紀(jì)錄——小于10秒)
  • 在2年內(nèi)讓訓(xùn)練時(shí)間小于2秒

為了達(dá)成快速訓(xùn)練的神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn),Tysam參考了David Page在CIFAR-10圖像分類(lèi)數(shù)據(jù)集上有效訓(xùn)練殘差網(wǎng)絡(luò)的代碼,但幾乎是從頭編寫(xiě)的。

圖片

這種做法的好處是,Tysam code現(xiàn)在保持著CIFAR-10上單GPU訓(xùn)練速度的世界紀(jì)錄——在A100上不到10秒!

在David Page代碼的基礎(chǔ)上,Tysam做了如下改動(dòng):

  • 壓縮和激勵(lì)層(squeeze and excite layers)
  • 非常多的超參數(shù)調(diào)整
  • 復(fù)雜架構(gòu)修剪(miscellaneous architecture trimmings)
  • 更改內(nèi)存格式,更好地使用張量核心等
  • 其他

與原始代碼相比,Tysam的代碼全部都在一個(gè)文件中,而且非常扁平flat。

此外,所有的管線也都已經(jīng)公開(kāi),有興趣的朋友可以在里面快速探索自己的想法。

至于為什么會(huì)選擇ConvNet,而不是現(xiàn)在最流行的Transformer呢?

在Tysam看來(lái),雖然Transformer是新事物,但信息從訓(xùn)練集中壓縮到神經(jīng)網(wǎng)絡(luò)中的方式,實(shí)際上始終都遵循著同樣的一套基本數(shù)學(xué)原理。

Tysam希望,在一兩年內(nèi)讓這個(gè)代碼庫(kù)在2秒內(nèi)完成訓(xùn)練,在四到五年內(nèi)在1秒內(nèi)完成訓(xùn)練。

Karpathy瘋狂點(diǎn)贊

對(duì)于Tysam的代碼,Karpathy贊嘆不已,他絲毫不吝嗇自己的溢美之辭——

「我喜歡這種極簡(jiǎn)的設(shè)計(jì)美學(xué),它讓閱讀代碼不再是精疲力竭的尋寶過(guò)程。你不需要把代碼散布在復(fù)雜的嵌套目錄結(jié)構(gòu)之中,然后用各種指令把事情搞得過(guò)于復(fù)雜?!?/span>

圖片

隨后,Karpathy還表示,這讓他想起了自己在12年前做的測(cè)試:

12年前,「肉眼」分類(lèi)實(shí)現(xiàn)了94%的準(zhǔn)確率,用時(shí)未知。

12年后,600行代碼實(shí)現(xiàn)了94%的準(zhǔn)確率,用時(shí)不到10秒。

圖片

當(dāng)時(shí)的過(guò)程大概是:

在一個(gè)平平無(wú)奇的周末,Karpathy突然想看看人類(lèi)在這個(gè)數(shù)據(jù)集上能達(dá)到什么樣的精度。

于是就快速地手搓了一段MATLAB代碼用于測(cè)試。

界面長(zhǎng)這個(gè)樣子:

圖片

在測(cè)試過(guò)程中,程序首先會(huì)一張一張圖片地展示,然后Karpathy會(huì)按下0-9(10個(gè)鍵),對(duì)應(yīng)這張圖他所認(rèn)為的類(lèi)別(10個(gè)分類(lèi))。

在經(jīng)過(guò)了不知道多長(zhǎng)時(shí)間之后,Karpathy終于完成了400張圖片的分類(lèi),準(zhǔn)確率為94%左右。

那么,為什么不是100%呢?

Karpathy:「因?yàn)橛行﹫D像真的太扯了!」

比如下面這幾個(gè):

圖片

也難怪Karpathy當(dāng)年預(yù)測(cè)AI所能達(dá)到的極限是85-90%(笑)。

當(dāng)然,后來(lái)的結(jié)果大家也都知道了,CIFAR-10分類(lèi)的準(zhǔn)確率早就被刷到了99.5%。

圖片

著名的CIFAR-10

眾所周知,CIFAR-10是由Geoffrey Hinton和他的學(xué)生Alex Krizhevsky和Ilya Sutskever整理的一個(gè)用于識(shí)別普適物體的小型數(shù)據(jù)集,也是如今機(jī)器學(xué)習(xí)研究中最廣泛使用的數(shù)據(jù)集之一。

CIFAR-10數(shù)據(jù)集由10類(lèi)32x32的彩色圖片組成,總共包含60000張圖片,其中50000張圖片作為訓(xùn)練集,10000張圖片作為測(cè)試集。

這10個(gè)類(lèi)別為:飛機(jī)( airplane )、汽車(chē)( automobile )、鳥(niǎo)類(lèi)( bird )、貓( cat )、鹿( deer )、狗( dog )、蛙類(lèi)( frog )、馬( horse )、船( ship )和卡車(chē)( truck )。

圖片

?參考資料:https://github.com/tysam-code/hlb-CIFAR10

責(zé)任編輯:武曉燕 來(lái)源: 新智元
相關(guān)推薦

2022-11-01 13:42:54

雷達(dá)智能

2022-04-08 08:11:28

Python代碼

2022-08-21 21:15:28

模型AI

2021-07-09 17:49:46

腦機(jī)接口機(jī)器人工智能

2011-06-10 13:53:24

天河一號(hào)A

2016-06-16 16:55:02

華為

2017-05-10 15:06:43

聯(lián)想聯(lián)想X6服務(wù)器

2023-07-05 15:18:42

AI自動(dòng)駕駛

2023-03-22 15:35:48

新華三

2021-12-09 10:26:35

AI 數(shù)據(jù)人工智能

2014-04-24 09:45:23

ASC14HPL計(jì)算性能

2017-11-29 11:15:43

AMDEPYC服務(wù)器

2020-08-18 14:48:00

AI 數(shù)據(jù)人工智能

2015-05-21 21:55:42

浪潮

2011-11-01 11:00:43

AMD處理器推土機(jī)FX-8150

2024-01-29 07:05:00

自動(dòng)駕駛技術(shù)

2024-03-20 12:27:48

模型訓(xùn)練

2009-04-07 13:55:15

NehalemIntel服務(wù)器

2021-11-15 15:19:11

NVIDIA

2018-07-16 14:53:18

海信
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)