我用90年代的古董電腦訓(xùn)練CNN
本文經(jīng)AI新媒體量子位(公眾號(hào)ID:QbitAI)授權(quán)轉(zhuǎn)載,轉(zhuǎn)載請(qǐng)聯(lián)系出處。
在90年代的電腦上實(shí)現(xiàn)CNN是一種什么體驗(yàn)?
最近,一位日本小哥武田廣正(音譯)就在1990年的電腦PC-9801上實(shí)現(xiàn)了CNN來(lái)識(shí)別手寫(xiě)字符。
就像這樣。

可能因?yàn)殡娔X性能的限制,整個(gè)識(shí)別過(guò)程要消耗一分多鐘。

原來(lái)30年前CNN是這樣實(shí)現(xiàn)的。
他還將整個(gè)過(guò)程分享到了推特上,得到了大量的關(guān)注。
不少網(wǎng)友驚嘆之余,還表示,心疼這個(gè)電腦,學(xué)習(xí)AI一定很難……

如何實(shí)現(xiàn)?
雖然目前這項(xiàng)技術(shù)還沒(méi)有開(kāi)源,但早在93年就已經(jīng)有人將CNN玩得很溜了。
這個(gè)人就是LeCun。
前不久,一段關(guān)于LeCun93年的視頻火了。視頻中展現(xiàn)的是,當(dāng)時(shí)的文字識(shí)別系統(tǒng)已經(jīng)用上了CNN。
他首先是電腦的系統(tǒng)中編寫(xiě)了一種網(wǎng)絡(luò)數(shù)據(jù)結(jié)構(gòu)的編譯器,并生成了可編譯的 C 語(yǔ)言代碼,在源代碼中以權(quán)重和網(wǎng)表(netlist)代表文字。
整套系統(tǒng)是在算力為20MFLOPS 的DSP版上運(yùn)行。
當(dāng)時(shí),手寫(xiě)數(shù)字?jǐn)?shù)據(jù)集 MNIST還沒(méi)有問(wèn)世,LeCun則用攝像拍攝來(lái)構(gòu)建文字識(shí)別系統(tǒng)的。除此之外,還需要解決文字縮放、位置等問(wèn)題。
只需在紙上寫(xiě)好任意數(shù)字,不管任意大小形狀,或者帶有一定的“藝術(shù)性”,只要用攝像頭導(dǎo)入電腦,就可以識(shí)別。
而這位日本小哥則是在MNIST數(shù)據(jù)集上構(gòu)建的,電腦上清晰展現(xiàn)了識(shí)別過(guò)程。
首先,讀取MNIST的數(shù)字圖像的信息。
隨后,進(jìn)行一波卷積、池化等操作。
最后經(jīng)過(guò)SoftMax層,每個(gè)數(shù)字轉(zhuǎn)換成概率或者權(quán)重,按照權(quán)重大小選出所得數(shù)字。
背后的作者
武田廣正,來(lái)自巖手縣立大學(xué)信息學(xué)研究院,喜歡操作系統(tǒng)以及研究復(fù)古電腦,曾撰寫(xiě)《Raspberry Pi GPGPU入門(mén)》
因?yàn)檫@個(gè)項(xiàng)目,他在enPiT的PBL活動(dòng)中獲得了優(yōu)秀獎(jiǎng)。
他表示,會(huì)將這一教程編寫(xiě)進(jìn)《令和的PC-98編程》一起發(fā)行,源代碼將在GitHub上提供。
參考鏈接:
https://twitter.com/T_taisyou/status/1357655009618399232