AI朋克致敬MNIST:只用Python和開發(fā)板,制作永不重樣的時鐘
是的,有了這面鐘,這輩子都離不開 MNIST 手寫數(shù)據(jù)集了。
我們見慣了上古時代,由電子管組成的時鐘。在 AI 時代,有沒有更加新潮的時間顯示方式?是的,數(shù)據(jù)集也能做成時鐘,每天早上,讓 MNIST 手寫數(shù)字喚醒你一天的記憶。
MNIST 是計算機視覺中不老的經(jīng)典,當(dāng)?shù)谝淮矸e神經(jīng)網(wǎng)絡(luò)在這個手寫數(shù)字?jǐn)?shù)據(jù)集上綻放出耀眼的光芒,它注定會載入「史冊」。
盡管目前計算機視覺已經(jīng)早就走出了 MNIST 數(shù)據(jù)集的時代,甚至連一千多萬圖像的 ImageNet 也不再是非常大的一個圖像數(shù)據(jù)集。然而,MNIST 仍然不可忽視,深度學(xué)習(xí)入門的第一個數(shù)據(jù)集、驗證算法的第一個實驗都是它。甚至連 Hinton 驗證 Capsule 這個想法的數(shù)據(jù)集都用的它。
如果說想要致敬這樣的數(shù)據(jù)集「先驅(qū)」,你會采用什么樣的方式?在 GitHub 中,機器之心發(fā)現(xiàn)一個有意思的小項目,作者 Dheera Venkatraman 做了一面鐘,里面的數(shù)字都是從 MNIST 數(shù)據(jù)集中采樣的。
項目地址:https://github.com/dheera/mnist-clock
也就是說,24 小時隨機抽萬張不同的手寫數(shù)字,每天都不帶重樣。做出來的效果是這樣的:
這樣的電子鐘只需要簡單的電路板再加上 4 塊電子墨水屏就行了,它背后的樣子是這樣的:
硬件
項目使用了 TinyPICO 開發(fā)板;緊湊的 ESP32 板以及大量的 GPIO 插腳、4MB 閃存、Wi-Fi,以及其他很多功能。TinyPICO 可以說是目前世界上基于 ESP32-PICO-D4 體積最小的開發(fā)板,240 MHz 的 32 位雙核處理器足夠我們完成計算。
4 塊 e-link 數(shù)字顯示器,之所以選擇 e-link,是因為它符合手寫數(shù)字的概念,在任何光線條件下都能正常運行,而且也不至于打擾到任何人。Waveshare 的 e-link 顯示屏大部分是 SPI,雖然也有些額外的引腳。大部分人會希望一塊只包含 SPI 以及一塊 CS 插腳,但多一些的鏈接器是有必要的。下面是 ESP32 的連接圖,根據(jù)這個把電線卷起來。
作者在 TinyPICO 上使用的是兩個 10-引腳的 JST-EH 的連接器,JST-EH 比 JST-XH 使用更低的配置,更適合插入,以及比標(biāo)準(zhǔn)引腳更短更安全。
JST-EH 連接器所連接的 TinyPICO
下面,再見硬件固定在 3D 打印的外殼上,就大功告成了:
如果讀者們對硬件不熟悉,那也不要急,我們只要按照項目作者給出的硬件,并裝配好就行了。后面我們會介紹所有「裝備」的價格以及作者提供了設(shè)計圖。
軟件
項目作者 Dheera Venkatraman 表示,他經(jīng)常寫 C++或者 C,但他對 MicroPython 非常有興趣,因此在這個項目中采用的就是它。
項目作者使用每像素 2 比特的灰度深度來表示 MNIST 手寫數(shù)字。在這種比特深度下一張 28*28 像素的圖像只需要 196 字節(jié),因此一個 4MB 的閃存就能滿足整個 MNIST 驗證集。如果你想把整個數(shù)據(jù)集都裝進去,那么也只需要換閃存更大的微控制器、或者使用 1 比特深度的圖像、或者使用壓縮方法等。
將所有文件放在 TinyPICO 根目錄中的/ code 中,正確的文件大概如下圖所示。
另外,我們還需要為 Wi-Fi 創(chuàng)建一個名為.wifi 的文件,中間寫上 yourssid 與 yourpassword,具體的讀取 WIFI 設(shè)置的代碼就如下所示。
項目作者 Dheera Venkatraman 在 GitHub 中提供了所有代碼文件,打印鐘表數(shù)字的代碼也非常易讀。更友善的的是,作者的代碼提供了非常完善的注釋,基本重要的語句都有解讀。
現(xiàn)實一點,做一塊多少錢?
如果從硬件來看,似乎主要成本就是 TinyPICO 開發(fā)板以及四塊 e-ink 屏。首先 TinyPICO 在淘寶或者國外網(wǎng)站都能買到,國外賣 20 美元,而淘寶上標(biāo)價 235 元,加上運費其實也差不多。此外,讀者也可以選擇專門的元器件商城,其價格也在 200 塊左右。
其次,一塊 e-ink 屏大概 24 美元,雖然淘寶找不到,但是國內(nèi)的元器件商城要便宜得多,一塊只需要 92 元左右,可能樹莓派對它的需求比較大吧。
其它的成本就比較少了,線材、連接器裝時鐘的外包裝都比較容易獲得,在國內(nèi)的元器件商城也可以一次性買到。如果讀者想 3D 打印外包裝,作者也提供了具體的打印參數(shù)。所以,總的來說,制作成本應(yīng)該是低于 650 元的,其中開發(fā)板和電子屏都可以在其它項目中再利用。
也許我們還能改進該項目作者的實現(xiàn),在一塊大的墨水屏上實現(xiàn)數(shù)字時鐘,直接使用更常用的樹莓派作為主板(功耗遠高于 TinyPICO),并實現(xiàn)更多的能力,例如實時采樣個 CIFAR-10 作為背景。總之,MNIST 數(shù)字時鐘還有很多可以玩的地方。
最后,所有硬件與軟件的詳細信息都可查閱原項目。此外,值得一提的是,Dheera Venkatraman 還是非常有意思的一位小哥哥,他從杭州到北京沿著人類歷史上最長的人工河靠自行車騎了 1600 公里。
Last But Not Least
確實 MNIST 站在舞臺中央的時代已經(jīng)過去了,但它的作用仍然不可忽視,仍然有很多研究者致力于改進并修復(fù)它,做出獨特的貢獻。
2017 年,德國時尚科技公司 Zalando 提供了 Fashion MNIST 數(shù)據(jù)集,它的大小、格式和訓(xùn)練集 / 測試集劃分與原始的 MNIST 完全一致,從 MNIST 遷移到它,我們不需要修改任何代碼。
去年 6 月份,NYU 和 Facebook 的研究者重建并擴展了 MNIST 數(shù)據(jù)集,在測試集中新增了 50000 個樣本,將測試集增加到 6 萬樣本。MNIST 作者之一的 Yann LeCun 表示,「如果多次使用原版的 MNIST 測試集,你的模型可能在測試集上已經(jīng)過擬合了,是時候在新增的樣本上試一下了?!?/p>
不論是將 MNIST 做成日常生活中好看又好玩的項目,還是提升數(shù)據(jù)集本身的能力,MNIST 一直都會是活著的歷史~