視覺感知堪比人眼:這款突破性光學(xué)傳感器模仿人類視網(wǎng)膜,有望帶來 AI 重大進(jìn)展
視覺、聽覺、嗅覺、味覺、觸覺是人類最基本的五種感覺,其中視覺極為關(guān)鍵,畢竟隨著物種進(jìn)化,眼睛作為人類最為精細(xì)、復(fù)雜的器官,感知能力無與倫比。
曾有神經(jīng)科學(xué)、認(rèn)知心理學(xué)研究表明,80% 以上的外界信息都是通過視覺進(jìn)入了我們的大腦。
技術(shù)代代革新之下,仿人眼的嘗試不斷涌現(xiàn)。
2015 年,美國明尼蘇達(dá)州一位名為 Allen Zderad 的 68 歲男子在失明 10 年之后,憑借一雙 “仿生眼”重見光明。
2020 年 5 月,香港科技大學(xué)范智勇團(tuán)隊(duì)聯(lián)合加州大學(xué)伯克利分校、美國勞倫斯伯克利國家實(shí)驗(yàn)室的一組研究人員,就視網(wǎng)膜問題提出了最新方案,甚至打造出了多項(xiàng)性能超越人眼的仿生眼。
而就在近日,美國公立研究型大學(xué)俄勒岡州立大學(xué)(Oregon State University)在光學(xué)傳感器領(lǐng)域有了重大進(jìn)展,更接近于人眼感知視野變化能力的傳感器終于來了。
俄勒岡州立大學(xué)表示:
- 該傳感器是圖像識(shí)別、機(jī)器人和人工智能等領(lǐng)域的重大突破,突破性的仿人眼光學(xué)傳感器是人工智能發(fā)展的關(guān)鍵一步。
打造新型視網(wǎng)膜傳感器
2020 年 12 月 8 日,相關(guān)研究成果正式發(fā)表于《應(yīng)用物理快報(bào)》,題為 A perovskite retinomorphic sensor(一種鈣鈦礦型視網(wǎng)膜傳感器),論文作者為俄勒岡州立大學(xué)工程學(xué)院研究員、電氣與計(jì)算機(jī)工程助理教授 John Labram 和研究生 Cinthya Trujillo Herrera。

- 哪怕最先進(jìn)的超級(jí)計(jì)算機(jī),復(fù)雜程度也無法與人腦相媲美。
最早,基于這一事實(shí),神經(jīng)形態(tài)計(jì)算領(lǐng)域的研究開始興起,其設(shè)計(jì)目的是在執(zhí)行機(jī)器學(xué)習(xí)任務(wù)時(shí)優(yōu)于傳統(tǒng)計(jì)算機(jī),原理可以簡要概括為一句話:將人腦(的一些方面)復(fù)制到硬件中。
論文介紹,雖然近年來這一領(lǐng)域取得了很大的進(jìn)展,但幾乎所有提供給神經(jīng)形態(tài)處理器的輸入信號(hào)仍然是為傳統(tǒng)的 von Neumann 計(jì)算機(jī)體系結(jié)構(gòu)設(shè)計(jì)的。
研究團(tuán)隊(duì)設(shè)計(jì)了一個(gè)簡單的光敏電容器,并描述了它對(duì)光刺激的反應(yīng)。
如下圖 a 所示,該結(jié)構(gòu)基于雙層電介質(zhì):
- 底部為二氧化硅:二氧化硅高度絕緣,并且對(duì)光基本上沒有反應(yīng)。
- 頂部為鈣鈦礦:即甲基銨碘化鉛(MAPbI3),這是一種具有大光電導(dǎo)響應(yīng)的化合物,在光照下介電常數(shù)有顯著變化,是電介質(zhì)的理想候選材料,在光照下可以改變電容。
電極方面:
- 底部電極是高摻雜的硅,用作襯底。
- 頂部電極是 15nm 的、通過熱蒸發(fā)沉積的金,被設(shè)計(jì)得足夠薄,即便接觸電阻很大,在導(dǎo)電時(shí)能對(duì)光照半透明。

John Labram 表示:
- 以前嘗試制造仿人眼設(shè)備(視網(wǎng)膜視覺傳感器)都是依靠軟件或較為復(fù)雜的硬件。但我們?cè)O(shè)計(jì)的這種新型傳感器,其操作包括在基礎(chǔ)設(shè)計(jì)中,涉及了鈣鈦礦半導(dǎo)體的超薄層。當(dāng)置于光下時(shí),鈣鈦礦會(huì)從堅(jiān)固的電絕緣體變?yōu)閷?dǎo)體,它具有發(fā)展太陽能的潛力,近年來對(duì)于鈣鈦礦,學(xué)界也有著廣泛的研究。
基于上述結(jié)構(gòu),當(dāng)與外部電阻器串聯(lián)時(shí),電阻器兩端的電壓降(又稱電位差)將在電容器充電 / 放電時(shí)暫時(shí)出現(xiàn)尖峰,然后恢復(fù)到其平衡值。也就是說,傳感器會(huì)在照度變化時(shí)出現(xiàn)尖峰,在其他時(shí)候輸出零電壓(如上圖 d 所示)。
研究團(tuán)隊(duì)設(shè)計(jì)的光敏電容器在設(shè)計(jì)和預(yù)期的用途上,都與別的科學(xué)團(tuán)隊(duì)以前研制的光電電容器不同——光電電容器被設(shè)計(jì)用來儲(chǔ)存來自太陽輻射的能量,而上述傳感器被設(shè)計(jì)用來檢測(cè)神經(jīng)形態(tài)計(jì)算中光學(xué)刺激的變化。
模仿人眼感知更加逼真
那么上述傳感器實(shí)際的仿人眼效果如何呢?
首先,研究人員通過播放視頻作為施加給傳感器的光學(xué)刺激,模擬大型陣列。
結(jié)果表明:
- 對(duì)應(yīng)視頻的靜止部分,傳感器輸出了較暗的視頻;
- 對(duì)應(yīng)視頻的移動(dòng)部分,傳感器則輸出了較亮的視頻。
- 在沒有光照的情況下緩慢移動(dòng)時(shí),傳感器輸出的較亮區(qū)域存在 “鬼影”效應(yīng)。
可見,傳感器對(duì)于動(dòng)態(tài)圖像有著很明顯的反應(yīng)。
隨后,研究人員向傳感器施加了以特定角度排列的光刺激,作為另一種檢驗(yàn)。
這一實(shí)驗(yàn)受到了 20 世紀(jì) 50、60 年代一項(xiàng)發(fā)現(xiàn)的啟發(fā)——科學(xué)家們注意到貓的某些神經(jīng)元對(duì)以特定角度排列的光刺激有強(qiáng)烈的反應(yīng)。科學(xué)家們認(rèn)為,這是視網(wǎng)膜中一些細(xì)胞的特定排列導(dǎo)致了超極化、去極化,它們對(duì)光學(xué)刺激會(huì)產(chǎn)生反應(yīng)。
因此,研究人員選擇測(cè)量兩個(gè)值:電容器兩端的電壓降(C 傳感器)和電阻器兩端的電壓降(R 傳感器)。

結(jié)果如上圖所示,這種傳感器的確會(huì)對(duì)某個(gè)方向的刺激做出更強(qiáng)烈的反應(yīng)。
上述兩項(xiàng)實(shí)驗(yàn)表明,這一傳感器的人眼感知模仿能力的確較強(qiáng)。
不僅如此,研究人員還認(rèn)為,由于這是一種傳感器,它不需要任何復(fù)雜的讀出算法或后處理,它可直接輸出電壓,電壓取決于傳感器所瞄準(zhǔn)的物體的方向。
John Labram 表示:
- 新型傳感器將與神經(jīng)形態(tài)計(jì)算機(jī)完美匹配,將為下一代人工智能的應(yīng)用提供動(dòng)力,如自動(dòng)駕駛汽車、機(jī)器人技術(shù)和先進(jìn)的圖像識(shí)別。