讓AI像嬰兒一樣思考!DeepMind“柏拉圖”模型登Nature子刊
論文地址:https://www.nature.com/articles/s41562-022-01394-8
不過,在聊這個(gè)項(xiàng)目之前,我們需要先舉一個(gè)例子便于大家理解。
假如我拿著一根筆站在你面前,然后我把筆藏在身后,你是不是就看不見這支筆了?
但筆肯定還存在,對(duì)吧。
這么簡(jiǎn)單的道理,不光你懂,就連兩個(gè)月大小的嬰兒都明白。
但背后的原因就很耐人尋味了??茖W(xué)家很好奇,為什么人會(huì)天生就懂這個(gè)道理?
DeepMind的故事就從這點(diǎn)簡(jiǎn)單的好奇講起。
你以為嬰兒什么都不懂?
我們把「筆放身后看不見但筆還在」叫做萬千物理學(xué)常識(shí)中的一個(gè),而DeepMind的科學(xué)家就是要讓AI和小嬰兒比一比物理學(xué)常識(shí)。
普林斯頓大學(xué)的Luis Piloto和他的同事開發(fā)了一個(gè)深度學(xué)習(xí)AI系統(tǒng),這個(gè)系統(tǒng)可以理解一些物理學(xué)世界的常識(shí)性規(guī)律。
通過這種方式,未來的計(jì)算機(jī)模型就可以更好的模仿人類思維,用一個(gè)有著和嬰兒相同認(rèn)知的模型來解決問題。
通常意義上,任何AI模型一開始都是白紙一張,然后用各種各樣的例子來訓(xùn)練這個(gè)模型。通過輸入的數(shù)據(jù)和例子,模型產(chǎn)生了知識(shí)。
然而科學(xué)家指出,嬰兒卻不是這么個(gè)模式。
嬰兒學(xué)東西并不是從零開始,而是一降生就帶著一些對(duì)客觀事物的預(yù)判。
還是拿上面那個(gè)藏筆舉例子。嬰兒天生就知道,筆就算藏起來了也還在。
這是接下來實(shí)驗(yàn)的底層邏輯。即:嬰兒在出生時(shí)就有一些核心的假設(shè),而這些假設(shè)會(huì)讓他們?cè)谥蟪砷L(zhǎng)的過程中朝著正確的方向發(fā)展,而他們的知識(shí)也會(huì)隨著時(shí)間的推移、經(jīng)驗(yàn)的增多變得越來越精煉。
這給了Piloto團(tuán)隊(duì)以啟示。
Piloto想,一個(gè)模仿嬰兒行為模式的深度學(xué)習(xí)人工智能,是不是要比一個(gè)一開始白紙一張,單純靠經(jīng)驗(yàn)學(xué)習(xí)的人工智能模型表現(xiàn)要好?
研究人員進(jìn)一步比較了這兩種不同的模式。
他們首先進(jìn)行的是傳統(tǒng)的辦法(簡(jiǎn)稱白紙一張)。他們給了AI模型一些物體的視覺動(dòng)畫,讓AI進(jìn)行學(xué)習(xí),比方說一個(gè)方塊從斜坡上滑下來,或者是一個(gè)球彈向墻壁。
AI模型檢測(cè)了這些動(dòng)畫中的運(yùn)動(dòng)模式,然后研究人員就開始著手測(cè)試,模型能不能預(yù)測(cè)一些其它物體的運(yùn)動(dòng)結(jié)果。
而另一邊,模仿嬰兒的人工智能模型在一開始就有了一些「原則」,而這些「原則」的來源就是嬰兒對(duì)物體之間運(yùn)動(dòng)、交互的一些先天的假設(shè)。
舉個(gè)簡(jiǎn)單的例子,嬰兒知道兩個(gè)物體不可能穿過彼此,一個(gè)物體不可能憑空升起來等等。
模仿嬰兒認(rèn)知的AI——「柏拉圖」
而實(shí)際上,嬰兒先天就知道的物理學(xué)常識(shí)不止上面提到的這兩點(diǎn)。完整版是以下五點(diǎn):
1. 連續(xù)性:物體不會(huì)從一個(gè)地方傳送到另一個(gè)地方,而是在時(shí)間和空間中有一定的連續(xù)路徑。
2. 對(duì)象持久性:物體在看不見時(shí)不會(huì)消失。
3. 固體性:物體不會(huì)相互滲透。
4. 不變性:對(duì)象的屬性(如形狀)不會(huì)更改。
5. 定向慣性:物體運(yùn)動(dòng)的路徑與慣性原理一致。
基于這五點(diǎn)認(rèn)知,如果你給嬰兒表演個(gè)魔術(shù)啥的,然后發(fā)生了違背他們預(yù)設(shè)認(rèn)知的現(xiàn)象,他們是能知道你在整花活的,他們也知道反常識(shí)的現(xiàn)象并不是事物本來的樣子。
雖然但是,嬰兒還是沒大一點(diǎn)的孩子見識(shí)廣,嬰兒會(huì)長(zhǎng)時(shí)間觀察出現(xiàn)的反常識(shí)現(xiàn)象,然后和自己預(yù)設(shè)的認(rèn)知進(jìn)行比對(duì),最終才能得出有人在變戲法的結(jié)論。
說到這里不禁想起了一個(gè)之前熱度很高的視頻,爸媽躲在床單后面,上下晃動(dòng)床單幾次之后,藏在床單后面的同時(shí),快速躲到身后的房間里。嬰兒在床單消失后沒看到爸媽的身影,就會(huì)站在那里思索一會(huì)兒,琢磨爸媽去哪兒了。
這里還有一個(gè)有意思的點(diǎn)。那就是嬰兒在看到反常識(shí)的現(xiàn)象之后,還會(huì)表示出「驚訝」,聽起來這是很顯然的事,但研究人員把這種獨(dú)特的表現(xiàn)也復(fù)刻到AI那里去了。
有了這些基礎(chǔ),我們?cè)賮砜磳?shí)驗(yàn)結(jié)果。
Piloto設(shè)計(jì)的AI模型名叫PLATO(Physics Learning through Auto-encoding and Tracking Objects),也就是「柏拉圖」。
PLATO接受了差不多30個(gè)小時(shí)的視頻訓(xùn)練,這些視頻展示了物體是如何進(jìn)行一些簡(jiǎn)單運(yùn)動(dòng)的,然后訓(xùn)練模型來預(yù)測(cè)這些物體在不同情況下的運(yùn)動(dòng)。
有意思的是,模型最終習(xí)得了上述提到的五點(diǎn)物理學(xué)常識(shí)。
而當(dāng)觀看的視頻中出現(xiàn)了反常識(shí)的現(xiàn)象時(shí),PLATO也能像嬰兒一樣,表現(xiàn)出一定程度的驚訝。
Piloto和他的同事們發(fā)現(xiàn),傳統(tǒng)訓(xùn)練方法(白紙一張)的AI模型表現(xiàn)不錯(cuò),但是不比不知道,一比嚇一跳。模仿嬰兒的AI模型PLATO的表現(xiàn)要好的多得多。
因?yàn)橛辛祟A(yù)設(shè)認(rèn)知的加持,后一種模型可以更精確地預(yù)測(cè)一個(gè)物體的運(yùn)動(dòng),可以把預(yù)設(shè)的認(rèn)知應(yīng)用到新的物體運(yùn)動(dòng)動(dòng)畫中去,并且訓(xùn)練模型所用的數(shù)據(jù)集規(guī)模也會(huì)小一點(diǎn)。
Piloto團(tuán)隊(duì)總結(jié)到,雖然通過后天學(xué)習(xí)和經(jīng)驗(yàn)積累很重要,但這并不是全部。
他們的研究直指一個(gè)經(jīng)典的問題——什么是人類與生俱來的,什么又是后天學(xué)習(xí)的。
而下一步,就是把這種關(guān)于人類的認(rèn)知應(yīng)用在AI的研究中。
Piloto已經(jīng)向我們展示了,新方法的卓越成績(jī)。
但是,Piloto強(qiáng)調(diào),PLATO并不是要設(shè)計(jì)成嬰兒行為模型的,我們只是借用嬰兒認(rèn)知的一些方式來反哺人工智能。
PLATO的仿真系統(tǒng):前饋感知模塊(左)和循環(huán)動(dòng)態(tài)預(yù)測(cè)器模塊(右)
溫哥華不列顛哥倫比亞大學(xué)的計(jì)算機(jī)科學(xué)家Jeff Clune也表示,把AI和人類嬰兒的學(xué)習(xí)方式相結(jié)合是一個(gè)比較重要的方向。
而此時(shí)此刻,Clune正和其他研究人員一道,開發(fā)獨(dú)屬于他們的理解物理世界的算法的方法。
作者介紹
Luis Piloto是論文的一作,也是通訊作者。
他于2012年獲得羅格斯大學(xué)計(jì)算機(jī)科學(xué)學(xué)士學(xué)位,隨后又去普林斯頓大學(xué)攻讀,并分別于2017年和2021年獲得神經(jīng)科學(xué)的碩士和博士學(xué)位。
2016年,他正式加入DeepMind,成為一名研究科學(xué)家。