自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

Hinton預(yù)言的「AI將擁有常識」如何實現(xiàn)?劍橋最新研究:從小狗學(xué)起

新聞 人工智能
最近,谷歌DeepMind、帝國理工和劍橋的研究人員開創(chuàng)性地提出,AI可以從動物身上學(xué)習(xí)常識!今后可以像訓(xùn)練小狗一樣訓(xùn)練智能體了。

 常識一直是困擾AI發(fā)展的難解謎題。就算AI能夠在圍棋比賽中戰(zhàn)勝人類,但機智如GPT-3卻不能理解「太陽有幾只眼睛」這種問題是反常識的。而最近,谷歌DeepMind、帝國理工和劍橋的研究人員開創(chuàng)性地提出,AI可以從動物身上學(xué)習(xí)常識!今后可以像訓(xùn)練小狗一樣訓(xùn)練智能體了。

Geoffery Hinton曾經(jīng)預(yù)言,十年內(nèi),我們將研發(fā)出具有常識的計算機。

這些計算機并沒有靈魂,它們只是具備了人類世界如何運作的知識,熟悉我們的慣例。它們知道爐子是熱的,知道人們通常不會買12臺烤箱等等。

常識是什么?最通俗的解釋是指與生俱來、毋須特別學(xué)習(xí)的判斷能力,或是眾人皆知、無須解釋或加以論證的知識。

[[348961]]

數(shù)十年來,常識是一直以來困擾著AI發(fā)展的難解謎題,就算AI能夠在圍棋比賽和Atari游戲中戰(zhàn)勝人類,但聰明如GPT-3卻不能理解「太陽有幾只眼睛」這種問題是違背常識的。

在如何讓AI擁有常識的漫長求索之路上,研究人員往往會從嬰幼兒身上入手,從神經(jīng)科學(xué)和行為科學(xué)中尋找靈感和答案。

而最近,谷歌 DeepMind、倫敦帝國理工學(xué)院和劍橋大學(xué)的人工智能研究人員開創(chuàng)性地提出,AI可以從動物身上學(xué)習(xí)常識!

這其實不是第一次提出AI應(yīng)該向動物學(xué)習(xí)了,AI大神Yann LeCun曾表示,「家貓都比最聰明的機器有常識得多?!?/p>

[[348963]]

人的常識是建立在許多其他動物所擁有的一系列基本能力之上的,而通過深度強化學(xué)習(xí),智能體或許可以從動物身上學(xué)到很多東西。

該研究小組發(fā)表在《 CellPress Reviews 》雜志上的論文《人工智能與動物常識》(Artificial Intelligence and the Common Sense of Animals)寫道: 「動物認知提供了一個很好理解的,非語言的,智能行為的概要,提出了作為評估基準的實驗方法,它以指導(dǎo)環(huán)境和任務(wù)設(shè)計?!?/p>

向小狗學(xué)習(xí)?像訓(xùn)練寵物一樣訓(xùn)練智能體

在著名的伊索寓言中,試驗者要求鳥類將物體投入裝有水和浮動食物的玻璃管中,提升水位,來獲取食物。

[[348964]]

訓(xùn)練動物的過程,通常包含著目標(biāo)和獎勵。比如說訓(xùn)練小狗,動作做的對,就獎勵他食物,這和運用深度強化學(xué)習(xí)訓(xùn)練智能體的方式有相似之處。

[[348965]]

相比之下,其他形式的人工智能,例如助手 Alexa 或 Siri,就不具備這種類似于在迷宮中搜索獎勵或食物的能力。

此前,認知行為科學(xué)家已經(jīng)發(fā)現(xiàn),動物的智力水平比先前設(shè)想的要高,包括海鴉的復(fù)仇心理和海豚的自我意識。(小孩子要長到一歲半時才能有自我意識,才能認出鏡子里自己的形象)

[[348966]]

很多時候,動物甚至?xí)扇∑垓_或者詭計來達成自己的目的。例如,黑猩猩把目光從渴望得到的東西上移開,來迷惑競爭對手,而松鴉會假裝把食物儲存在虛假的地點來保護它們的隱秘儲藏處。

實驗中,研究人員將測試場景中的動物和強化學(xué)習(xí)智能體進行類比,用一種新的方法來測試人工智能系統(tǒng)的認知能力?!度斯ぶ悄芘c動物常識》一文細講述了對鳥類和靈長類動物的認知實驗。

這個實驗最初的目的是確定鳥類是否能夠區(qū)分與任務(wù)相關(guān)的功能性和非功能性物體,并探索它們對所涉及的因果關(guān)系的理解程度。

做的好才有的吃,學(xué)會理解因果,要先試錯!

松鼠會想辦法撬開堅果的外殼,獲取里面的果實;某些鸚鵡也十分擅長從各種容器中提取食物;當(dāng)看到裂縫,孔洞或破裂之類的東西時,有的動物會作出「我要打開它」的反應(yīng)。

這是為什么?這是它們的意識中有了「因果」這一概念。

也就是,「只要我打開它,就會有食物?!苟@,也是AI要訓(xùn)練的部分。

作者聯(lián)想到訓(xùn)練動物的方法,發(fā)現(xiàn)「試錯」是十分奏效的。

來源于動物認知實驗,用來測試強化學(xué)習(xí)智能體獲取的常識

如上圖,

(A)使用四種不同形式的管道測試物理認知能力。如果棍子從錯誤的一端拔出,食物就會丟失。通過試錯來應(yīng)對不同情況(i),只學(xué)會了表面聯(lián)想的動物,在遷移任務(wù)[變異]中往往表現(xiàn)不佳 (ii)至(iv))],而已獲得因果理解的動物往往在第一次試驗中表現(xiàn)良好。

(B)用一個看不見的位移任務(wù)來測試對物體永久性的理解。在用食物做誘餌后,杯子被移動至右邊所示的最終排布。然后,動物要選擇盛有食物的杯子。當(dāng)然,杯子是不透明的,但是食物的位置能夠清晰地顯示出來。能夠理解這種看不見的位移的動物在所有四種不同情況中都表現(xiàn)得很好,即使它以前從未見過相關(guān)的物體。

而足夠逼真的3D世界模擬,是訓(xùn)練的必要條件,包括可能會破裂或被撬開的貝殼,無法擰開或撬開的瓶蓋,可撕開的包裝盒等等物體。

訓(xùn)練RL智能體的3D環(huán)境

(A)DeepMind游戲室環(huán)境

(B)與前者相同,不過是智能體視角下

智能體可以在場景中移動,并推動物體。在游戲室的環(huán)境中,智能體也可以拿起物品并把它們放下,它通過成功地執(zhí)行自然語言指令獲得獎勵,比如「把一個泰迪熊放在一個藍色的方塊上」。在動物AI環(huán)境中,智能體通過移動綠色球體獲得獎勵。

更為有趣的是,為了精準模仿動物與食物的因果關(guān)系。研究人員將綠色物體定位為「食物」,當(dāng)被觸摸時會產(chǎn)生積極的獎勵,然后就像被吃掉一樣消失。

[[348968]]

更高層次的常識:類比和隱喻,AI:我太難了

總結(jié)來說,常識是人類獨有的嗎?研究人員認為,并不是,常識是取決于一些基本概念的。比如,眼前的物體是什么?它會占據(jù)多大空間?以及因果之間的關(guān)系等等。

而且,這些理解被深深地刻進頭腦,并不會隨著時間的推移而發(fā)生改變。

然而,動物所表現(xiàn)出來的常識,很可能就包含對獎勵的認知。

「如何構(gòu)建這樣的人工智能技術(shù)仍然有待解答。但是我們提倡一種方法,讓 RL 智能體通過與豐富的虛擬環(huán)境進行擴展交互來獲得所需的東西?!?/p>

因此,通過適當(dāng)?shù)娜蝿?wù)訓(xùn)練智能體,很可能就能為AI賦予常識。

[[348969]]

當(dāng)然,常識也不僅僅是這些。物理學(xué)只是常識的一個領(lǐng)域。我們忽略了一些心理學(xué)概念(如相信某件事或表達出不開心)以及相關(guān)的常識性社會概念(如與某人某物在一起,或給予某人某物)。

物理上講,上述實驗的重點是固體。更完整的還應(yīng)該包括液體(水坑、溪流、瓶中的酒)、氣態(tài)物質(zhì)(煙、霧、火焰)和顆粒物(土壤、沙子),甚至包括可變形物體(海綿、紙張、繩子、衣服、樹葉、樹枝、動物的身體)和空間(洞、門道、入口)等。

從這個意義上講,常識可以看作是一組相互關(guān)聯(lián)的基本原則和抽象概念。更高更抽象的層面上,還包括類比和隱喻的運用。

[[348970]]

「理想情況下,我們希望建立一種AI技術(shù)能夠把握這些(關(guān)于認知的)相互關(guān)聯(lián)的原則和概念,并擁有人類層面的概括和創(chuàng)新能力」論文的最后寫道。

看來,讓AI擁有常識終歸是一條漫漫長路。

 

責(zé)任編輯:張燕妮 來源: 新智元
相關(guān)推薦

2022-12-06 09:44:00

算法神經(jīng)網(wǎng)絡(luò)

2023-12-11 19:08:03

AI模型

2022-04-07 14:44:24

人工智能計算神經(jīng)網(wǎng)絡(luò)

2025-01-02 13:50:35

2025-02-06 14:35:39

2021-06-15 09:19:11

存儲技術(shù)容器

2023-05-22 18:39:03

2017-11-22 19:00:51

人工智能深度學(xué)習(xí)膠囊網(wǎng)絡(luò)

2015-10-16 10:03:36

安卓設(shè)備安全終端安全

2017-07-11 13:27:31

人工智能機器智能

2021-04-27 09:30:47

AI 數(shù)據(jù)人工智能

2023-06-16 13:02:22

GPT-5GPT-4AI

2021-07-19 14:37:04

AI 數(shù)據(jù)人工智能

2011-08-24 10:11:47

云計算IT變革

2011-09-28 17:17:05

云計算IT變革

2019-11-28 09:42:46

人工智能AI精準醫(yī)療

2023-07-25 14:28:52

人工智能醫(yī)療硬件

2020-08-20 13:36:36

微軟開發(fā)AI
點贊
收藏

51CTO技術(shù)棧公眾號