自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

^{<blockquote id="1uf3c"></blockquote>}

<legend id="1uf3c"><track id="1uf3c"></track></legend>

<pre id="1uf3c"></pre>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認證廠商認證 IT技術(shù)PMP項目管理免費題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設(shè)置退出

Hinton預(yù)言的「AI將擁有常識」如何實現(xiàn)？劍橋最新研究：從小狗學(xué)起

作者：佚名 2020-10-28 10:05:00

新聞人工智能

最近，谷歌DeepMind、帝國理工和劍橋的研究人員開創(chuàng)性地提出，AI可以從動物身上學(xué)習(xí)常識！今后可以像訓(xùn)練小狗一樣訓(xùn)練智能體了。

常識一直是困擾AI發(fā)展的難解謎題。就算AI能夠在圍棋比賽中戰(zhàn)勝人類，但機智如GPT-3卻不能理解「太陽有幾只眼睛」這種問題是反常識的。而最近，谷歌DeepMind、帝國理工和劍橋的研究人員開創(chuàng)性地提出，AI可以從動物身上學(xué)習(xí)常識！今后可以像訓(xùn)練小狗一樣訓(xùn)練智能體了。

Geoffery Hinton曾經(jīng)預(yù)言，十年內(nèi)，我們將研發(fā)出具有常識的計算機。

這些計算機并沒有靈魂，它們只是具備了人類世界如何運作的知識，熟悉我們的慣例。它們知道爐子是熱的，知道人們通常不會買12臺烤箱等等。

常識是什么？最通俗的解釋是指與生俱來、毋須特別學(xué)習(xí)的判斷能力，或是眾人皆知、無須解釋或加以論證的知識。

數(shù)十年來，常識是一直以來困擾著AI發(fā)展的難解謎題，就算AI能夠在圍棋比賽和Atari游戲中戰(zhàn)勝人類，但聰明如GPT-3卻不能理解「太陽有幾只眼睛」這種問題是違背常識的。

在如何讓AI擁有常識的漫長求索之路上，研究人員往往會從嬰幼兒身上入手，從神經(jīng)科學(xué)和行為科學(xué)中尋找靈感和答案。

而最近，谷歌 DeepMind、倫敦帝國理工學(xué)院和劍橋大學(xué)的人工智能研究人員開創(chuàng)性地提出，AI可以從動物身上學(xué)習(xí)常識！

這其實不是第一次提出AI應(yīng)該向動物學(xué)習(xí)了，AI大神Yann LeCun曾表示，「家貓都比最聰明的機器有常識得多?！?/p>

人的常識是建立在許多其他動物所擁有的一系列基本能力之上的，而通過深度強化學(xué)習(xí)，智能體或許可以從動物身上學(xué)到很多東西。

該研究小組發(fā)表在《 CellPress Reviews 》雜志上的論文《人工智能與動物常識》(Artificial Intelligence and the Common Sense of Animals)寫道: 「動物認知提供了一個很好理解的，非語言的，智能行為的概要，提出了作為評估基準的實驗方法，它以指導(dǎo)環(huán)境和任務(wù)設(shè)計?！?/p>

向小狗學(xué)習(xí)？像訓(xùn)練寵物一樣訓(xùn)練智能體

在著名的伊索寓言中，試驗者要求鳥類將物體投入裝有水和浮動食物的玻璃管中，提升水位，來獲取食物。

訓(xùn)練動物的過程，通常包含著目標(biāo)和獎勵。比如說訓(xùn)練小狗，動作做的對，就獎勵他食物，這和運用深度強化學(xué)習(xí)訓(xùn)練智能體的方式有相似之處。

相比之下，其他形式的人工智能，例如助手 Alexa 或 Siri，就不具備這種類似于在迷宮中搜索獎勵或食物的能力。

此前，認知行為科學(xué)家已經(jīng)發(fā)現(xiàn)，動物的智力水平比先前設(shè)想的要高，包括海鴉的復(fù)仇心理和海豚的自我意識。（小孩子要長到一歲半時才能有自我意識，才能認出鏡子里自己的形象）

很多時候，動物甚至?xí)扇∑垓_或者詭計來達成自己的目的。例如，黑猩猩把目光從渴望得到的東西上移開，來迷惑競爭對手，而松鴉會假裝把食物儲存在虛假的地點來保護它們的隱秘儲藏處。

實驗中，研究人員將測試場景中的動物和強化學(xué)習(xí)智能體進行類比，用一種新的方法來測試人工智能系統(tǒng)的認知能力?！度斯ぶ悄芘c動物常識》一文細講述了對鳥類和靈長類動物的認知實驗。

這個實驗最初的目的是確定鳥類是否能夠區(qū)分與任務(wù)相關(guān)的功能性和非功能性物體，并探索它們對所涉及的因果關(guān)系的理解程度。

做的好才有的吃，學(xué)會理解因果，要先試錯！

松鼠會想辦法撬開堅果的外殼，獲取里面的果實；某些鸚鵡也十分擅長從各種容器中提取食物；當(dāng)看到裂縫，孔洞或破裂之類的東西時，有的動物會作出「我要打開它」的反應(yīng)。

這是為什么？這是它們的意識中有了「因果」這一概念。

也就是，「只要我打開它，就會有食物?！苟@，也是AI要訓(xùn)練的部分。

作者聯(lián)想到訓(xùn)練動物的方法，發(fā)現(xiàn)「試錯」是十分奏效的。

來源于動物認知實驗，用來測試強化學(xué)習(xí)智能體獲取的常識

如上圖，

(A)使用四種不同形式的管道測試物理認知能力。如果棍子從錯誤的一端拔出，食物就會丟失。通過試錯來應(yīng)對不同情況(i)，只學(xué)會了表面聯(lián)想的動物，在遷移任務(wù)[變異]中往往表現(xiàn)不佳 (ii)至(iv))]，而已獲得因果理解的動物往往在第一次試驗中表現(xiàn)良好。

(B)用一個看不見的位移任務(wù)來測試對物體永久性的理解。在用食物做誘餌后，杯子被移動至右邊所示的最終排布。然后，動物要選擇盛有食物的杯子。當(dāng)然，杯子是不透明的，但是食物的位置能夠清晰地顯示出來。能夠理解這種看不見的位移的動物在所有四種不同情況中都表現(xiàn)得很好，即使它以前從未見過相關(guān)的物體。

而足夠逼真的3D世界模擬，是訓(xùn)練的必要條件，包括可能會破裂或被撬開的貝殼，無法擰開或撬開的瓶蓋，可撕開的包裝盒等等物體。

訓(xùn)練RL智能體的3D環(huán)境

（A）DeepMind游戲室環(huán)境

（B）與前者相同，不過是智能體視角下

智能體可以在場景中移動，并推動物體。在游戲室的環(huán)境中，智能體也可以拿起物品并把它們放下，它通過成功地執(zhí)行自然語言指令獲得獎勵，比如「把一個泰迪熊放在一個藍色的方塊上」。在動物AI環(huán)境中，智能體通過移動綠色球體獲得獎勵。

更為有趣的是，為了精準模仿動物與食物的因果關(guān)系。研究人員將綠色物體定位為「食物」，當(dāng)被觸摸時會產(chǎn)生積極的獎勵，然后就像被吃掉一樣消失。

更高層次的常識：類比和隱喻，AI：我太難了

總結(jié)來說，常識是人類獨有的嗎？研究人員認為，并不是，常識是取決于一些基本概念的。比如，眼前的物體是什么？它會占據(jù)多大空間？以及因果之間的關(guān)系等等。

而且，這些理解被深深地刻進頭腦，并不會隨著時間的推移而發(fā)生改變。

然而，動物所表現(xiàn)出來的常識，很可能就包含對獎勵的認知。

「如何構(gòu)建這樣的人工智能技術(shù)仍然有待解答。但是我們提倡一種方法，讓 RL 智能體通過與豐富的虛擬環(huán)境進行擴展交互來獲得所需的東西?！?/p>

因此，通過適當(dāng)?shù)娜蝿?wù)訓(xùn)練智能體，很可能就能為AI賦予常識。

當(dāng)然，常識也不僅僅是這些。物理學(xué)只是常識的一個領(lǐng)域。我們忽略了一些心理學(xué)概念(如相信某件事或表達出不開心)以及相關(guān)的常識性社會概念(如與某人某物在一起，或給予某人某物)。

物理上講，上述實驗的重點是固體。更完整的還應(yīng)該包括液體(水坑、溪流、瓶中的酒)、氣態(tài)物質(zhì)(煙、霧、火焰)和顆粒物(土壤、沙子)，甚至包括可變形物體(海綿、紙張、繩子、衣服、樹葉、樹枝、動物的身體)和空間(洞、門道、入口)等。

從這個意義上講，常識可以看作是一組相互關(guān)聯(lián)的基本原則和抽象概念。更高更抽象的層面上，還包括類比和隱喻的運用。

「理想情況下，我們希望建立一種AI技術(shù)能夠把握這些（關(guān)于認知的）相互關(guān)聯(lián)的原則和概念，并擁有人類層面的概括和創(chuàng)新能力」論文的最后寫道。

看來，讓AI擁有常識終歸是一條漫漫長路。

責(zé)任編輯：張燕妮來源：新智元

AI 數(shù)據(jù)人工智能

51CTO技術(shù)棧公眾號

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營

<legend id="fqd4i"><track id="fqd4i"><dfn id="fqd4i"></dfn></track></legend>