AI發(fā)展的下一站——機(jī)器人用自己獨(dú)創(chuàng)的語(yǔ)言進(jìn)行交流
如今能夠“學(xué)習(xí)”身邊的世界已經(jīng)是人工智能算法的最基本要求了。AI機(jī)器人的下一站將是學(xué)會(huì)互相交流,并發(fā)展它們共享的語(yǔ)言體系。
OpenAI于前不久發(fā)布的一項(xiàng)新研究詳細(xì)說(shuō)明了他們?nèi)绾斡?xùn)練AI機(jī)器人在預(yù)設(shè)環(huán)境中通過(guò)不斷試錯(cuò)去創(chuàng)造自己的語(yǔ)言。
這與一般AI算法通過(guò)分析海量數(shù)據(jù)(比如讀取幾千張狗的圖片來(lái)學(xué)會(huì)認(rèn)狗)的學(xué)習(xí)方式不同。
研究人員為AI機(jī)器人打造的學(xué)習(xí)場(chǎng)所是電腦模擬的二維白色方框。在那里,分別用綠圈、紅圈和籃圈代表的AI們肩負(fù)著各自的任務(wù),比如移動(dòng)至方框內(nèi)不同顏色的圓點(diǎn)上。
完成任務(wù)的目標(biāo)驅(qū)動(dòng)著AI用自己的語(yǔ)言進(jìn)行互相交流。機(jī)器人創(chuàng)造了不同術(shù)語(yǔ),比如“觸地”,或是與環(huán)境中其他物體、其他機(jī)器人以及具體動(dòng)作對(duì)應(yīng)的詞匯,比如“去”、“看”。但機(jī)器人創(chuàng)造的語(yǔ)言并不是人們想象的那些詞匯,而是一組組數(shù)字,研究員給它們分別標(biāo)上了文字說(shuō)明。
研究員教會(huì)AI如何通過(guò)強(qiáng)化學(xué)習(xí)來(lái)進(jìn)行溝通:經(jīng)歷過(guò)不斷試錯(cuò)后,機(jī)器人下次執(zhí)行任務(wù)時(shí)就記住了哪些行得通和哪些行不通。這項(xiàng)研究的論文作者之一Igor Mordatch將于9月開(kāi)始在卡耐基梅隆大學(xué)執(zhí)教。另一作者Pieter Abbeel是OpenAI的研究人員兼加州大學(xué)伯克利分校的教授。
目前已經(jīng)有AI助手能夠聽(tīng)懂人類語(yǔ)言(如Siri和Alexa)或做一些翻譯工作,但這往往是通過(guò)向AI輸送大量語(yǔ)言數(shù)據(jù)來(lái)做到的,而不是AI在親身經(jīng)歷中學(xué)會(huì)了理解語(yǔ)言。
“我們認(rèn)為,如果我們慢慢地使AI的學(xué)習(xí)環(huán)境復(fù)雜起來(lái),并漸漸擴(kuò)大允許執(zhí)行的動(dòng)作范疇,它們就有可能會(huì)創(chuàng)造出超越基本動(dòng)詞和名詞的富有表現(xiàn)力的語(yǔ)言,”研究人員這樣寫(xiě)道。
為什么這很關(guān)鍵呢?
“在AI的潛能被完全開(kāi)發(fā)出來(lái)之前,語(yǔ)言理解對(duì)于AI的繼續(xù)進(jìn)步都極其重要,” 牛津大學(xué)的AI政策學(xué)者M(jìn)iles Brundage說(shuō)道,他也提到OpenAI的成果代表了AI領(lǐng)域的一個(gè)潛在重要前進(jìn)方向。
“AI在沒(méi)有詞匯基礎(chǔ)的情況下能達(dá)到怎樣的語(yǔ)言理解水平還很難說(shuō),”Brundage說(shuō),“大部分AI算法還停留在單字理解。”