機(jī)器人正在創(chuàng)造自己的語言,未來將實(shí)現(xiàn)自主交流?
人工智能技術(shù)突飛猛進(jìn),但是如何解決他們之間交流的問題呢?科幻電影中一般假設(shè)它們使用人類語言,但是很明顯,人類語言是一種低效率而模糊的語言,先進(jìn)的人工智能完全沒必要采用。最近,有一群科學(xué)家正在致力于讓機(jī)器人創(chuàng)造自己的語言。這當(dāng)然是一個(gè)很有前途的研究,但不知為什么,總讓人有一種細(xì)思恐極的感覺。以下是相關(guān)介紹。
Igor Mordatch正在努力開發(fā)能夠進(jìn)行對話的機(jī)器,這也是其他許多人正在努力的事情。
聊天機(jī)器人在硅谷是一個(gè)熱詞,但是Mordatch和其他人不一樣:他是一個(gè)動(dòng)畫師出身的機(jī)器人專家而不是語言學(xué)家,他通常不參與那些語言相關(guān)的AI技術(shù)。他在皮克斯待過一段時(shí)間,并且參與制作了《玩具總動(dòng)員3》,在此期間還在斯坦福大學(xué)和華盛頓大學(xué)這樣的地方作為高校科研人員工作,在這些大學(xué)訓(xùn)練機(jī)器人像人一樣行動(dòng)。“我總是熱衷于從零到一的過程,”他說。
讓機(jī)器人創(chuàng)造互相交流的語言
在烏克蘭出生,在多倫多長大,31歲的Mordatch是OpenAI的一位訪問學(xué)者,這間AI實(shí)驗(yàn)室是由特斯拉的創(chuàng)始人Elon Musk和科技孵化器的主席Sam Altman創(chuàng)立的。Mordatch正在那里研究一種新的方法,使得機(jī)器不僅能夠和人交談,而且能夠在機(jī)器人之間進(jìn)行交流。他正在創(chuàng)立一個(gè)虛擬世界,軟件機(jī)器人出于需要可以在里面創(chuàng)造出他們自己的語言。如OpenAI本周發(fā)表的一篇研究論文所披露出的細(xì)節(jié)那樣,Mordatch和他的伙伴們創(chuàng)造出了一個(gè)世界,那里的機(jī)器人需要完成特定的任務(wù),比如要把自己移動(dòng)到某個(gè)特定的坐標(biāo)。這個(gè)世界很簡單,就是一個(gè)白色的大方塊——只有兩個(gè)維度——而機(jī)器人是帶顏色的圖形:一個(gè)綠色、紅色或是藍(lán)色的圓形。但是這個(gè)宇宙的意義要更加復(fù)雜。作為一種協(xié)同合作的方式,這個(gè)世界允許機(jī)器人創(chuàng)造自己的語言,以幫助其他機(jī)器人完成這些任務(wù)。
與AlphaGo類似
所有這些都是通過增強(qiáng)式學(xué)習(xí)(reinforcement learning)實(shí)現(xiàn)的,如同圍棋高手AlphaGo的那種基本技術(shù)一樣?;旧?,這些機(jī)器人通過極端的試驗(yàn)和錯(cuò)誤來指引自己的世界,它們尋求獎(jiǎng)勵(lì)的時(shí)候會(huì)小心地遵循著正確的事情,避開錯(cuò)誤的事情。他們通過同樣的方式創(chuàng)造出了自己的語言,告訴其他人要去哪些地方能夠幫助他們更快地各就各位。
為了建立它們的語言,當(dāng)它們在它們的虛擬世界里航行的時(shí)候,這些機(jī)器人會(huì)給自己學(xué)到的一些簡單概念指定隨機(jī)的抽象特征。他們給彼此指定特征;給虛擬世界里的地點(diǎn)或是物品指定特征;還給比如“去到”和“看著”這樣的動(dòng)作指定特征。Mordatch和他的同事們希望,隨著這些機(jī)器人的語言變得越來越復(fù)雜,相關(guān)的科技可以把它們的語言翻譯成英語這樣的語言。這是一條漫漫長路——至少對于實(shí)用軟件來說是這樣的——但是OpenAI的另一位研究員已經(jīng)開始研究這種“翻譯機(jī)器人”了。
Mordatch說,這些方法最終能使機(jī)器對語言有更深的領(lǐng)會(huì),可以讓它們看到語言是如何產(chǎn)生的——而這就為真正的對話提供了一個(gè)跳板,一種計(jì)算機(jī)科學(xué)家們夢寐已久卻從未實(shí)現(xiàn)的電腦交互界面。
AI里程碑:從模仿人類語言,到創(chuàng)造自己語言
這些方法是語言相關(guān)的AI研究的一次重要里程碑。如今,科學(xué)家們一般都在研究試圖模仿人類語言的方法,而不是創(chuàng)造出一種新的語言。其中一個(gè)例子就是以深度神經(jīng)網(wǎng)絡(luò)為中心的工作。近幾年來,深度神經(jīng)網(wǎng)絡(luò)——能夠從大量數(shù)據(jù)中找出模式從而學(xué)習(xí)任務(wù)的復(fù)雜數(shù)學(xué)系統(tǒng)——在識別圖像中的物體、識別智能手機(jī)的語音命令以及更多其他事情上已經(jīng)被證明出了有極大的高效性。現(xiàn)在,在Google、Facebook、還有Microsoft這些地方的研究人員憑著有限的成功,開始在理解語言、在英語對話中找出模式應(yīng)用相似的方法。
Mordatch和他的同事,包括OpenAI和加利福尼亞的研究員、伯克利大學(xué)的教授Pieter Abbeel,都質(zhì)疑那種方法會(huì)不會(huì)奏效。所以他們從一個(gè)截然不同的地方開始了。“智能體要想和人智能地互動(dòng),光靠捕獲數(shù)據(jù)模式是不夠的,”他們的論文里這樣寫道。“如果一個(gè)智能體在他的環(huán)境里能夠使用語言來達(dá)到自己的目的,那么它就理解了這門語言(包括其他非語言的交流以及身體語言)。
對于早期人類來說,語言是因?yàn)樾枰a(chǎn)生的。他們學(xué)著如何交流,因?yàn)檫@能夠幫助他們做其他的事情,可以讓他們有超過動(dòng)物的優(yōu)勢。OpenAI的這些研究員想給機(jī)器人創(chuàng)造出一種一樣的動(dòng)態(tài)。在他們的虛擬世界里,機(jī)器人不僅會(huì)學(xué)習(xí)自己的語言,它們同時(shí)還會(huì)用簡單的動(dòng)作輔助交流——比如指向一個(gè)特定的位置,或者就把一個(gè)機(jī)器人從一個(gè)地方領(lǐng)到另一個(gè)地方——很像嬰兒們的行為。那也是一種語言,或者起碼算是一條通向語言的道路。
但是,仍然有很多AI研究人員認(rèn)為深度神經(jīng)網(wǎng)絡(luò)——從數(shù)據(jù)里找出統(tǒng)計(jì)模式從而發(fā)現(xiàn)語言——的方法有用。“它們本質(zhì)上還是在捕獲統(tǒng)計(jì)模式,只不過是在一個(gè)更簡單、更智能的環(huán)境里。”Salesforce在OpenAI的團(tuán)隊(duì)里的一名AI研究員Richard Socher說。“在一片有趣的新領(lǐng)域里取得進(jìn)步?jīng)]什么問題,但是那些抽象的論斷就有點(diǎn)太過了。”
無論如何,Mordatch的項(xiàng)目顯示,分析大量數(shù)據(jù)并不是唯一的道路。系統(tǒng)也可以通過自己的行動(dòng)來學(xué)習(xí),而這可能會(huì)帶來非常不一樣的優(yōu)勢。OpenAI的其他研究人員透露一個(gè)更大更復(fù)雜的叫做“宇宙”的虛擬世界之后,取消了差不多一樣的這種想法。除此之外,機(jī)器人可以在“宇宙”里學(xué)習(xí)使用常見的軟件應(yīng)用,比如網(wǎng)頁瀏覽器。這在增強(qiáng)式學(xué)習(xí)的一種形式里也會(huì)發(fā)生。而對于OpenAI的創(chuàng)始人之一Ilya Sutskever來說,這種安排其實(shí)是理解語言的另一條道路。一個(gè)AI只有在理解了人類聊天的自然方式之后才可以瀏覽互聯(lián)網(wǎng)。與此同時(shí),微軟正在通過增強(qiáng)式學(xué)習(xí)的另一種方式來處理語言,而斯坦福的研究員正在探究他們與“機(jī)器人協(xié)同合作”有關(guān)的方法。
***,成功可能會(huì)隨著科技的結(jié)合而到來,而不是僅憑單一的科技。而Mordatch其實(shí)正在提倡另一種科技,讓機(jī)器人不僅僅是學(xué)著交談,而是理解語言本身,并自己創(chuàng)造出語言。如同人類最初創(chuàng)造語言一樣,機(jī)器人也可能因此而迎來新紀(jì)元。