這款「無皮」機(jī)器人的凝視直擊靈魂,未來還要現(xiàn)身迪士尼樂園
談起迪士尼,你會(huì)想到機(jī)智勇敢的公主們?
城堡上空絢麗的煙花?
還是......迪士尼出品的機(jī)器人???
近日召開的機(jī)器人國際頂級(jí)會(huì)議 2020 IEEE 國際智能機(jī)器人與系統(tǒng)大會(huì)(IROS 2020)上,有一篇論文發(fā)表,介紹的就是上面這款似人非人、似機(jī)器確實(shí)是機(jī)器的機(jī)器人。
論文題為 Realistic and Interactive Robot Gaze(逼真、可互動(dòng)的機(jī)器人凝視)——的確,來自這款機(jī)器人的凝視可太逼真了!
再近距離觀察一下它的眼球。
在迪士尼樂園偶遇機(jī)器人
這款機(jī)器人的特征應(yīng)該不難發(fā)現(xiàn),一是沒有皮膚,二是會(huì)眼神互動(dòng)。
維基百科上,類人機(jī)器人(Humanoid robot)的定義是:機(jī)器人的一種,具有類似于人類外型的特征,例如有頭部、軀干跟手腳,但不一定有頭發(fā)、五官、牙齒、皮膚等細(xì)微特征。
如此看來,這是一款類人機(jī)器人。
它主要的應(yīng)用領(lǐng)域是娛樂——迪士尼下一步打算將其發(fā)展成卡通人物,它將按腳本與游客互動(dòng)。
對(duì)于這款有點(diǎn)詭異的機(jī)器人,迪士尼官方的腦洞是:
機(jī)器人的角色是一位正在讀書的老人,可能是在圖書館里,也可能在公園長椅上。他聽力有困難、視力也在下降,但還是經(jīng)常被路過的人分散注意力。大多數(shù)時(shí)候他會(huì)瞥一眼匆匆走過的人們,也會(huì)友好地向熟人點(diǎn)頭示意,但當(dāng)有人侵占私人空間時(shí)他會(huì)瞪著他們。
也許下一次去迪士尼樂園就能偶遇這位“老人”了,還是希望工作人員能給它穿上人造皮膚。
眼神交流,真實(shí)最重要
這款機(jī)器人的研究團(tuán)隊(duì)陣容可以說是強(qiáng)強(qiáng)聯(lián)合了:
-
曾設(shè)計(jì)過不少機(jī)器人的迪士尼研究中心;
-
負(fù)責(zé)設(shè)計(jì)、建造世界上所有迪士尼樂園及度假村的迪士尼業(yè)務(wù)部門華特迪士尼幻想工程(WDI);
-
世界頂尖的私立研究型大學(xué)加州理工學(xué)院;
-
被譽(yù)為是“公立常春藤”的伊利諾伊大學(xué)厄巴納-香檳分校。
他們?cè)O(shè)計(jì)的機(jī)器人究竟有何亮點(diǎn),來看看論文是怎么說的。
論文表示,此前「人-機(jī)注視互動(dòng)」的研究主要關(guān)注技術(shù)層面。而此次,迪士尼團(tuán)隊(duì)展示了一個(gè)通用架構(gòu)——要?jiǎng)?chuàng)建「注視互動(dòng)」,不僅是從技術(shù)角度出發(fā),也注重機(jī)器人眼球運(yùn)動(dòng)的逼真性和可信度。
對(duì)此,IEEE 網(wǎng)站的評(píng)價(jià)是:
可以把它想象成一種老式的、專用于注視的圖靈測(cè)試——如果無法區(qū)分機(jī)器人與人類的注視,那么迪士尼的設(shè)計(jì)就是逼真的。
也就是說,迪士尼不是要讓機(jī)器人注視遠(yuǎn)方,而是當(dāng)人類走近它并望向它的眼睛時(shí),它會(huì)有眼神的回應(yīng)。
包容體系結(jié)構(gòu)的傳承
通常,科學(xué)家們會(huì)通過研究人類的大腦運(yùn)作機(jī)制設(shè)計(jì)控制系統(tǒng),但這一次迪士尼團(tuán)隊(duì)采用的方法是他們最為擅長的東西——動(dòng)畫。
正因如此,機(jī)器人硬件部分其實(shí)是一個(gè)「音頻-動(dòng)畫半身像」。
畢竟,迪士尼只是不希望機(jī)器人在注視人類時(shí)出錯(cuò)。在這種所謂的“視覺吸引”(visual appeal)方法背后,實(shí)際上是多年的、大量的人機(jī)交互(HRI)研究積累。
迪士尼希望把「人-機(jī)注視互動(dòng)」打造成真人面對(duì)面眼神交流的水平,為此他們的設(shè)計(jì)是:機(jī)器人可以感知環(huán)境中的人,根據(jù)人們的動(dòng)作確定他們是否對(duì)機(jī)器人感興趣,隨后機(jī)器人會(huì)選擇適當(dāng)方式執(zhí)行高度逼真的動(dòng)作。
具體來講,機(jī)器人有以下幾種狀態(tài):
-
讀書:機(jī)器人的默認(rèn)狀態(tài)。
-
掃視:使用 RGB-D 攝像機(jī)識(shí)別目標(biāo),當(dāng)注意力引擎顯示人們的好奇心分?jǐn)?shù)超過某一閾值時(shí),機(jī)器人會(huì)瞥一眼對(duì)方。
-
吸引:當(dāng)注意力引擎顯示刺激達(dá)到了某一閾值時(shí),機(jī)器人會(huì)將頭轉(zhuǎn)向?qū)Ψ?,目光注視?/p>
-
確認(rèn):當(dāng)機(jī)器人判定見到“熟人”時(shí),將直接從吸引狀態(tài)或掃視狀態(tài)進(jìn)入確認(rèn)狀態(tài)。
不過,在上述狀態(tài)以外,還有一些更低級(jí)的行為,如呼吸、輕微的頭部運(yùn)動(dòng)、眨眼和眼球快速運(yùn)動(dòng)等。
雷鋒網(wǎng)了解到,這幾種行為其實(shí)涉及到了包容體系結(jié)構(gòu)(subsumption architecture)。
簡單來講,包容體系結(jié)構(gòu)是一種自下而上的組織架構(gòu),從簡單、分散、低層次的行為到更復(fù)雜的行為。
1980 年代,包容體系結(jié)構(gòu)的概念由斯坦福大學(xué)博士、美國著名機(jī)器人制造專家、前麻省理工學(xué)院 CSAIL 負(fù)責(zé)人 Rodney Brooks 提出。作為「現(xiàn)代機(jī)器人之父」,Rodney Brooks 還是著名機(jī)器人公司 iRobot 和 Rethinks Robotics 的創(chuàng)辦者、Robust.ai 的聯(lián)合創(chuàng)始人和首席技術(shù)官。
雷鋒網(wǎng)注意到,10 月 30 日 Rodney Brooks 也在推特上對(duì)迪士尼團(tuán)隊(duì)的設(shè)計(jì)發(fā)表了自己的看法:
人們低估了一款機(jī)器人從學(xué)術(shù)論文到現(xiàn)實(shí)世界所需的時(shí)間。迪士尼用了 25 年時(shí)間,在類人機(jī)器人眼控制方面使用了包容體系結(jié)構(gòu),比我 1995 年在機(jī)器人 Cog 和 Kismet 上的應(yīng)用更好、更流暢。
下圖展示的即為由麻省理工學(xué)院創(chuàng)作的機(jī)器人 Kismet,它是最早實(shí)現(xiàn)與人類社交、情感互動(dòng)的一款機(jī)器人。
雖然看上去有點(diǎn)傻,但 Kismet 要比迪士尼團(tuán)隊(duì)的機(jī)器人親切多了。