迪士尼玩起強(qiáng)化學(xué)習(xí),新機(jī)器人有星球大戰(zhàn)那味了
迪士尼新機(jī)器人閃亮登場!
話不多說,先來看長啥樣——
一閃一閃的大眼睛、搖搖晃晃的腦袋、靈活擺動的觸角,還有一雙小短腿。
走起路來屁顛屁顛,關(guān)鍵還很穩(wěn):
雖然是機(jī)器,但不得不說這神態(tài)很有“靈性”:
就在剛舉行完的國際機(jī)器人頂會IROS上,迪士尼研究所研究科學(xué)家Moritz B?cher帶領(lǐng)團(tuán)隊展示的這個新機(jī)器人,可謂萌翻全場。
雖然這個小家伙還沒有一個正式的名字,但它的表現(xiàn)足夠令人印象深刻。
和常見的雙足機(jī)器人最大的不同點(diǎn)在于,它不僅能夠在行走中保持動態(tài)平衡,還能夠通過動作表達(dá)出一些“情感”。
經(jīng)研究人員介紹,這主要是因?yàn)樵谟?xùn)練過程中使用了團(tuán)隊去年耗費(fèi)一年時間研發(fā)的強(qiáng)化學(xué)習(xí)系統(tǒng);并且還請了專業(yè)的動畫師設(shè)計動作,將動畫角色用動作表現(xiàn)情感的方式應(yīng)用到了機(jī)器人身上。
基于此,小家伙不再是一個冷冰冰的機(jī)器??梢韵胍?,若給它裝一個GPT大腦,家里的狗子?!?/p>
瑞思拜,我是大學(xué)生,給我。
不少網(wǎng)友看到后聯(lián)想到了星球大戰(zhàn)中的角色:
另一波網(wǎng)友認(rèn)為小家伙如此“憨態(tài)可掬”,分明就是現(xiàn)實(shí)版瓦力(WALL-E,《機(jī)器人總動員》中的角色):
更有網(wǎng)友直呼感覺“站在了機(jī)器人革命的風(fēng)口浪尖”:
這個小家伙走起路來為何如此平穩(wěn)?開發(fā)者具體是如何賦予其“情感”的?我們接著往下看。
在瑞士森林中“漫步”
搖頭晃腦還能平穩(wěn)運(yùn)動的秘訣,在于頭部和腿部的設(shè)計。
其中,小家伙的頭部是一個四自由度的設(shè)計,可實(shí)現(xiàn)上、下、左、右四個方向傾斜觀察:
而它的腿部更是增加到五自由度,具備髖關(guān)節(jié),因此它在行走時能夠保持動態(tài)平衡。
偷襲推它,或是故意拖拽它腳下的地毯,它都能應(yīng)對自如:
挑戰(zhàn)更為復(fù)雜的地形,在瑞士野外森林中漫步也不在話下:
穩(wěn)重又不失風(fēng)情,走著走著,還能跳上一段:
據(jù)研究人員介紹,能做到這種效果,從概念提出到最終打磨成型,其實(shí)只用了不到一年的時間。
這還要得益于3D打印技術(shù),使用模塊化硬件和執(zhí)行器,大為提高了設(shè)計和迭代的速度。
再來說說賦予其“情感”。
其實(shí)這種讓機(jī)器人以有情感的方式運(yùn)動是迪士尼的專長,早在上世紀(jì)六七十年代,迪士尼就開發(fā)出了機(jī)械人偶。
但隨著機(jī)器人變得愈加先進(jìn)和機(jī)動,設(shè)計出能夠與其兼容的情感行為變得具有挑戰(zhàn)性。
為此,迪士尼搬出了王牌,請用了擅長使角色通過運(yùn)動傳達(dá)情感的動畫師來為機(jī)器人設(shè)計動作。
但交由動畫師設(shè)計動作,就不得不面臨一個難題——
動畫工具通常沒有內(nèi)置物理特性,動畫師的設(shè)想有時在現(xiàn)實(shí)中難以做到。這就使得團(tuán)隊需要耗費(fèi)大量時間試驗(yàn)。
為了彌合這一差距,團(tuán)隊用到了強(qiáng)化學(xué)習(xí)系統(tǒng)。
背后是強(qiáng)化學(xué)習(xí)的加持
研究團(tuán)隊開發(fā)了一個基于強(qiáng)化學(xué)習(xí)的流程,通過模擬將動畫師的視覺設(shè)想和機(jī)器人動作相結(jié)合。
這個過程本質(zhì)上是為動畫師提供了物理約束條件,確保動畫師設(shè)計的高表現(xiàn)力動作可以在現(xiàn)實(shí)中實(shí)行,或者盡可能接近機(jī)器人所能做到的程度。
迪士尼研究所的研究科學(xué)家Morgan Pope表示:
這就不僅僅是走路了,走路只是強(qiáng)化學(xué)習(xí)系統(tǒng)的輸入之一,另一個重要的輸入是如何行走。
好在這種情況下,強(qiáng)化學(xué)習(xí)的一大優(yōu)勢是生成的運(yùn)動魯棒性很好。
并且根據(jù)研究人員的說法,用該流程在一臺PC上只需幾個小時就能訓(xùn)練機(jī)器人做新動作,大大縮短了開發(fā)新機(jī)器人角色所需的時間。
同時在一遍遍的訓(xùn)練中,還可以對電機(jī)性能、質(zhì)量分布和機(jī)器人與地面之間的摩擦力等進(jìn)行細(xì)微的調(diào)整。
團(tuán)隊負(fù)責(zé)人B?cher認(rèn)為,“這使得迪士尼開發(fā)新機(jī)器人角色所需的時間從幾年縮短到幾個月”。
并且研究人員還強(qiáng)調(diào)重要的不是機(jī)器人,而是這個過程:
所以如果我們想要增加更多的腿、手臂,或者制作一個全新角色,我們可以迅速教它新的動作?,F(xiàn)成的執(zhí)行器、3D打印組件、可適應(yīng)性強(qiáng)的強(qiáng)化學(xué)習(xí)框架,這些都可以應(yīng)用于外觀和動作都大不相同的機(jī)器人。
而這個機(jī)器人,只是該旅程的第一步。