MIT機(jī)器狗再進(jìn)化,碎石冰面上跑也不打滑,這次真的穩(wěn)如狗了
本文經(jīng)AI新媒體量子位(公眾號ID:QbitAI)授權(quán)轉(zhuǎn)載,轉(zhuǎn)載請聯(lián)系出處。
那群曾經(jīng)集體后空翻、踢足球的MIT機(jī)器狗迷你獵豹(Mini Cheetah),瘸了?
但你別說,走得依舊挺歡快:
這可不是MIT科學(xué)家們在侵犯“機(jī)器狗權(quán)”,而是因?yàn)楣纷觽冊?strong>新技術(shù)的加持下又進(jìn)化了。
不僅壞了一條腿也能走路,之前寸步難行的碎石路更是不在話下:
還能在結(jié)冰路面轉(zhuǎn)圈撒歡兒:
不瘸的時候,速度最快能到3.9m/s,尥蹶子跑起來時,開發(fā)員只能抱著電腦在后面追得跌跌撞撞:
而上述所有的技能,最原版(也就是開源那版)的MIT機(jī)器狗僅用了3小時就完全掌握。
如此強(qiáng)大的學(xué)習(xí)能力到底從何而來?
3小時積累100多天奔跑經(jīng)驗(yàn)
首先,機(jī)器狗們的各種行為都依賴于身體里的一個專門的控制器。
工程師們會通過分析運(yùn)動的物理規(guī)律,制定有效的抽象概念,再去設(shè)計(jì)并實(shí)現(xiàn)專門的控制器層次結(jié)構(gòu),使機(jī)器狗能夠在運(yùn)行時保持平衡。
但要提前人為分析、建立所有可能的地形分析,并使機(jī)器狗快速識別對環(huán)境的變化作出反應(yīng),并不簡單。
例如,草地上的一小塊結(jié)冰面,碎石堆上突然出現(xiàn)的大塊凸起,都有可能使機(jī)器狗再起不能:
(所以說…不要停下來?。。?/span>
人為設(shè)計(jì)的控制器,出現(xiàn)問題自然也得人為分析原因,再手動調(diào)整,一來二去的時間成本就大大增加。
怎么辦呢?
MIT的科學(xué)家們表示:
讓機(jī)器狗自己學(xué)!
研究團(tuán)隊(duì)開發(fā)了一種模擬環(huán)境,其中包含了多個地形,再將狗子放在其中進(jìn)行訓(xùn)練。
在訓(xùn)練期間,他們加入了神經(jīng)網(wǎng)絡(luò),讓機(jī)器狗從不同地形的跑步和失敗經(jīng)驗(yàn)中總結(jié)規(guī)律,進(jìn)而自己找出適應(yīng)新地形的最好方法。
僅僅3小時,模擬世界中的迷你獵豹就積累了100天的多樣化地形奔跑經(jīng)驗(yàn)。
并且,團(tuán)隊(duì)也為機(jī)器狗部署了一種基于端到端的傳感運(yùn)動策略的控制器。
這種控制器會將關(guān)節(jié)編碼器和IMU(慣性測量單元)數(shù)據(jù)直接轉(zhuǎn)換為關(guān)節(jié)指令,沒有了額外的狀態(tài)估計(jì)或控制子系統(tǒng),機(jī)器狗在進(jìn)行敏捷或極限的動作時,便會更加得心應(yīng)手。
這時的迷你獵豹,就變成了一只經(jīng)驗(yàn)豐富的狗子。
剛剛還被絆倒的路沿,現(xiàn)在已經(jīng)能自信地邁過去了:
高速奔跑中也不會被地上的線絆倒:
室內(nèi)轉(zhuǎn)圈的速度能達(dá)到5.7rad/s(每秒320°,近一圈):
研究來自MIT CSAIL
這次的研究來自于MIT的計(jì)算機(jī)科學(xué)與人工智能研究院(MIT CSAIL),論文和代碼很快會公開。
一作Gabriel Margolis為MIT的一名博士生,主要研究領(lǐng)域是具身智能(Embodied Intelligence),即開發(fā)能與真實(shí)世界進(jìn)行多模態(tài)交互的具有身體的人工智能。
共同一作Ge Yang本科畢業(yè)于耶魯大學(xué),獲得了物理學(xué)和數(shù)學(xué)學(xué)士學(xué)位,后來在芝加哥大學(xué)獲得物理學(xué)博士學(xué)位。
現(xiàn)為美國國家科學(xué)基金會(NSF)的AI與基礎(chǔ)交互研究所(IAIFI)的一名博士后。
視頻:
https://www.youtube.com/watch?v=-BqNl3AtPVw