波士頓動(dòng)力Atlas逆天進(jìn)化!這次用上了「強(qiáng)化學(xué)習(xí)+動(dòng)捕」,人類動(dòng)作直接復(fù)刻,背后還有個(gè)AI機(jī)構(gòu)
說(shuō)起波士頓動(dòng)力,大家肯定不陌生,他們家的Atlas機(jī)器人,也是人形機(jī)器人界的“頂流”。剛剛,Atlas人形機(jī)器人又秀了一波新操作,簡(jiǎn)直太驚人了,動(dòng)作無(wú)限接近人類,大家直接看視頻感受一下
波士頓動(dòng)力官方發(fā)推表示,Atlas這次展示的是用動(dòng)作捕捉服開發(fā)的強(qiáng)化學(xué)習(xí)策略。 啥意思呢?簡(jiǎn)單來(lái)說(shuō),就是讓真人穿上動(dòng)捕服,做出各種動(dòng)作,然后把這些動(dòng)作數(shù)據(jù)“喂”給Atlas,讓它自己學(xué)習(xí)模仿
更厲害的是,這次合作方是 RAI Institute 這個(gè)AI機(jī)構(gòu)。他們也發(fā)推簡(jiǎn)單解釋了背后的技術(shù)細(xì)節(jié):
核心技術(shù):強(qiáng)化學(xué)習(xí) 這次Atlas能這么絲滑地復(fù)刻人類動(dòng)作,強(qiáng)化學(xué)習(xí)功不可沒(méi)。它可以加速機(jī)器人“行為”的開發(fā)速度
訓(xùn)練秘訣:物理引擎模擬器 為了讓Atlas學(xué)得更快更好,RAI Institute 用了一個(gè)物理引擎驅(qū)動(dòng)的模擬器。 這個(gè)模擬器能生成海量的訓(xùn)練數(shù)據(jù),模擬各種各樣的動(dòng)作場(chǎng)景
海量數(shù)據(jù)煉成“神功”:1.5億次模擬 你沒(méi)看錯(cuò),每個(gè)動(dòng)作的訓(xùn)練數(shù)據(jù),都來(lái)自大約 1.5億次 模擬器運(yùn)行! 這數(shù)據(jù)量,簡(jiǎn)直是“暴力喂養(yǎng)”??!
零樣本遷移:學(xué)完直接上真機(jī) 最牛的是,這些在模擬器里訓(xùn)練好的“技能”,可以直接 零樣本遷移到真實(shí)的Atlas機(jī)器人身上! 不用再在真機(jī)上額外訓(xùn)練,直接就能用!
人形機(jī)器人的下一步
波士頓動(dòng)力首席技術(shù)官:Aaron Saunders
一個(gè)關(guān)鍵的問(wèn)題始終擺在我們面前:我們看到的進(jìn)步,究竟是 切實(shí)可行、可以真正落地應(yīng)用的人形機(jī)器人解決方案 的進(jìn)步,還是僅僅停留在 孤立的實(shí)驗(yàn)室研究成果 展示層面?
深入探討這一至關(guān)重要的區(qū)別,審視當(dāng)前人形機(jī)器人技術(shù)的現(xiàn)狀,并找出實(shí)驗(yàn)室演示與實(shí)際應(yīng)用之間的差距。 分析阻礙人形機(jī)器人廣泛普及的關(guān)鍵挑戰(zhàn),包括在非結(jié)構(gòu)化環(huán)境中保持可靠性和穩(wěn)定性、成本效益,以及對(duì)具備真正適應(yīng)性和問(wèn)題解決能力的高級(jí)人工智能的迫切需求