自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

紐大具身智能新進(jìn)展:靠視覺反饋學(xué)會(huì)開罐頭,任務(wù)成功率提高135%,LeCun點(diǎn)贊

人工智能 機(jī)器人
這個(gè)機(jī)器人的背后,是紐約大學(xué)聯(lián)合Meta AI實(shí)驗(yàn)室推出的最新具身智能成果。研究人員提出了一種名為TAVI的新訓(xùn)練方法,將視覺與觸覺相結(jié)合,把機(jī)器人執(zhí)行任務(wù)的效果提高一倍以上。目前,研究團(tuán)隊(duì)的論文已經(jīng)公開發(fā)表,相關(guān)代碼也已經(jīng)開源。

注意看,這個(gè)機(jī)器人用手中的鉗子輕松剪斷了一根金屬絲。

蓋上的鐵盒子,也三下五除二就打開了。

除此之外,物體抓取等任務(wù)更是能輕松完成。

這個(gè)機(jī)器人的背后,是紐約大學(xué)聯(lián)合Meta AI實(shí)驗(yàn)室推出的最新具身智能成果。

研究人員提出了一種名為TAVI的新訓(xùn)練方法,將視覺與觸覺相結(jié)合,把機(jī)器人執(zhí)行任務(wù)的效果提高一倍以上。

目前,研究團(tuán)隊(duì)的論文已經(jīng)公開發(fā)表,相關(guān)代碼也已經(jīng)開源。

看到這個(gè)機(jī)器人的表現(xiàn),Meta首席科學(xué)家LeCun也不禁感嘆這是一項(xiàng)驚人的進(jìn)展。

那么用這種方法訓(xùn)練出的機(jī)器人,還能做些什么呢?

取物置物易如反掌

它可以把摞在一起的兩只碗分開,然后拿取上面的一個(gè)。

仔細(xì)觀察可以發(fā)現(xiàn),在分開的過程當(dāng)中,機(jī)器人的手部做出了攆的動(dòng)作,讓黃色的碗沿著綠色碗的內(nèi)壁滑動(dòng)。

這個(gè)機(jī)器人不僅能“分”,還能“合”。

將紅色的物塊拿起之后,機(jī)器人將它精準(zhǔn)地放入了紫色的蓋子當(dāng)中。

或者,給橡皮翻個(gè)身。

只見它將一大塊橡皮拿起,然后利用下面的盒子調(diào)整角度。

雖然不知道為什么不多用幾根手指,但畢竟也是學(xué)會(huì)了借助工具。

總之,用TAVI方式訓(xùn)練出的具身智能機(jī)器人,動(dòng)作已經(jīng)和人類有了幾分相似。

數(shù)據(jù)上,TAVI方式在6項(xiàng)典型任務(wù)中明顯優(yōu)于只用觸覺或視覺反饋的方法。

和不使用觸覺信息的AVI方式相比,TAVI的平均成功率提高了135%,和圖像+觸覺獎(jiǎng)勵(lì)模型的方式相比也翻了倍。

而同樣采用視覺觸覺混合模式的T-DEX訓(xùn)練方式,成功率還不到TAVI的四分之一。

TAVI訓(xùn)練的機(jī)器人還有很強(qiáng)的泛化能力——對(duì)于未曾見過的物體,機(jī)器人也可以完成任務(wù)。

在“拿碗”和“裝盒”兩項(xiàng)任務(wù)中,機(jī)器人面對(duì)未知物體的成功率均超過了半數(shù)。

此外,TAVI方法訓(xùn)練出的機(jī)器人不僅能出色完成各項(xiàng)任務(wù),還能按順序依次執(zhí)行多項(xiàng)子任務(wù)。

魯棒性方面,研究團(tuán)隊(duì)通過調(diào)整相機(jī)角度進(jìn)行了測試,結(jié)果機(jī)器人依舊保持了高成功率。

那么,TAVI方法是如何實(shí)現(xiàn)這樣的效果的呢?

用視覺信息評(píng)價(jià)機(jī)器人表現(xiàn)

TAVI的核心是使用視覺上的反饋來訓(xùn)練機(jī)器人,工作主要分為三個(gè)步驟。

首先是從視覺和觸覺兩個(gè)維度收集人類給出的演示信息。

收集到的視覺信息會(huì)被用于建立獎(jiǎng)勵(lì)函數(shù),以供后續(xù)學(xué)習(xí)過程中使用。

這一過程中,系統(tǒng)通過對(duì)比學(xué)習(xí)的方式來獲取對(duì)完成任務(wù)有用的視覺特征,對(duì)機(jī)器人動(dòng)作完成度進(jìn)行評(píng)價(jià)。

然后結(jié)合觸覺信息和視覺反饋,通過強(qiáng)化學(xué)習(xí)方式進(jìn)行訓(xùn)練,讓機(jī)器人反復(fù)嘗試,直到獲得較高的完成度評(píng)分。

而TAVI的學(xué)習(xí)是一個(gè)循序漸進(jìn)的過程,隨著學(xué)習(xí)步驟的增加,獎(jiǎng)勵(lì)函數(shù)越來越完善,機(jī)器人的動(dòng)作也越來越精準(zhǔn)。

而為了提高TAVI的靈活性,研究團(tuán)隊(duì)還引入了一種殘差策略。

遇到與基礎(chǔ)策略出現(xiàn)差別時(shí),只需要對(duì)有差別的部分進(jìn)行學(xué)習(xí),而不必從頭開始。

消融實(shí)驗(yàn)結(jié)果表明,如果沒有殘差策略,而是每次都從頭學(xué)起,機(jī)器人完成任務(wù)的成功率將有所降低。

如果對(duì)具身智能有興趣,可以閱讀研究團(tuán)隊(duì)的論文了解更多詳情。

論文地址:https://arxiv.org/abs/2309.12300GitHub。

項(xiàng)目頁:https://github.com/irmakguzey/see-to-touch。

責(zé)任編輯:姜華 來源: 量子位
相關(guān)推薦

2010-11-18 10:59:00

求職

2024-01-03 17:39:23

云計(jì)算混合云

2024-06-04 09:25:51

2021-01-20 18:13:52

VRAR守門員

2023-07-17 10:21:25

TC39JavaScript

2019-11-15 10:11:03

人工智能埃博拉技術(shù)

2012-11-19 10:37:57

思杰OpenStack

2012-11-19 10:50:39

思杰CloudStack開源

2015-11-12 09:27:13

C++最新進(jìn)展

2009-09-25 09:27:33

Ubuntu 2010最新進(jìn)展Lucid Lynx

2024-06-27 11:02:44

2020-09-23 22:33:28

量子芯片網(wǎng)絡(luò)

2013-01-22 17:39:57

360瀏覽器搶票專版

2009-07-01 08:09:23

開服時(shí)間魔獸世界

2021-11-12 20:59:21

數(shù)字人民幣數(shù)字貨幣區(qū)塊鏈

2017-02-17 13:38:40

2022-03-02 09:53:51

微軟FlutterEngine PR

2020-07-02 16:00:53

?Flutter桌面應(yīng)用代碼

2021-09-14 10:03:35

RustLinux開發(fā)工作
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)