自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

伯克利開源高質(zhì)量大型機(jī)器人操控基準(zhǔn),面對復(fù)雜自主操控任務(wù)不再犯難

人工智能 新聞
機(jī)器人操控面臨兩個(gè)主要挑戰(zhàn):機(jī)器人如何智能地處理復(fù)雜的接觸動(dòng)力學(xué)以及如何應(yīng)對環(huán)境和物體的多樣性。

圖片

隨著人工智能和機(jī)器人技術(shù)的迅速發(fā)展,功能操控(Functional Manipulation)在機(jī)器人學(xué)中的重要性愈加突出。傳統(tǒng)的基準(zhǔn)測試已無法滿足目前機(jī)器人對復(fù)雜操控任務(wù)的需求,呼吁新的操控基準(zhǔn)(Functional Manipulation Benchmark)出現(xiàn)。

概述

機(jī)器人操控面臨兩個(gè)主要挑戰(zhàn):機(jī)器人如何智能地處理復(fù)雜的接觸動(dòng)力學(xué)以及如何應(yīng)對環(huán)境和物體的多樣性。針對這些挑戰(zhàn),機(jī)器人學(xué)習(xí)技術(shù)被視為關(guān)鍵的解決手段。因此,該領(lǐng)域需要一個(gè)全面易得的框架,提供有挑戰(zhàn)性的實(shí)際任務(wù)、高質(zhì)量數(shù)據(jù)、易于復(fù)制的設(shè)置,集合了基線結(jié)果的相關(guān)方法,基于該框架,研究人員能夠?qū)λ岢鋈蝿?wù)的實(shí)驗(yàn)發(fā)現(xiàn)進(jìn)行深入分析。

加州大學(xué)伯克利分校智能機(jī)器人實(shí)驗(yàn)室(RAIL)的研究團(tuán)隊(duì)提出了如上所述的現(xiàn)實(shí)世界基準(zhǔn),稱為 FMB(Functional Manipulation Benchmark for Generalizable Robotic Learning)。

圖片

  • 項(xiàng)目主頁:https://functional-manipulation-benchmark.github.io/
  • 論文地址:https://arxiv.org/abs/2401.08553
  • 論文題目:FMB: a Functional Manipulation Benchmark for Generalizable Robotic Learning
  • 共同第一作者主頁:https://people.eecs.berkeley.edu/~jianlanluo/
  • https://charlesxu0124.github.io/

FMB 具有以下特點(diǎn):

  • 創(chuàng)新設(shè)計(jì):采用了 3D 打印技術(shù)制作任務(wù)中的物體,來考驗(yàn)機(jī)器人的泛化能力,這種方法也便于其他研究人員復(fù)現(xiàn)。
  • 多樣化任務(wù):包含單物體和多物體多階段操控任務(wù),真實(shí)模擬日常環(huán)境中的挑戰(zhàn)。
  • 大型數(shù)據(jù)集:通過大量人工演示,為機(jī)器人提供了豐富的數(shù)據(jù)集。
  • 模仿學(xué)習(xí)基線:使用最先進(jìn)的機(jī)器學(xué)習(xí)方法,提供了基線結(jié)果和模塊化組件以供其他研究者使用。

物體和任務(wù)

FMB 中的任務(wù)大致分為兩類:單物體多步驟操控任務(wù)和多物體多步驟操控任務(wù)。這些任務(wù)旨在測試機(jī)器人的基本技能,如抓取、重新定位和裝配等,這些都是完成整個(gè)任務(wù)所必需的技能。FMB 中的任務(wù)要求機(jī)器人不僅能完成單一的操控技能,還要求機(jī)器人能夠?qū)⑦@些技能組合起來,完成更為復(fù)雜的多步驟任務(wù)。

FMB 的任務(wù)設(shè)計(jì)靈活多變,研究人員可以根據(jù)需要選擇專注于單一技能,深入研究機(jī)器人的操控能力,也可以研究完整的多步驟任務(wù),這需要機(jī)器人進(jìn)行長期規(guī)劃并具備從失敗中恢復(fù)的能力。由于涉及選擇合適的物體并推理操控物體的順序,更為復(fù)雜的多步驟任務(wù)要求機(jī)器人能夠做出復(fù)雜的實(shí)時(shí)決策。

圖片


圖片

大型數(shù)據(jù)集

在機(jī)器人學(xué)習(xí)的過程中,數(shù)據(jù)的作用不可小覷。為了使機(jī)器人更好地理解和掌握復(fù)雜的任務(wù),研究團(tuán)隊(duì)收集了一個(gè)涵蓋上述任務(wù)的大規(guī)模專家人類示范數(shù)據(jù)集,包含超過兩萬個(gè)操作軌跡。研究團(tuán)隊(duì)采用了四個(gè)不同的攝像機(jī)記錄這些示范數(shù)據(jù),其中兩個(gè)攝像機(jī)安裝在機(jī)器人的腕部,另外兩個(gè)提供全局視角。這些攝像機(jī)捕捉了對于機(jī)器人學(xué)習(xí)解決任務(wù)至關(guān)重要的 RGB 彩色圖像信息、深度信息等數(shù)據(jù)。

此外,數(shù)據(jù)集還記錄了機(jī)器人末端執(zhí)行器的力 / 扭矩信息,這對于像裝配這樣需要接觸大量物體的的任務(wù)非常重要。通過這些豐富的數(shù)據(jù),機(jī)器人能夠深入理解任務(wù)的每個(gè)細(xì)節(jié),更加精確地模仿人類的操作技巧。正是由于數(shù)據(jù)的深度和廣度,為機(jī)器人學(xué)習(xí)提供了堅(jiān)實(shí)的基礎(chǔ)。這使得機(jī)器人在執(zhí)行復(fù)雜任務(wù)時(shí),能夠更加人性化和更靈巧地對任務(wù)作出響應(yīng)。

圖片


圖片

模仿學(xué)習(xí)基線

圖片基線策略的架構(gòu)圖。

基于 Transformer 和 ResNet 的兩種模型都使用了共享權(quán)重的 ResNet 編碼器對每個(gè)圖像視圖進(jìn)行編碼,然后與本體感知信息和可選的物體和相應(yīng)的機(jī)器人技能編碼特征結(jié)合,以預(yù)測 7 自由度的動(dòng)作。

FMB 的實(shí)驗(yàn)部分對模仿學(xué)習(xí)系統(tǒng)的性能進(jìn)行了一系列測試,比較了不同的學(xué)習(xí)方法,探究了不同輸入模式和設(shè)計(jì)決策的影響。實(shí)驗(yàn)發(fā)現(xiàn),使用深度信息有助于提高抓取策略的效果,力 / 扭矩信息對于裝配任務(wù)非常重要。對于多步驟任務(wù),傳統(tǒng)的 ResNet、Transformer 和 Diffusion 方法均未能奏效,但該論文中提出的分級控制 (hierarchical control) 方法顯示出了潛力。

抓取任務(wù)

圖片

實(shí)驗(yàn)結(jié)果顯示,納入深度信息的 ResNet 策略在抓取任務(wù)中的性能一致優(yōu)于僅使用 RGB 信息的策略。通過數(shù)據(jù)削減研究,研究團(tuán)隊(duì)探究了不同數(shù)量的訓(xùn)練數(shù)據(jù)對抓取任務(wù)性能的影響。結(jié)果顯示,納入深度信息的 ResNet 策略在處理已見物體時(shí)的性能將隨著訓(xùn)練數(shù)據(jù)量的增加而提升。值得注意的是,該策略對未見過的物體表現(xiàn)出了與已見物體相近的性能,這表明訓(xùn)練對象的多樣性極大地促進(jìn)了機(jī)器人的泛化能力。

裝配任務(wù)

在裝配任務(wù)中,力 / 扭矩信息的重要性得到了證實(shí)。力 / 扭矩信息對于機(jī)器人采取的策略判斷物體是否已經(jīng)接觸到目標(biāo)表面,并有效進(jìn)行搜索等行為非常重要。

圖片

然而,當(dāng)策略在所有物體上進(jìn)行訓(xùn)練時(shí),機(jī)器人并不總是能夠成功地完成裝配任務(wù)。這是因?yàn)椴呗孕枰紫扰袛鄳?yīng)將物體裝配到哪個(gè)孔中,然后再生成相應(yīng)的動(dòng)作,這大大增加了任務(wù)的復(fù)雜性。為了解決這個(gè)問題,研究團(tuán)隊(duì)在策略中添加了一個(gè)選取物體機(jī)制,幫助策略確定需要裝配的物體的形狀,從而專注于生成正確的裝配動(dòng)作。

多步驟任務(wù)

圖片

FMB 的框架包含了兩項(xiàng)復(fù)雜任務(wù)。這些復(fù)雜任務(wù)要求機(jī)器人能夠像人類一樣連續(xù)完成多個(gè)步驟。此前的方法是讓機(jī)器人學(xué)習(xí)整個(gè)過程,但這種方法容易因?yàn)閱我画h(huán)節(jié)的錯(cuò)誤而不斷累計(jì)誤差,最后導(dǎo)致整個(gè)任務(wù)失敗。無論是在單物體還是多物體操控任務(wù)中,這種方法的成功率均為 0/10。

針對累積誤差問題,研究團(tuán)隊(duì)采用了分層控制策略。分層策略通過將任務(wù)分解成若干小塊,每完成一塊便相當(dāng)于通過一個(gè)決策點(diǎn),即使出現(xiàn)錯(cuò)誤也能迅速糾正,避免影響后續(xù)環(huán)節(jié)。例如,如果機(jī)器人在抓取過程中未能穩(wěn)固抓住物體,它會(huì)持續(xù)嘗試直至成功。

研究團(tuán)隊(duì)測試了兩種分層方法,第一種方法為單一策略提供指示任務(wù)類型的有效向量,而第二種方法則是針對每個(gè)操控技能單獨(dú)訓(xùn)練不同的策略,均采用了操作員的指令作為上層策略,在測試中,研究團(tuán)隊(duì)發(fā)現(xiàn)這兩種方法均表現(xiàn)優(yōu)異。

測試結(jié)果顯示了分層方法在處理復(fù)雜機(jī)器人任務(wù)中的有效性,并為未來研究提供了新的研究方向。

圖片

如上圖所示,機(jī)器人在學(xué)習(xí)后能夠自主進(jìn)行功能操控。

圖片

總的來說,以上實(shí)驗(yàn)展示了研究團(tuán)隊(duì)在機(jī)器人學(xué)習(xí)領(lǐng)域的技術(shù)創(chuàng)新,也驗(yàn)證了 FMB 是適合開發(fā)先進(jìn)機(jī)器人學(xué)習(xí)方法的基準(zhǔn)。研究團(tuán)隊(duì)研究期待未來的研究可以在 FMB 基礎(chǔ)上進(jìn)一步推動(dòng)機(jī)器人學(xué)習(xí)的邊界。

責(zé)任編輯:張燕妮 來源: 機(jī)器之心
相關(guān)推薦

2024-08-19 14:05:00

2023-04-11 14:16:53

模型AI

2024-03-26 15:43:00

訓(xùn)練數(shù)據(jù)機(jī)器人

2021-01-04 09:18:36

機(jī)器人人工智能系統(tǒng)

2022-03-23 10:52:07

機(jī)器人神經(jīng)網(wǎng)絡(luò)系統(tǒng)

2022-06-30 17:53:56

機(jī)器狗智能

2021-07-12 13:02:50

機(jī)器人人工智能算法

2024-11-25 19:04:21

2024-09-25 09:37:16

2022-12-02 10:38:50

機(jī)器學(xué)習(xí)開發(fā)工程項(xiàng)目

2021-11-18 14:23:22

機(jī)器人人工智能AI

2009-10-10 14:07:56

2024-10-14 09:40:00

AI機(jī)器人

2022-03-21 11:05:28

機(jī)器人遠(yuǎn)程操控升級

2018-06-06 18:30:53

機(jī)器人工人機(jī)器人工信部

2022-10-19 10:08:29

技術(shù)匯報(bào)研發(fā)管理

2024-02-21 12:20:00

AI訓(xùn)練

2019-01-15 13:14:03

機(jī)器人算法SAC

2011-05-31 13:43:46

外鏈

2017-07-14 09:54:47

代碼函數(shù)程序
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號