自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

斯坦福炒蝦機(jī)器人爆火全網(wǎng)!華人團(tuán)隊(duì)成本22萬元,能做滿漢全席還會洗碗

人工智能 新聞
今天,大家都被斯坦福華人團(tuán)隊(duì)的這個炒菜機(jī)器人刷屏了。僅用50個演示,就能讓機(jī)器人完成各種復(fù)雜任務(wù)。最重要的是,打造成本22萬,項(xiàng)目全部開源。

今天,會做一大桌子菜的斯坦福機(jī)器人Mobile ALOHA刷屏全網(wǎng)。

滑蛋蝦仁、干貝燒雞、蠔油生菜,色香味俱全,看著很誘人。

就拿滑蛋蝦仁這道菜來說,Mobile ALOHA在燒水的過程中先打上3顆雞蛋,然后把蝦仁放到水中焯熟,平底鍋倒入雞蛋液再加入蝦仁,攪拌幾下,一道菜完成了。

再看干貝燒雞的制作過程。

首先,將去骨雞腿肉煎至兩面金黃,再加入干貝等調(diào)料之后,悶個20分鐘即可。

最后擺盤時,再撒上一小撮蔥花,完美。

至于蠔油生菜,機(jī)器人「大廚」的基操也是非常嫻熟。

甚至,還能切蒜末。

網(wǎng)友看后紛紛表示,我們簡直生活在未來!用不了多久快餐店做漢堡的工作要全面被機(jī)器人取代!

就連Pytorch之父稱贊道,很酷的新家機(jī)器人平臺,很高興看到更多的工作在這個方向上!

這個由斯坦福三人團(tuán)隊(duì)研發(fā)的全新移動機(jī)器人Mobile ALOHA,可以通過模仿學(xué)習(xí),執(zhí)行各種復(fù)雜的任務(wù)。

它不僅可以自主操作,還可以支持全身遠(yuǎn)程操控。

值得一提的是,機(jī)器人的成本僅為32000美元(約22萬),甚至軟件和硬件全部開源。

論文地址:https://mobile-aloha.github.io/resources/mobile-aloha.pdf

研究人員每個任務(wù)只用了50個演示,便讓Mobile ALOHA機(jī)器人始終如一地做一件事,比如連續(xù)9次擦拭灑在桌子上的葡萄酒,連續(xù)5次乘坐電梯。

它還可以在受干擾的情況下,把鍋放入碗柜。即便是訓(xùn)練數(shù)據(jù)中看不到的椅子,也能夠擺正。

圖片

50個演示如何就讓機(jī)器人擁有如此強(qiáng)大的學(xué)習(xí)能力?

作者解釋關(guān)鍵在于,利用靜態(tài)ALOHA數(shù)據(jù)共同訓(xùn)練模仿學(xué)習(xí)算法。這能持續(xù)提高性能,尤其是在需要精確操作的任務(wù)中。

圖片

再來看一波Mobile ALOHA炫酷的演示吧!

清洗平底鍋:

和人擊掌:

炒蝦仁:

此外,還可以遙控Mobile ALOHA完成一些更加精細(xì)的工作。

比如把紙抽出來擦玻璃。

以及用笤帚掃地等等。

機(jī)器人元年強(qiáng)勢開局

2024年還沒到來之前,許多大佬都在預(yù)測機(jī)器人便是今年除了大模型,另一件重要的研究領(lǐng)域。

沒錯,2024年將會是機(jī)器人元年。

一般來說,開發(fā)通用機(jī)器人一個非常有前途的方法是,從人類提供的演示中進(jìn)行模仿學(xué)習(xí)。

這種「行為克隆」可以讓機(jī)器人學(xué)習(xí)各種原始的技能,從簡單的拾放操作,到更精細(xì)的操作等等。

然而,現(xiàn)實(shí)生活中許多任務(wù),都需要全身協(xié)調(diào)的機(jī)動性,以及靈巧操作,而非單獨(dú)的移動或操作行為。

這篇論文中,作者研究了將「模仿學(xué)習(xí)」擴(kuò)展到需要雙臂移動機(jī)器人全身控制的任務(wù)可行性。

當(dāng)前,有兩個主要因素阻礙了「模仿學(xué)習(xí)」在雙臂機(jī)器人移動操作中的廣泛應(yīng)用。

一是,缺乏即插即用的「全身遠(yuǎn)程操控硬件」。

如果購買現(xiàn)成的,雙臂移動操作器成本會很高,比如PR2和TIAGo這樣的機(jī)器人價格超過20萬美元。為了在這些平臺上實(shí)現(xiàn)遠(yuǎn)程操控,額外的硬件和校準(zhǔn)也是必要的

二是,之前的機(jī)器人學(xué)習(xí)研究中,尚未證明對于復(fù)雜任務(wù)的高性能雙臂移動操作。

圖片

在本文中,研究人員試圖解決將「模仿學(xué)習(xí)」應(yīng)用于雙臂移動操作的挑戰(zhàn)。

在硬件方面,作者引入了機(jī)器人Mobile ALOHA,一個低成本的全身遙操作系統(tǒng),用于收集雙臂移動操作數(shù)據(jù)。

通過將其安裝在輪式底座上,Mobile ALOHA擴(kuò)展了原始ALOHA的能力,即低成本和靈巧的雙人木偶操縱設(shè)置。

然后,用戶將身體栓在系統(tǒng)上,反向驅(qū)動輪子,以便底座移動。

當(dāng)用戶雙手控制ALOHA時,底座可以獨(dú)立移動。研究人員同時記錄底座速度數(shù)據(jù)和手臂操縱數(shù)據(jù),形成一個全身遠(yuǎn)程操控系統(tǒng)。

成本只需3萬刀

值得一提的是,斯坦福團(tuán)隊(duì)在打造Mobile ALOHA的所有成本僅用了3萬美元。

在具體的機(jī)器人設(shè)計中,它們綜合考慮了四個關(guān)鍵的因素:

- 移動:系統(tǒng)的移動速度可與人類行走的速度相媲美,大約每秒1.42米。

- 穩(wěn)定性:當(dāng)操作重型家用物品,如鍋和櫥柜時,能夠保持穩(wěn)定。

- 全身遠(yuǎn)程操控:所有自由度都可以同時遙操作,包括手臂和移動底座。

- 不受束縛:機(jī)載電源和計算

如下圖所示,可以清楚地看到Mobile ALOHA的技術(shù)規(guī)格。

Mobile ALOHA有2個腕部攝像頭,和1個頂部攝像頭,并配有機(jī)載電源和計算。

另外,遠(yuǎn)程操作裝置可以拆除,Mobile ALOHA自主執(zhí)行時只使用2個ViperX 300。兩只手臂的最低/最高高度分別為65厘米/200厘米,并從底座伸出100厘米。

研究人員選擇AgileX Tracer AGV(Tracer)作為了移動底座,這是一個專為倉庫物流設(shè)計的。

其移動速度可以達(dá)到1.6m/s,接近人類的平均步行速度。它的最大有效載荷為100千克,高度為17毫米。

值得一提的是,Tracer在美的售價為7000美元,比同等速度和有效載荷的Clearpath的AGV便宜5倍多。

然后,研究人員試圖在Tracer移動底座和ALOHA機(jī)械臂的基礎(chǔ)上設(shè)計一個全身遠(yuǎn)程操控系統(tǒng),即一個可以同時控制底座和兩個機(jī)械臂的遠(yuǎn)程操控系統(tǒng)。

而將操作員的腰部拴在移動底座上的設(shè)計是最簡單直接的解決方案,這樣可以反向驅(qū)動車輪,而車輪在扭矩關(guān)閉時摩擦力非常小。

為了改善人體工程學(xué)和擴(kuò)大工作空間,團(tuán)隊(duì)還安裝了4個ALOHA手臂都面向前,不同于原始面向內(nèi)的ALOHA手臂。

圖片

此外,為了讓Mobile ALOHA不受束縛,作者在底部配置了1.26千瓦時重14公斤的電池。同時還可以起到平衡作用,避免翻到。

在數(shù)據(jù)收集和推理過程中的所有計算都在一臺消費(fèi)級筆記本電腦上進(jìn)行,該筆記本電腦配有Nvidia 3070ti GPU (8gb VRAM)和 Intel i7-12800H。

以上便是Mobile ALOHA設(shè)計的重要組件。

一些開發(fā)細(xì)節(jié)

材料價格一覽

有興趣的小伙伴可以查看他們的官方文檔:https://docs.google.com/document/d/1_3yhWjodSNNYlpxkRCPIlvIAaQ76Nqk2wsqhnEVM6Dc/edit

圖片

圖片

圖片

圖片

圖片

圖片

圖片

圖片

圖片

協(xié)同學(xué)習(xí),提升「模仿學(xué)習(xí)」性能

硬件得到了,接下來便是使用數(shù)據(jù)進(jìn)行協(xié)同訓(xùn)練。

論文中,研究人員使用一個協(xié)同訓(xùn)練管道,利用現(xiàn)有的靜態(tài)ALOHA數(shù)據(jù)集,以改善模仿學(xué)習(xí)在移動操作,特別是雙手臂操作的性能。

靜態(tài)ALOHA數(shù)據(jù)集總共有825個演示任務(wù),包括密封袋子、拿起叉子、包裝糖果、撕紙巾、打開帶蓋塑料杯、玩乒乓球、使用咖啡機(jī)、翻轉(zhuǎn)鉛筆、固定魔術(shù)貼電纜、裝上電池和操作螺絲刀。

然后,研究人員選擇了7個任務(wù),讓Mobile ALOHA去完成。

對于機(jī)器人需要清理灑在桌子上紅酒的任務(wù),需要機(jī)動性和雙手靈活性。

具體來說,機(jī)器人需要首先導(dǎo)航到水龍頭,拿起毛巾,然后導(dǎo)航回到桌子。

然后一只手臂舉起酒杯,另一只手臂需要用毛巾擦拭桌子和杯底。這個任務(wù)在靜態(tài)ALOHA中是不可能完成的,單臂移動機(jī)器人需要更多的時間來完成。

對于炒蝦仁來說,機(jī)器人需要將一個生蝦兩面煎熟,然后把它放進(jìn)碗里。

機(jī)動性和雙手靈活性也是這項(xiàng)任務(wù)的必要條件:機(jī)器人需要從灶臺移動到廚房臺,用鏟子翻動蝦仁,而另一只手臂還需傾斜平底鍋。

這項(xiàng)任務(wù)要求比擦酒精度更高,因?yàn)榉D(zhuǎn)半熟的蝦需要更高的精度。

同樣,對于清洗平底鍋、收納鍋、乘坐電梯、推椅子、擊掌的任務(wù),Mobile ALOHA也能熟練地完成。

下圖是機(jī)器人在執(zhí)行任務(wù)時的導(dǎo)航移動軌跡。

50個演示,80%+成功率

實(shí)驗(yàn)評估中,研究人員主要為了回答兩個核心問題:

(1) 通過協(xié)同訓(xùn)練和少量移動操作數(shù)據(jù),Mobile ALOHA能否掌握復(fù)雜的移動操作技能?

(2)Mobile ALOHA能否使用不同類型的模仿學(xué)習(xí)方法,包括ACT、擴(kuò)散策略和基于檢索的VINN?

研究發(fā)現(xiàn),協(xié)同訓(xùn)練可以提高ACT性能。在7項(xiàng)具有挑戰(zhàn)性的移動操作任務(wù)中,與靜態(tài)ALOHA數(shù)據(jù)集進(jìn)行協(xié)同訓(xùn)練可持續(xù)提高ACT的成功率。

這對于乘電梯時需要按鍵、清洗鍋時需要打開水龍頭,等子任務(wù)尤為重要,因?yàn)樵谶@些任務(wù)中,精確操作是瓶頸所在。

另外,Mobile ALOHA與「模仿學(xué)習(xí)」方法兼容。

帶分塊的VINN、擴(kuò)散策略和ACT在Mobile ALOHA上都取得了良好的性能,并且受益于與靜態(tài)ALOHA的協(xié)同訓(xùn)練。

協(xié)同訓(xùn)練針對不同數(shù)據(jù)組合,其表現(xiàn)也是非常穩(wěn)健。如下是使用ACT進(jìn)行擦拭酒的任務(wù)訓(xùn)練后的成功率。

圖片

協(xié)同訓(xùn)練和預(yù)訓(xùn)練效果對比如下。協(xié)同訓(xùn)練在擦拭酒的任務(wù)中的表現(xiàn),成功率95%,大大優(yōu)于預(yù)訓(xùn)練的成功率40%。

圖片

另外,用戶使用Mobile ALOHA遠(yuǎn)程操控未見過的任務(wù)時,可以迅速接近專家級速度。

圖片

總而言之,僅用32000美元的預(yù)算,通過靜態(tài)ALOHA數(shù)據(jù)協(xié)同訓(xùn)練的模仿學(xué)習(xí),Mobile ALOHA只需要20-50個演示就能學(xué)會各種復(fù)雜的任務(wù)。

斯坦福Mobile ALOHA向所有人展示了機(jī)器人在各種應(yīng)用場景的潛力,甚至機(jī)器人開源實(shí)現(xiàn)了人人可復(fù)刻。

網(wǎng)友表示,機(jī)器人學(xué)是一門既需要硬件又需要算法的系統(tǒng)研究。我猜在2024年,我們將在現(xiàn)實(shí)世界中看到越來越多的機(jī)器人。

作者介紹

Zipeng Fu(項(xiàng)目共同負(fù)責(zé)人)

圖片

Zipeng Fu是斯坦福大學(xué)AI實(shí)驗(yàn)室的計算機(jī)科學(xué)博士生,導(dǎo)師是Chelsea Finn。同時也在Google DeepMind擔(dān)任學(xué)生研究員,與Jie Tan合作。

此前,他在卡內(nèi)基梅隆大學(xué)(CMU)攻讀機(jī)器學(xué)習(xí)領(lǐng)域的碩士學(xué)位,并在機(jī)器人學(xué)院(Robotics Institute)擔(dān)任學(xué)生研究員,導(dǎo)師是Deepak Pathak和Jitendra Malik。

他在加州大學(xué)洛杉磯分校(UCLA)獲得了計算機(jī)科學(xué)與應(yīng)用數(shù)學(xué)的學(xué)士學(xué)位,導(dǎo)師是Song-Chun Zhu。

他的研究興趣集中在機(jī)器人學(xué)、機(jī)器學(xué)習(xí)和計算機(jī)視覺的交匯處。并致力于研究在復(fù)雜多變的開放世界中實(shí)現(xiàn)穩(wěn)定性能和可實(shí)際部署的機(jī)器人系統(tǒng)。

他的研究得到斯坦福研究生獎學(xué)金的支持,并且還是Pierre和Christine Lamond獎學(xué)金的獲得者。

Tony Z. Zhao(項(xiàng)目共同負(fù)責(zé)人)

圖片

Tony Z. Zhao是斯坦福大學(xué)的計算機(jī)科學(xué)博士生,導(dǎo)師是Chelsea Finn。同時也在Google DeepMind擔(dān)任兼職研究助理。

在此之前,他于2021年在加州大學(xué)伯克利分校(UCB)獲得了電子與計算機(jī)科學(xué)(EECS)學(xué)士學(xué)位,導(dǎo)師是Sergey Levine和Dan Klein。并曾在特斯拉Autopilot和谷歌X Intrinsic實(shí)習(xí)。

他的目標(biāo)是使機(jī)器人能夠完成復(fù)雜而精細(xì)的操控任務(wù)。

Chelsea Finn

圖片

Chelsea Finn是斯坦福大學(xué)計算機(jī)科學(xué)與電氣工程的助理教授。研究興趣是機(jī)器人及其他智能體能夠通過學(xué)習(xí)和互動來展現(xiàn)出的智能行為。

她的實(shí)驗(yàn)室IRIS致力于通過大規(guī)模的機(jī)器人互動研究智能,并且是SAIL和ML Group的合作實(shí)驗(yàn)室。同時,她也在Google Brain團(tuán)隊(duì)擔(dān)任研究工作。

此前,她在加州大學(xué)伯克利分校(UCB)獲得了計算機(jī)科學(xué)博士學(xué)位,并在麻省理工學(xué)院(MIT)取得了電氣工程與計算機(jī)科學(xué)的學(xué)士學(xué)位。

責(zé)任編輯:張燕妮 來源: 新智元
相關(guān)推薦

2024-01-29 07:00:00

機(jī)器人AI

2024-01-05 13:24:29

谷歌家務(wù)機(jī)器人AI

2024-07-12 13:40:23

2024-09-11 14:59:00

2013-01-17 09:44:02

數(shù)據(jù)中心網(wǎng)絡(luò)構(gòu)建

2024-03-15 15:15:15

數(shù)據(jù)模型開源

2018-12-19 10:20:54

嵌入式主流處理器

2024-07-22 08:00:00

機(jī)器人虛擬

2025-03-12 08:54:46

2024-04-08 00:01:00

機(jī)器人任務(wù)特斯拉

2024-06-03 14:19:00

AI訓(xùn)練

2023-11-29 14:53:00

AI數(shù)據(jù)

2023-07-07 17:03:23

AI智能

2024-05-07 13:24:54

2023-10-15 13:15:12

博士研究

2020-07-25 18:02:49

機(jī)器狗人工智能系統(tǒng)

2024-11-04 14:35:00

AI機(jī)器人

2024-04-02 11:13:59

機(jī)器人人工智能自變量機(jī)器人

2024-01-06 17:10:14

AI機(jī)器人
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號