僅靠視覺自主分類物體、能做瑜伽,特斯拉人形機(jī)器人再進(jìn)化
沉寂了幾個月的特斯拉人形機(jī)器人擎天柱(Optimus)終于有了新的動態(tài)。記得上一次看到它還是在特斯拉股東大會上,當(dāng)時 Optimus 展示了自由行走、靈活抓取放下物體等技能。
今天,特斯拉 Optimus 又進(jìn)化了?,F(xiàn)在,它可以自主地對物體進(jìn)行分類了。其中的亮點(diǎn)是神經(jīng)網(wǎng)絡(luò)完全端到端訓(xùn)練:輸入視頻,輸出控制。這類似于特斯拉自動駕駛 FSD V12 開發(fā)中的神經(jīng)網(wǎng)絡(luò)訓(xùn)練 —— 處理所有輸入信號,輸出駕駛決策。
不禁要問,如何做到的呢?
Optimus 擁有了自我校準(zhǔn)手臂和腿部的能力,僅使用視覺和關(guān)節(jié)位置編碼器,它就可以在空間中精準(zhǔn)定位自己的肢體。
精確的校準(zhǔn)能力使 Optimus 更高效地學(xué)習(xí)各種任務(wù),并且僅使用視覺,其神經(jīng)網(wǎng)絡(luò)完全實現(xiàn)了 on-board 運(yùn)行。
這樣一來,Optimus 可以完全自主地將物體按顏色進(jìn)行分類。
即便有人干擾,Optimus 也能按顏色將物體準(zhǔn)確分類。
Optimus 還展示了自主糾正(將歪倒的物體擺正)的行為能力。
經(jīng)過訓(xùn)練后,它還能執(zhí)行新任務(wù),比如將分類好的物體打亂。
經(jīng)過了一整天的「工作」,是時候伸展一下、做個雙手合十吧。
團(tuán)隊資深軟件工程師 Julian Ibarz 表示,「非常高興分享團(tuán)隊在過去幾個月中取得的進(jìn)展?,F(xiàn)在 Optimus 可以完成長期任務(wù),比如完全以任務(wù)無關(guān)的方式自動對物體進(jìn)行分類。只需要收集更多數(shù)據(jù),則無需更改任何代碼就可以訓(xùn)練新的復(fù)雜任務(wù)?!?/span>
馬斯克也肯定了這一「進(jìn)展」。
網(wǎng)友在震驚之余,也提出了一些問題,比如是否可以輸入 prompt 讓 Optimus 來執(zhí)行任務(wù)?答案是肯定的,視頻中使用相同的網(wǎng)絡(luò)來執(zhí)行分類或取消分類任務(wù),只需要告訴 Optimus 你想做什么就行了。
Optimus 的「前世今生」
Optimus 并非一開始就是一個實體機(jī)器人的,它從「Tesla Bot」這樣一個機(jī)器人通用計劃慢慢孵化。
2021 年馬斯克在「特斯拉 AI 日」上展示了 Tesla Bot 的大致形態(tài)。
甚至在 Tesla Bot 動作展示時,是由工作人員穿著特制的緊身服裝,扮成機(jī)器人的模樣表演了一段舞蹈。但就是這樣一個想法,逐漸扎根,并走向現(xiàn)實,一次次突破給人們驚喜。
一年后的「特斯拉 AI 日」上,曾經(jīng)由人扮演的 Tesla Bot 變?yōu)榱藱C(jī)器人 Optimus。
2022 年「特斯拉 AI 日」上 Optimus 和人們打招呼
剛亮相的 Optimus 已經(jīng)可以搬運(yùn)箱子,給花澆水,在工廠里工作。但這不是 Optimus 的最終目標(biāo)。Optimus 要成為擁有「大腦」的類人機(jī)器人。
Optimus 在特斯拉超級工廠里工作
馬斯克表示,當(dāng)時這個機(jī)器人設(shè)計出來只用了半年時間,未來成型的樣子有很多值得期待的地方。
事實也正如此,2023 年特斯拉股東大會上的 Optimus 的腳步已經(jīng)更加順暢,動作也更加熟練。
Optimus 靈活抓取、放下物體
而現(xiàn)在,Optimus 已經(jīng)向著它的目標(biāo)不斷前進(jìn),擁有「大腦」的路程也越走越清晰。下一次它將如何進(jìn)化,我們拭目以待。