特斯拉機器人真這么絲滑?科技博主在線「打假」:遠程操控的
前天,特斯拉開了一場相當(dāng)科幻的發(fā)布會,其中一大看點就是新一代人形機器人 Optimus。
「你能以 2 萬到 3 萬美元的價格購買一臺 Optimus 機器人,它可以當(dāng)老師、幫你照顧孩子,可以遛狗、修剪草坪、買菜、做你的朋友、端上飲料,你能想到的任何事情,它都能做?!?/span>
「我認為這將是有史以來最偉大的產(chǎn)品!」
身穿皮衣亮相發(fā)布會的馬斯克,一臉自豪地夸贊著自家的機器人。
與此同時,社交媒體上也冒出一堆視頻,均是展示 Optimus 的強大實力。
比如,戴著牛仔帽的 Optimus 化身調(diào)酒小哥,平穩(wěn)地倒著飲料:
視頻來源:https://x.com/ChrisJBakke/status/1844610918552121596
唱著生日快樂歌:
視頻來自:https://x.com/ray4tesla/status/1844606188790370611
它還到處閑逛,各種跟人搭話聊天:
視頻來源:https://x.com/teslaownersSV/status/1844610376165425658
現(xiàn)場如此嘈雜,聲音也是紛亂,Optimus 不僅能精確地鎖定對答,還如此流暢,絲毫察覺不到響應(yīng)的間隔。語言風(fēng)格、語氣語調(diào)聽起來都與真人無異。
如果這些都是 Optimus 的自主回應(yīng),那說明特斯拉的技術(shù)已經(jīng)達到了新的 level。
除了交流,Optimus 的動作似乎更加「出賣」了它。
它的頭部可以在對話過程中四處觀察環(huán)境,掃視眾人。手指也比往常更加靈敏,看起來每個動作都精準(zhǔn)且生動,不得不讓人懷疑,這真的是 Optimus 自己的水平嗎?
果不其然,有科技博主開始在線「打假」。
科技博主在線「打假」
幾天前,特斯拉在華納兄弟工作室的攝影棚中,舉行了一場備受期待的媒體活動,并推出一款馬斯克稱之為 Cybercab 的無人駕駛出租車。
華爾街并不買賬,特斯拉股票應(yīng)聲跌了約 9%。
當(dāng)然,這并沒有影響 Party 上的氣氛,參加特斯拉活動的人們在社交媒體上發(fā)布了幾十個視頻,展示了 Optimus 機器人的絕活 —— 跳舞、說話,甚至調(diào)酒。
不過,科技博主 Robert Scoble 在 X 上質(zhì)疑:「這并非完全是人工智能,而是有人在遠程協(xié)助」,并附上了一段視頻。
圖源:https://x.com/Scobleizer/status/1844593576040333767
Scoble 的質(zhì)疑并非空穴來風(fēng)。
他在現(xiàn)場專門問了一個機器人:「嘿,Optimus,你的人工智能成分有多少?」
Optimus 有些慌亂地回答:「我不能透露具體有多少。這是你以后需要弄清楚的事情?!?/span>
Scoble 又問:「是有一部分還是完全沒有?」
Optimus 開始打太極:「我想說,可能有一部分。我不會確認,但可能有一些?!?/span>
視頻來源:https://x.com/Scobleizer/status/1844594008225611858
答案似乎呼之欲出。
以馬斯克的性格,如果他真的制造了一群能與大量人群實時互動的機器人,早就大肆宣揚這一點了,但現(xiàn)實情況恰恰相反,他們的回應(yīng)相當(dāng)含糊其辭。
Scoble 還發(fā)了一條后續(xù)推文,說他與一位特斯拉工程師進行了交談以獲得清晰的答案。
「當(dāng)它走路時,是 AI 在控制 Optimus。Optimus 可以在人群中走來走去,這真的太棒了?!沟?Scoble 沒有進行進一步詳細說明。
科技媒體 Gizmodo 也表示,以他們對 Optimus 的了解,馬斯克實際上遠遠落后于競爭對手。
今年 1 月份,馬斯克篡改了一個 Optimus 的演示視頻,被網(wǎng)友抓包。
視頻中,Optimus 正在疊襯衫,但眼尖的觀眾注意到,有一只手不斷進入攝像機的視野。這意味著,有人在鏡頭外執(zhí)行折疊任務(wù),而機器人只是在模仿人類。
圖注:特斯拉的擎天柱機器人在 2024 年 1 月折疊衣物,紅色箭頭標(biāo)注顯示的是人類的手。
如果 Optimus 真的能夠完全自主地玩石頭剪刀布,無需人類干預(yù),并且可以毫不延遲地進行快速對話,那確實很牛,但目前并沒有相關(guān)的證據(jù)能夠表明這一點。
被遙控操作的機器人們
特斯拉在今年 8 月底,發(fā)布了「動捕師」訓(xùn)練人形機器人 Optimus 的招聘,時薪最高達到了 48 美元。特斯拉 Optimus 人形機器人讓我們看到了動作捕捉這一數(shù)據(jù)采集思路的應(yīng)用潛力。這是一種常見且往往經(jīng)濟高效的訓(xùn)練機器人執(zhí)行類人動作的方法,特斯拉是首批大規(guī)模使用動作捕捉技術(shù)的公司之一。
Optimus 訓(xùn)練過程
其實操控機器人并不是一件新鮮事。
在年初爆火的斯坦福機器人 Aloha,既是炒菜的一把好手,又能打理家務(wù)。備菜、翻炒、出鍋,洗衣、逗貓、澆花它是樣樣精通。這其中就有不少遠程操控的展示,Aloha 也憑借這種視覺效果拿下了不少人對機器人養(yǎng)老的期待。
來自英偉達的研究科學(xué)家 Jim Fan 當(dāng)時發(fā)布了推文,提醒大家別因為視頻的驚艷程度就忽略了其中技術(shù)真相。他提到,應(yīng)該將 Mobile ALOHA 看作是一輛制造精良的跑車,而它仍需要人類駕駛才能表現(xiàn)出自己的能力。現(xiàn)在的水平與能夠完全自主的廚師還有較大的差距。
在機器人技術(shù)領(lǐng)域,從人類示范中進行的模仿學(xué)習(xí)已經(jīng)取得了令人矚目的成績。其實訓(xùn)練 Mobile ALOHA 的過程就是像是在玩游戲 —— 操作機器人直到動作通關(guān)。Mobile ALOHA 之所以能夠讓人發(fā)出驚嘆,是因為它所展示的任務(wù)不局限于桌面操作。這些復(fù)雜且靈活的動作源于研究者開發(fā)的一套系統(tǒng),用于模仿需要全身控制的雙臂移動操作任務(wù)。利用 Mobile ALOHA 收集的數(shù)據(jù),進行有監(jiān)督的行為克隆。
研究團隊在介紹時表示,對于一些簡單的任務(wù),Mobile ALOHA 可以在 50 次學(xué)習(xí)之后達到 90% 的行動成功率。對于一些簡單的任務(wù),如炒一只蝦仁(有且只有一只)、拿塊抹布、擺放好椅子,Mobile ALOHA 無需人類指點,還是可以自己 hold 住的。