自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

OpenAI押注的「1X」訓出專用世界模型,首證機器人Scaling Law

人工智能 新聞
機器人能認出鏡子中的自己嗎?目前來看,依然做不到。

去年 3 月,OpenAI 領投了一家具身智能公司「1X」。這是一家成立于 2014 年的挪威人形機器人公司,致力于研發(fā)雙足機器人 NEO 和商用輪式人形機器人 EVE。

本月初,1X 正式推出了專為家庭使用而設計的雙足人形機器人 NEO Beta,讓人們看到了大模型加持下活靈活現(xiàn)、超擬人機器人的不斷進步。

如今,1X 迎來了自己的世界模型。具體地, 基于視頻生成(Sora)和自動駕駛世界模型(端到端自動駕駛,E2EAD)領域的進展,1X 訓練出了一個世界模型,作為自家機器人的虛擬模擬器。

1X 人工智能副總裁 Eric Jang 表示,過去幾個月,1X 一直在開發(fā)通用機器人的學習模擬器,如今終于問世了。

1X 工程師 Daniel Ho 表示這是機器人世界模型的初步進展,模型可以理解接觸到的物理世界并生成高保真視頻,使機器人可以在自己的神經(jīng)空間中執(zhí)行規(guī)劃、評估和模擬操作。并且,很多生成的視頻片段很難與真實視頻區(qū)分開來。

圖片

1X 創(chuàng)始人兼 CEO Bernt Bornich 表示,這是人形機器人數(shù)據(jù)顯著增強擴展定律的首個證據(jù),「沒有勺子」。

各路網(wǎng)友也對這個機器人世界模型給予了很高評價。

世界模型加持下的 1X 人形機器人還讓一些人直呼《西部世界》重現(xiàn)。

從 1X 官方給出的 Demo 可以看到,從相同的起始圖像序列開始,1X 的世界模型可以從不同的機器人(EVE)動作建議中想象出多種未來。

圖片

這個世界模型還能預測非平凡物體(如剛體)的相互作用、掉落物體的影響、部分可觀測性、可變形物體(窗簾、衣物)和鉸接物體(門、抽屜、窗簾、椅子)。

圖片

圖片

圖片

機器人的「ChatGPT 時刻」,同樣需要擴展定律

世界模型解決了構建通用機器人時一個非常實際、但經(jīng)常被忽視的挑戰(zhàn),即評估。如果你訓練的機器人可以執(zhí)行 1000 項任務,與先前模型相比,我們也很難確定新模型用在機器人上,在這 1000 項任務上表現(xiàn)優(yōu)越。由于周圍環(huán)境如光照細微的變化,即使模型權重相同,機器人也可能在幾天內經(jīng)歷性能的快速下降。

此前 1X 訓練了一個模型,在 50 天的時間里,機器人性能下降了

如果環(huán)境隨著時間的推移不斷變化,那么此前在該環(huán)境中達到的實驗性能很難復現(xiàn),因為舊環(huán)境不存在了。如果你在不斷變化的環(huán)境(如家庭或辦公室)中評估多任務系統(tǒng),那么這個問題將會變得更加糟糕。這一狀況使得在現(xiàn)實世界中進行機器人科學研究變得異常困難。

經(jīng)過深入研究我們不禁會問,當數(shù)據(jù)、計算和模型規(guī)模增加時,機器人的能力將如何擴展?在大模型領域,擴展定律普遍得到大家的認同,如果機器人技術要迎來「ChatGPT 時刻」,必須首先建立它的擴展定律。

其他評估方法

基于物理的模擬(Bullet、Mujoco、Isaac Sim、Drake)是快速測試機器人策略的合理方法。這些方法可重置且可重現(xiàn),這樣一來,研究人員能夠仔細比較不同控制算法帶來的的差異。

然而,這些模擬器大多是為剛體動力學設計的,需要大量手工資產(chǎn)創(chuàng)作。

如何讓機器人打開咖啡濾紙的紙盒、用刀切水果、擰開冷凍果醬罐或與人類等其他智能體互動還是一個值得思考的問題。眾所周知,家庭環(huán)境中遇到的日常物體或者飼養(yǎng)的寵物很難模擬,因此機器人使用的模擬環(huán)境往往在視覺上很單調,缺乏現(xiàn)實世界用例的多樣性。對現(xiàn)實或模擬環(huán)境中有限數(shù)量任務的小規(guī)模評估無法泛化到對現(xiàn)實世界中的大規(guī)模評估。

世界模型

1X 正在采用一種全新的方法來評估通用機器人,即直接從原始傳感器數(shù)據(jù)中學習模擬器,并使用模擬器來評估新策略。通過直接從真實數(shù)據(jù)中學習模擬器,你可以在不手動創(chuàng)建資產(chǎn)的情況下了解真實世界的復雜性。

在過去的一年里,1X 收集的 1X 旗艦產(chǎn)品 EVE 機器人的數(shù)據(jù)高達數(shù)千小時,這些數(shù)據(jù)包括在家中和辦公室中執(zhí)行各種移動操作任務以及與人互動的任務。研究人員將這些視頻和動作數(shù)據(jù)結合起來,訓練了一個世界模型,該模型可以根據(jù)觀察和動作預測未來的視頻。

圖片

圖片

圖片

圖片

圖片

圖片

圖片

圖片

動作控制

該研究訓練的世界模型能夠根據(jù)不同的動作指令產(chǎn)生不同的結果,下面展示了在四種不同軌跡條件下的世界模型生成的效果,每種軌跡都從相同的初始幀開始。 

圖片

左門軌跡

圖片

右門軌跡

圖片

彈奏空氣吉他

世界模型的主要價值來自于模擬對象交互。在抓取盒子實驗中,研究團隊為模型提供相同的初始框架和三組不同的動作來抓取盒子。在每種情況下,所抓取的盒子都會根據(jù)夾具的運動而被提升和移動,而其他盒子則保持不受干擾。

圖片

即使沒有提供動作,世界模型也會生成看似合理的視頻,例如學會駕駛時應避開人和障礙物:

圖片

圖片

長視野任務

模型還可以生成長視野視頻。下面的示例模擬了完整的 T 恤折疊演示。T 恤和可變形物體往往很難在剛體模擬器中實現(xiàn)。

圖片


故障

對象連貫性

模型可能無法在交互過程中保持對象的形狀和顏色,有時對象甚至可能會完全消失。此外,當對象被遮擋或以不利的角度顯示時,它們的外觀可能會在整個生成過程中變得扭曲。

圖片

圖片

物理定律

左邊的生成結果表明模型對物理特性有了新的理解,當抓手松開勺子時,勺子掉到桌子上就證明了這一點。然而,在很多情況下,模型生成結果都未能遵守物理定律,例如右側的盤子懸浮在空中。

圖片

圖片

自我認知

研究團隊讓 EVE 走到鏡子前,以觀察它能否生成與鏡子中動作相一致的行為。

圖片

圖片

結果顯示,模型雖然開始自我反思,但沒有出現(xiàn)「自我識別」或「自我理解」的覺醒。

博客地址:https://www.1x.tech/discover/1x-world-model

責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-09-18 13:30:00

2023-03-28 07:49:38

2024-11-14 18:40:57

2024-12-30 10:20:00

模型數(shù)據(jù)訓練

2024-11-11 17:35:11

2024-09-09 13:50:00

2024-03-14 18:14:03

2024-09-14 14:00:00

AI模型

2024-12-16 07:15:00

2021-07-19 09:11:05

機器人人工智能算法

2021-07-21 17:24:28

OpenAI機器人AI

2024-04-28 14:54:09

機器人代碼

2025-03-19 10:26:10

2024-05-13 12:53:06

AI模型

2024-06-04 14:16:00

機器人AI

2021-07-27 15:47:12

谷歌機器人技術

2024-03-14 11:55:08

AI模型

2020-09-17 13:07:16

阿里物流機器人
點贊
收藏

51CTO技術棧公眾號