英偉達發(fā)布GROOT N1,人形機器人基礎模型再添重磅玩家
在3月18日舉行的英偉達GTC大會上,英偉達創(chuàng)始人兼CEO黃仁勛正式發(fā)布了人形機器人基礎模型GROOT N1,標志著人形機器人基礎模型領域再添重磅玩家。黃仁勛透露,該模型已經(jīng)被多家機器人制造商采用,包括Fourier GR-01、Agility Robotics、Boston Dynamics等,助力類人機器人進入更廣泛的商業(yè)應用場景。
GROOT N1定位全球首款開源且可定制的通用人形機器人基礎模型。它采用了獨特的雙系統(tǒng)架構,靈感來源于人類的認知原理。其中,“系統(tǒng)1”是一個快速思考的行動模型,類似于人類的直覺和反射,能夠迅速做出反應;“系統(tǒng)2”則是一個慢速思考模型,用于進行深思熟慮的決策制定。這種架構使得GROOT N1能夠在復雜環(huán)境中靈活應對各種任務,例如抓取、雙臂搬運、單臂與雙臂協(xié)作,以及多步復雜操作,適用于物料搬運、包裝和檢測等場景。
此外,英偉達還推出了一系列模擬框架和方案,包括NVIDIA Isaac GROOT方案,用于生成合成數(shù)據(jù),以及Newton——一款開源物理引擎。這款引擎由英偉達與Google DeepMind和迪士尼研究院共同開發(fā),專門用于機器人研發(fā)。這些工具的發(fā)布,不僅為開發(fā)者提供了強大的技術支持,也為GROOT N1的廣泛應用奠定了基礎。
人形機器人模型頻繁發(fā)布
早前,F(xiàn)igure公司也發(fā)布了其人形機器人模型Helix。Helix基于視覺-語言-動作(VLA)架構,采用準分層式設計,首次實現(xiàn)了四大技術突破。
能力泛化:Helix能夠適應多樣化的應用場景,無論是工業(yè)物流還是倉儲管理,都能大展身手。精準控制:全身上半身的運動控制實現(xiàn)了更加穩(wěn)定的動作執(zhí)行,確保機器人的靈活性與準確性。協(xié)同作業(yè):Helix支持兩臺及以上機器人協(xié)同操作,突破了以往單機作業(yè)的局限。低成本運行:Helix采用嵌入式GPU設計的“大小腦”架構運行,無需依賴云計算能力,顯著降低了部署和運營成本。
Helix模型的發(fā)布,標志著人形機器人在工業(yè)物流、倉儲管理等場景的規(guī)?;瘧眠~出了重要一步。
與此同時,中國的智元機器人也在人形機器人領域取得了重要進展。3月10日,智元機器人正式發(fā)布了具身智能大模型GO-1,并完成了其在本體機器人上的部署。這一模型基于創(chuàng)新的ViLLA架構,解決了圖像-文本輸入與動作執(zhí)行之間的技術鴻溝,通過多模態(tài)數(shù)據(jù)訓練賦予機器人自主學習與場景泛化能力。
GO-1的核心在于其Vision-Language-Latent-Action(ViLLA)架構,該架構由多模態(tài)大模型(VLM)和混合專家模型(MoE)組成。相較于傳統(tǒng)VLA架構,ViLLA通過預測隱式動作標記,將感知與執(zhí)行環(huán)節(jié)深度耦合,顯著提升了任務理解的連貫性和動作規(guī)劃的效率。這一突破使得人形機器人能夠更好地適應家庭和工業(yè)等多樣化場景。
分析認為,隨著各家基礎模型的發(fā)布,人形機器人技術的發(fā)展將不僅僅局限于硬件的升級,更將集中在軟件和算法的優(yōu)化,以及跨領域的融合應用。隨著技術的不斷進步和應用場景的不斷拓展,人形機器人將在更多領域發(fā)揮重要作用,為人類的生活和工作帶來更多的便利和創(chuàng)新。