一年秀一次!稚暉君的人形機器人上新了,還有開源、免費彩蛋
一年一秀,稚暉君的第二代人形機器人來了。
靈巧小手,正在麻將桌上叱咤風(fēng)云:
不對不對,讓我們先看看整體氣質(zhì):
然后是常規(guī)家務(wù),能看出來也是非常熟練:
在大模型風(fēng)靡的 2024 年,如果說 AI 領(lǐng)域什么最火,「具身智能」這個方向必定位列其中。
視線放到國內(nèi),「智元機器人」這家具身智能公司備受矚目。自 2023 年 2 月成立以來,「智元機器人」已馬不停蹄地完成了 6 輪融資,迅速成為機器人創(chuàng)業(yè)圈的「頂流項目」。
創(chuàng)業(yè)半年,稚暉君和團隊就拿出了首款產(chǎn)品「遠(yuǎn)征 A1」。一出道,「遠(yuǎn)征 A1」的行走能力和人機互動就是業(yè)界領(lǐng)先水平。不過,在「遠(yuǎn)征 A1」初次亮相之后,我們似乎再也沒聽說過它的下一步消息,甚至沒有放出任何整活視頻。
但今天的發(fā)布會之后,我們知道了,智元機器人在「悶聲干大事」。
在這場發(fā)布會中,稚暉君一口氣推出了三款遠(yuǎn)征系列機器人產(chǎn)品:交互服務(wù)機器人「遠(yuǎn)征 A2」、柔性智造機器人「遠(yuǎn)征 A2-W」、重載特種機器人「遠(yuǎn)征 A2-Max」。最后的 One more thing 環(huán)節(jié),智元 X-Lab 孵化的模塊化機器人系列產(chǎn)品「靈犀 X1」和「靈犀 X1-W」也作為「彩蛋」正式亮相。
相比上一代,五款機器人采用了家族化設(shè)計語言,對機器人的外形進(jìn)行了系列化的規(guī)整,結(jié)合輪式與足式兩種形態(tài),覆蓋交互服務(wù)、柔性智造、特種作業(yè)、科研教育和數(shù)據(jù)采集等應(yīng)用場景。
關(guān)于量產(chǎn)進(jìn)度,智元機器人也透露了最新消息:2024 年預(yù)估發(fā)貨量將達(dá)到 300 臺左右,其中雙足 200 臺左右,輪式 100 臺左右。
新一代遠(yuǎn)征 A2
從「遠(yuǎn)征 A1」開始,智元在機器人產(chǎn)品上的落地方向就已經(jīng)很清晰:「進(jìn)廠打工」。今年的「遠(yuǎn)征 A2」更是為批量「進(jìn)廠打工」做了更充分的準(zhǔn)備。
我們來看下這個家族的成員:
「遠(yuǎn)征 A2」是一款交互服務(wù)機器人,全身具備超過 40 個主動自由度的關(guān)節(jié)和仿人的靈巧雙手,能夠模擬出豐富和復(fù)雜的人類工作。它擁有一個可以持續(xù)學(xué)習(xí)的大腦,由大語言模型加持。此外,它還具備多模態(tài)的感知,輸入系統(tǒng),可以通過視覺感知交互者的情緒。
「遠(yuǎn)征 A2-Max」是一款重載特種機器人,既力大無窮又具備靈巧作業(yè)的優(yōu)勢,在開場的情景劇中,它輕松地搬動了 40kg 的航空箱,目前「遠(yuǎn)征 A2-Max」還處于產(chǎn)品研發(fā)階段。
「遠(yuǎn)征 A2-W」是一款柔性智造機器人,它的兩條手臂既可以獨立操作,也可以協(xié)同工作。它采用了輪式底盤,結(jié)合機身搭載的 rgbd 激光雷達(dá)、全景相機、為全域安全配置的傳感器等等構(gòu)件,使得它可以在各種環(huán)境中快速而平穩(wěn)的移動。
在發(fā)布會前,「遠(yuǎn)征 A2-W」的表現(xiàn)簡直像鋼鐵俠的「賈維斯」走進(jìn)了現(xiàn)實。在聽懂稚暉君的指令后,它完全自主地打開了可樂瓶子,在榨汁機中放入葡萄,按下榨汁機,一滴沒撒地把榨汁機里的飲料倒進(jìn)了杯子,給稚暉君端上了一杯「萄氣可樂」。
除了顏值提升,「遠(yuǎn)征 A2」系列機器人更是內(nèi)外兼修。對于機器人的核心零部件,「智元機器人」創(chuàng)新地將機器人系統(tǒng)劃分為動力域、感知域、通信域、控制域。顯然,「智元機器人」都是沖著全棧生態(tài)去的。
在動力域方面,「智元機器人」對 PowerFlow 關(guān)節(jié)模組實現(xiàn)了量產(chǎn)化迭代升級,從參數(shù)上看,PowerFlow 關(guān)節(jié)模組都有大幅提升。在穩(wěn)定性和可靠性方面,「智元機器人」也對其峰值性能、老化速度等方面進(jìn)行了大量測試和優(yōu)化。
對于「干活」而言對重要的靈巧手,這回「智元機器人」也升級了一番:自由度數(shù)躍升至 19 個,主動自由度翻倍至 12 個,在感知能力方面也引入了更多模態(tài),例如基于 MEMS 原理的觸覺感知和視觸覺感知技術(shù)。
此外,「智元機器人」還推出了高精度力控 7 自由度雙臂,能夠精準(zhǔn)執(zhí)行阻抗控制、導(dǎo)納控制、力位混控等多種力控任務(wù),也支持雙臂拖拽示教模式和可視化調(diào)節(jié)。
對于感知域方面,新一代的遠(yuǎn)征機器人系列集成了 RGBD 相機、激光雷達(dá)、全景相機等傳感器,引入自動駕駛 Occupancy 前沿感知方案,通過 SLAM 算法進(jìn)一步提升環(huán)境理解能力。
在通信域方面,「智元機器人」自研了具身原生、輕量化、高性能的智能機器人通信框架 AimRT。相比 ROS 等第三方中間件,提升了性能、穩(wěn)定性、系統(tǒng)部署的效率和靈活性,同時又完全兼容 ROS/ROS2 已有生態(tài)。AimRT 將于 9 月底開源。
對于控制域方面,「智元機器人」結(jié)合了 Model-based 與 Learning-based 兩種算法,進(jìn)一步提升機器人運動控制與適應(yīng)能力。對于 Model-based,「智元機器人」進(jìn)一步提升了系統(tǒng)的魯棒性,因此,在發(fā)布會上機器人所做的演示才能如此流暢和絲滑。對于 Learning-based 算法,「智元機器人」在這里劃了一個重點,希望能促成機器人訓(xùn)練方法從算法驅(qū)動 - 數(shù)據(jù)驅(qū)動的轉(zhuǎn)變。
在運控算法的基礎(chǔ)上,「智元機器人」預(yù)研了基于自然語言指令集驅(qū)動的、可以適配不同機器人本體的 AgentOS,基于強化學(xué)習(xí),實現(xiàn)機器人技能的精準(zhǔn)編排與高效執(zhí)行。
首次提出 G1-G5 具身智能技術(shù)演進(jìn)路線
在本次發(fā)布會上,智元機器人還首次提出了具身智能領(lǐng)域的技術(shù)演進(jìn)路線,包含從 G1 到 G5 五個階段:
G1 指的是基礎(chǔ)自動化階段,也就是基于手工設(shè)計的特征,配合簡單的機器視覺去做一些反饋。這一階段的部署是為特定的場景量身定制的,雖然可以解決某些場景下的任務(wù)執(zhí)行問題,但無法在不同的場景里面做低成本快速遷移。
G2 是「通用原子技能」階段,針對大量不同的場景任務(wù)和各種作業(yè)的任務(wù)需求,提煉出一些可以復(fù)用的原子能力。簡而言之,是以相對通用的方式去實現(xiàn)類似場景任務(wù)的快速遷移,然后配合大語言模型框架去做任務(wù)編排,使得機器人具備一定的泛化能力。
G3 則意味著具身智能的整體架構(gòu)開始調(diào)整為「端到端」的路線,盡管這個階段與 G2 階段的算法架構(gòu)可能是類似的,但此時的各項「原子能力」的形成方式,已經(jīng)由手工設(shè)計的算法驅(qū)動變?yōu)榱舜罅繑?shù)據(jù)采集之后的數(shù)據(jù)驅(qū)動。
區(qū)別于前三個階段,G4 階段將會出現(xiàn)一個通用的端到端操作大模型。到了這一階段,即可引入大量跨場景的真實數(shù)據(jù)和仿真數(shù)據(jù),同時引入世界模型幫助 AI 理解現(xiàn)實世界背后的物理原理,理解不同任務(wù)背后底層邏輯的相通之處。比如對于「擰開瓶子」和「擰開門把手」這兩件事,就不再需要采集兩份單獨的數(shù)據(jù)以獲得兩項單獨的技能。最終通向無限趨近 AGI 的 G5 階段。
過去一年,智元機器人已經(jīng)在 G2 路線取得了階段性突破,實現(xiàn)了通用的位姿估計模型 UniPose、通用的抓取模型 UniGrasp,通用的力控插拔模型 UniPlug 等一系列 zero-shot 和 few-shot 的通用原子技能。在 G2 階段的原子能力模型,面向柔性智造和交互服務(wù)場景,已經(jīng)在多個實際場景中得到了商業(yè)應(yīng)用。
在 G3 路線上,智元機器人也形成了一套完整的全流程具身數(shù)據(jù)方案 AIDEA(Agibot Integrated Data-system for Embodied AI,智元具身智能數(shù)據(jù)系統(tǒng))。
但我們都知道,要想形成這樣一套方案,首先需要投入大量的數(shù)據(jù)采集成本,不是每個機器人團隊都有條件做到的。
而智元機器人做到了,還預(yù)備在今年第四季度開源。
稚暉君表示,數(shù)據(jù)采集是整個環(huán)節(jié)的痛點。在過去一年中他們面向數(shù)據(jù)做了大量的基建工作,而且形成了一套完整、全流程的數(shù)據(jù)采集、應(yīng)用的方案 AIDEA。
AIDEA 除了提供硬件本體方案之外,也會提供整個云全鏈路數(shù)據(jù)平臺,還有 AIDEA ML 機器學(xué)習(xí)平臺進(jìn)行模型訓(xùn)練與算法評測,以及 AIDEA Sim 仿真平臺。
稚暉君表示,他預(yù)計接下來智元會有百臺以上自由部署機器人專門用來做端到端的數(shù)據(jù)采集,他們也將于四季度開源基于 AIDEA 的百萬條真機、千萬條仿真數(shù)據(jù)集,以積極建設(shè)開放生態(tài)。
稚暉君的 One more thing
大概因為覺得一年才開一次發(fā)布會屬實「鴿」太久了,稚暉君也在發(fā)布會最后公布了 One more thing:全棧開源機器人靈犀 X1、專業(yè)數(shù)采機器人靈犀 X1-W 兩款新品。
這兩款機器人來自于 X-Lab(稚暉君實驗室),是 10 個人不到 3 個月的時間做出的產(chǎn)品,里面有非常多的創(chuàng)新細(xì)節(jié)。例如,自研了 PF86 和 PF52 兩款全新的 PowerFlow 關(guān)節(jié),融入了模塊化設(shè)計理念,可以通過簡單抱箍形式輕松拆裝。
基于 X-Lab 對極致創(chuàng)新的追求,稚暉君表示,會開源靈犀 X1 的本體設(shè)計圖紙、軟件框架、中間件源碼、基礎(chǔ)運控算法。
此外在執(zhí)行器方面,X-Lab 自研了帶前饋力控、超低成本的自適應(yīng)通用夾爪,也推出了滿足場景需求的百元級成本的六維力傳感器。
對了,靈犀的售價是零元,開源大部分設(shè)計資料及代碼,但賣零件。
稚暉君表示,希望這能夠推動「人形機器人人人造」時代的到來。
你喜歡嗎?