馬斯克擎天柱大將跳槽,在抱抱臉開(kāi)源一套機(jī)器人技術(shù):會(huì)做家務(wù)的大白,復(fù)刻低至1800
馬斯克部下跳槽,把人形機(jī)器人技術(shù)開(kāi)源了。不少創(chuàng)業(yè)公司的估值,一夜被打了骨折。
最新成果已正式發(fā)布——
它能像大白(●—●)一樣,聽(tīng)懂并正確執(zhí)行人類發(fā)出的指令,比如放杯子、拿水果。
可以自己打開(kāi)筆帽,在白板上寫(xiě)名字。
或者是疊衣服。
把鑰匙準(zhǔn)確插進(jìn)鎖眼。
這些操作,全都是機(jī)器人自己搞定。沒(méi)有人遠(yuǎn)程操控,完全端到端實(shí)現(xiàn)。
最關(guān)鍵的是,它使用的算法、數(shù)據(jù)集完全開(kāi)源!
這意味著,你完全可以在家自己改造一個(gè)小機(jī)器人,讓它完成同樣的事。
如上進(jìn)展,來(lái)自Hugging Face今年新成立的機(jī)器人項(xiàng)目Le Robot。
團(tuán)隊(duì)領(lǐng)軍人物Remi Cadene(雷米·卡德內(nèi)),1月才從特斯拉Optimus機(jī)器人團(tuán)隊(duì)離職,才過(guò)了幾個(gè)月就帶來(lái)如上新成果。
這立馬引發(fā)業(yè)內(nèi)關(guān)注,谷歌DeepMind科學(xué)家都來(lái)圍觀表示:
開(kāi)源哆啦A夢(mèng)才是出路嘛。
網(wǎng)友們更是amazing刷屏了。
所以,這個(gè)開(kāi)源機(jī)器人,究竟如何而來(lái)?
訓(xùn)練只用2個(gè)小時(shí)
完成這些動(dòng)作的,是花粉機(jī)器人公司最新的機(jī)器人Reachy2。
不過(guò),Reachy2并不是一開(kāi)始就實(shí)現(xiàn)自主操作的,而是先經(jīng)歷了一段遙控操作的過(guò)程。
該階段中,開(kāi)發(fā)人員會(huì)佩戴VR裝備,控制機(jī)器人完成一系列任務(wù)。
VR遙控的過(guò)程被記錄成了50段視頻,每段約15秒,與Reachy2機(jī)器人內(nèi)的不同傳感器相關(guān)聯(lián)。
這些視頻成為了ML算法的學(xué)習(xí)素材,用于研究如何自行完成并指導(dǎo)Reachy2完成一系列任務(wù)。
訓(xùn)練一共持續(xù)了2個(gè)小時(shí),之后作者測(cè)試了所有的checkpoint,發(fā)現(xiàn)機(jī)器人果然學(xué)習(xí)到了新的概念——
- 在2萬(wàn)步時(shí),它學(xué)會(huì)了將杯子可靠地放在碗碟架上;
- 在4萬(wàn)步時(shí),它學(xué)會(huì)了旋轉(zhuǎn)底座并交出蘋果;
- 在6萬(wàn)步時(shí),它學(xué)會(huì)了旋轉(zhuǎn)手臂回到初始位置。
這其中的數(shù)據(jù)集和使用的模型,現(xiàn)在都已開(kāi)源,就連VR操作時(shí)用的程序,也同樣是開(kāi)源的。
在抱抱臉上,Reachy訓(xùn)練用的50段視頻都可以直接下載,開(kāi)源框架和工具也放在了GitHub。
包括機(jī)器人ML框架LeRobot,采用了Apache-2.0協(xié)議,可免費(fèi)商用,據(jù)作者稱達(dá)到了SOTA水準(zhǔn),在GitHub上已經(jīng)斬獲了3.4k+星標(biāo)。
LeRobot基于PyTorch實(shí)現(xiàn),包括了預(yù)訓(xùn)練模型、人工采集的數(shù)據(jù)集,還有一套模擬環(huán)境,無(wú)需真實(shí)的機(jī)器人硬件也能觀察效果。
值得一提的是,斯坦福知名開(kāi)源機(jī)器人項(xiàng)目ALOHA中的數(shù)據(jù),也被囊括進(jìn)了其中。
此外,Reachy2機(jī)器人還用到了華人軟件工程師、開(kāi)源AI解決方案平臺(tái)1ms.ai創(chuàng)始人Haixuan Xavier Tao開(kāi)源的面向數(shù)據(jù)流的機(jī)器人應(yīng)用DORA。
除了用DORA幫助HuggingFace完善機(jī)器人框架,1ms.ai還曾幫助清華大學(xué)完成了一套機(jī)器人工程的教程。
說(shuō)回DORA,它提供了低延遲、可組合和分布式數(shù)據(jù)流功能,可以簡(jiǎn)化機(jī)器人程序的創(chuàng)建,目前已獲1.2k星標(biāo)。
DORA的目標(biāo)是將硬件、算法和人工智能模型結(jié)合在一起,并使它們相互通信,讓硬件和軟件的集成變得容易。
DORA提供了Python、Rust、C/C++等多種語(yǔ)言版本,其中在Python上速度比ROS2快了17倍。
在Python上,DORA還具備熱重載功能,意味著可以在運(yùn)行過(guò)程中也可以隨時(shí)修改Python代碼。
未來(lái),如果把檢索增強(qiáng)生成(RAG)技術(shù)和熱重載功能結(jié)合,還能創(chuàng)建出自編碼機(jī)器人,根據(jù)提示自動(dòng)生成代碼。
作者表示,有了LeRobot和Dora,自己在家也能復(fù)刻出一個(gè)Reachy2的小號(hào)仿品。
把具身智能成本打下來(lái)
那么,這個(gè)機(jī)器人價(jià)格到底多少呢?這還是大家最關(guān)注的問(wèn)題。
其實(shí)主要取決于硬件。
作者雷米表示,目前能接入LeRobot最便宜的機(jī)械臂,只需250美元(折合人民幣約1800元)。
目前展示的這款Reachy2,價(jià)格還沒(méi)公布,參考它的上一代,起售價(jià)為9750美元(折合人民幣約7萬(wàn)元)。
有網(wǎng)友表示,看來(lái)幾年內(nèi)把機(jī)器人助手價(jià)格打到5000美元以內(nèi)有希望了(大約3.6萬(wàn),不到一輛車的價(jià)格)。
這也是為啥Hugging Face入局具身智能會(huì)引發(fā)轟動(dòng)的關(guān)鍵所在。
要知道,具身智能研發(fā)成本一直居高不下,這個(gè)火爆賽道如今已經(jīng)吸金幾十億。
而將所有算法數(shù)據(jù)集開(kāi)源,意味著人形機(jī)器人的成本(起碼在軟件算法層面)大幅降低,會(huì)給業(yè)內(nèi)其他布局機(jī)器人領(lǐng)域的玩家?guī)?lái)不小壓力。
與此同時(shí),Hugging Face還挖來(lái)了一流工程師。
領(lǐng)銜項(xiàng)目的Remi Cadene(雷米·卡德內(nèi))曾是特斯拉Autopoilot和Optimus機(jī)器人研究項(xiàng)目的成員。
入職時(shí)雷米還調(diào)侃了OpenAI,表示要做真正意義上的開(kāi)源。
具體動(dòng)作上,雷米的腳步走得也確實(shí)很快。上個(gè)月剛剛發(fā)布了Le Robot開(kāi)源代碼庫(kù),如今首個(gè)具身智能成果也來(lái)了。
不過(guò)能快速在人形機(jī)器人上部署訓(xùn)練,也少不了花粉機(jī)器人公司出力。
這是一家來(lái)自法國(guó)的機(jī)器人公司,他們也強(qiáng)調(diào)開(kāi)源理念。在2013年發(fā)布了據(jù)稱是第一個(gè)開(kāi)源的3D打印機(jī)器人。
此前已經(jīng)推出了開(kāi)源全遙控機(jī)器人Reachy1。
雷米介紹,在Hugging Face團(tuán)隊(duì)正留意人形機(jī)器人硬件時(shí),花粉機(jī)器人這邊也在找端到端方案,所以兩家一拍即合。
而且還有地理上的優(yōu)勢(shì),他們的辦公地點(diǎn)相隔只有2小時(shí)的路程。
所以我們只是去拜訪了他們幾天而已。
從目前雷米透露的動(dòng)向來(lái)看,他們還會(huì)開(kāi)源一系列工作,比如語(yǔ)音命令控制等,大家可以期待一下。
By the way,Hugging Face最近正在招人哦,崗位是Post-Sales Machine Learning Solutions Engineer - Asia Remote,感興趣的童鞋可以嘗試下~