稚暉君機(jī)器人“葡萄縫針”神技再現(xiàn)江湖,這次是人形的!騎自行車(chē)驚呆眾人:又抽象又硬核
剛剛!鴿了兩年之后,稚暉君罕見(jiàn)更新視頻——
上線(xiàn)號(hào)稱(chēng)史上最復(fù)雜項(xiàng)目靈犀X2,能夠像人一樣靈動(dòng)地騎自行車(chē)。
評(píng)論區(qū)早已經(jīng)是聽(tīng)取哇聲一片。
他自己表示,悄咪咪研發(fā)了三個(gè)月,視頻準(zhǔn)備了一個(gè)月。嗯,鴿的越久,事情越大!
據(jù)介紹,之所以這次如此有人味兒,源于背后集齊了運(yùn)動(dòng)、交互、作業(yè)三大智能。
于是乎,四年前葡萄縫針的神技,再次在靈犀X2上看到了。
它能像人一樣,有著一呼一吸的韻律。
它可以毫秒級(jí)交互,幫助你決策一些日常的選擇困難。
睡前該喝什么飲料。
除此之外,它還擁有一些其他機(jī)器人不具備的抽象能力。
比如腦殼里裝手機(jī)???
還有遠(yuǎn)程裸眼3D交流。。。
著實(shí)是非常抽象了。
本體是怎么設(shè)計(jì)?
整個(gè)設(shè)計(jì)過(guò)程也完全公開(kāi),與以往的項(xiàng)目一樣的硬核。他們此次在本體設(shè)計(jì)上有很多創(chuàng)新思考。
首先是硬件系統(tǒng),抽象出了一個(gè)個(gè)可復(fù)用的核心組件。
- 小腦控制器Xyber-Edge;
- 域控制器Xyber-DCU;
- 智能電源管理系統(tǒng)Xyber-BMS;
- 核心關(guān)節(jié)模組;
……
通過(guò)這樣模塊化的組件設(shè)計(jì),就可以像拼無(wú)人機(jī)航模一樣來(lái)搭建起各種形態(tài)的人形機(jī)器人系統(tǒng)。
就比如拿抓完全體,這里他又挖坑了,鴿了兩年不知還要再鴿幾年。
還有就是在材料選擇上,選擇了很親和的柔性材料。他們進(jìn)行了多種嘗試,包括TPU、ETPU、EVA,甚至是美妝蛋???
另外,他們?nèi)略O(shè)計(jì)了核心關(guān)節(jié)模組,并在原型機(jī)全身28個(gè)自由度沒(méi)有使用任何一個(gè)并聯(lián)結(jié)構(gòu)。
這樣既能保證慣量上移,又實(shí)現(xiàn)了運(yùn)控算法的完全解耦。
就像這樣,跟人一樣很Chill的晃腿~
更為重要的突破來(lái)自運(yùn)控算法層面——全面從Model-based轉(zhuǎn)向?qū)W習(xí)驅(qū)動(dòng)的強(qiáng)化學(xué)習(xí)。
通過(guò)深度強(qiáng)化學(xué)習(xí)與模仿學(xué)習(xí)相結(jié)合,讓靈犀X2學(xué)會(huì)了像人一樣的運(yùn)動(dòng)能力。
而且平衡能力不錯(cuò),隨機(jī)跑起來(lái)或者原地轉(zhuǎn)圈也是輕松拿捏。
甚至它還能抓住舞蹈精髓,跟隨bgm跳一曲科目三。
同時(shí),更考驗(yàn)身體協(xié)調(diào)性和平衡能力的深蹲動(dòng)作,靈犀X2舉著小杠鈴也輕松完成了。
(體重暴露了,靈犀X2重33.8KG,加上身高在一米三左右,嗯,標(biāo)準(zhǔn)身材)
此外,它還學(xué)會(huì)了人類(lèi)必備技能——偷懶(doge),各種工具用起來(lái)也是得心應(yīng)手。
踩滑板車(chē)、平衡車(chē)那叫一個(gè)6:
不過(guò)要想要想訓(xùn)練出這樣一個(gè)靈活的機(jī)器人,其實(shí)并不容易。他們?cè)谶^(guò)程中也遇到了各種各樣神奇的體驗(yàn)(Bug)。
比如偶然習(xí)得了一種抽象的走路方式。。。
不想動(dòng)了就直接擺爛,太像人了有沒(méi)有?!
又或者鬧一波情緒,經(jīng)鑒定該孩子為情緒暴躁型。
目前靈犀X2還在持續(xù)進(jìn)化運(yùn)動(dòng)能力中,按照稚暉君的說(shuō)法:
通過(guò)數(shù)據(jù)驅(qū)動(dòng)的算法范式,智能體能夠從每秒數(shù)萬(wàn)次的環(huán)境交互和動(dòng)作數(shù)據(jù)中,找到突破運(yùn)動(dòng)瓶頸的方法。
我們相信人形機(jī)器人的運(yùn)動(dòng)智能問(wèn)題,很快會(huì)得到徹底解決。
讓機(jī)器人有人味兒了
不過(guò)要讓機(jī)器人真正跟人一樣,除了運(yùn)動(dòng)智能之外,交互智能、作業(yè)智能也必不可少。
首先交互方面,要讓機(jī)器人不光四肢發(fā)達(dá),頭腦也不簡(jiǎn)單,這主要得益于他們開(kāi)發(fā)的一套基于Diffusion的生成式動(dòng)作引擎。
此外,還為靈犀X2訓(xùn)練了定制的多模態(tài)交互大模型——硅光動(dòng)語(yǔ),以至于靈犀X2被稱(chēng)為“第一臺(tái)真正具備復(fù)雜交互能力的靈動(dòng)機(jī)器人”。
在此基礎(chǔ)上,通過(guò)邊緣側(cè)大腦和端到端模型架構(gòu),以及一系列工程優(yōu)化,靈犀X2具備了毫秒級(jí)交互能力。
日常坐下來(lái)聊聊天(用了稚暉君本人的聲音訓(xùn)練):
最有意思的是,當(dāng)問(wèn)靈犀X2“剛剛提的問(wèn)有多少是預(yù)先寫(xiě)好的”,它驕傲回答道:
完全隨機(jī)。
與此同時(shí),除了語(yǔ)音和視覺(jué),靈犀X2所使用的模型還集成了動(dòng)作模態(tài),使它被賦予了生命感。
除了開(kāi)頭提到的呼吸韻律,它還有自己的好奇心以及肢體語(yǔ)言:
當(dāng)然,情緒價(jià)值拉滿(mǎn)的同時(shí),靈犀X2還具備了一定的生產(chǎn)能力。
據(jù)稚暉君介紹,過(guò)去一年里,他們初步找到了一條通往泛化作業(yè)智能的路徑,而靈犀X2則是集大成者。
結(jié)合已開(kāi)源的數(shù)據(jù)集和框架,靈犀X2目前已具備簡(jiǎn)單任務(wù)的零樣本泛化能力。
像前段時(shí)間Figure展現(xiàn)出來(lái)的多機(jī)協(xié)作,靈犀X2在某些特定任務(wù)中也能實(shí)現(xiàn)。
而按照規(guī)劃,最終靈犀X2能夠?qū)崿F(xiàn)作業(yè)領(lǐng)域的“機(jī)器人吉祥三?!薄0病⒈D芬约氨?。