世界機(jī)器人大會(huì)上,這家承載「未來養(yǎng)老希望」的國(guó)產(chǎn)機(jī)器人被包圍了
正在北京舉行的世界機(jī)器人大會(huì)上,人形機(jī)器人的展示成為了現(xiàn)場(chǎng)絕對(duì)的焦點(diǎn),在星塵智能的展臺(tái)上,由于 AI 機(jī)器人助理 S1 在一個(gè)展區(qū)上演揚(yáng)琴、武術(shù)、書法三臺(tái)大戲,能文能武,吸引了大量專業(yè)觀眾和媒體的駐足。
在帶彈性的琴弦上的優(yōu)雅演奏,讓 S1 展現(xiàn)出速度、力度、精度兼具的精細(xì)操作和絕對(duì)掌控。
央視新聞對(duì)「書法」背后的模仿學(xué)習(xí)和智能控制進(jìn)行了專題報(bào)道,公司創(chuàng)始人來杰解釋到,絲滑動(dòng)作的背后,是硬件側(cè)追求最好力控和最仿人身體指標(biāo)(速度、負(fù)載等),而是在 AI 側(cè)則采集人的真實(shí)動(dòng)作數(shù)據(jù),讓機(jī)器人遇強(qiáng)則強(qiáng),快速學(xué)習(xí)進(jìn)化。
而敏捷飄逸的詠春拳法,被現(xiàn)場(chǎng)觀眾點(diǎn)評(píng)為「剛?cè)岵?jì)」,賦予了機(jī)器人賽博葉問的風(fēng)采。
就在三天前,這位「AI 機(jī)器人助理」,還在家里里掃地、喂貓、攤餅、泡茶,被網(wǎng)友叫做「賽博管家」、「未來養(yǎng)老希望」。
Astribot星塵智能
反正已經(jīng)火出國(guó),被大名鼎鼎的 Figure AI 公司 CEO 看到了。
選取視頻中難度最高的功夫茶,仔細(xì)看看 S1 的表現(xiàn):
從洗、取、沏、端的十幾道工序,到使用碗、盞、壺、杯、勺等工具,抓放陶瓷、金屬、木頭和茶葉等物品,形狀、大小、材質(zhì)、重量完全不同,動(dòng)作都一氣呵成,展現(xiàn)了復(fù)雜情況實(shí)時(shí)感知,復(fù)雜流程的智能規(guī)劃與執(zhí)行。
力控不止精準(zhǔn) —— 拿木勺從瓷杯取茶,左右手用的力不同,且陶瓷光滑易碎,不能大力抓握;但下一秒拿起金屬水壺,力控必須實(shí)時(shí)調(diào)整,不然拎不起水壺倒水。
細(xì)節(jié)更是擬人到發(fā)指:遞茶時(shí)會(huì)輕點(diǎn)茶巾,抹去細(xì)微水漬,符合茶禮之道。
這種驚人的復(fù)雜規(guī)劃和精細(xì)操作能力,引來網(wǎng)友辣評(píng) —— 快進(jìn)到底特律:變?nèi)恕?/strong>
劃重點(diǎn),以上這些技能,全部是靠學(xué)出來,1 倍速、無(wú)遙操作(沒有住家保姆背后遙控)、實(shí)物實(shí)拍。
且不說它的敏捷、靈活和絲滑度,這份優(yōu)雅,無(wú)形中讓動(dòng)作帶了情緒價(jià)值。
茶藝、樂器等專家技能,人學(xué)起來并不那么容易,更別說大腦和身體一分為二的機(jī)器人,因此技術(shù)門檻挺高。
早在 2010 年,蘋果公司聯(lián)合創(chuàng)始人 Steve Wozniak 就提出過一個(gè)評(píng)估機(jī)器人智能的咖啡測(cè)試。要求機(jī)器人從進(jìn)入一個(gè)陌生的家中開始,找到廚房,識(shí)別工具(例如咖啡機(jī)、水壺)和材料(咖啡豆、糖、牛奶等),最終做好一杯咖啡,且全程不超過 20 分鐘。
這考驗(yàn)了機(jī)器人在未知環(huán)境中導(dǎo)航、識(shí)別物體、操作工具和材料,以及遵循人類命令等一系列能力。
有人發(fā)起過投票,2040 年這樣的機(jī)器人會(huì)誕生嗎?89% 的人投了 yes。
考慮到功夫茶的難度,以及 S1 的進(jìn)化速度,國(guó)產(chǎn)機(jī)器人離具身智能,更近了一點(diǎn)?
具身智能焦點(diǎn):高價(jià)值的上半身
今年四月,S1 曾用熨疊衣物、分揀整理、顛鍋炒菜、吸塵清潔、競(jìng)技疊杯等一系列令人眼花繚亂的復(fù)雜操作,奠定了同規(guī)格機(jī)器人中「最強(qiáng)操作性能」初印象。
8 月的發(fā)布,S1 不僅有了仿人的腰,還有實(shí)用的輪式底盤,能覆蓋人所在的大部分平面場(chǎng)景,包括家庭、辦公室、工廠到商場(chǎng)等。
雙足機(jī)器人無(wú)法彎腰撿東西,S1 極限下腰、蹲地喂貓都 OK。
無(wú)論是科研還是產(chǎn)業(yè)上,上肢操作正在逐漸成為具身智能的焦點(diǎn)。而從自然界發(fā)展史看,能用手干活的,基本是智能化水平非常高的哺乳動(dòng)物,人類大部分操作也由上肢和手完成。上半身的智能決策 + 操作,是能否解決真實(shí)需求和實(shí)際落地的核心技術(shù)壁壘。
具身智能的未來:軟硬一體
無(wú)論是「最強(qiáng)操作」、「高度像人」或是「動(dòng)作絲滑」等表現(xiàn)背后,星塵的核心技術(shù)壁壘是什么?
創(chuàng)始人來杰在采訪中提到,其秘訣是軟硬一體的系統(tǒng)架構(gòu),Design for AI。
一方面是硬件的軟硬一體,機(jī)器人既控制硬的準(zhǔn)度,又把握軟的力度。工業(yè)機(jī)械臂的剛度很高,能達(dá)到很高的精度,卻無(wú)法進(jìn)入家庭,因?yàn)槿岫炔粔颉H说氖种负茈y精確地移動(dòng)一毫米,但能靈活控制力度,而這才是交互的關(guān)鍵。S1 從結(jié)構(gòu)設(shè)計(jì)到底層硬件設(shè)計(jì),都會(huì)追求硬度和軟度的平衡。
第二層是軟件和硬件,即 AI 和機(jī)器人的強(qiáng)耦合。AI 依賴數(shù)據(jù),希望從中得到概念和洞察;而機(jī)器人來自存粹的物理世界,理解位置、力等多維度信息。星塵讓機(jī)器人 Design for AI,給 AI 更豐富、更高維度的數(shù)據(jù)(比如力、觸覺),讓 AI 能更有效的學(xué)習(xí)和執(zhí)行。
比如削黃瓜,S1 用傳感器監(jiān)測(cè)傳動(dòng)過程中力的變化,像人一樣,不用去估算軌跡,而是直接「感受」削皮刀在黃瓜上的力,再精準(zhǔn)控制力的輸出。這種獨(dú)特的剛?cè)狁詈蟼鲃?dòng)結(jié)構(gòu),不僅極大提升了動(dòng)作精度,也給 AI 提供了「力」的豐富數(shù)據(jù)。
如果黃瓜換成胡蘿卜,換成更大的蘿卜,都沒問題,S1 可以像人一樣去用「力」,就能像人一樣舉一反三去處理。
在研發(fā)中,星塵借鑒了騰訊 RoboticsX 機(jī)器人實(shí)驗(yàn)室的團(tuán)隊(duì)架構(gòu),一半人強(qiáng)調(diào)用 AI 算法做感知和運(yùn)動(dòng)控制,另一半人主攻機(jī)器人本體,持續(xù)推進(jìn)「軟硬一體」。
多維度數(shù)據(jù)打造最強(qiáng)大腦
除了「軟硬一體」,數(shù)據(jù)也將是具身智能的下一個(gè)分水嶺。
AI 發(fā)展的核心要素是算法、算力和數(shù)據(jù)。算力無(wú)法掌控,算法在持續(xù)進(jìn)化,恒定不變的只有數(shù)據(jù)。
一個(gè)冷知識(shí)是:都 GPT 時(shí)代了,要訓(xùn)練機(jī)器人,直接可用的數(shù)據(jù)幾乎為零。
來杰在百度時(shí),已意識(shí)到數(shù)據(jù)量級(jí)、數(shù)據(jù)維度的重要性,但機(jī)器人在數(shù)據(jù)維度上已經(jīng)多年未有提升。在星塵,他將對(duì)「力」的長(zhǎng)期思考和 AI 結(jié)合,打造了突破性的具身智能數(shù)據(jù)獲取方案。
具體而言,S1 能低成本、高效率地利用現(xiàn)有的真實(shí)世界視頻數(shù)據(jù)和人體動(dòng)作捕捉數(shù)據(jù),并通過第一人稱視角收集觸覺、力覺、視覺、聽覺等多維度高質(zhì)量數(shù)據(jù)。
只要與真實(shí)世界交互,S1 就能源源不斷產(chǎn)生新的「學(xué)習(xí)資料」,持續(xù)進(jìn)化,向通用人工智能邁進(jìn)。
機(jī)器人的安全與經(jīng)濟(jì)
機(jī)器人要成為人的助理,來杰認(rèn)為有兩個(gè)關(guān)鍵,一是安全,二要經(jīng)濟(jì)。
機(jī)器人的安全,不是把握精度,而是把握輕重,是跟人、跟物體交互的力度,這就讓安全的基礎(chǔ),又回到了「力」。
通過剛?cè)狁詈嫌布O(shè)計(jì)和創(chuàng)新力規(guī)劃算法,S1 無(wú)比安全,能在運(yùn)動(dòng)中不傷人、不傷己、不傷環(huán)境。
在大家最關(guān)心的價(jià)格問題上,依靠關(guān)鍵零部件自研,S1 具備明顯成本優(yōu)勢(shì)。來杰提到:「我們希望它是一輛車的價(jià)格,并隨整個(gè)行業(yè)發(fā)展,變成一個(gè)人人都能接受的價(jià)格」,這打開了科研、商用到家用場(chǎng)景的廣闊空間和想象力。
一個(gè)典型的應(yīng)用場(chǎng)景,是在生物、醫(yī)療或化學(xué)實(shí)驗(yàn)室中,需要高智力勞動(dòng),又繞不開重復(fù)枯燥、還要精細(xì)操作的實(shí)驗(yàn)。此時(shí)一個(gè)合格「專家機(jī)器人助理」,能準(zhǔn)確無(wú)誤、不分晝夜地為教授們工作,解放了勞動(dòng)力,也釋放了創(chuàng)造力,提供了更大的社會(huì)價(jià)值。
當(dāng) S1 能像人一樣學(xué)習(xí)、思考和勞動(dòng),與人流暢智能交互,使用人的工具和設(shè)備,幫人完成枯燥、困難或危險(xiǎn)的任務(wù)。這一切都將帶著溫度,體現(xiàn)出「高科技帶來更美好」(High Tech, High Life)的品牌理念。
鵝廠機(jī)器人實(shí)驗(yàn)室 1 號(hào)員工創(chuàng)業(yè)
星塵智能于 2022 年 12 月在深圳成立;名字源自拉丁古諺語(yǔ)「Ad astra per aspera」,意為「穿越苦旅,以達(dá)星塵」,代表了公司對(duì) AI 機(jī)器人技術(shù)普及的長(zhǎng)期計(jì)劃與堅(jiān)定承諾。
團(tuán)隊(duì)用一年時(shí)間精心打磨技術(shù)和產(chǎn)品,于 2024 年一月完成 S1 原型機(jī),四月首次展示,八月正式發(fā)布,連續(xù)引發(fā)行業(yè)討論,如此高效的成果背后,是一支實(shí)力強(qiáng)勁的團(tuán)隊(duì)在默默耕耘。
創(chuàng)始人來杰擁有超過 16 年的機(jī)器人研發(fā)經(jīng)驗(yàn),曾是騰訊 RoboticsX 機(jī)器人實(shí)驗(yàn)室 1 號(hào)成員,主導(dǎo)研發(fā)了輪腿式機(jī)器人 Ollie。此前擔(dān)任了百度「小度機(jī)器人」負(fù)責(zé)人。
另一位創(chuàng)始人戴媛,在 UIUC 獲得學(xué)士學(xué)位,后在 UCLA 拿下博士學(xué)位,主攻機(jī)器人感知。她在 Nature Comm 和 Science Adv 等頂刊上發(fā)表過 30 多篇論文,擁有 70 多項(xiàng)機(jī)器人專利。與來杰相同,她也是 2018 年就加入了剛剛成立的 RoboticsX。
初創(chuàng)團(tuán)隊(duì)中六位核心成員,全部來自騰訊 RobticsX 實(shí)驗(yàn)室,目前團(tuán)隊(duì)來自谷歌、華為、大疆、優(yōu)必選等大廠和頂尖高校。
通用機(jī)器人的未來:填補(bǔ)缺口、服務(wù)家庭
展望未來,隨著勞動(dòng)力缺口的擴(kuò)大和老齡化趨勢(shì)的加劇,通用機(jī)器人成為了一個(gè)至關(guān)重要的解決方案。有專家預(yù)測(cè),到 2035 年,全球?qū)⑿枰^ 1 億臺(tái)機(jī)器人來填補(bǔ)勞動(dòng)力的空缺。
不僅如此,家務(wù)勞動(dòng)的價(jià)值也常常被忽視,消耗了我們大量的閑暇時(shí)間。無(wú)論是在制造、物流等工業(yè)領(lǐng)域,還是在家庭中,機(jī)器人商業(yè)化的探索都是由實(shí)際需求驅(qū)動(dòng)的。然而,從長(zhǎng)期來看,機(jī)器人進(jìn)入普通家庭將是最具變革意義的一次應(yīng)用。每個(gè)人都曾幻想過擁有一個(gè)「賽博保姆」,就像電影《機(jī)器管家》中的安德魯,從燒飯、打掃衛(wèi)生到照顧孩子,無(wú)所不能。
來杰表示:公司愿景正是讓數(shù)十億人擁有 AI 機(jī)器人助理。無(wú)論是照顧家庭還是到工廠工作,AI 機(jī)器人在學(xué)習(xí)、決策和執(zhí)行上越像人,越能幫人做得更多、更好。也希望在未來五到十年內(nèi),AI 機(jī)器人能走進(jìn)千家萬(wàn)戶。
那關(guān)鍵問題,可能就像每次 S1 展示結(jié)束時(shí)希望激發(fā)想象的提問:「你還想讓 S1 為你做什么?」