谷歌的一項(xiàng)新研究,讓機(jī)器狗小跑起來(lái)成為可能
本文轉(zhuǎn)自雷鋒網(wǎng),如需轉(zhuǎn)載請(qǐng)至雷鋒網(wǎng)官網(wǎng)申請(qǐng)授權(quán)。
3月4日,據(jù)外媒Tech Xplor報(bào)道,谷歌、佐治亞理工學(xué)院和加州大學(xué)伯克利分校(UC Berkeley)的研究人員聯(lián)合發(fā)表了一篇論文,詳細(xì)介紹了他們構(gòu)建的一個(gè)通過(guò)AI技術(shù)自學(xué)走路的四足機(jī)器人Rainbow Dash。它只需花費(fèi)約數(shù)個(gè)小時(shí),就能自己學(xué)會(huì)向前、向后以及左右轉(zhuǎn)彎等運(yùn)動(dòng)。
有觀點(diǎn)認(rèn)為,盡管機(jī)器人很能干,能代替人類實(shí)現(xiàn)很多事情,但自然形成的原始動(dòng)物還是比他們好很多。之所以這樣說(shuō)是因?yàn)椋麄兒茈y直接從狗身上學(xué)會(huì)像狗一樣去走路。
但是,近期谷歌人工智能實(shí)驗(yàn)室的一項(xiàng)研究顛覆了人們對(duì)于這件事的認(rèn)知,讓這個(gè)環(huán)節(jié)變得容易多了。
雷鋒網(wǎng)了解到,這項(xiàng)研究是谷歌人工智能實(shí)驗(yàn)室與加州大學(xué)伯克利分校一起合作進(jìn)行的,目的是找到一種能夠高效、自動(dòng)地將狗在輕快地小跑這種“敏捷行為”轉(zhuǎn)移到四足機(jī)器人身上的方法。這類事情以前就有人做過(guò),但正如研究人員的博客文章所指出的那樣,既定的培訓(xùn)過(guò)程往往“需要大量的專家洞察力,而且通常涉及對(duì)每項(xiàng)所需技能漫長(zhǎng)的獎(jiǎng)勵(lì)調(diào)整過(guò)程”。
學(xué)會(huì)適應(yīng)環(huán)境的隨機(jī)性
當(dāng)然,這個(gè)摸索和擴(kuò)展的過(guò)程是非常不容易的,甚至必要時(shí)需要配合手動(dòng)調(diào)整以確保動(dòng)物的動(dòng)作能被機(jī)器人很好地模仿。而即使是一個(gè)非常像狗的機(jī)器人實(shí)際上也不是狗,而且狗的移動(dòng)方式可能也不是機(jī)器人應(yīng)該有的方式,因?yàn)檫@會(huì)導(dǎo)致后者摔倒、被鎖住或以其他方式失敗告終。
谷歌人工智能項(xiàng)目通過(guò)在正常的秩序中添加一些可控制的混亂來(lái)解決這個(gè)問(wèn)題。通常情況下,狗的動(dòng)作會(huì)被捕捉,像腳和關(guān)節(jié)這樣的關(guān)鍵點(diǎn)會(huì)被仔細(xì)追蹤。在數(shù)字模擬中,這些點(diǎn)將近似于機(jī)器人的點(diǎn),虛擬版的機(jī)器人試圖用自己的動(dòng)作來(lái)模擬狗的運(yùn)動(dòng),學(xué)習(xí)它的動(dòng)作。
到目前為止,一切都很好,但真正的問(wèn)題是當(dāng)你試圖用模擬的結(jié)果來(lái)控制一個(gè)真正的機(jī)器人時(shí),現(xiàn)實(shí)世界并不是一個(gè)具有理想化的摩擦規(guī)則的二維平面。不幸的是,這意味著未經(jīng)修正的基于模擬的步態(tài)會(huì)使機(jī)器人直接在現(xiàn)實(shí)中的地面開(kāi)始行走。
雷鋒網(wǎng)了解到,為了防止這種情況的發(fā)生,研究人員在模擬中使用的物理參數(shù)中加入了隨機(jī)因素,使得虛擬機(jī)器人的重量更大,或者電機(jī)更弱,或者與地面的摩擦更大。這使得描述如何走路的機(jī)器學(xué)習(xí)模型不得不考慮到如何抵消各種各樣、微小的差異和它們?cè)谏a(chǎn)過(guò)程中造成的復(fù)雜情況。
學(xué)會(huì)適應(yīng)這種隨機(jī)性,使得四足機(jī)器人學(xué)習(xí)走路的方法在現(xiàn)實(shí)世界中更加穩(wěn)健,可以模仿目標(biāo)狗的行走,甚至更復(fù)雜的動(dòng)作,比如轉(zhuǎn)彎和旋轉(zhuǎn),而不需要任何人工干預(yù),只需要一點(diǎn)額外的虛擬訓(xùn)練。
當(dāng)然,如果需要的話,手動(dòng)調(diào)整仍然可以添加到混合中,但就目前的情況來(lái)看,這與以前完全自動(dòng)完成的工作相比是一個(gè)很大的改進(jìn)。
谷歌對(duì)機(jī)器人的探索
除了這個(gè)四足機(jī)器人,年初谷歌推出了一款基于AI的聊天機(jī)器人,名叫Meena,與此前最新的聊天機(jī)器人相比,它可以進(jìn)行更合理、更具體的對(duì)話。
據(jù)公開(kāi)數(shù)據(jù),Meena有26億個(gè)參數(shù),并接受了341 GB文本的訓(xùn)練,這些文本從公共領(lǐng)域的社交媒體對(duì)話中被篩選出來(lái)。與現(xiàn)有最新的生成模型OpenAI GPT-2相比,Meena具有1.7倍的模型容量,并接受了8.5倍的數(shù)據(jù)進(jìn)行訓(xùn)練??梢允沟昧奶斓倪^(guò)程更為有趣。
另外,當(dāng)我們還在為自己芯片研發(fā)苦苦掙扎的時(shí)候,谷歌AI已經(jīng)可以自己設(shè)計(jì)芯片。
根據(jù)公開(kāi)信息,用AI來(lái)設(shè)計(jì)AI芯片,最初是因?yàn)楣雀柙O(shè)計(jì)算法的速度要遠(yuǎn)高于芯片設(shè)計(jì)的時(shí)間,比如某些神經(jīng)網(wǎng)絡(luò)架構(gòu)已經(jīng)出來(lái)了,但是匹配的硬件加速器還是兩年前的,這樣使得先進(jìn)的算法只能在比較“落后”的硬件上運(yùn)行,因此它的運(yùn)行狀況就不會(huì)理想。要解決這個(gè)問(wèn)題,谷歌最終給出的方案就是“讓AI設(shè)計(jì)AI芯片”,這樣芯片的設(shè)計(jì)時(shí)間就會(huì)大為縮短。
而未來(lái),這種技術(shù)很有可能在機(jī)器人上應(yīng)用,從而使得機(jī)器人具備“意識(shí)”······
談及Google 機(jī)器人的輝煌經(jīng)歷,最早可以追溯到2013 年。
那一年,被稱為 Android 之父的 Andy Rubin 親自掛帥,連續(xù)收購(gòu)了 9 個(gè)機(jī)器人公司,其中包括當(dāng)時(shí)專為軍方研究機(jī)器人的 波士頓動(dòng)力、以及曾在 DARPA 機(jī)器人挑戰(zhàn)賽中獲勝的 Schaft等??梢哉f(shuō),他們的起點(diǎn)非常高。
然而,2017 年,波士頓動(dòng)力被賣給了軟銀,隨后Schaft也被正式關(guān)閉。
近年來(lái),他們繼續(xù)在四足機(jī)器人方面發(fā)力,包括此次讓機(jī)器狗小跑起來(lái)的這項(xiàng)研究,不知是不是后悔當(dāng)年痛失波士頓動(dòng)力。
根據(jù)工研院 IEK 的研究報(bào)告預(yù)估,預(yù)計(jì)至 2021 年,全球智能機(jī)器人的市場(chǎng)規(guī)模將增長(zhǎng)至 336 億美元。
除了Google、亞馬遜、微軟,還有許多初創(chuàng)公司也投入到了機(jī)器人領(lǐng)域。但依據(jù)當(dāng)前市場(chǎng)情況來(lái)看,能夠進(jìn)入市場(chǎng)的商業(yè)化機(jī)器人還比較少。
而就在去年,波士頓動(dòng)力宣布Spot將四足機(jī)器人開(kāi)始商業(yè)化,同年已經(jīng)有一些企業(yè)收到了Spot并展開(kāi)應(yīng)用測(cè)試,它們?cè)谌祟惖牟倏叵峦瓿山ㄖさ匮矙z、巡航追蹤工程進(jìn)度等工作。到了11月,Spot迎來(lái)了第一個(gè)商業(yè)買家——德國(guó)公司HoloBuilder,該公司與波士頓動(dòng)力的合作,進(jìn)一步推動(dòng)建筑行業(yè)的數(shù)字化和自動(dòng)化,將現(xiàn)實(shí)捕捉的大量工作轉(zhuǎn)移到機(jī)器人平臺(tái)上去。
今年2月20日,據(jù)日本媒體報(bào)道,日本鹿島建設(shè)株式會(huì)社發(fā)布消息稱,已在施工現(xiàn)場(chǎng)引入了四足行走機(jī)器人“Spot”。利用四足行走機(jī)器人在隧道施工現(xiàn)場(chǎng)進(jìn)行實(shí)證試驗(yàn)后,還對(duì)其進(jìn)行升級(jí)以應(yīng)對(duì)更加惡劣的地形,希望能使得“Spot”不僅能完成自動(dòng)化巡邏等任務(wù),還可以緩解建筑行業(yè)人手不足的問(wèn)題。
波士頓動(dòng)力創(chuàng)始人兼CEO雷博特曾表示:機(jī)器人將比互聯(lián)網(wǎng)還強(qiáng)大?;ヂ?lián)網(wǎng)提供了大眾一個(gè)知識(shí)接觸的管道,但是并沒(méi)有給予人們接觸真實(shí)世界的機(jī)會(huì),但機(jī)器人加上互聯(lián)網(wǎng)可以讓人類操控、拿取實(shí)體物件,也就是又增加了一個(gè)認(rèn)識(shí)世界的維度。
或許在錯(cuò)失波士頓動(dòng)力這件事情上,很難說(shuō)得上好壞,但谷歌機(jī)器人項(xiàng)目的一舉一動(dòng),仍然值得我們關(guān)注。