自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

認(rèn)真的嗎?讓機(jī)器狗當(dāng)守門員,還發(fā)了篇論文

人工智能 新聞
機(jī)器狗不僅能跑能跳,踢足球、當(dāng)守門員都很行。

讓一個機(jī)器狗擔(dān)當(dāng)足球守門員,靠譜嗎?靠不靠譜,我們先看看效果在下結(jié)論。

工作人員一次很溫和的進(jìn)攻,機(jī)器狗攔住了球:

圖片

加點(diǎn)難度,來個拋物線進(jìn)球,也不再話下:

圖片

用手拋球有作弊嫌疑?用腳試試,機(jī)器狗也能把球門守的死死的

圖片

有趣的是,該研究還嘗試讓一只機(jī)器狗踢球,另一只當(dāng)守門員,兩只機(jī)器狗自己也能玩挺好:

圖片

看完效果,感覺機(jī)器狗當(dāng)守門員還挺靠譜。這款機(jī)器狗是 MIT 在 2019 年研發(fā)的 Mini Cheetah,現(xiàn)在來自加州大學(xué)伯克利分校等機(jī)構(gòu)的研究者為 Mini Cheetah 部署了一個新的強(qiáng)化學(xué)習(xí)框架,讓它完成足球守門任務(wù),守門成功率高達(dá) 87.5%。

論文地址:https://arxiv.org/pdf/2210.04435.pdf

4 米開外踢球

Mini Cheetah 僅用不到 1 秒成功守門

讓 Mini Cheetah 學(xué)會守門還是一件比較難的事,因為這涉及物體(例如球)拋出的高度以及動態(tài)移動的位置,具體而言,一方操縱一個快速移動的球,球的方向和位置不確定,而另一方需要迅速判斷球的位置以阻止進(jìn)球。想要完成這一任務(wù),需要教會機(jī)器人動態(tài)移動它的身體,同時確保它的腳 (或臉) 到達(dá)它們需要及時阻擋球的地方,這基本上是將兩個難題結(jié)合在一起。

該研究的解決辦法是將運(yùn)動控制器與末端執(zhí)行器軌跡規(guī)劃相結(jié)合,這樣一來就可以找到最佳的方法讓 Mini Cheetah 在球到達(dá)目標(biāo)不到一秒的時間內(nèi),進(jìn)行阻擋。

完成上述過程,還需要訓(xùn)練 Mini Cheetah 掌握一套有用的守門員技能,例如 Mini Cheetah 需要掌握在地面附近和靠近地面的地方對球進(jìn)行側(cè)身攔截、掌握俯沖到達(dá)球門的下角技術(shù)、跳躍到球門的頂部和上角。做完這些動作,Mini Cheetah 都可以恢復(fù)并最終安全著陸。每個技能的參考動作都是手動編程的,在模擬中進(jìn)行訓(xùn)練,然后直接遷移到機(jī)器人上。

Mini Cheetah 防守的球門寬 1.5m,高 0.9m,球(3 號)從約 4m 外踢出,球被外部跟蹤,然后 Mini Cheetah 攔球。讓這么小的機(jī)器狗完成攔球動作,其表現(xiàn)是令人印象深刻的。

圖片

該研究表明,這款機(jī)器狗系統(tǒng)可以將在仿真中學(xué)習(xí)到的動態(tài)動作和守門員技能遷移到一個真正的四足機(jī)器人上,在現(xiàn)實(shí)世界中,對隨機(jī)射門的守門成功率為 87.5%。而人類足球守門員的平均成功率是 69%。研究人員表示,他們所提出的框架可以擴(kuò)展到其他場景,例如多技能足球。

下面我們來看看支持這款機(jī)器狗的背后框架。

分層強(qiáng)化學(xué)習(xí)框架

首先,讓四足機(jī)器人做足球守門員是一個很有挑戰(zhàn)性的問題,因為它必須要同時解決預(yù)測物體運(yùn)動軌跡和機(jī)器人捕獲非抓握物體(球體)兩個實(shí)際問題。機(jī)器人需要在很短的時間內(nèi)(通常不到一秒)對空中飛行的球做出反應(yīng)并攔截。

為了完成這個挑戰(zhàn),研究團(tuán)隊提出了一個分層無模型強(qiáng)化學(xué)習(xí) (RL) 框架。該框架包含一個針對不同運(yùn)動技能的多個控制策略,覆蓋了目標(biāo)的不同區(qū)域。

圖片

這些控制策略讓機(jī)器人能夠跟蹤隨機(jī)參數(shù)化末端執(zhí)行器的軌跡,同時執(zhí)行特定的運(yùn)動技能,例如跳躍攔球、撲球和順勢攔住地面滾動的球。

圖片

RL 框架中包含一個高級規(guī)劃器,它幫助機(jī)器人確定所需的運(yùn)動技能和規(guī)劃末端執(zhí)行器軌跡,以攔截飛向不同目標(biāo)區(qū)域的球。

該研究在 MIT 2019 年提出的 Mini Cheetah 四足機(jī)器人上部署了上述 RL 框架,實(shí)驗表明這種 RL 框架能夠讓四足機(jī)器人有效攔截現(xiàn)實(shí)世界中快速移動的球。

圖片

此前對四足機(jī)器人 RL 框架的研究主要集中在低級運(yùn)動控制上,例如讓機(jī)器人按要求速度步行、模仿參考運(yùn)動。而該研究提出的框架將學(xué)習(xí)到的運(yùn)動技能擴(kuò)展到更高級別的任務(wù)上,成功使用高級規(guī)劃讓四足機(jī)器人以敏捷的動作精確攔截快速移動的足球。這對四足機(jī)器人的高級規(guī)劃控制具有重要意義。

責(zé)任編輯:張燕妮 來源: 機(jī)器之心
相關(guān)推薦

2013-09-11 09:28:22

測試人員bug

2024-12-04 08:19:36

API網(wǎng)關(guān)微服務(wù)

2022-10-28 13:16:07

四足機(jī)器人機(jī)器人人工智能

2021-01-20 18:13:52

VRAR守門員

2016-09-23 18:40:42

微軟開源代碼開源社區(qū)

2016-10-11 11:38:06

程序員

2020-11-25 07:59:38

網(wǎng)頁設(shè)計響應(yīng)式

2024-09-30 10:27:22

2022-03-18 14:53:50

機(jī)器狗計算機(jī)人工智能

2020-10-21 14:52:00

神經(jīng)網(wǎng)絡(luò)AI算法

2017-06-14 17:18:43

機(jī)器學(xué)習(xí)數(shù)據(jù)研究回歸

2010-07-15 16:21:03

不可思議的服務(wù)器

2021-03-02 17:47:59

騰訊云AI

2009-05-21 15:58:12

程序員工作經(jīng)驗職場

2020-12-30 09:43:04

互聯(lián)網(wǎng)微軟芯片

2020-08-04 11:35:38

Vue前端裝飾器

2021-01-04 11:13:36

機(jī)器編程程序員代碼

2020-05-26 10:19:11

機(jī)器人人工智能系統(tǒng)

2010-05-13 21:30:23

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號