自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

Science Robotics封面!DeepMind強化學習打造超一流機器人球員

人工智能 新聞
雙足機器人運動技能突破!谷歌DeepMind創(chuàng)新深度強化學習框架,賦能仿人機器人全身控制,征戰(zhàn)足球賽場。機器人展現(xiàn)驚人動態(tài)技能,跌倒自恢復,戰(zhàn)術(shù)防守樣樣精通。

AI和機器人專家的長遠目標,是創(chuàng)造出具有一般具身智能的代理,它們能夠像動物或人類一樣,在物理世界中靈活、巧妙地行動。

這不僅涉及流暢的動作組合,還包括對環(huán)境的感知與理解,以及利用身體實現(xiàn)復雜目標的能力。

圖片

多年來,研究者們致力于在仿真和真實環(huán)境中創(chuàng)造出具備復雜運動能力的智能化身代理。

最近,這一領域取得了顯著的進展,其中深度強化學習發(fā)揮了至關重要的作用。

盡管四足機器人的應用已經(jīng)相當廣泛,但人形和雙足機器人的控制仍然面臨著諸多挑戰(zhàn),包括穩(wěn)定性、安全性以及自由度等問題。

不過,近日Google DeepMind在仿人足球領域取得了突破性進展——

研究團隊不僅展示了深度強化學習如何孕育出高質(zhì)量的個體技能,如精準的踢球、快速的奔跑和靈活的轉(zhuǎn)身,更將這些技能巧妙地編織成一套敏捷的反應策略。

目前,相關成果已發(fā)表于《Science Robotics》,并成為該期的封面論文。

圖片

論文地址:https://www.science.org/doi/10.1126/scirobotics.adi8022

ROBOTIS OP3機器人平臺

研究人員采用ROBOTIS OP3機器人平臺,這款微型仿人機器人經(jīng)濟實惠,擁有20個可控關節(jié),其靈活性足以應對復雜的足球動作。

在訓練中,機器人僅依靠板載傳感器如關節(jié)位置加速計和陀螺儀來感知環(huán)境,并通過板載計算機計算目標關節(jié)角度,實現(xiàn)精準的動作執(zhí)行。

為了確保機器人能夠?qū)崟r掌握球場動態(tài),研究團隊還使用了實時運動捕捉系統(tǒng),實時監(jiān)測兩個機器人和球的位置。

圖片

簡化足球比賽驗證技能與策略

為了測試這些技能的實戰(zhàn)效果,研究人員精心設計了一場簡化的單對單足球比賽。

在這個競技場上,兩位「選手」——兩臺仿人足球機器人,展開了激烈的較量。

球賽的規(guī)則為:進球者獲得獎勵,過于靠近對手則會受到懲罰。

這種巧妙的游戲設定,使得機器人能夠在不斷試錯中,逐步學會如何在激烈的對抗中保持優(yōu)勢。

Teacher策略提煉與Student策略集成

在訓練過程中,研究人員采用了分布式MPO這一非策略強化學習算法,對機器人進行了多階段的仿真訓練。

他們首先訓練了兩個teacher策略,分別負責站立和射門,隨后通過KL正則化方法將這兩個策略融合,形成一個student策略。

圖片

圖片

隨著訓練的深入,正則化逐漸減弱,最終行為得以自由優(yōu)化任務獎勵。

仿真訓練對于機器人技能的磨練至關重要,但如何確保這些技能能夠安全穩(wěn)健地應用于真實機器人,是另一個巨大的挑戰(zhàn)。

為此,研究團隊在訓練和仿真中加入了多種噪音,如觀測噪音和仿真動力學模型擾動,以增強機器人的魯棒性。

圖片

同時,他們還增加了仿真中的延遲,同時盡降低真實機器人控制軟件中的延遲,確保機器人能夠迅速響應。

鑒于機器人在進行動態(tài)踢踏運動時,其齒輪容易受到瞬時沖擊的影響,特別是膝蓋部位容易因此受損。

為了顯著降低機器人在游戲過程中由于高扭矩所引發(fā)的損壞風險,研究團隊在仿真環(huán)境中特別針對膝關節(jié)產(chǎn)生的高扭矩設定了懲罰機制。

通過這一措施,成功地引導機器人學習和采用更為柔和、穩(wěn)定的步態(tài),顯著提高了其運動的安全性和穩(wěn)定性。

圖片

實戰(zhàn)表現(xiàn)展現(xiàn)高層次戰(zhàn)略意識

經(jīng)過這一系列訓練,機器人展現(xiàn)出了令人驚嘆的足球技能。

它們不僅能夠快速起身和行走,還能在比賽中靈活應對各種情況,如拒絕干擾、從跌倒中恢復、快速轉(zhuǎn)身射門和攔截移動中的球。

圖片

更令人驚訝的是,它們還表現(xiàn)出了高水平的戰(zhàn)略行為。比如,機器人會巧妙地利用位置優(yōu)勢,防御性地阻擋對手的射門,展現(xiàn)出與真實球員不相上下的競技水平。

圖片

責任編輯:張燕妮 來源: 新智元
相關推薦

2020-09-02 10:36:52

機器人人工智能系統(tǒng)

2023-09-21 10:29:01

AI模型

2023-04-25 11:44:36

垃圾分類AI

2022-10-08 09:53:17

AI算法

2021-03-25 14:46:24

人工智能機器學習技術(shù)

2024-09-05 08:23:58

2022-01-18 09:54:31

機器人收購人工智能

2023-10-09 12:36:25

AI模型

2021-04-15 16:38:38

新華三

2021-06-22 15:20:53

機器人人工智能技術(shù)

2022-05-06 13:59:10

機器人研發(fā)

2023-11-01 19:17:05

特斯拉機器人Optimus

2022-07-24 19:24:32

機器學習預訓練模型機器人

2025-04-15 09:15:00

AI機器人訓練

2022-11-02 14:02:02

強化學習訓練

2023-10-04 09:17:03

機器人AI

2021-09-03 16:12:52

機器人人工智能編程

2021-01-28 10:51:50

人工智能機器學習技術(shù)

2023-07-20 15:18:42

2021-01-12 14:50:55

機器學習人工智能計算機
點贊
收藏

51CTO技術(shù)棧公眾號