自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考華為認證廠商認證 IT技術(shù)PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設置退出

Science Robotics封面！DeepMind強化學習打造超一流機器人球員

作者：新智元 2024-04-15 08:20:00

人工智能新聞

雙足機器人運動技能突破！谷歌DeepMind創(chuàng)新深度強化學習框架，賦能仿人機器人全身控制，征戰(zhàn)足球賽場。機器人展現(xiàn)驚人動態(tài)技能，跌倒自恢復，戰(zhàn)術(shù)防守樣樣精通。

AI和機器人專家的長遠目標，是創(chuàng)造出具有一般具身智能的代理，它們能夠像動物或人類一樣，在物理世界中靈活、巧妙地行動。

這不僅涉及流暢的動作組合，還包括對環(huán)境的感知與理解，以及利用身體實現(xiàn)復雜目標的能力。

多年來，研究者們致力于在仿真和真實環(huán)境中創(chuàng)造出具備復雜運動能力的智能化身代理。

最近，這一領域取得了顯著的進展，其中深度強化學習發(fā)揮了至關重要的作用。

盡管四足機器人的應用已經(jīng)相當廣泛，但人形和雙足機器人的控制仍然面臨著諸多挑戰(zhàn)，包括穩(wěn)定性、安全性以及自由度等問題。

不過，近日Google DeepMind在仿人足球領域取得了突破性進展——

研究團隊不僅展示了深度強化學習如何孕育出高質(zhì)量的個體技能，如精準的踢球、快速的奔跑和靈活的轉(zhuǎn)身，更將這些技能巧妙地編織成一套敏捷的反應策略。

目前，相關成果已發(fā)表于《Science Robotics》，并成為該期的封面論文。

論文地址：https://www.science.org/doi/10.1126/scirobotics.adi8022

ROBOTIS OP3機器人平臺

研究人員采用ROBOTIS OP3機器人平臺，這款微型仿人機器人經(jīng)濟實惠，擁有20個可控關節(jié)，其靈活性足以應對復雜的足球動作。

在訓練中，機器人僅依靠板載傳感器如關節(jié)位置加速計和陀螺儀來感知環(huán)境，并通過板載計算機計算目標關節(jié)角度，實現(xiàn)精準的動作執(zhí)行。

為了確保機器人能夠?qū)崟r掌握球場動態(tài)，研究團隊還使用了實時運動捕捉系統(tǒng)，實時監(jiān)測兩個機器人和球的位置。

簡化足球比賽驗證技能與策略

為了測試這些技能的實戰(zhàn)效果，研究人員精心設計了一場簡化的單對單足球比賽。

在這個競技場上，兩位「選手」——兩臺仿人足球機器人，展開了激烈的較量。

球賽的規(guī)則為：進球者獲得獎勵，過于靠近對手則會受到懲罰。

這種巧妙的游戲設定，使得機器人能夠在不斷試錯中，逐步學會如何在激烈的對抗中保持優(yōu)勢。

Teacher策略提煉與Student策略集成

在訓練過程中，研究人員采用了分布式MPO這一非策略強化學習算法，對機器人進行了多階段的仿真訓練。

他們首先訓練了兩個teacher策略，分別負責站立和射門，隨后通過KL正則化方法將這兩個策略融合，形成一個student策略。

隨著訓練的深入，正則化逐漸減弱，最終行為得以自由優(yōu)化任務獎勵。

仿真訓練對于機器人技能的磨練至關重要，但如何確保這些技能能夠安全穩(wěn)健地應用于真實機器人，是另一個巨大的挑戰(zhàn)。

為此，研究團隊在訓練和仿真中加入了多種噪音，如觀測噪音和仿真動力學模型擾動，以增強機器人的魯棒性。

同時，他們還增加了仿真中的延遲，同時盡降低真實機器人控制軟件中的延遲，確保機器人能夠迅速響應。

鑒于機器人在進行動態(tài)踢踏運動時，其齒輪容易受到瞬時沖擊的影響，特別是膝蓋部位容易因此受損。

為了顯著降低機器人在游戲過程中由于高扭矩所引發(fā)的損壞風險，研究團隊在仿真環(huán)境中特別針對膝關節(jié)產(chǎn)生的高扭矩設定了懲罰機制。

通過這一措施，成功地引導機器人學習和采用更為柔和、穩(wěn)定的步態(tài)，顯著提高了其運動的安全性和穩(wěn)定性。

實戰(zhàn)表現(xiàn)展現(xiàn)高層次戰(zhàn)略意識

經(jīng)過這一系列訓練，機器人展現(xiàn)出了令人驚嘆的足球技能。

它們不僅能夠快速起身和行走，還能在比賽中靈活應對各種情況，如拒絕干擾、從跌倒中恢復、快速轉(zhuǎn)身射門和攔截移動中的球。

更令人驚訝的是，它們還表現(xiàn)出了高水平的戰(zhàn)略行為。比如，機器人會巧妙地利用位置優(yōu)勢，防御性地阻擋對手的射門，展現(xiàn)出與真實球員不相上下的競技水平。

責任編輯：張燕妮來源：新智元

機器人技能

51CTO技術(shù)棧公眾號

業(yè)務
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學堂精培企業(yè)培訓 CTO訓練營

<thead id="h7rt0"><delect id="h7rt0"></delect></thead>