自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

賬號(hào)設(shè)置退出

谷歌旗下 DeepMind 開發(fā)出 RoboCat AI 模型，能控制多種機(jī)器人執(zhí)行一系列任務(wù)

作者：遠(yuǎn)洋 2023-06-26 11:04:12

RoboCat 的靈感來自于 DeepMind 的另一個(gè) AI 模型 Gato，后者可以分析和處理文本、圖像和事件。RoboCat 的訓(xùn)練數(shù)據(jù)包括模擬和真實(shí)機(jī)器人的圖像和動(dòng)作數(shù)據(jù)，這些數(shù)據(jù)來自于虛擬環(huán)境中的其他機(jī)器人控制模型、人類控制的機(jī)器人以及 RoboCat 自身的前期版本。

6 月 26 日消息，谷歌旗下 DeepMind 表示，該公司已經(jīng)開發(fā)出一種名為 RoboCat 的人工智能模型，可以控制不同的機(jī)器人手臂執(zhí)行一系列任務(wù)。僅僅這一點(diǎn)并不特別新穎，但 DeepMind 聲稱，該模型是第一個(gè)能夠解決和適應(yīng)多種任務(wù)的模型，并且使用不同的、真實(shí)世界的機(jī)器人來完成。

RoboCat 的靈感來自于 DeepMind 的另一個(gè) AI 模型 Gato，后者可以分析和處理文本、圖像和事件。RoboCat 的訓(xùn)練數(shù)據(jù)包括模擬和真實(shí)機(jī)器人的圖像和動(dòng)作數(shù)據(jù)，這些數(shù)據(jù)來自于虛擬環(huán)境中的其他機(jī)器人控制模型、人類控制的機(jī)器人以及 RoboCat 自身的前期版本。

DeepMind 的研究科學(xué)家李亞歷克斯（Alex Lee）是 RoboCat 團(tuán)隊(duì)的合作者之一，他在接受 TechCrunch 郵件采訪時(shí)說：“我們證明了一個(gè)單一的大型模型可以在多個(gè)真實(shí)的機(jī)器人實(shí)體上解決多樣化的任務(wù)，并且可以快速地適應(yīng)新的任務(wù)和實(shí)體?！?/p>

IT之家注意到，為了訓(xùn)練 RoboCat，DeepMind 的研究人員首先使用人類控制的機(jī)械臂，在模擬或真實(shí)環(huán)境中收集了每個(gè)任務(wù)或機(jī)器人的 100 到 1000 次演示。例如，讓機(jī)械臂拾取齒輪或堆疊積木等。然后，他們對(duì) RoboCat 進(jìn)行微調(diào)，在每個(gè)任務(wù)上創(chuàng)建一個(gè)專門的“衍生”模型，讓它平均練習(xí) 10000 次。通過利用衍生模型生成的數(shù)據(jù)和演示數(shù)據(jù)，研究人員不斷擴(kuò)大 RoboCat 的訓(xùn)練數(shù)據(jù)集，并訓(xùn)練出新版本的 RoboCat。

最終版本的 RoboCat 在模擬和真實(shí)世界中，在總共 253 個(gè)任務(wù)上進(jìn)行了訓(xùn)練，并在這些任務(wù)的 141 個(gè)變體上進(jìn)行了測(cè)試。DeepMind 聲稱，在觀察了幾個(gè)小時(shí)內(nèi)收集的 1000 次人類控制的演示后，RoboCat 學(xué)會(huì)了操作不同類型的機(jī)械臂。雖然 RoboCat 已經(jīng)在四種有兩爪臂的機(jī)器人上進(jìn)行了訓(xùn)練，但該模型能夠適應(yīng)一種更復(fù)雜的有三指夾具和兩倍可控輸入的機(jī)械臂。

盡管如此，RoboCat 在 DeepMind 的測(cè)試中，在不同任務(wù)上的成功率也有很大差異，從最低的 13% 到最高的 99% 不等。這是在訓(xùn)練數(shù)據(jù)中有 1000 次演示的情況下；如果演示次數(shù)減半，成功率也會(huì)相應(yīng)降低。不過，在某些情況下，DeepMind 聲稱 RoboCat 只需要觀察 100 次演示就能學(xué)習(xí)新任務(wù)。

李亞歷克斯認(rèn)為，RoboCat 可能會(huì)降低解決新任務(wù)的難度?！爸灰o出一定數(shù)量的新任務(wù)演示，RoboCat 就可以微調(diào)到新任務(wù)，并且可以自我生成更多數(shù)據(jù)來進(jìn)一步提高?！彼a(bǔ)充說。

未來，研究團(tuán)隊(duì)的目標(biāo)是減少教授 RoboCat 完成新任務(wù)所需的演示次數(shù)，使其少于 10 次。

責(zé)任編輯：姜華來源： IT之家

點(diǎn)贊

51CTO技術(shù)棧公眾號(hào)

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營(yíng)