自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

谷歌旗下 DeepMind 開發(fā)出 RoboCat AI 模型,能控制多種機(jī)器人執(zhí)行一系列任務(wù)

人工智能
RoboCat 的靈感來自于 DeepMind 的另一個(gè) AI 模型 Gato,后者可以分析和處理文本、圖像和事件。RoboCat 的訓(xùn)練數(shù)據(jù)包括模擬和真實(shí)機(jī)器人的圖像和動(dòng)作數(shù)據(jù),這些數(shù)據(jù)來自于虛擬環(huán)境中的其他機(jī)器人控制模型、人類控制的機(jī)器人以及 RoboCat 自身的前期版本。

6 月 26 日消息,谷歌旗下 DeepMind 表示,該公司已經(jīng)開發(fā)出一種名為 RoboCat 的人工智能模型,可以控制不同的機(jī)器人手臂執(zhí)行一系列任務(wù)。僅僅這一點(diǎn)并不特別新穎,但 DeepMind 聲稱,該模型是第一個(gè)能夠解決和適應(yīng)多種任務(wù)的模型,并且使用不同的、真實(shí)世界的機(jī)器人來完成。

RoboCat 的靈感來自于 DeepMind 的另一個(gè) AI 模型 Gato,后者可以分析和處理文本、圖像和事件。RoboCat 的訓(xùn)練數(shù)據(jù)包括模擬和真實(shí)機(jī)器人的圖像和動(dòng)作數(shù)據(jù),這些數(shù)據(jù)來自于虛擬環(huán)境中的其他機(jī)器人控制模型、人類控制的機(jī)器人以及 RoboCat 自身的前期版本。

DeepMind 的研究科學(xué)家李亞歷克斯(Alex Lee)是 RoboCat 團(tuán)隊(duì)的合作者之一,他在接受 TechCrunch 郵件采訪時(shí)說:“我們證明了一個(gè)單一的大型模型可以在多個(gè)真實(shí)的機(jī)器人實(shí)體上解決多樣化的任務(wù),并且可以快速地適應(yīng)新的任務(wù)和實(shí)體?!?/p>

IT之家注意到,為了訓(xùn)練 RoboCat,DeepMind 的研究人員首先使用人類控制的機(jī)械臂,在模擬或真實(shí)環(huán)境中收集了每個(gè)任務(wù)或機(jī)器人的 100 到 1000 次演示。例如,讓機(jī)械臂拾取齒輪或堆疊積木等。然后,他們對(duì) RoboCat 進(jìn)行微調(diào),在每個(gè)任務(wù)上創(chuàng)建一個(gè)專門的“衍生”模型,讓它平均練習(xí) 10000 次。通過利用衍生模型生成的數(shù)據(jù)和演示數(shù)據(jù),研究人員不斷擴(kuò)大 RoboCat 的訓(xùn)練數(shù)據(jù)集,并訓(xùn)練出新版本的 RoboCat。

最終版本的 RoboCat 在模擬和真實(shí)世界中,在總共 253 個(gè)任務(wù)上進(jìn)行了訓(xùn)練,并在這些任務(wù)的 141 個(gè)變體上進(jìn)行了測(cè)試。DeepMind 聲稱,在觀察了幾個(gè)小時(shí)內(nèi)收集的 1000 次人類控制的演示后,RoboCat 學(xué)會(huì)了操作不同類型的機(jī)械臂。雖然 RoboCat 已經(jīng)在四種有兩爪臂的機(jī)器人上進(jìn)行了訓(xùn)練,但該模型能夠適應(yīng)一種更復(fù)雜的有三指夾具和兩倍可控輸入的機(jī)械臂。

盡管如此,RoboCat 在 DeepMind 的測(cè)試中,在不同任務(wù)上的成功率也有很大差異,從最低的 13% 到最高的 99% 不等。這是在訓(xùn)練數(shù)據(jù)中有 1000 次演示的情況下;如果演示次數(shù)減半,成功率也會(huì)相應(yīng)降低。不過,在某些情況下,DeepMind 聲稱 RoboCat 只需要觀察 100 次演示就能學(xué)習(xí)新任務(wù)。

李亞歷克斯認(rèn)為,RoboCat 可能會(huì)降低解決新任務(wù)的難度?!爸灰o出一定數(shù)量的新任務(wù)演示,RoboCat 就可以微調(diào)到新任務(wù),并且可以自我生成更多數(shù)據(jù)來進(jìn)一步提高?!彼a(bǔ)充說。

未來,研究團(tuán)隊(duì)的目標(biāo)是減少教授 RoboCat 完成新任務(wù)所需的演示次數(shù),使其少于 10 次。

責(zé)任編輯:姜華 來源: IT之家
相關(guān)推薦

2025-03-13 10:28:07

2023-03-09 06:31:14

視覺語(yǔ)言模型人工智能

2023-05-19 12:54:33

StabilityAI開源

2024-01-05 19:44:48

谷歌機(jī)器人憲法AI

2010-07-15 14:49:05

AIX TELNET

2010-03-30 09:40:30

IE系統(tǒng)補(bǔ)丁

2018-03-29 08:25:54

主存儲(chǔ)優(yōu)化系列

2017-09-22 22:30:39

網(wǎng)絡(luò)

2023-09-21 10:29:01

AI模型

2019-02-15 10:38:30

機(jī)器人人工智能系統(tǒng)

2022-09-14 12:59:27

人工智能運(yùn)動(dòng)課程足球比賽

2024-01-05 09:16:22

谷歌機(jī)器人人工智能

2024-04-15 08:20:00

機(jī)器人技能

2021-04-07 14:35:39

谷歌AR WebAR

2024-12-13 15:41:46

2023-07-29 13:43:26

機(jī)器人模型

2020-10-22 06:29:39

編程前端開發(fā)

2010-02-05 10:31:46

谷歌機(jī)器人

2019-03-27 09:27:06

機(jī)器人人工智能系統(tǒng)

2011-06-16 10:46:50

思科網(wǎng)真
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)