自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

機(jī)器人落地「秘訣」:持續(xù)學(xué)習(xí)、知識遷移和自主參與

人工智能 新聞
亞馬遜機(jī)器人實(shí)驗室的三位頂級科學(xué)家,在 ICRA 會議上探討了機(jī)器人的現(xiàn)有挑戰(zhàn)。

機(jī)器人落地「秘訣」:持續(xù)學(xué)習(xí)、知識遷移和自主參與

本文轉(zhuǎn)自雷鋒網(wǎng),如需轉(zhuǎn)載請至雷鋒網(wǎng)官網(wǎng)申請授權(quán)。

?2022年5月23日,一年一度的機(jī)器人技術(shù)領(lǐng)域的頂級國際會議 ICRA 2022 (IEEE International Conference on Robotics and Automation) 在美國費(fèi)城如期舉行。

這是ICRA舉辦的第39個年頭。ICRA 是 IEEE 機(jī)器人和自動化學(xué)會的旗艦會議,也是機(jī)器人研究者展示和討論他們工作的主要國際論壇。

在今年的ICRA上,亞馬遜的三位首席機(jī)器人專家,Sidd Srinivasa、 Tye Brady 和 Philipp Michel 簡單討論了在現(xiàn)實(shí)世界中構(gòu)建人機(jī)互動的機(jī)器人系統(tǒng)所面臨的挑戰(zhàn)。

機(jī)器人落地「秘訣」:持續(xù)學(xué)習(xí)、知識遷移和自主參與

圖注:從左到右為亞馬遜機(jī)器人人工智能主管 Sidd Srinivasa,亞馬遜機(jī)器人公司(全球)首席技術(shù)專家 Tye Brady,以及亞馬遜 Scout 應(yīng)用科學(xué)高級經(jīng)理 Philipp MichelSidd

Srinivasa是全球知名的機(jī)器人專家,IEEE Fellow,現(xiàn)任華盛頓大學(xué)波音特聘教授,同時是 Amazon 機(jī)器人人工智能項目的負(fù)責(zé)人,負(fù)責(zé)管理協(xié)助 Amazon 物流中心員工的自主機(jī)器人的算法,研究可以收拾和包裝產(chǎn)品的機(jī)器人和可自主搬卸和運(yùn)輸貨物的推車式機(jī)器人。

Tye Brady是亞馬遜機(jī)器人公司(全球)首席技術(shù)專家,MIT航空航天工程碩士背景。而Philipp Michel與Sidd Srinivasa同為CMU機(jī)器人研究所的博士校友,是亞馬遜Scout機(jī)器人項目的高級經(jīng)理。

在探討解決機(jī)器人落地挑戰(zhàn)的問題上,他們提出了自己的看法。AI科技評論作了不改原意的整理,如下:

Q: 你們在機(jī)器人領(lǐng)域的研究分別解決不同的問題,這些問題之間有什么相同點(diǎn)?

Sidd Srinivasa:機(jī)器人研究的一個重要難點(diǎn)是:我們生活在一個開放的世界中。我們甚至不知道即將面對的「輸入」是什么。在我們的營運(yùn)中心,我需要操控超過2000萬件物品,而且這些物品還以每天成千上百件的數(shù)量在增加。大部分時候,我們的機(jī)器人并不清楚它們所拾起的物品是什么,但它們需要小心地拾起物品,并在不損壞物品的前提下將物品進(jìn)行快速包裝。

Philipp Michel:對于Scout來說,難點(diǎn)是在人行道上遇到的物體,以及運(yùn)送的環(huán)境。我們在美國四個州都部署了私人送貨設(shè)備。天氣狀況、光照條件……我們從一開始就明確要處理大量的變量,使機(jī)器人能夠適應(yīng)復(fù)雜的環(huán)境。

Tye Brady:在開發(fā)執(zhí)行機(jī)器人的過程中,我們有一個顯著的優(yōu)勢,就是在半結(jié)構(gòu)化的環(huán)境中展開運(yùn)營。我們可以自行制定機(jī)器人的交通規(guī)則,了解環(huán)境真的有助于我們的科學(xué)家和工程師深入理解我們要移動、操作、分類和識別的物體,完成訂單。也就是說,我們可以在真實(shí)世界中實(shí)現(xiàn)對技術(shù)的追求。

Philipp Michel :還有另一個共同點(diǎn),就是我們非常依賴從數(shù)據(jù)中學(xué)習(xí),以解決問題。Scout 會在執(zhí)行任務(wù)的過程中接收真實(shí)世界的數(shù)據(jù),然后不斷迭代開發(fā)用于感知、定位和導(dǎo)航的機(jī)器學(xué)習(xí)解決方案。

Sidd Srinivasa:我完全同意(從數(shù)據(jù)中學(xué)習(xí)解決問題)。我認(rèn)為機(jī)器學(xué)習(xí)和自適應(yīng)控制是超線性規(guī)模拓展的關(guān)鍵。如果我們部署了成千上萬的機(jī)器人,我們不可能有成千上萬的科學(xué)家和工程師來研究它們,我們需要依賴真實(shí)世界的數(shù)據(jù),實(shí)現(xiàn)超線性地增長。

另外,我認(rèn)為開放的世界會迫使我們思考怎樣「持續(xù)學(xué)習(xí)」。我們的機(jī)器學(xué)習(xí)模型往往是基于一些輸入數(shù)據(jù)分布來訓(xùn)練的,但因為這是一個開放的世界,會遇到「協(xié)變量轉(zhuǎn)移」(covariate shift)的問題,也就是看到的數(shù)據(jù)與分布不匹配,這會導(dǎo)致機(jī)器學(xué)習(xí)模型常常沒來由地過于自信。

因此,我們所做的大量工作就是創(chuàng)建一個「watchdogs」(看門狗,一種監(jiān)督設(shè)備),用來識別輸入數(shù)據(jù)分布何時偏離了它所受訓(xùn)的分布。然后,我們再進(jìn)行「重要性抽樣」(importance sampling),這樣我們就可以挑選出已經(jīng)改變的數(shù)據(jù),重新訓(xùn)練機(jī)器學(xué)習(xí)模型。

Philipp Michel:這也是為什么我們想要在不同的地方訓(xùn)練機(jī)器人的原因之一,這樣我們就可以盡早知道機(jī)器人可能遇到的現(xiàn)實(shí)數(shù)據(jù),反過來迫使我們開發(fā)能夠解決新數(shù)據(jù)的方案。

Sidd Srinivasa:這的確是個好主意。擁有多機(jī)器人的優(yōu)點(diǎn)之一就是系統(tǒng)能夠識別出變化的內(nèi)容,重新進(jìn)行訓(xùn)練,然后將這些知識分享給其他機(jī)器人。

想到一個分揀機(jī)器人的故事:在世界的某個角落,一個機(jī)器人遇到一個新的包裝類型。一開始,它很困擾,因為它從來沒有見過這種情況,也無法識別出來。后來出現(xiàn)了一個新的解決方案:這只機(jī)器人可以將新的包裝類型傳輸給世界上所有機(jī)器人。如此一來,當(dāng)這種新包裝類型出現(xiàn)在其他地方,其余機(jī)器人就知曉如何處理了。相當(dāng)于有了一個「備份」,新的數(shù)據(jù)出現(xiàn)在一個點(diǎn),其他點(diǎn)都會知道,因為系統(tǒng)已經(jīng)能夠重新自我訓(xùn)練、并分享信息了。

Philipp Michel:我們的機(jī)器人也在做類似的事情。如果我們的機(jī)器人遇到之前沒有遇到過的新障礙,我們會嘗試調(diào)整模型來識別與處理這些障礙,隨后將新的模型部署到所有的機(jī)器人上。

讓我夜不能寐的一件事情是,我們的機(jī)器人會在人行道上遇到新的物體,但這些物體在接下來的三年都不會再遇到,例如:人們在萬圣節(jié)上用來裝飾草坪的滴水獸,或者人們在野餐的桌子上放一把傘、使桌子看起來不像「野餐桌」。對于這種情況,所有的機(jī)器學(xué)習(xí)算法都無法識別出這是一張野餐桌。

因此,我們的部分研究還是關(guān)于如何平衡無需糾結(jié)的普通事物與具體類別的事物。如果這是一個敞開的井蓋口,那么機(jī)器人一定要善于識別,不然它會掉下去。但如果它只是一個隨機(jī)的盒子,我們可能就不需要知道這個盒子的層次結(jié)構(gòu),只需要知道這是我們要繞過去的物體即可。

Sidd Srinivasa:另一個挑戰(zhàn)是,當(dāng)你改變你的模型時,可能會出現(xiàn)意想不到的后果。改變后的模型也許不會影響機(jī)器人的感知,但可能會改變機(jī)器人「剎車」方式,導(dǎo)致兩個月后滾珠軸承磨損。在端到端的系統(tǒng)中,未來許多有趣的研究都是關(guān)于“理解系統(tǒng)部分更改對整個系統(tǒng)性能的影響”。

Philipp Michel:我們花了很多時間思考是否應(yīng)該劃分機(jī)器人堆棧的不同部分。在他們之間做整合能夠帶來很多好處,但也是有限的。一個極端情況是攝像頭到電機(jī)到扭矩的學(xué)習(xí),這在任何現(xiàn)實(shí)世界的機(jī)器人應(yīng)用中都是非常具有挑戰(zhàn)性的。還有就是傳統(tǒng)的機(jī)器人堆棧,它被很好地分成了定位、感知、規(guī)劃和控制等部分。

我們還花了很多時間思考堆棧應(yīng)該如何隨著時間的推移而發(fā)展,把這些部分更緊密地結(jié)合在一起時性能有什么提升?同時,我們希望有一個系統(tǒng)盡可能地保持可解釋性。我們試圖最大化利用整個堆棧的學(xué)習(xí)組件集成,同時保留可解釋性和安全功能的數(shù)量。

Sidd Srinivasa:這個觀點(diǎn)很贊,我完全同意 Philipp 的觀點(diǎn),用一個模型來統(tǒng)治所有模型未必是正確的。但通常,我們最終建立的機(jī)器學(xué)習(xí)模型共享一個主干,有多個應(yīng)用的頭。一個物體是什么,分割一個物體意味著什么?可能類似于挑選、堆放或者包裝,但是每一個都需要專門的頭,搭載在專門任務(wù)的主干上。

Philipp Michel:我們考慮的一些因素是電池、行程、溫度、空間和計算限制。因此,我們需要高效使用我們的模型、優(yōu)化模型、并嘗試盡可能多地利用共享主干,就像 Sidd 提到的,不同的頭用于不同的任務(wù)。

機(jī)器人落地「秘訣」:持續(xù)學(xué)習(xí)、知識遷移和自主參與

圖注:Amazon Scout 是一個自動送貨機(jī)器人,它可以在公共人行道上以步行的速度移動,目前正在美國四個州進(jìn)行實(shí)地測試。

Q:當(dāng)我問及你們項目之間的共性時,我想到的一件事是你們的機(jī)器人都是和人類在同樣的環(huán)境中工作。為什么這會使問題復(fù)雜化呢?

Sidd Srinivasa:機(jī)器人正在走近人類生活,我們必須尊重發(fā)生在人類世界中的所有復(fù)雜的互動。除了走路、開車、執(zhí)行任務(wù)外,還有復(fù)雜的社交。對機(jī)器人來說重要的是,首先,要有意識;其次,要參與其中。

這真的很難,當(dāng)你在開車的時候,有時很難判斷其他人在想什么,也很難根據(jù)他們的想法來決定如何行動。僅僅是推理問題就很難,然后閉環(huán)就更難了。

如果機(jī)器人正在下棋或與人對弈,那么預(yù)測他們將要做什么就容易多了,因為規(guī)則已經(jīng)很好地制定了。如果你假設(shè)你的對手是最優(yōu)的,那么你會做得很好,即使他們是次優(yōu)的。這在某些雙人游戲中是種保證。

但實(shí)際情況并非如此,我們在玩這種確保雙贏的合作博弈發(fā)現(xiàn),博弈時其實(shí)很難準(zhǔn)確預(yù)測,即便合作者也是好意。

Philipp Michel:而且人類世界的行為變化很大。有的寵物完全無視機(jī)器人,有的寵物會走向機(jī)器人。行人也是如此,有些人對機(jī)器人視而不見,而有些人則徑直走近它。特別是孩子,他們的好奇心超強(qiáng),互動非常密切,我們需要能夠安全地處理所有相處場景,這些可變性讓人躍躍欲試。?

責(zé)任編輯:張燕妮 來源: 雷鋒網(wǎng)
相關(guān)推薦

2020-08-24 09:08:17

機(jī)器人自主研發(fā)技術(shù)

2024-05-20 09:44:13

人工智能機(jī)器人

2020-10-15 15:42:00

人工智能

2018-07-06 10:19:55

仿生機(jī)器人仿生神經(jīng)機(jī)器人

2017-05-09 15:39:33

ensorFlow機(jī)器人機(jī)器學(xué)習(xí)

2016-06-02 11:45:34

2020-02-23 23:16:18

機(jī)器人物聯(lián)網(wǎng)人工智能

2021-07-22 10:17:55

加密機(jī)器人加密貨幣機(jī)器人

2021-08-19 15:44:20

機(jī)器人人工智能機(jī)器學(xué)習(xí)

2015-07-28 09:36:11

機(jī)器人

2017-03-30 10:24:10

機(jī)器人

2021-11-18 14:23:22

機(jī)器人人工智能AI

2017-03-30 15:00:48

機(jī)器人語言自主交流

2021-11-06 10:53:07

機(jī)器學(xué)習(xí)機(jī)器人AI

2023-11-28 10:54:49

機(jī)器人人工智能

2011-03-29 17:37:19

地震機(jī)器人

2015-12-10 21:49:32

IM機(jī)器人

2022-01-04 10:34:06

機(jī)器人人工智能算法
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號