自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

機(jī)器人懂點(diǎn)「常識」,找東西快多了:CMU打造新型語義導(dǎo)航機(jī)器人

新聞 人工智能
想讓機(jī)器人像人一樣思考,似乎一直是個難題。例如,讓機(jī)器人去拿放在「植物」旁邊的遙控器,機(jī)器人幾乎立即檢測出了「植物」盆栽所在的位置,從而檢測到遙控器的存在。

本文經(jīng)AI新媒體量子位(公眾號ID:QbitAI)授權(quán)轉(zhuǎn)載,轉(zhuǎn)載請聯(lián)系出處。

 想讓機(jī)器人像人一樣思考,似乎一直是個難題。

例如,讓機(jī)器人去拿放在「植物」旁邊的遙控器,機(jī)器人幾乎立即檢測出了「植物」盆栽所在的位置,從而檢測到遙控器的存在。

項目已被ECCV 2020收錄,并獲得了居住地目標(biāo)導(dǎo)航挑戰(zhàn)賽的第一名。

一起來看看實現(xiàn)的過程。

讓機(jī)器人「學(xué)點(diǎn)常識」

事實上,以往大部分采用機(jī)器學(xué)習(xí)訓(xùn)練的語義導(dǎo)航機(jī)器人,找東西的效果都不太好。

相比于人類潛意識中形成的常識,機(jī)器人往往有點(diǎn)“死腦筋”,它們更傾向于去記住目標(biāo)物體的位置。

但物體所處的場景往往非常復(fù)雜,而且彼此間差異很大(正所謂每個人的家,亂得各有章法),如果單純以大量不同場景對系統(tǒng)進(jìn)行訓(xùn)練,模型泛化能力都不太好。

于是,相比于用更多的樣本對系統(tǒng)進(jìn)行訓(xùn)練,這次研究者們換了一種思路:

采用半監(jiān)督學(xué)習(xí)的方式,使用一種名為semantic curiosity(語義好奇心)的獎勵機(jī)制對系統(tǒng)進(jìn)行訓(xùn)練。

訓(xùn)練的核心目的,是讓系統(tǒng)基于對語義的「理解」來確定目標(biāo)物體的最優(yōu)位置,換而言之,就是讓機(jī)器人“學(xué)點(diǎn)常識”。

舉個例子,通過理解冰箱和洗手間的差異,機(jī)器人就能搞懂目標(biāo)物體和房間布局的關(guān)系,并計算出最容易找到某個物體的房間。(就像沙發(fā)通常會在客廳、而不是在洗手間)

一旦確定了物體最可能出現(xiàn)的地方,機(jī)器人就能通過導(dǎo)航,直接去往預(yù)計的位置,并快速檢測到目標(biāo)物體的存在,這個過程被稱之為探索策略(exploration policy)。

采用Mask RCNN訓(xùn)練探索策略

如下圖所示,策略的實現(xiàn)被分成了三步:學(xué)習(xí)、訓(xùn)練、測試。

機(jī)器人懂點(diǎn)「常識」,找東西快多了:CMU打造新型語義導(dǎo)航機(jī)器人

首先,采用Mask RCNN對圖像從上至下進(jìn)行目標(biāo)預(yù)測,用于訓(xùn)練探索策略,后者負(fù)責(zé)生成目標(biāo)檢測和場景分割所需的訓(xùn)練數(shù)據(jù)。

對訓(xùn)練數(shù)據(jù)進(jìn)行標(biāo)記后,數(shù)據(jù)會被用于微調(diào)和評估目標(biāo)檢測及場景分割的效果。

在目標(biāo)檢測的過程中,即使面對某一物體的鏡頭轉(zhuǎn)360度,機(jī)器人也必須將之識別為同一種物體。

這其中最關(guān)鍵的一個步驟,在于構(gòu)造語義地圖。

構(gòu)造「有魔法的」地圖

從下圖可見,圖像被處理成RGB和Depth兩種模式。

機(jī)器人懂點(diǎn)「常識」,找東西快多了:CMU打造新型語義導(dǎo)航機(jī)器人

其中,RGB圖像會通過Mask RCNN網(wǎng)絡(luò),用于獲得目標(biāo)分割預(yù)測。

而Depth架構(gòu),則被用于計算點(diǎn)云,其中的每個點(diǎn),都會在Mask RCNN的預(yù)測結(jié)果基礎(chǔ)上與語義標(biāo)簽進(jìn)行關(guān)聯(lián)。

最后,基于幾何計算,會在空間中會生成一個三維立體圖。

每一個通道用于表示一種物體類別,原本2D的地圖就會轉(zhuǎn)變成一個3D的語義地圖。

有了語義地圖,機(jī)器人在移動時也能準(zhǔn)確地對3D空間進(jìn)行目標(biāo)預(yù)測了。

「語義好奇心」獎勵機(jī)制

不過,這會出現(xiàn)一種情況,如果目標(biāo)物體在不同的幀上被預(yù)測的標(biāo)簽不同,那么語義圖中對應(yīng)這個物體的多個通道都會是1。

如下圖,不同的時間,系統(tǒng)預(yù)測的目標(biāo)標(biāo)簽可能并不一樣,有時候是床,有時候則變成了沙發(fā)。

機(jī)器人懂點(diǎn)「常識」,找東西快多了:CMU打造新型語義導(dǎo)航機(jī)器人

這就出現(xiàn)了語義好奇心的策略。

論文定義了語義好奇心累計獎勵(cumulative semantic curiosity reward),指占語義地圖中所有元素總和的比例。

而語義好奇心獎勵機(jī)制,則采用強(qiáng)化學(xué)習(xí)的方式,目的是使這個比例最大化。

機(jī)器人懂點(diǎn)「常識」,找東西快多了:CMU打造新型語義導(dǎo)航機(jī)器人

通過了解物體之間的差異、從而了解房間布局,系統(tǒng)就會逐漸理解房間與物體的聯(lián)系。

實驗結(jié)果

事實證明,這種方法非常有效。

機(jī)器人在訓(xùn)練過程中,可以專注地去理解目標(biāo)物體與房間布局的關(guān)系,而非不停地進(jìn)行路徑規(guī)劃。

訓(xùn)練出的機(jī)器人,在人機(jī)交互方向上變得更加容易操控。

例如,在各種方法下,即使探索區(qū)域不及倒數(shù)第二和第三種方法,但語義好奇心仍然檢測出了相當(dāng)?shù)哪繕?biāo)數(shù)量。

機(jī)器人懂點(diǎn)「常識」,找東西快多了:CMU打造新型語義導(dǎo)航機(jī)器人

這說明它在進(jìn)行目標(biāo)檢測時,能更專注于所需要探測的物體。

而從下圖可見,語義好奇心明顯發(fā)現(xiàn)了更多其他策略無法發(fā)現(xiàn)的物體,這對于檢測目標(biāo)是非常有效的。

機(jī)器人懂點(diǎn)「常識」,找東西快多了:CMU打造新型語義導(dǎo)航機(jī)器人

在最終的訓(xùn)練結(jié)果中,語義好奇心拿到了最高的39.96分。

機(jī)器人懂點(diǎn)「常識」,找東西快多了:CMU打造新型語義導(dǎo)航機(jī)器人

這個方法,使得人與機(jī)器人之間的交互也變得更加容易實現(xiàn)。

作者介紹

Devendra Singh Chaplot,在卡內(nèi)基梅隆大學(xué)(CMU)讀博,主要研究深度強(qiáng)化學(xué)習(xí)、以及其在機(jī)器人和自然語言處理方向上的應(yīng)用。

[[334879]]

傳送門:

論文鏈接:https://arxiv.org/pdf/2006.09367.pdf

項目鏈接:https://devendrachaplot.github.io/projects/SemanticCuriosity

 

責(zé)任編輯:張燕妮 來源: 量子位
相關(guān)推薦

2020-04-09 09:56:55

機(jī)器人導(dǎo)航框架

2020-10-15 15:42:00

人工智能

2021-07-22 10:17:55

加密機(jī)器人加密貨幣機(jī)器人

2021-08-19 15:44:20

機(jī)器人人工智能機(jī)器學(xué)習(xí)

2015-07-28 09:36:11

機(jī)器人

2015-12-10 21:49:32

IM機(jī)器人

2012-03-08 09:42:16

開源軟件Linux

2013-11-12 10:37:20

開源自動導(dǎo)航藍(lán)牙機(jī)器人

2017-08-21 13:31:44

AI聊天機(jī)器人facebook

2024-12-25 11:30:43

2023-08-21 13:31:36

2022-06-06 14:56:03

機(jī)器人算法模型

2022-10-21 17:30:26

機(jī)器人

2019-03-05 10:38:44

機(jī)器人人工智能系統(tǒng)

2022-07-28 11:26:41

人工智能機(jī)器人

2019-01-27 15:03:52

機(jī)器人下崗智障機(jī)器人

2020-04-10 21:36:46

協(xié)作機(jī)器人物聯(lián)網(wǎng)機(jī)器人

2021-08-19 15:46:08

機(jī)器人人工智能機(jī)器學(xué)習(xí)

2021-01-28 19:34:49

人工智能AI機(jī)器人
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號