自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

未知物體也能輕松識別分割,效果可遷移

人工智能
目標發(fā)現(xiàn)網(wǎng)絡以圖像的一個裁剪部分作為輸入,裁剪的部分應該包含圖像的大部分區(qū)域,且這部分圖像并沒有在其他方面進行增強處理。

從來沒有見過的新物體,它也能進行很好地分割。

這是DeepMind研究出的一種新的學習框架:目標發(fā)現(xiàn)和表示網(wǎng)絡(Object discovery and representation networks,簡稱Odin)

圖片

以往的自我監(jiān)督學習(SSL)方法能夠很好地描述整個大的場景,但是很難區(qū)分出單個的物體。

現(xiàn)在,Odin方法做到了,并且是在沒有任何監(jiān)督的情況下做到的。

區(qū)分出圖像中的單個物體可不是很容易的事,它是怎么做到的呢?

方法原理

能夠很好地區(qū)分出圖像中的各個物體,主要歸功于Odin學習框架的“自我循環(huán)”。

Odin學習了兩組協(xié)同工作的網(wǎng)絡,分別是目標發(fā)現(xiàn)網(wǎng)絡和目標表示網(wǎng)絡。

目標發(fā)現(xiàn)網(wǎng)絡以圖像的一個裁剪部分作為輸入,裁剪的部分應該包含圖像的大部分區(qū)域,且這部分圖像并沒有在其他方面進行增強處理。

然后對輸入圖像生成的特征圖進行聚類分析,根據(jù)不同的特征對圖像中各個物體的進行分割。

圖片

目標表示網(wǎng)絡的輸入視圖是目標發(fā)現(xiàn)網(wǎng)絡中所生成的分割圖像。

視圖輸入之后,對它們分別進行隨機預處理,包括翻轉(zhuǎn)、模糊和點級顏色轉(zhuǎn)換等。

這樣就能夠獲得兩組掩模,它們除了剪裁之外的差異,其他信息都和底層圖像內(nèi)容相同。

而后兩個掩模會通過對比損失,進而學習能夠更好地表示圖像中物體的特征。

具體來說,就是通過對比檢測,訓練一個網(wǎng)絡來識別不同目標物體的特征,同時還有許多來自其他不相干物體的“負面”特征。

然后,最大化不同掩模中同一目標物體的相似性,最小化不同目標物體之間的相似性,進而更好地進行分割以區(qū)別不同目標物體。

圖片

與此同時,目標發(fā)現(xiàn)網(wǎng)絡會定期根據(jù)目標表示網(wǎng)絡的參數(shù)進行相應的更新。

最終的目的是確保這些對象級的特性在不同的視圖中大致不變,換句話說就是將圖像中的物體分隔開來。

那么Odin學習框架的效果究竟如何呢?

能夠很好地區(qū)分未知物體

Odin方法在場景分割時,沒有先驗知識的情況下遷移學習的性能也很強大。

首先,使用Odin方法在ImageNet數(shù)據(jù)集上進行預訓練,然后評估其在COCO數(shù)據(jù)集以及PASCAL和Cityscapes語義分割上的效果。

已經(jīng)知道目標物體,即獲得先驗知識的方法在進行場景分割時,效果要明顯好于其他未獲得先驗知識的方法。

而Odin方法即使未獲得先驗知識,其效果也要優(yōu)于獲得先驗知識的DetCon和ReLICv2。

圖片

圖片

除此之外,Odin方法不僅可以應用在ResNet模型中,還可以應用到更復雜的模型中,如Swim Transformer。

圖片

在數(shù)據(jù)上,Odin框架學習的優(yōu)勢很明顯,那在可視化的圖像中,Odin的優(yōu)勢在何處體現(xiàn)了呢?

將使用Odin生成的分割圖像與隨機初始化的網(wǎng)絡(第3列),ImageNet監(jiān)督的網(wǎng)絡(第4列)中獲得的分割圖像進行比較。

第3、4列都未能清晰地描繪出物體的邊界,或者缺乏現(xiàn)實世界物體的一致性和局部性,而Odin生成的圖像效果很明顯要更好一些。

圖片

參考鏈接:

[1] https://twitter.com/DeepMind/status/1554467389290561541

[2] ?https://arxiv.org/abs/2203.08777

責任編輯:武曉燕 來源: 量子位
相關推薦

2024-06-07 11:24:20

2021-12-27 07:45:30

CSS 技巧煙霧效果

2012-05-21 15:41:40

2024-07-30 10:51:51

2025-03-03 10:00:00

2024-11-20 08:09:19

RabbitMQ項目客戶端

2023-04-27 09:27:44

視頻AI

2014-12-17 12:46:17

華為存儲

2019-10-29 09:55:59

人臉識別人工智能亞馬遜

2015-10-28 14:03:32

數(shù)據(jù)遷移數(shù)據(jù)

2011-04-14 10:18:20

數(shù)據(jù)遷移

2022-12-26 08:25:16

CSS函數(shù)節(jié)流

2015-01-19 09:37:00

2025-01-07 07:00:00

DDD微服務MySQL

2017-09-15 13:48:58

支付寶

2016-07-12 09:40:30

惡意程序TLS加密惡意流量

2018-09-14 10:09:42

微軟人工智能開發(fā)

2012-06-29 09:47:39

2011-05-31 16:38:47

Android 實現(xiàn)語音
點贊
收藏

51CTO技術棧公眾號