自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

旋轉(zhuǎn)角度目標(biāo)檢測(cè)的重要性!

人工智能 新聞
任意方向的目標(biāo)檢測(cè)是一項(xiàng)具有挑戰(zhàn)性的任務(wù)。由于遙感圖像中的物體方向是任意的,使用水平邊界框會(huì)導(dǎo)致檢測(cè)精度低?,F(xiàn)有的基于回歸的旋轉(zhuǎn)檢測(cè)器會(huì)導(dǎo)致邊界不連續(xù)的問(wèn)題。

本文經(jīng)計(jì)算機(jī)視覺(jué)研究院公眾號(hào)授權(quán)轉(zhuǎn)載,轉(zhuǎn)載請(qǐng)聯(lián)系出處。

圖片

論文地址:https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=9521517

一、背景

目標(biāo)檢測(cè)是計(jì)算機(jī)視覺(jué)中的一項(xiàng)基本任務(wù),許多研究人員已經(jīng)應(yīng)用水平邊界框來(lái)定位圖像中的物體。 水平邊界框的使用可以使候選區(qū)域的表示更加簡(jiǎn)潔直觀。 在許多基于深度學(xué)習(xí)的方法中,往往需要大量標(biāo)記樣本來(lái)訓(xùn)練目標(biāo)檢測(cè)器模型,使用軸平行標(biāo)記框可以大大提高標(biāo)記效率,快速獲取大量標(biāo)記樣本。 此外,水平邊界框涉及的參數(shù)較少,簡(jiǎn)化了檢測(cè)模型的訓(xùn)練過(guò)程。 因此,在大多數(shù)目標(biāo)檢測(cè)方法中,使用水平邊界框來(lái)表示遙感圖像中目標(biāo)的大致范圍,如下圖所示。

圖片

然而,航拍圖像中的物體通常是任意方向的。因此,使用水平邊界框來(lái)檢測(cè)目標(biāo)會(huì)引起幾個(gè)問(wèn)題。首先,這種類(lèi)型的物體檢測(cè)框通常包含許多背景區(qū)域。如上圖(a)所示,圖中大約60%的區(qū)域?qū)儆诒尘皡^(qū)域。檢測(cè)框內(nèi)存在過(guò)多的背景區(qū)域,不僅增加了分類(lèi)任務(wù)的難度,而且會(huì)導(dǎo)致目標(biāo)范圍表示不準(zhǔn)確的問(wèn)題。其次,水平邊界框會(huì)導(dǎo)致檢測(cè)框之間出現(xiàn)強(qiáng)烈重疊,如上圖(b)所示,降低檢測(cè)精度。最后,由于飛機(jī)、船舶、車(chē)輛等圖像中的物體包含運(yùn)動(dòng)方向信息,如果使用水平邊界框,則無(wú)法獲得目標(biāo)運(yùn)動(dòng)方向的信息。

圖片

上述三個(gè)問(wèn)題可以通過(guò)使用帶有角度信息的旋轉(zhuǎn)檢測(cè)框有效解決,如上圖所示。首先,旋轉(zhuǎn)檢測(cè)可以精確定位圖像中的物體,并且邊界框幾乎不包含背景區(qū)域,從而減少背景對(duì)物體分類(lèi)的影響。其次,旋轉(zhuǎn)檢測(cè)框之間幾乎沒(méi)有重疊,從而可以更清晰地識(shí)別框內(nèi)包含的物體。最后,可以從旋轉(zhuǎn)檢測(cè)框粗略得到物體的運(yùn)動(dòng)方向信息,從而判斷物體的運(yùn)動(dòng)軌跡。綜上所述,在遙感圖像目標(biāo)檢測(cè)任務(wù)中使用帶有角度信息的旋轉(zhuǎn)檢測(cè)框獲得了優(yōu)越的性能。

二、前言

任意方向的目標(biāo)檢測(cè)是一項(xiàng)具有挑戰(zhàn)性的任務(wù)。由于遙感圖像中的物體方向是任意的,使用水平邊界框會(huì)導(dǎo)致檢測(cè)精度低。現(xiàn)有的基于回歸的旋轉(zhuǎn)檢測(cè)器會(huì)導(dǎo)致邊界不連續(xù)的問(wèn)題。

在今天的分享中,研究者提出了一種基于角度分類(lèi)的遙感圖像目標(biāo)檢測(cè)方法,該方法使用帶有角度信息的旋轉(zhuǎn)檢測(cè)邊界框來(lái)檢測(cè)對(duì)象。具體來(lái)說(shuō),研究者將神經(jīng)架構(gòu)搜索框架與特征金字塔網(wǎng)絡(luò) (NAS-FPN) 模塊結(jié)合到密集檢測(cè)器 (RetinaNet) 中,并在角度分類(lèi)中使用二進(jìn)制編碼方法。這種方法減少了背景影響,使得檢測(cè)框之間幾乎沒(méi)有重疊。根據(jù)檢測(cè)框的角度,我們可以推斷出目標(biāo)的運(yùn)動(dòng)方向信息,進(jìn)一步確定目標(biāo)的運(yùn)動(dòng)軌跡。

研究者對(duì)一個(gè)可用于航空影像 (DOTA) 中的目標(biāo)檢測(cè)的大型公共數(shù)據(jù)進(jìn)行了消融實(shí)驗(yàn),以驗(yàn)證該方法中每個(gè)模塊的有效性,并將該方法與其他幾種檢測(cè)方法進(jìn)行比較。實(shí)驗(yàn)結(jié)果證明了新提出方法的有效性。

三、新框架

圖片

新提出的旋轉(zhuǎn)檢測(cè)器框架如上圖所示。網(wǎng)絡(luò)基于RetinaNet框架。圖中標(biāo)記為C2、C3、C4的特征圖是由深度卷積神經(jīng)網(wǎng)絡(luò)提取的。該方法的總體步驟如下:首先利用特征提取網(wǎng)絡(luò)對(duì)遙感圖像中的特征進(jìn)行提取,利用NAS-FPN對(duì)提取的特征進(jìn)行融合,得到不同尺度的特征圖。然后,使用長(zhǎng)邊定義方法來(lái)表示旋轉(zhuǎn)檢測(cè)框,并在框回歸任務(wù)中使用二進(jìn)制編碼標(biāo)記技術(shù)將角度回歸問(wèn)題轉(zhuǎn)化為角度分類(lèi)問(wèn)題。下面詳細(xì)描述該方法中的一些重要結(jié)構(gòu)。

NAS-FPN

在NAS-FPN中,最重要的結(jié)構(gòu)是由特征圖節(jié)點(diǎn)集合、操作池和搜索終止條件組成的合并單元結(jié)構(gòu)。下圖簡(jiǎn)要描述了特征圖的搜索過(guò)程。

圖片

1)從特征圖節(jié)點(diǎn)集中隨機(jī)選擇一個(gè)特征圖作為輸入之一。初始特征圖節(jié)點(diǎn)集包含五個(gè)尺度的特征圖,表示為 {C1,C2, C3, C4, C5}。

2)從特征圖節(jié)點(diǎn)集中隨機(jī)選擇另一個(gè)特征圖作為另一個(gè)輸入。

3)選擇輸出特征圖的分辨率。

4)在操作池中選擇一個(gè)操作對(duì)(1)(2)中選擇的特征圖節(jié)點(diǎn)進(jìn)行操作,產(chǎn)生與輸出特征圖分辨率相同的特征圖,并將該特征圖加入到特征圖節(jié)點(diǎn)集合中選擇。

5) 循環(huán)重復(fù)上述步驟。搜索的終止條件是生成五個(gè)與初始特征圖分辨率相同的特征金字塔網(wǎng)絡(luò),記為{P1, P2, P3, P4, P5}。

ROTATION DETECTION FRAME

典型的角度編碼方法有三種,包括兩種不同角度范圍的五參數(shù)方法和一種八參數(shù)方法。詳細(xì)情況如下:

圖片

角度范圍為90°的五參數(shù)法(OpenCV定義法):其示意圖如上圖所示。該定義法包含五個(gè)參數(shù)[x,y,w,h,θ]。其中,x和y為旋轉(zhuǎn)坐標(biāo)系的中心坐標(biāo),θ為旋轉(zhuǎn)坐標(biāo)系與x軸的銳角,逆時(shí)針?lè)较蛑付樨?fù)角,因此角度范圍為[?90° , 0); 旋轉(zhuǎn)框的寬度w為旋轉(zhuǎn)框所在的邊角,旋轉(zhuǎn)框的高度h為另一邊。

圖片

180°角范圍的五參數(shù)法

圖片

八參數(shù)法

八參數(shù)法:該定義方法示意圖如上圖所示,該定義方法包含8個(gè)參數(shù)[a1,a2,b1,b2,c1,c2,d1,d2], 定義的左上角為起點(diǎn),其余點(diǎn)按逆時(shí)針順序排列。旋轉(zhuǎn)坐標(biāo)系的表示不限于上述三種方法,旋轉(zhuǎn)坐標(biāo)系其余部分的表示可以通過(guò)上述三種方法的變換得到。

ANGLE CODING METHOD

圖片

90°范圍的五參數(shù)定義方法的問(wèn)題

圖片

八參數(shù)四邊形定義方法的問(wèn)題

角度編碼方法:

圖片

圖片

四、實(shí)驗(yàn)及可視化

實(shí)驗(yàn)環(huán)境

圖片

DOTA數(shù)據(jù)集上的性能比較

圖片


圖片

圖片

責(zé)任編輯:張燕妮 來(lái)源: 計(jì)算機(jī)視覺(jué)研究院
相關(guān)推薦

2020-07-04 10:41:00

物聯(lián)網(wǎng)平臺(tái)MVNO物聯(lián)網(wǎng)

2023-10-24 11:07:57

2010-07-30 16:28:06

2013-08-08 10:10:06

備份策略全備份增量備份

2020-08-27 07:00:00

代碼軟件應(yīng)用程序

2017-12-29 10:14:48

IT項(xiàng)目

2011-07-05 18:30:44

站內(nèi)優(yōu)化

2020-09-30 14:12:07

網(wǎng)絡(luò)安全

2009-12-25 15:00:48

WPF軟件

2016-08-29 20:31:17

2009-11-25 17:36:38

PHP函數(shù)includ

2009-03-03 17:25:41

2010-07-05 14:27:30

UML各種圖形

2021-12-22 23:12:19

物聯(lián)網(wǎng)隱私安全

2022-11-04 14:13:54

2014-04-23 11:36:29

運(yùn)維日志

2011-08-11 10:12:11

2021-06-29 20:50:29

端點(diǎn)安全網(wǎng)絡(luò)安全數(shù)據(jù)安全

2013-05-06 10:49:59

虛擬化IT戰(zhàn)略

2018-11-06 09:31:34

物聯(lián)網(wǎng)分析AoT物聯(lián)網(wǎng)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)