自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

改進(jìn)的檢測算法:用于高分辨率光學(xué)遙感圖像目標(biāo)檢測

人工智能 新聞
目標(biāo)檢測對光學(xué)遙感圖像的解釋至關(guān)重要,可以作為研究利用遙感的其他視覺任務(wù)的基礎(chǔ)。然而,目前在光學(xué)遙感圖像中使用的目標(biāo)檢測網(wǎng)絡(luò)沒有充分利用特征金字塔的輸出,因此仍有改進(jìn)檢測的潛力。

本文經(jīng)計算機(jī)視覺研究院公眾號授權(quán)轉(zhuǎn)載,轉(zhuǎn)載請聯(lián)系出處。

01 前景概要

目前,難以在檢測效率和檢測效果之間獲得適當(dāng)?shù)钠胶狻N覀兙脱芯砍隽艘环N用于高分辨率光學(xué)遙感圖像中目標(biāo)檢測的增強(qiáng)YOLOv5算法,利用多層特征金字塔、多檢測頭策略和混合注意力模塊來提高光學(xué)遙感圖像的目標(biāo)檢測網(wǎng)絡(luò)的效果。根據(jù)SIMD數(shù)據(jù)集,新算法的mAP比YOLOv5好2.2%,比YOLOX好8.48%,在檢測效果和速度之間實現(xiàn)了更好的平衡。

02 背景&動機(jī)

隨著遙感技術(shù)的快速發(fā)展,高分辨率光學(xué)遙感圖像已被用于描述地球表面的許多物體,包括飛機(jī)、汽車、建筑物等。目標(biāo)檢測在遙感圖像的解釋中起著至關(guān)重要的作用,可用于遙感圖像的分割、描述和目標(biāo)跟蹤。然而,由于其相對較大的視場和高海拔的必要性,航空光學(xué)遙感圖像表現(xiàn)出尺度、視點(diǎn)特異性、隨機(jī)定向和高背景復(fù)雜性的多樣性,而大多數(shù)傳統(tǒng)數(shù)據(jù)集包含地面視圖。因此,用于構(gòu)建人工特征的對象檢測技術(shù)傳統(tǒng)上在精度和速度方面具有較差的記錄?;诰矸e神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測算法明顯比傳統(tǒng)的目標(biāo)檢測方法更高效。由于社會的需要和深度學(xué)習(xí)發(fā)展的支持,在光學(xué)遙感圖像中使用神經(jīng)網(wǎng)絡(luò)進(jìn)行目標(biāo)檢測是必要的。

目前結(jié)合深度學(xué)習(xí)分析光學(xué)遙感照片的目標(biāo)檢測算法可以分為有監(jiān)督、監(jiān)督不力或無監(jiān)督。然而,由于無監(jiān)督和弱監(jiān)督算法的復(fù)雜性和不穩(wěn)定性,監(jiān)督算法是最常用的算法。此外,監(jiān)督目標(biāo)檢測算法可以分為單階段或兩階段?;陲w機(jī)通常位于機(jī)場,船舶通常位于港口和海洋的假設(shè),在下采樣衛(wèi)星圖像中檢測機(jī)場和港口,然后將發(fā)現(xiàn)的項目映射回原始的超高分辨率衛(wèi)星圖像,可以成功地同時檢測不同大小的物體。有研究者提出了一種基于RCNN的旋轉(zhuǎn)目標(biāo)檢測方法,通過解決目標(biāo)方向的隨機(jī)化問題,提高遙感圖像中目標(biāo)檢測的準(zhǔn)確性。

03 新算法研究

目前的大多數(shù)YOLO系列檢測頭都是基于FPN和PAFPN的輸出特性,其中基于FPN的網(wǎng)絡(luò),如YOLOv3及其變體如下圖a所示,它們直接利用單向融合特性進(jìn)行輸出,YOLOv4和YOLOv5的基于PAFPN算法在此基礎(chǔ)上增加了一個低電平到高電平的信道,它直接向上傳輸?shù)图壭畔ⅲㄏ聢Db)。

如上圖c所示,類似地,在一些研究中,TPH-YOLOv5模型中的特定檢測任務(wù)添加了一個檢測頭。在上圖b,c中,只有PAFPN功能用于輸出,而FPN功能未得到充分利用。因此,YOLOv7將三個輔助磁頭連接到FPN輸出,如上圖d所示,盡管輔助磁頭僅用于“粗略選擇”,并且重量較低。SSD的檢測頭是為了改善YOLO網(wǎng)絡(luò)對錨集過于粗糙的設(shè)計而提出的,如上圖e所示,設(shè)計概念主要由多個尺度上具有多個縱橫比的密集錨設(shè)計組成。受圖c–e的啟發(fā),我們研究并提出了一種用于YOLO檢測頭的多檢測頭策略,如圖f所示,該策略可以同時利用PANet和FPN的特征信息。此外,在64倍下采樣處直接添加了輸出頭,這使得網(wǎng)絡(luò)包含先前的全局信息。

多檢測頭方法可以有效地利用網(wǎng)絡(luò)的輸出特征。改進(jìn)的YOLO是一個用于高分辨率遙感照片的目標(biāo)探測網(wǎng)絡(luò)。如下圖所示:

圖片

主干網(wǎng)的基本結(jié)構(gòu)是以C3和卷積模塊為核心的CSP密集網(wǎng)。在數(shù)據(jù)增強(qiáng)之后,圖像被饋送到網(wǎng)絡(luò)中,并且在核大小6的Conv模塊進(jìn)行信道混合之后,許多卷積模塊檢索特征。在名為SPPF的特征增強(qiáng)模塊之后,他們連接到Neck的PANet。為了提高網(wǎng)絡(luò)的檢測能力,進(jìn)行了雙向特征融合。Conv2d用于獨(dú)立縮放融合的特征層,以生成多層輸出。如下圖a所示,NMS算法將所有單層檢測器的輸出組合在一起,生成最終的檢測幀。

圖片

下圖b描述了改進(jìn)的YOLO網(wǎng)絡(luò)每個模塊的結(jié)構(gòu)組成。

圖片

Conv包括2D卷積層、BN層批量歸一化和Silu激活函數(shù),C3包括兩個2D卷積層和一個瓶頸層,Upsample是上采樣層。SPPF模塊是SPP模塊的加速版本,MAB模塊如上面提及的所示,其中ECA如左下角所示。在沒有降維的信道級全局平均池化之后,考慮到每個信道與其k個鄰居的關(guān)系,使用大小為k的快速1D卷積來捕獲局部跨信道交互信息,從而有效地執(zhí)行ECA。上述兩個變換沿著兩個空間方向收集特征,以產(chǎn)生一對方向感知特征圖,然后將其連接起來,并使用卷積和Sigmoid函數(shù)進(jìn)行修改,以提供注意力輸出。

04 實驗及可視化

SIMD數(shù)據(jù)集是一個多類別、開源、高分辨率遙感對象檢測數(shù)據(jù)集,共包含15個類別,如圖4所示。此外,SIMD數(shù)據(jù)集更多地分布在中小型目標(biāo)(w<0.4,h<0.4)中,并且我們提出的改進(jìn)YOLO用于檢測該區(qū)域的檢測頭是普通YOLO算法使用的檢測頭數(shù)量的兩倍,因此改進(jìn)的YOLO在該數(shù)據(jù)集上具有更大的優(yōu)勢。

圖片

圖片

可以將SPPF模塊的輸出連接到輸出頭,從而識別圖像中的大目標(biāo)。然而,SPPF模塊的輸出具有多個連接,并且涉及多個尺度的目標(biāo),因此直接將其用于探測頭來識別大型物體將導(dǎo)致較差的模型表示,如上圖所示,顯示了添加MAB模塊前后一些檢測結(jié)果熱圖的視覺比較。在添加MAB模塊后,該檢測頭專注于檢測大目標(biāo),而將小目標(biāo)的預(yù)測分配給其他預(yù)測頭,提高了模型的表達(dá)效果,也更符合YOLO算法中基于目標(biāo)大小劃分檢測頭的要求。

圖片

一些檢測結(jié)果如上圖所示。從各個檢測結(jié)果來看,與其他算法沒有太大差異,但與其他算法相比,我們研究的算法在保證時間消耗不顯著增加的同時,提高了模型的檢測效果,并利用注意力機(jī)制增強(qiáng)了模型的表達(dá)效果。

圖片

責(zé)任編輯:張燕妮 來源: 計算機(jī)視覺研究院
相關(guān)推薦

2024-07-05 10:41:30

目標(biāo)檢測算法

2023-02-16 07:30:55

圖形編輯器屏幕開發(fā)

2012-01-05 16:08:57

佳能激光打印機(jī)

2020-09-21 16:11:04

Adobe 軟件平臺

2022-12-05 15:27:52

VR技術(shù)

2011-11-14 13:30:27

惠普掃描儀

2025-02-05 12:41:21

線性新范式分辨率

2011-10-31 17:12:42

激光打印機(jī)評測

2023-10-27 08:30:52

傳輸接口刷新率

2020-06-30 14:08:57

算法模型deepfake

2012-01-17 10:35:31

惠普掃描儀

2018-11-16 09:50:46

Windows 10高分辨率屏幕截圖

2011-10-28 15:52:22

激光打印機(jī)評測

2018-07-19 15:00:41

衛(wèi)星圖像

2011-04-28 13:09:49

2022-11-01 08:00:00

2017-09-20 16:25:00

深度學(xué)習(xí)視覺領(lǐng)域計算機(jī)

2018-03-02 15:39:18

顯示器分辨率主流

2022-11-01 13:56:23

研究模型
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號