自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

EdgeYOLO:邊緣設(shè)備上實時運行的目標(biāo)檢測器及Pytorch實現(xiàn)

人工智能 新聞
今天分享的研究者提出了一種基于最先進的YOLO框架的高效、低復(fù)雜度和無錨的目標(biāo)檢測器,該檢測器可以在邊緣計算平臺上實時實現(xiàn)。

本文經(jīng)計算機視覺研究院公眾號授權(quán)轉(zhuǎn)載,轉(zhuǎn)載請聯(lián)系出處。

代碼地址:https://github.com/LSH9832/edgeyolo

01 概述

研究者開發(fā)了一種增強的數(shù)據(jù)增強方法來有效抑制訓(xùn)練過程中的過擬合,并設(shè)計了一種混合隨機損失函數(shù)來提高小目標(biāo)的檢測精度。受FCOS的啟發(fā),提出了一種更輕、更高效的解耦頭,可以在不損失精度的情況下提高推理速度。提出的基線模型在MS COCO2017數(shù)據(jù)集中可以達到50.6%的AP50:95和69.8%的AP50準(zhǔn)確度,在VisDrone2019 DET數(shù)據(jù)集可以達到26.4%的AP50:95和44.8%的AP50準(zhǔn)確度,并且它滿足邊緣計算設(shè)備Nvidia Jetson AGX Xavier的實時性要求(FPS≥30)。

02 介紹

在常見的目標(biāo)檢測數(shù)據(jù)集(如MS COCO2017)上,使用兩階段策略的模型比使用一階段策略的要好一點。盡管如此,由于兩階段框架的內(nèi)部限制,它遠遠不能滿足傳統(tǒng)計算設(shè)備的實時性要求,并且在大多數(shù)高性能計算平臺上可能面臨同樣的情況。相比之下,單級目標(biāo)檢測器可以在實時指標(biāo)和性能之間保持平衡。因此,他們更受研究人員的關(guān)注,YOLO系列算法以高速迭代更新。從YOLOv1到Y(jié)OLOv3的更新主要是對底層框架結(jié)構(gòu)的改進,YOLO的大多數(shù)后期主流版本都專注于提高精度和推理速度。

此外,他們的優(yōu)化測試平臺主要是具有高性能GPU的大型工作站。然而,他們最先進的模型在這些邊緣計算設(shè)備上通常以令人不滿意的低FPS運行。為此,一些研究人員提出了參數(shù)較少、結(jié)構(gòu)較輕的網(wǎng)絡(luò)結(jié)構(gòu),如MobileNet和ShuffleNet,以取代原有的骨干網(wǎng)絡(luò),從而在移動設(shè)備和邊緣設(shè)備上實現(xiàn)更好的實時性能,但要犧牲一定的精度。在今天分享中,研究者的目標(biāo)是設(shè)計一種具有良好精度并可以在邊緣設(shè)備上實時運行的物體檢測器。

如下圖所示,研究者還為計算能力較低的邊緣計算設(shè)備設(shè)計了更輕、參數(shù)更少的模型,這些設(shè)備也顯示出更好的性能。

圖片

03 新框架

隨機數(shù)據(jù)擴充不可避免地會導(dǎo)致一些標(biāo)簽無效,例如(a)中第二張圖的右下角和第三張圖的左下角。雖然有方框,但它們不能提供有效的目標(biāo)信息。標(biāo)簽數(shù)量過少會對訓(xùn)練產(chǎn)生明顯的負面影響,可以通過增加(b)中的有效方框數(shù)量來避免這種影響。

圖片

Enhanced-Mosaic & Mixup

常用的數(shù)據(jù)增強策略如下(a)和(b)所示,但是(a)和(b)由于數(shù)據(jù)變換,容易包含不含有效目標(biāo)的圖像,此外這種情況的概率隨著每個原始圖像中標(biāo)簽數(shù)量的減少而逐漸增加。

圖片

作者因此提出的方法(c):

  • 首先,對多組圖像使用Mosaic方法(可以根據(jù)數(shù)據(jù)集中單個圖片中標(biāo)簽的平均數(shù)量的豐富程度來設(shè)置組數(shù))
  • 然后,通過Mixup方法將最后一個簡單處理的圖像與Mosaic處理的圖像混合(最后一幅圖像的原始圖像邊界在變換后的最終輸出圖像的邊界內(nèi))

Lite-Decoupled Head

解耦頭首先在FCOS中提出,然后用于其他Anchor-Free目標(biāo)檢測器,如YOLOX。在最后幾個網(wǎng)絡(luò)層使用解耦結(jié)構(gòu)可以加速網(wǎng)絡(luò)收斂并提高回歸性能。但是由于解耦頭采用了導(dǎo)致額外推理成本的分支結(jié)構(gòu),因此YOLOv6提出了具有更快推理速度的高效解耦頭,這將中間3×3卷積層的數(shù)量減少到僅一層,同時保持與輸入特征圖相同的更大數(shù)量的通道。

圖片

但是這種額外的推理成本隨著通道和輸入大小的增加也變得更加明顯。因此引入重參化的技術(shù)增強學(xué)習(xí)能力的同時加快推理。

04 實驗

圖片

圖片

representative results in VisDrone2019-DET-val

圖片

責(zé)任編輯:張燕妮 來源: 計算機視覺研究院
相關(guān)推薦

2024-06-18 10:20:00

YOLO目標(biāo)檢測

2024-08-01 09:00:00

目標(biāo)檢測端到端

2024-01-15 14:03:00

2010-12-28 11:17:50

chkrootkitrootkit檢測器

2025-01-14 08:30:00

YOLO目標(biāo)檢測YOLOv8

2017-09-22 11:45:10

深度學(xué)習(xí)OpenCVPython

2023-07-31 11:30:27

研究技術(shù)

2022-03-11 10:18:04

Meta死鎖Android

2017-11-16 17:26:35

深度學(xué)習(xí)移動設(shè)備MobileNets應(yīng)

2020-11-16 19:37:17

物聯(lián)網(wǎng)智慧城市IoT

2010-01-06 09:36:59

2024-09-14 09:31:25

2023-07-26 09:00:00

人工智能AI檢測

2020-03-09 14:08:25

Python目標(biāo)檢測視覺識別

2018-01-29 11:40:44

LinuxAndroidTermux

2022-03-03 15:05:46

微軟Windows 11

2010-12-24 10:26:19

2023-10-23 12:05:17

2023-11-09 23:45:01

Pytorch目標(biāo)檢測

2010-12-22 21:52:12

rkhunter
點贊
收藏

51CTO技術(shù)棧公眾號