自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

YOLO不死!YOLOv9出爐:性能速度SOTA~

人工智能 新聞
本文提出使用PGI來解決信息瓶頸問題以及深度監(jiān)督機制不適用于輕量級神經(jīng)網(wǎng)絡(luò)的問題。設(shè)計了GELAN,這是一個高效且輕量級的神經(jīng)網(wǎng)絡(luò)。

本文經(jīng)自動駕駛之心公眾號授權(quán)轉(zhuǎn)載,轉(zhuǎn)載請聯(lián)系出處。

如今的深度學(xué)習(xí)方法專注于設(shè)計最適合的目標函數(shù),以使模型的預(yù)測結(jié)果與實際情況最接近。同時,必須設(shè)計一個合適的架構(gòu),以便為預(yù)測獲取足夠的信息?,F(xiàn)有方法忽略了一個事實,即當輸入數(shù)據(jù)經(jīng)過逐層特征提取和空間變換時,大量信息將會丟失。本文將深入探討數(shù)據(jù)通過深度網(wǎng)絡(luò)傳輸時的重要問題,即信息瓶頸和可逆函數(shù)?;诖颂岢隽丝删幊烫荻刃畔ⅲ≒GI)的概念,以應(yīng)對深度網(wǎng)絡(luò)實現(xiàn)多目標所需的各種變化。PGI可以為目標任務(wù)提供完整的輸入信息,以計算目標函數(shù),從而獲得可靠的梯度信息以更新網(wǎng)絡(luò)權(quán)重。此外設(shè)計了一種新的輕量級網(wǎng)絡(luò)架構(gòu)——基于梯度路徑規(guī)劃的廣義高效層聚合網(wǎng)絡(luò)(GELAN)。

GELAN的架構(gòu)證實了在輕量級模型上使用PGI取得了優(yōu)越的結(jié)果。在MS COCO數(shù)據(jù)集上對所提出的GELAN和PGI進行了驗證,結(jié)果顯示GELAN僅使用傳統(tǒng)卷積算子就能實現(xiàn)比基于深度卷積的最先進方法更好的參數(shù)利用率。PGI可以用于各種模型,從輕量級到大型模型都可以。它可以用于獲取完整的信息,使得從頭開始訓(xùn)練的模型可以比使用大型數(shù)據(jù)集預(yù)訓(xùn)練的最先進模型取得更好的結(jié)果。

文章地址:https://arxiv.org/pdf/2402.13616

代碼鏈接:https://github.com/WongKinYiu/yolov9

優(yōu)秀的性能

如下圖所示,在MS COCO數(shù)據(jù)集上實時目標檢測器的比較中,基于GELAN和PGI的目標檢測方法在目標檢測性能方面超越了所有先前的從頭開始訓(xùn)練的方法。在準確性方面,新方法優(yōu)于使用大型數(shù)據(jù)集預(yù)訓(xùn)練的RT DETR,同時也優(yōu)于基于深度卷積設(shè)計的YOLO MS在參數(shù)利用方面的表現(xiàn)。

本文貢獻

  1. 從可逆函數(shù)的角度理論分析了現(xiàn)有的深度神經(jīng)網(wǎng)絡(luò)架構(gòu),通過這一過程,成功解釋了過去難以解釋的許多現(xiàn)象。還基于這一分析設(shè)計了PGI和輔助可逆分支,并取得了優(yōu)秀的結(jié)果。
  2. 設(shè)計的PGI解決了深度監(jiān)督只能用于極深的神經(jīng)網(wǎng)絡(luò)架構(gòu)的問題,從而使得新的輕量級架構(gòu)真正能夠應(yīng)用于日常工作。
  3. 設(shè)計的GELAN僅使用傳統(tǒng)卷積就能實現(xiàn)比基于最先進技術(shù)的深度卷積設(shè)計更高的參數(shù)使用率,同時表現(xiàn)出輕巧、快速和準確的巨大優(yōu)勢。
  4. 將所提出的PGI和GELAN結(jié)合起來,YOLOv9在MS COCO數(shù)據(jù)集上的目標檢測性能在各個方面都大大超過了現(xiàn)有的實時目標檢測器。

方法

PGI及相關(guān)的網(wǎng)絡(luò)架構(gòu)和方法

如下圖所示,(a) 路徑聚合網(wǎng)絡(luò)(PAN),(b) 可逆列(RevCol),(c) 傳統(tǒng)的深度監(jiān)督,以及 (d) YOLOv9提出的可編程梯度信息(PGI)。

PGI主要由三個組成部分組成:

  1. 主分支:用于推理的架構(gòu);
  2. 輔助可逆分支:生成可靠的梯度以供主分支向后傳輸;
  3. 多級輔助信息:控制主分支學(xué)習(xí)可規(guī)劃的多級語義信息。

GELAN的架構(gòu)

如下圖所示,(a) CSPNet ,(b) ELAN,以及 (c) YOLOv9提出的GELAN。模仿了CSPNet,并將ELAN擴展為GELAN,可以支持任何計算塊。

結(jié)果對比

與現(xiàn)有技術(shù)的比較

下表列出了YOLOv9與其他從頭開始訓(xùn)練的實時目標檢測器的比較??傮w而言,在現(xiàn)有方法中表現(xiàn)最佳的方法是輕量級模型的YOLO MS-S,中等模型的YOLO MS ,通用模型的YOLOv7 AF,以及大型模型的YOLOv8-X。與輕量級和中等模型的YOLO MS相比,YOLOv9的參數(shù)減少約10%,計算減少5~15%,但在AP方面仍有0.4~0.6%的改善。與YOLOv7 AF相比,YOLOv9-C的參數(shù)減少了42%,計算減少了21%,但達到了相同的AP(53%)。與YOLOv8-X相比,YOLOv9-X的參數(shù)減少了15%,計算減少了25%,并且AP有顯著提高,提高了1.7%。上述比較結(jié)果表明,YOLOv9在各個方面都比現(xiàn)有方法有了顯著改進。

與最先進的實時目標檢測器進行比較

參與比較的方法都使用ImageNet作為預(yù)訓(xùn)練權(quán)重,包括RT DETR 、RTMDet 和PP-YOLOE等。使用從頭開始訓(xùn)練方法的YOLOv9顯然超過了其他方法的性能。

可視化結(jié)果

特征圖(可視化結(jié)果): 由PlainNet、ResNet、CSPNet和GELAN在不同深度上的隨機初始權(quán)重輸出。在100層后,ResNet開始產(chǎn)生足夠混淆目標信息的前饋輸出。這里提出的GELAN在第150層仍然可以保留相當完整的信息,并且在第200層仍然具有足夠的區(qū)分能力。

GELAN和YOLOv9(GELAN + PGI)的PAN特征圖(可視化結(jié)果):在進行一輪偏置預(yù)熱后。GELAN最初存在一些分歧,但在添加了PGI的可逆分支后,它更能夠集中注意力于目標對象。

不同網(wǎng)絡(luò)架構(gòu)的隨機初始權(quán)重輸出特征圖的可視化結(jié)果: (a)輸入圖像,(b)PlainNet,(c)ResNet,(d)CSPNet 和(e)提出的 GELAN。從圖中可以看出,在不同的架構(gòu)中,提供給目標函數(shù)計算損失的信息程度不同,而我們的架構(gòu)可以保留最完整的信息,并為計算目標函數(shù)提供最可靠的梯度信息。

結(jié)論

本文提出使用PGI來解決信息瓶頸問題以及深度監(jiān)督機制不適用于輕量級神經(jīng)網(wǎng)絡(luò)的問題。設(shè)計了GELAN,這是一個高效且輕量級的神經(jīng)網(wǎng)絡(luò)。在目標檢測方面,GELAN在不同的計算模塊和深度設(shè)置下表現(xiàn)出強大而穩(wěn)定的性能。它確實可以廣泛擴展為適用于各種推斷設(shè)備的模型。針對上述兩個問題,引入PGI使得輕量級模型和深度模型都能在準確性方面取得顯著改善。通過結(jié)合PGI和GELAN設(shè)計的YOLOv9表現(xiàn)出了強大的競爭力。其優(yōu)秀的設(shè)計使得深度模型在與YOLOv8相比,參數(shù)數(shù)量減少了49%,計算量減少了43%,但在MS COCO數(shù)據(jù)集上仍然實現(xiàn)了0.6%的AP改善。

原文鏈接:https://mp.weixin.qq.com/s/nP4JzVwn1S-MeKAzbf97uw

責(zé)任編輯:張燕妮 來源: 自動駕駛之心
相關(guān)推薦

2024-02-23 11:10:00

AI訓(xùn)練

2024-09-09 16:35:10

YOLO模型

2010-01-20 09:10:08

Windows 7 S下載

2010-06-22 11:36:20

VMwareVMware Fusi

2011-09-27 13:02:17

Ubuntu 11.1LibreOffice

2018-12-16 16:57:16

密碼弱密碼密碼泄露

2024-07-09 08:50:23

2014-08-01 09:17:38

趨勢科技程序競賽

2021-01-04 09:27:19

Python 開發(fā)編程語言

2009-09-01 14:17:17

Delphi 2010mixinJavaFX

2016-10-28 20:26:57

曙光

2024-04-30 10:04:14

目標檢測AI

2010-05-31 12:44:46

版本控制工具SVN

2020-11-19 10:25:09

密碼安全網(wǎng)絡(luò)

2024-11-06 16:56:51

2023-09-15 07:01:56

小米華碩優(yōu)派

2017-08-14 11:19:42

小程序

2023-07-21 07:40:13

AOC銷量HKC

2024-06-20 09:56:28

2020-07-30 14:05:53

谷歌華為芯片
點贊
收藏

51CTO技術(shù)棧公眾號