自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

Fast YOLO:用于實時嵌入式目標檢測

人工智能 新聞
目標檢測被認為是計算機視覺領域中最具挑戰(zhàn)性的問題之一,因為它涉及場景中對象分類和對象定位的組合。今天分享這個框架有點陳舊,但精髓!

本文經(jīng)計算機視覺研究院公眾號授權轉載,轉載請聯(lián)系出處。

一、前言

目標檢測被認為是計算機視覺領域中最具挑戰(zhàn)性的問題之一,因為它涉及場景中對象分類和對象定位的組合。最近,與其他方法相比,深度神經(jīng)網(wǎng)絡 (DNN) 已被證明可以實現(xiàn)卓越的目標檢測性能,其中YOLOv2是基于DNN的最先進技術之一。

圖片

目標檢測方法在速度和準確性方面。盡管YOLOv2可以在強大的GPU上實現(xiàn)實時性能,但在計算能力和內存有限的嵌入式計算設備上利用這種方法進行視頻中的實時目標檢測仍然非常具有挑戰(zhàn)性。

二、概要

在今天分享中,有研究者提出了一個名為Fast YOLO的新框架,這是一個快速的You Only Look Once框架,它可以加速YOLOv2以便能夠以實時方式在嵌入式設備上執(zhí)行視頻中的目標檢測。

首先,利用進化深度智能框架來進化YOLOv2網(wǎng)絡架構,并產生一個優(yōu)化的架構(這里稱為O-YOLOv2),其參數(shù)減少了2.8倍,IOU下降了約2%。為了在保持性能的同時進一步降低嵌入式設備的功耗,在提出的Fast YOLO框架中引入了一種運動自適應推理方法,以降低基于時間運動特性的O-YOLOv2深度推理的頻率。實驗結果表明,與原始YOLOv2相比,所提出的Fast YOLO框架可以將深度推理的數(shù)量平均減少38.13%視頻中目標檢測的平均加速約為3.3倍,導致Fast YOLO運行在Nvidia Jetson TX1嵌入式系統(tǒng)上平均約為18FPS。

三、新框架

圖片

提出的Fast YOLO框架分為兩個主要部分:i)優(yōu)化的YOLOv2架構,以及ii運動自適應推理(見上圖)。對于每個視頻幀,由帶有參考幀的視頻幀組成的圖像堆棧被傳遞到1×1卷積層。卷積層的結果是一個運動概率圖,然后將其送入運動自適應推理模塊以確定是否需要深度推理來計算更新的類概率圖。正如介紹中提到的,主要目標是引入一個視頻中的目標檢測框架,該框架可以在嵌入式設備上更快地執(zhí)行,同時減少資源使用,從而顯著降低功耗。通過利用這種運動自適應推理方法,深度推理的頻率大大降低,并且僅在必要時執(zhí)行。

圖片

深度神經(jīng)網(wǎng)絡的主要挑戰(zhàn)之一,尤其是在將它們用于嵌入式場景時,是網(wǎng)絡架構設計。設計過程通常由人類專家執(zhí)行,他探索大量網(wǎng)絡配置,以在建模精度和參數(shù)數(shù)量方面為特定任務找到最佳架構。尋找優(yōu)化的網(wǎng)絡架構目前通常作為超參數(shù)優(yōu)化問題來解決,但這種解決問題的方法非常耗時,而且大多數(shù)方法對于大型網(wǎng)絡架構來說要么在計算上難以處理,要么導致次優(yōu)解決方案不夠嵌入式使用。

圖片

例如,超參數(shù)優(yōu)化的一種常用方法是網(wǎng)格搜索,其中檢查大量不同的網(wǎng)絡配置,然后選擇最佳配置作為最終的網(wǎng)絡架構。然而,為視頻中的目標檢測而設計的深度神經(jīng)網(wǎng)絡(如YOLOv2)具有大量參數(shù),因此在計算上難以搜索整個參數(shù)空間以找到最佳解決方案。

圖片

因此,研究者沒有利用超參數(shù)優(yōu)化方法來獲得基于YOLOv2的最佳網(wǎng)絡架構,而是利用專為提高網(wǎng)絡效率而設計的網(wǎng)絡優(yōu)化策略。特別是,研究者利用進化深度智能框架來優(yōu)化網(wǎng)絡架構,以合成滿足嵌入式設備內存和計算能力限制的深度神經(jīng)網(wǎng)絡。

圖片

為了進一步降低處理器單元的功耗,用于視頻中的嵌入式目標檢測,研究者利用了這樣一個事實,即并非所有捕獲的視頻幀都包含唯一信息,因此不需要對所有幀進行深度推理。因此,研究者引入了一種運動自適應推理方法來確定特定視頻幀是否需要深度推理。通過在必要時使用前面介紹的O-YOLOv2網(wǎng)絡進行深度推理,這種運動自適應推理技術可以幫助框架減少對計算資源的需求,從而顯著降低功耗系統(tǒng)以及處理速度的提高。

四、實驗

圖片

原始YOLOv2網(wǎng)絡架構與優(yōu)化后的YOLOv2之間的架構和性能比較

提出的Fast YOLO、O-YOLOv2和原始YOLOv2在Nvidia Jetson TX1嵌入式系統(tǒng)上運行的平均運行時性能和深度推理頻率。

圖片

責任編輯:張燕妮 來源: 計算機視覺研究院
相關推薦

2024-10-09 17:02:34

2021-09-13 09:50:28

MicroEJ開源JavaScript框

2021-12-16 22:39:45

Linux發(fā)行版開發(fā)

2018-07-06 11:49:51

Linux嵌入式系統(tǒng)工具

2011-01-14 13:13:23

嵌入式Linux開發(fā)

2024-08-01 09:00:00

目標檢測端到端

2022-04-01 08:09:03

操作系統(tǒng)嵌入式重構

2025-02-18 08:00:00

C++YOLO目標檢測

2025-01-22 11:10:34

2024-11-29 16:10:31

2009-07-17 16:06:59

ARM嵌入式開發(fā)

2009-12-09 10:12:28

嵌入式Linux

2011-04-18 11:34:34

嵌入式軟件測試

2009-12-17 10:33:05

嵌入式Linux

2009-12-16 15:41:40

嵌入式Linux入門

2025-01-14 08:30:00

YOLO目標檢測YOLOv8

2023-11-20 09:47:14

自動駕駛視覺

2014-11-17 21:19:58

VxWorks 7風河

2009-11-30 16:54:28

微軟

2020-04-22 11:51:41

物聯(lián)網(wǎng)嵌入式編程IOT
點贊
收藏

51CTO技術棧公眾號