自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<abbr id="pt5vo"><tt id="pt5vo"><mark id="pt5vo"></mark></tt></abbr>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓

鴻蒙開發(fā)者社區(qū)

WOT技術大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設置退出

BEV跟蹤基線 | BEVTrack：基于鳥瞰圖中的點云跟蹤

作者：敢敢のwings 2024-04-16 09:50:23

人工智能智能汽車

本文提出了BEVTrack，這是一種簡單而強大的三維單目標跟蹤的基線框架。這種開創(chuàng)性的方法通過BEV表示有效地利用了空間信息，從而簡化了跟蹤流程設計。

本文經(jīng)自動駕駛之心公眾號授權(quán)轉(zhuǎn)載，轉(zhuǎn)載請聯(lián)系出處。

0.簡介

本文介紹了BEVTrack：鳥瞰圖中點云跟蹤的簡單基線。由于點云的外觀變化、外部干擾和高度稀疏性，點云的3D單目標跟蹤（SOT）仍然是一個具有挑戰(zhàn)性的問題。值得注意的是，在自動駕駛場景中，目標物體通常在連續(xù)幀間保持空間鄰接，多數(shù)情況下是水平運動。這種空間連續(xù)性為目標定位提供了有價值的先驗知識。然而，現(xiàn)有的跟蹤器通常使用逐點表示，難以有效利用這些知識，這是因為這種表示的格式不規(guī)則。因此，它們需要精心設計并且解決多個子任務以建立空間對應關系。本文《BEVTrack: A Simple Baseline for 3D Single Object Tracking in Bird’s-Eye View》（https://arxiv.org/pdf/2309.02185.pdf）中的BEVTrack是一種簡單而強大的三維單目標跟蹤基線框架。在將連續(xù)點云轉(zhuǎn)換為常見的鳥瞰圖表示后，BEVTrack固有地對空間近似進行編碼，并且通過簡單的逐元素操作和卷積層來熟練捕獲運動線索進行跟蹤。此外，為了更好地處理具有不同大小和運動模式的目標，BEVTrack直接學習潛在的運動分布，而不像先前的工作那樣做出固定的拉普拉斯或者高斯假設。BEVTrack在KITTI和NuScenes數(shù)據(jù)集上實現(xiàn)了最先進的性能，同時維持了122FPS的高推理速度。目前這個項目已經(jīng)在Github（https://github.com/xmm-prio/BEVTrack）上開源了。

1.主要貢獻

本文的貢獻總結(jié)如下：

1）本文提出了BEVTrack，這是一種簡單而強大的三維單目標跟蹤的基線框架。這種開創(chuàng)性的方法通過BEV表示有效地利用了空間信息，從而簡化了跟蹤流程設計；

2）本文提出了一種新型的分布感知回歸策略，其直接學習具有不同大小和各種運動模式的目標的潛在運動分布。該策略為跟蹤提供準確的指導，從而提供了性能，同時避免了額外的計算開銷；

3）BEVTrack在保持高推理速度的同時，在兩個主流的基準上實現(xiàn)了最先進的性能

2.概述

其中F是跟蹤器學習到的映射函數(shù)。

根據(jù)公式（1），我們提出了BEVTrack，這是一個簡單但強大的3D單目標跟蹤基準框架。BEVTrack的整體架構(gòu)如圖2所示。它首先利用共享的VoxelNext [29]提取3D特征，然后將其壓縮以獲得BEV表示。隨后，BEVTrack通過串聯(lián)和多個卷積層融合BEV特征，并通過MLP回歸目標的平移。為了實現(xiàn)準確的回歸，我們采用了一種新穎的分布感知回歸策略來優(yōu)化BEVTrack的訓練過程。

圖2. BEVTrack的示意圖。它使用VoxelNet從連續(xù)幀中提取特征，進一步將其轉(zhuǎn)換為BEV表示。然后，通過串聯(lián)和幾個卷積層，它融合BEV特征并捕捉運動線索。最后，通過多層感知機（MLP）回歸運動偏移量。在訓練過程中，我們提出了一種分布感知回歸策略來優(yōu)化BEVTrack。

3.特征提取

4.基于BEV的運動建模

其中Conv表示BMM中的卷積塊，[;][;]表示連接運算符。

其中H^′、W^′和C^′分別表示空間維度和特征通道數(shù)。

最后，我們使用最大池化層和多層感知器（MLP）來預測目標平移偏移，即，

其中C ∈ \mathbb{R}^6表示目標平移偏移\bar{u} ∈ \mathbb{R}^3的期望值和標準差σ ∈ \mathbb{R}^3，這將在第5節(jié)中詳細介紹。通過將平移應用于目標的最后狀態(tài)，我們可以在當前幀中定位目標。

5.分布感知回歸

在先前的工作中，通常在訓練過程中使用傳統(tǒng)的L1或L2損失來進行目標位置回歸，這實際上對目標位置的分布做出了固定的拉普拉斯或高斯假設。與之相反，我們提出直接學習底層運動分布，并引入一種新穎的分布感知回歸策略。通過這種方式，可以為跟蹤提供更準確的指導，使BEVTrack能夠更好地處理具有不同大小和移動模式的物體。

在[11]的基礎上，我們使用重新參數(shù)化來建模目標平移偏移u～P(u)的分布。具體而言，P(u)可以通過對來自零均值分布z～P_Z(z)進行縮放和平移得到，其中u=\bar{u}+σ·z，其中\(zhòng)bar{u}表示目標平移偏移的期望，σ表示分布的尺度。P_Z(z)可以通過歸一化流模型（例如，real NVP [2]）進行建模。給定這個變換函數(shù)，可以計算出P(u)的密度函數(shù)：

與之前僅回歸確定性目標翻譯偏移量u的方法相比，我們的方法專注于回歸兩個不同的參數(shù)：目標翻譯偏移量u的期望值\bar{u}和其標準差σ。

在這項工作中，我們采用了[11]中的殘差對數(shù)似然估計（RLE）來估計上述參數(shù)。RLE將分布P_Z(z)分解為一個先驗分布Q_Z(z)（例如，拉普拉斯分布或高斯分布）和一個學習到的分布G_Z(z | θ)。為了最大化方程（4）中的似然函數(shù)，我們可以最小化以下?lián)p失函數(shù)：

責任編輯：張燕妮來源：自動駕駛之心

點云跟蹤框架

51CTO技術棧公眾號

業(yè)務
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學堂精培企業(yè)培訓 CTO訓練營

<sub id="31mpv"><p id="31mpv"></p></sub>

<legend id="31mpv"><track id="31mpv"></track></legend>