自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

BEV跟蹤基線 | BEVTrack:基于鳥瞰圖中的點云跟蹤

人工智能 智能汽車
本文提出了BEVTrack,這是一種簡單而強大的三維單目標跟蹤的基線框架。這種開創(chuàng)性的方法通過BEV表示有效地利用了空間信息,從而簡化了跟蹤流程設計。

本文經(jīng)自動駕駛之心公眾號授權(quán)轉(zhuǎn)載,轉(zhuǎn)載請聯(lián)系出處。

0.簡介

本文介紹了BEVTrack:鳥瞰圖中點云跟蹤的簡單基線。由于點云的外觀變化、外部干擾和高度稀疏性,點云的3D單目標跟蹤(SOT)仍然是一個具有挑戰(zhàn)性的問題。值得注意的是,在自動駕駛場景中,目標物體通常在連續(xù)幀間保持空間鄰接,多數(shù)情況下是水平運動。這種空間連續(xù)性為目標定位提供了有價值的先驗知識。然而,現(xiàn)有的跟蹤器通常使用逐點表示,難以有效利用這些知識,這是因為這種表示的格式不規(guī)則。因此,它們需要精心設計并且解決多個子任務以建立空間對應關系。本文《BEVTrack: A Simple Baseline for 3D Single Object Tracking in Bird’s-Eye View》(https://arxiv.org/pdf/2309.02185.pdf)中的BEVTrack是一種簡單而強大的三維單目標跟蹤基線框架。在將連續(xù)點云轉(zhuǎn)換為常見的鳥瞰圖表示后,BEVTrack固有地對空間近似進行編碼,并且通過簡單的逐元素操作和卷積層來熟練捕獲運動線索進行跟蹤。此外,為了更好地處理具有不同大小和運動模式的目標,BEVTrack直接學習潛在的運動分布,而不像先前的工作那樣做出固定的拉普拉斯或者高斯假設。BEVTrack在KITTI和NuScenes數(shù)據(jù)集上實現(xiàn)了最先進的性能,同時維持了122FPS的高推理速度。目前這個項目已經(jīng)在Github(https://github.com/xmm-prio/BEVTrack)上開源了。

1.主要貢獻

本文的貢獻總結(jié)如下:

1)本文提出了BEVTrack,這是一種簡單而強大的三維單目標跟蹤的基線框架。這種開創(chuàng)性的方法通過BEV表示有效地利用了空間信息,從而簡化了跟蹤流程設計;

2)本文提出了一種新型的分布感知回歸策略,其直接學習具有不同大小和各種運動模式的目標的潛在運動分布。該策略為跟蹤提供準確的指導,從而提供了性能,同時避免了額外的計算開銷;

3)BEVTrack在保持高推理速度的同時,在兩個主流的基準上實現(xiàn)了最先進的性能

2.概述

圖片

其中F是跟蹤器學習到的映射函數(shù)。

根據(jù)公式(1),我們提出了BEVTrack,這是一個簡單但強大的3D單目標跟蹤基準框架。BEVTrack的整體架構(gòu)如圖2所示。它首先利用共享的VoxelNext [29]提取3D特征,然后將其壓縮以獲得BEV表示。隨后,BEVTrack通過串聯(lián)和多個卷積層融合BEV特征,并通過MLP回歸目標的平移。為了實現(xiàn)準確的回歸,我們采用了一種新穎的分布感知回歸策略來優(yōu)化BEVTrack的訓練過程。

圖2. BEVTrack的示意圖。它使用VoxelNet從連續(xù)幀中提取特征,進一步將其轉(zhuǎn)換為BEV表示。然后,通過串聯(lián)和幾個卷積層,它融合BEV特征并捕捉運動線索。最后,通過多層感知機(MLP)回歸運動偏移量。在訓練過程中,我們提出了一種分布感知回歸策略來優(yōu)化BEVTrack。

3.特征提取

圖片

4.基于BEV的運動建模

圖片

其中Conv表示BMM中的卷積塊,[;][;]表示連接運算符。

其中H^′、W^′和C^′分別表示空間維度和特征通道數(shù)。

最后,我們使用最大池化層和多層感知器(MLP)來預測目標平移偏移,即,

其中C ∈ \mathbb{R}^6表示目標平移偏移\bar{u} ∈ \mathbb{R}^3的期望值和標準差σ ∈ \mathbb{R}^3,這將在第5節(jié)中詳細介紹。通過將平移應用于目標的最后狀態(tài),我們可以在當前幀中定位目標。

5.分布感知回歸

在先前的工作中,通常在訓練過程中使用傳統(tǒng)的L1或L2損失來進行目標位置回歸,這實際上對目標位置的分布做出了固定的拉普拉斯或高斯假設。與之相反,我們提出直接學習底層運動分布,并引入一種新穎的分布感知回歸策略。通過這種方式,可以為跟蹤提供更準確的指導,使BEVTrack能夠更好地處理具有不同大小和移動模式的物體。

在[11]的基礎上,我們使用重新參數(shù)化來建模目標平移偏移u~P(u)的分布。具體而言,P(u)可以通過對來自零均值分布z~P_Z(z)進行縮放和平移得到,其中u=\bar{u}+σ·z,其中\(zhòng)bar{u}表示目標平移偏移的期望,σ表示分布的尺度。P_Z(z)可以通過歸一化流模型(例如,real NVP [2])進行建模。給定這個變換函數(shù),可以計算出P(u)的密度函數(shù):

與之前僅回歸確定性目標翻譯偏移量u的方法相比,我們的方法專注于回歸兩個不同的參數(shù):目標翻譯偏移量u的期望值\bar{u}和其標準差σ。

在這項工作中,我們采用了[11]中的殘差對數(shù)似然估計(RLE)來估計上述參數(shù)。RLE將分布P_Z(z)分解為一個先驗分布Q_Z(z)(例如,拉普拉斯分布或高斯分布)和一個學習到的分布G_Z(z | θ)。為了最大化方程(4)中的似然函數(shù),我們可以最小化以下?lián)p失函數(shù):

責任編輯:張燕妮 來源: 自動駕駛之心
相關推薦

2024-07-04 12:06:00

2025-01-06 08:20:00

雷達AI生成

2023-12-06 09:49:36

自動駕駛算法

2024-03-20 15:53:28

模型技術

2024-04-02 10:23:56

雷達自動駕駛

2020-05-15 09:50:11

云計算云架構(gòu)、私有云

2022-12-07 13:12:15

2020-12-18 17:27:20

物聯(lián)網(wǎng)資產(chǎn)跟蹤IOT

2021-07-01 15:56:42

深度學習人工智能互聯(lián)網(wǎng)

2024-04-16 09:42:38

自動駕駛模型

2009-07-09 15:30:53

Servlet容器會話跟蹤

2020-06-04 21:52:18

工廠資產(chǎn)跟蹤物聯(lián)網(wǎng)IOT

2019-05-22 14:28:08

AI人工智能深度學習

2011-01-18 13:50:20

路由跟蹤tcptracerou

2018-01-24 18:51:39

Linuxftrace內(nèi)核函數(shù)

2010-08-02 15:32:01

ICMP路由跟蹤

2010-05-10 17:18:47

Oracle跟蹤事件

2022-06-28 12:12:09

工業(yè)物聯(lián)網(wǎng)物聯(lián)網(wǎng)自動化

2023-11-07 10:10:56

地圖技術

2020-02-28 16:01:54

物聯(lián)網(wǎng)資產(chǎn)跟蹤IOT
點贊
收藏

51CTO技術棧公眾號