自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

SIMPL:用于自動駕駛的簡單高效的多智能體運動預測基準

人工智能 智能汽車
本文提出了一種用于自動駕駛車輛的簡單高效的運動預測基線(SIMPL)。

本文經自動駕駛之心公眾號授權轉載,轉載請聯(lián)系出處。

原標題:SIMPL: A Simple and Efficient Multi-agent Motion Prediction Baseline for Autonomous Driving

論文鏈接:https://arxiv.org/pdf/2402.02519.pdf

代碼鏈接:https://github.com/HKUST-Aerial-Robotics/SIMPL

作者單位:香港科技大學 大疆

圖片

論文思路:

本文提出了一種用于自動駕駛車輛的簡單高效的運動預測基線(SIMPL)。與傳統(tǒng)的以代理為中心(agent-centric) 的方法(精度高但需要重復計算)和以場景為中心(scene-centric) 的方法(精度和通用性受到影響)不同,SIMPL 可以為所有相關交通參與者提供實時、準確的運動預測。為了提高準確性和推理速度,本文提出了一種緊湊而高效的全局特征融合模塊,該模塊以對稱方式執(zhí)行定向消息傳遞,使網絡能夠在單次前饋傳遞中預測所有道路使用者的未來運動,并減輕視點移動導致的精度損失。此外,本文研究了在軌跡解碼中使用 Bernstein basis polynomials 進行連續(xù)軌跡參數(shù)化,允許在任何所需時間點評估狀態(tài)及其高階導數(shù),這對于下游規(guī)劃任務很有價值。作為強大的基線,與其他最先進的方法相比,SIMPL 在 Argoverse 1 和 2 運動預測基準上表現(xiàn)出極具競爭力的性能。此外,其輕量級設計和低推理延遲使 SIMPL 具有高度可擴展性,并有望用于現(xiàn)實世界的機載部署。

網絡設計:

周圍交通參與者的運動預測對于自動駕駛汽車至關重要,尤其是下游決策和規(guī)劃模塊,因為準確及時的意圖和軌跡預測將顯著提高安全性和乘坐舒適性。

對于基于學習的運動預測,最重要的主題之一是上下文表示。早期的方法通常將周圍場景表示為多通道鳥瞰圖像 [1]–[4]。相比之下,最近的研究越來越多地采用矢量化場景表示[5]-[13],其中使用帶有地理坐標的點集或多段線(polylines) 來標注位置和幾何形狀,從而提高保真度并擴大感受野。然而,對于光柵化和矢量化表示,都存在一個關鍵問題:我們應該如何為所有這些元素選擇合適的參考系?一種直接的方法是描述共享坐標系(以場景為中心)內的所有實例,例如以自動駕駛車輛為中心的坐標系,并直接使用坐標作為輸入特征。這使我們能夠在一次前饋傳遞中對多個目標代理進行預測 [8, 14]。然而,使用全局坐標作為輸入,通常會在單個前饋傳遞中對多個目標代理進行預測 [8, 14]。然而,使用全局坐標作為輸入(通常會在很大范圍內變化)將大大加劇任務的固有復雜性,導致網絡性能下降和對新場景的適應性有限。為了提高準確性和魯棒性,一種常見的解決方案是根據目標代理的當前狀態(tài)對場景上下文進行歸一化處理 [5, 7, 10]-[13](以代理為中心)。這意味著必須對每個目標代理重復執(zhí)行歸一化過程和特征編碼,從而獲得更好的性能,但代價是冗余計算。因此,有必要探索一種能夠有效地編碼多個目標的特征,同時保持對視角(perspective) 變化的魯棒性的方法。

對于運動預測的下游模塊,例如決策和運動規(guī)劃,不僅需要考慮未來位置,還需要考慮航向、速度和其他高階導數(shù)。例如,周圍車輛的預測航向在塑造未來時空占用方面發(fā)揮著關鍵作用,這是確保安全和穩(wěn)健的運動規(guī)劃的關鍵因素[15, 16]。此外,在不遵守物理約束的情況下獨立預測高階量可能會導致預測結果不一致[17, 18]。例如,盡管速度為零,但它可能會產生位置位移,從而導致規(guī)劃模塊混亂。

本文提出了用于自動駕駛系統(tǒng)的 SIMPL(簡單高效的運動預測基線),解決了現(xiàn)實車載應用中多智能體軌跡預測的關鍵問題。首先,本文引入以實例為中心的場景表示,然后引入 symmetric fusion Transformer(SFT),從而能夠在單次前饋傳遞中對所有代理進行有效的軌跡預測,同時保留視點不變屬性帶來的準確性和魯棒性。與最近基于對稱上下文融合的其他工作[19]-[21]相比,所提出的SFT明顯更簡單、更輕量級且更易于實現(xiàn),使其適合機載部署。

其次,本文引入了一種基于 Bernstein basis polynomial(也稱為 Bezier curve)的預測軌跡的新穎參數(shù)化方法。這種連續(xù)表示確保了平滑性,并能夠在任何給定時間點輕松評估精確狀態(tài)及其高階導數(shù)。本文的實證研究表明,與估計 monomial basis polynomials 的系數(shù)相比,學習預測 Bezier curves 的控制點更加有效且數(shù)值穩(wěn)定。

最后,所提出的組件被很好地集成到一個簡單而高效的模型中。本文在兩個大型運動預測數(shù)據集上評估了所提出的方法[22, 23],實驗結果表明,盡管 SIMPL 具有簡化的設計,但與其他最先進的方法相比仍具有很強的競爭力。更重要的是,SIMPL通過較少的可學習參數(shù)和較低的推理延遲實現(xiàn)了高效的多智能體軌跡預測,而沒有犧牲量化性能,這對于真實世界的機載部署來說是充滿希望的。本文還強調,作為一個強大的基線,SIMPL 具有出色的可擴展性。簡潔的架構便于與最新的運動預測進展直接整合,為進一步提高整體性能提供了機會。

圖 1:復雜駕駛場景中多智能體運動預測的圖示。本文的方法能夠實時地同時為所有相關代理生成合理的假設。自車和其他車輛分別以紅色和藍色顯示。根據時間戳使用漸變顏色來可視化預測軌跡。請參考附帶的視頻了解更多示例。

圖片

圖 2:SIMPL 示意圖。本文利用盡可能簡單的網絡架構來證明其有效性。語義實例的局部特征由簡單的編碼器處理,而實例間特征則保留在相對位置嵌入中。多模態(tài)軌跡預測結果由運動解碼器在提出的 symmetric feature Transformer 之后生成。

圖 3:相對位姿計算示意圖。

圖 4:所提出的 L 層 symmetric fusion Transformer (SFT) 的圖示。實例 tokens 和相對位置嵌入(RPE)在每個SFT層中都會循環(huán)更新。

圖 5:2D septic Bezier curve(左)。

實驗結果:

圖片

總結:

本文提出了一種簡單高效的自動駕駛多智能體運動預測基線。利用所提出的 symmetric fusion Transformer,所提出的方法實現(xiàn)了高效的全局特征融合,并保持了針對視點移動的魯棒性?;?Bernstein basis polynomials 的連續(xù)軌跡參數(shù)化提供了與下游模塊更高的兼容性。在大規(guī)模公共數(shù)據集上的實驗結果表明,SIMPL 在模型大小和推理速度方面更具優(yōu)勢,同時獲得與其他最先進方法相同水平的精度。

引用:

Zhang L, Li P, Liu S, et al. SIMPL: A Simple and Efficient Multi-agent Motion Prediction Baseline for Autonomous Driving[J]. arXiv preprint arXiv:2402.02519, 2024.

責任編輯:張燕妮 來源: 自動駕駛之心
相關推薦

2025-02-26 10:17:43

2024-10-15 09:40:00

自動駕駛AI

2023-10-13 09:49:33

模型智能

2024-08-20 08:42:33

自動駕駛算法

2022-02-07 16:11:39

自動駕駛汽車安全

2023-10-26 09:34:44

自動駕駛技術

2023-03-14 09:52:48

人工智能

2023-08-08 12:12:07

自動駕駛預測

2021-12-06 14:33:32

自動駕駛冬奧會安全

2023-12-04 09:33:00

自動駕駛視覺

2019-09-19 14:10:12

人工智能物聯(lián)網自動駕駛

2025-03-21 09:57:40

2023-12-05 09:40:18

自動駕駛數(shù)據

2017-03-07 13:55:30

自動駕駛神經網絡深度學習

2022-01-05 14:23:10

mobileye英特爾CES

2023-07-27 09:45:39

自動駕駛技術

2022-02-25 10:56:08

自動駕駛傳感器技術

2019-10-14 11:00:27

人工智能AI自動駕駛

2017-12-06 18:50:51

自動駕駛智能駕駛艙

2021-05-18 15:37:39

自動駕駛麥肯錫汽車
點贊
收藏

51CTO技術棧公眾號