自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

端到端自動(dòng)駕駛新SOTA!港科大聯(lián)合元戎啟行共同提出PPAD端到端算法

人工智能 新聞
今天為大家分享港科大聯(lián)合元戎啟行共同提出的PPAD端到端算法!

本文經(jīng)自動(dòng)駕駛之心公眾號(hào)授權(quán)轉(zhuǎn)載,轉(zhuǎn)載請(qǐng)聯(lián)系出處。

寫(xiě)在前面&筆者的個(gè)人理解

目前隨著深度學(xué)習(xí)技術(shù)的快速蓬勃發(fā)展為自動(dòng)駕駛領(lǐng)域的研發(fā)提供了強(qiáng)大的助力。目前的自動(dòng)駕駛系統(tǒng)由于其方便解耦和可解釋性的離散化模塊設(shè)計(jì)使得自動(dòng)駕駛領(lǐng)域產(chǎn)生了很多令我們興奮的成績(jī)。自動(dòng)駕駛系統(tǒng)中的傳統(tǒng)方法通常將系統(tǒng)分解為模塊化組件,包括定位、感知、跟蹤、預(yù)測(cè)、規(guī)劃和控制,以實(shí)現(xiàn)更好的可解釋性和可見(jiàn)性。然而這類系統(tǒng)卻存在著一些問(wèn)題:(1)隨著系統(tǒng)復(fù)雜度的增加,模塊之間的誤差積累變得更加顯著,存在很大的誤差累計(jì)效應(yīng);(2)下游任務(wù)所表現(xiàn)出來(lái)的性能與上游模塊變得高度相關(guān),從而使得構(gòu)建統(tǒng)一的數(shù)據(jù)驅(qū)動(dòng)網(wǎng)絡(luò)模型框架變得非常困難。

最近,端到端自動(dòng)駕駛因其簡(jiǎn)單性而受到歡迎?;趯W(xué)習(xí)架構(gòu)提出了兩條主線。第一種方法以原始傳感器數(shù)據(jù)作為輸入,直接輸出規(guī)劃軌跡或控制命令,無(wú)需任何視圖變換,作為場(chǎng)景理解的中間表示。另外一類算法模型則是建立在BEV空間表示的基礎(chǔ)上,充分利用查詢來(lái)生成中間輸出作為生成規(guī)劃結(jié)果的指導(dǎo)。其中一個(gè)最顯著的優(yōu)勢(shì)在于可解釋性。

受到端到端自動(dòng)駕駛工作VAD的啟發(fā),本文工作的目標(biāo)是將逐步預(yù)測(cè)規(guī)劃引入基于學(xué)習(xí)的框架當(dāng)中。直觀地說(shuō),預(yù)測(cè)和規(guī)劃模塊可以建模為運(yùn)動(dòng)預(yù)測(cè)任務(wù),根據(jù)給定的歷史信息預(yù)測(cè)未來(lái)的路徑點(diǎn)。每個(gè)時(shí)間戳?xí)r刻的預(yù)測(cè)和規(guī)劃模塊的結(jié)果高度相互依賴。因此,我們需要迭代和雙向地考慮代理和代理之間以及代理和環(huán)境之間的相互作用,在給定其他代理觀測(cè)下實(shí)現(xiàn)代理預(yù)測(cè)期望的最大化。基于此,本文提出了PPAD端到端自動(dòng)駕駛框架,可以逐步規(guī)劃自車代理的未來(lái)軌跡,在矢量學(xué)習(xí)框架下基于時(shí)間實(shí)現(xiàn)雙向交互,如下圖所示。

提出的PPAD算法模型的概括示意圖

論文鏈接:https://arxiv.org/pdf/2311.08100

官方倉(cāng)庫(kù)鏈接:https://github.com/zlichen/PPAD;

網(wǎng)絡(luò)模型的整體架構(gòu)&細(xì)節(jié)梳理

在詳細(xì)介紹本文提出的PPAD端到端算法模型細(xì)節(jié)之前,下圖展示了我們提出的PPAD算法的整體網(wǎng)絡(luò)結(jié)構(gòu)圖。

提出的PPAD算法模型的整體網(wǎng)絡(luò)結(jié)構(gòu)圖

通過(guò)上圖的整體網(wǎng)絡(luò)結(jié)構(gòu)可以看出,提出的PPAD算法模型主要包括感知Transformer和我們提出的迭代預(yù)測(cè)規(guī)劃模塊。整體而言,感知Transformer將場(chǎng)景上下文信息編碼為BEV空間特征圖,并進(jìn)一步解碼為矢量化代理和地圖表示。迭代預(yù)測(cè)規(guī)劃模塊通常由預(yù)測(cè)和規(guī)劃兩個(gè)過(guò)程組成。它剖析了自車和其他代理在時(shí)間維度上的動(dòng)態(tài)交互。最終,該模塊預(yù)測(cè)代理的運(yùn)動(dòng)并規(guī)劃自車的未來(lái)行駛軌跡。

具體而言,對(duì)于輸入到網(wǎng)絡(luò)模型中的環(huán)視圖像特征,我們采用一個(gè)共享的圖像主干網(wǎng)絡(luò)來(lái)提取每個(gè)視角的圖像特征。再得到每個(gè)視角的圖像特征之后,我們采用了BEVFormer中的Encoder模塊來(lái)得到統(tǒng)一的BEV空間特征。此外,受到端到端自動(dòng)駕駛框架VAD的啟發(fā),我們也通過(guò)解碼器和地圖元素解碼器將場(chǎng)景上下文信息完成矢量化的表示,進(jìn)而得到可學(xué)習(xí)的代理查詢和可學(xué)習(xí)的地圖查詢。單獨(dú)的基于多層感知機(jī)的解碼器通過(guò)采用學(xué)習(xí)到的查詢作為輸入,并使用代理的屬性和地圖屬性進(jìn)行預(yù)測(cè)得到最終的輸出。此外,代理查詢將與可學(xué)習(xí)的運(yùn)動(dòng)嵌入相結(jié)合,以對(duì)代理的各種運(yùn)動(dòng)進(jìn)行建模。具有運(yùn)動(dòng)的代理表示為。類似的,自車采用三種方式進(jìn)行建模,代表直行、左轉(zhuǎn)和右轉(zhuǎn)的高級(jí)駕駛命令,表示為。

然后我們采用迭代預(yù)測(cè)規(guī)劃模塊以交錯(cuò)的方式預(yù)測(cè)自車和其他代理的未來(lái)軌跡。與一次性預(yù)測(cè)所有軌跡的傳統(tǒng)做法不同,我們提出的PPAD算法框架通過(guò)迭代代理運(yùn)動(dòng)預(yù)測(cè)和自車規(guī)劃過(guò)程來(lái)表示運(yùn)動(dòng)規(guī)劃的每個(gè)步驟。借助提出的PPAD框架,我們可以進(jìn)行深入設(shè)計(jì),以精修的方式在場(chǎng)景上下文中執(zhí)行關(guān)鍵對(duì)象的交互過(guò)程。

預(yù)測(cè)和規(guī)劃的迭代交互

在現(xiàn)實(shí)世界中,駕駛交通狀況不斷變化。駕駛員通過(guò)不斷推理場(chǎng)景中交通參與者之間的關(guān)系來(lái)規(guī)劃和執(zhí)行他們的決策。規(guī)劃任務(wù)需要自動(dòng)駕駛系統(tǒng)對(duì)場(chǎng)景有很好的理解,并能夠解決時(shí)空因果因素。因此,我們對(duì)提出的PPAD進(jìn)行了創(chuàng)新,將規(guī)劃任務(wù)分解為代理預(yù)測(cè)和自車規(guī)劃過(guò)程的多步驟,并最終促進(jìn)自車和代理的未來(lái)軌跡達(dá)成共識(shí)。提出的PPAD框架將交通交互體現(xiàn)為沿時(shí)空的游戲,為自車提供更準(zhǔn)確的規(guī)劃軌跡。具體而言,自車和代理繼承了相同的理念,即在每個(gè)未來(lái)時(shí)間戳?xí)r刻中根據(jù)彼此的運(yùn)動(dòng)預(yù)測(cè)交替優(yōu)化其運(yùn)動(dòng)行為。

預(yù)測(cè)過(guò)程

代理在預(yù)測(cè)過(guò)程中預(yù)測(cè)其后續(xù)的運(yùn)動(dòng),以自車在先前規(guī)劃過(guò)程中的結(jié)果輸出為條件。具體而言,代理查詢的初始狀態(tài)包括其駕駛意圖。然后,它將與從先前規(guī)劃過(guò)程更新的自車查詢進(jìn)行交互,這表明自車當(dāng)前最新駕駛規(guī)劃。然后,它將與地圖元素交互以選擇駕駛路徑。最后,它通過(guò)與BEV空間特征進(jìn)行交互來(lái)收集詳細(xì)的幾何信息,并得出其精確的下一步運(yùn)動(dòng)。

規(guī)劃過(guò)程

我們用來(lái)表示歷史時(shí)期,來(lái)代表未來(lái)時(shí)期。自車的未來(lái)軌跡可以表示為。對(duì)于每一個(gè)代理,其軌跡可以表示為。檢測(cè)到的地圖元素位置可以表示為。

代理交互

地圖交互

現(xiàn)有的一些研究工作試圖通過(guò)簡(jiǎn)單地應(yīng)用一次全局級(jí)別的交互來(lái)總結(jié)規(guī)劃所需的所有地圖信息。但他們忽略了不斷發(fā)展的運(yùn)動(dòng)動(dòng)態(tài)的復(fù)雜性,高估了自車可以通過(guò)與地圖信息的單次交互進(jìn)行長(zhǎng)期精確規(guī)劃。

利用我們提出的PPAD算法框架,我們可以根據(jù)自車的最新位置考慮其本地道路狀況,從而豐富自車與地圖的交互。這樣可以更好地識(shí)別規(guī)劃每個(gè)步驟所需的有用地圖信息。自車查詢與地圖查詢的交互方式與代理的交互方式類似。不同之處在于地圖實(shí)例在未來(lái)的時(shí)間步驟中不可移動(dòng)。多頭交叉注意力機(jī)制可以將本地和全局地圖信息抽象到自車查詢中:

圖片

分層特征學(xué)習(xí)

層次結(jié)構(gòu)具有更好的捕捉和識(shí)別細(xì)粒度模式的能力。對(duì)于駕駛場(chǎng)景,駕駛行為基于對(duì)全局和局部場(chǎng)景的理解。駕駛往往只關(guān)注少數(shù)關(guān)鍵物體,這表明了空間局部性或局部注意力。因此,我們?cè)O(shè)計(jì)了分層關(guān)鍵對(duì)象注意力來(lái)利用由粗糙到精細(xì)的場(chǎng)景上下文。具體來(lái)說(shuō),給定一組距離范圍,我們首先找到給定范圍內(nèi)的關(guān)鍵對(duì)象。因此,我們應(yīng)用動(dòng)態(tài)局部注意力,它只考慮局部區(qū)域中代理或地圖元素之間的相互作用。下面展示的偽代碼描述了動(dòng)態(tài)關(guān)鍵對(duì)象注意力的實(shí)現(xiàn)。

圖片

噪聲軌跡作為預(yù)測(cè)

PPAD算法模型將預(yù)測(cè)和規(guī)劃過(guò)程交錯(cuò)起來(lái),逐步規(guī)劃自車和代理的軌跡。然后通過(guò)模仿學(xué)習(xí)將專家駕駛知識(shí)強(qiáng)化到模型中。在訓(xùn)練過(guò)程中,將噪聲軌跡作為預(yù)測(cè)引入PPAD框架。具體來(lái)說(shuō),我們通過(guò)添加噪聲來(lái)擾亂真值目標(biāo)自車軌跡的每一步。然后訓(xùn)練自車預(yù)測(cè)自車的原始下一步路徑點(diǎn)偏移,而不管其起始噪聲位置受到何種干擾。即使系統(tǒng)從不準(zhǔn)確的位置開(kāi)始,它也會(huì)通過(guò)與矢量化實(shí)例和環(huán)境交互來(lái)學(xué)習(xí)預(yù)測(cè)準(zhǔn)確的路徑點(diǎn)偏移。這種策略提高了規(guī)劃性能。

實(shí)驗(yàn)結(jié)果&評(píng)價(jià)指標(biāo)

為了驗(yàn)證我們提出算法模型的有效性,我們?cè)趎uScenes數(shù)據(jù)集上進(jìn)行了開(kāi)環(huán)實(shí)驗(yàn),相關(guān)的實(shí)驗(yàn)結(jié)果如下表所示。

在nuScenes 數(shù)據(jù)集上的開(kāi)環(huán)規(guī)劃結(jié)果

通過(guò)實(shí)驗(yàn)結(jié)果可以看出,我們提出的PPAD算法模型大大超越了當(dāng)前最先進(jìn)算法的表現(xiàn)性能。特別是對(duì)于L2距離指標(biāo),在時(shí)間范圍內(nèi)可以觀察到約20%的持續(xù)提升。得益于提出的預(yù)測(cè)和規(guī)劃的迭代交互,PPAD算法模型可以幫助避免碰撞,與其他端到端自動(dòng)駕駛算法模型VAD相比,在碰撞率方面取得了更好的結(jié)果。

此外,我們也在Argoverse2數(shù)據(jù)集上進(jìn)行了實(shí)驗(yàn)進(jìn)一步公平地比較我們的方法和基線算法模型,相關(guān)的實(shí)驗(yàn)結(jié)果如下表所示。

在Argoverse 數(shù)據(jù)集上的開(kāi)環(huán)規(guī)劃結(jié)果

通過(guò)實(shí)驗(yàn)結(jié)果也可以看出,我們的方法可以在 L2 距離和碰撞率指標(biāo)方面始終以明顯優(yōu)勢(shì)超越基線。

此外,為了展示我們的PPAD整體性能,我們還在下表中提供了傳統(tǒng)感知和運(yùn)動(dòng)預(yù)測(cè)任務(wù)的規(guī)劃指標(biāo)之外的評(píng)估結(jié)果。我們的 PPAD 在上游感知和預(yù)測(cè)任務(wù)中也取得了令人鼓舞的性能,這表明整個(gè)系統(tǒng)是聯(lián)合優(yōu)化的。

規(guī)劃任務(wù)以外的任務(wù)的結(jié)果比較

為了更加直觀的展示我們提出算法模型的表現(xiàn)性能,下圖是相關(guān)的可視化結(jié)果。PPAD 可以精確地感知場(chǎng)景,并以合理和多樣化的動(dòng)作預(yù)測(cè)周圍的代理。它還為自身車輛規(guī)劃了一條平滑而準(zhǔn)確的軌跡。

結(jié)論

在本文中,我們提出了一種新穎的自動(dòng)駕駛框架 PPAD。與以前缺乏深入交互建模的方法不同,我們將規(guī)劃問(wèn)題提出為自我車輛和代理之間的多步驟預(yù)測(cè)和規(guī)劃過(guò)程,并且實(shí)現(xiàn)了SOTA的效果。

責(zé)任編輯:張燕妮 來(lái)源: 自動(dòng)駕駛之心
相關(guān)推薦

2023-10-30 09:47:00

自動(dòng)駕駛技術(shù)

2024-04-17 09:50:28

自動(dòng)駕駛端到端

2024-02-21 09:14:32

端到端自動(dòng)駕駛

2024-04-15 11:40:37

自動(dòng)駕駛端到端

2024-06-19 09:45:07

2023-08-24 09:52:44

自動(dòng)駕駛設(shè)計(jì)

2024-03-13 09:39:45

端到端自動(dòng)駕駛

2024-07-15 07:30:00

自動(dòng)駕駛AI

2024-01-04 09:35:41

自動(dòng)駕駛端到端

2024-01-23 13:32:53

地平線自動(dòng)駕駛

2023-12-11 10:29:11

自動(dòng)駕駛系統(tǒng)

2023-08-05 13:08:54

2023-12-18 10:15:30

自動(dòng)駕駛自然語(yǔ)言

2025-04-07 03:00:00

自動(dòng)駕駛

2023-10-18 09:40:25

自動(dòng)駕駛技術(shù)

2023-01-04 09:59:48

自動(dòng)駕駛技術(shù)

2023-10-10 09:31:35

自動(dòng)駕駛技術(shù)

2025-02-10 10:35:00

自動(dòng)駕駛端到端模型

2024-08-14 10:40:00

模型自動(dòng)駕駛

2024-06-13 11:36:46

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)