端到端自動(dòng)駕駛下的軌跡預(yù)測(cè),未來走向如何?最新綜述一覽前沿!
本文經(jīng)自動(dòng)駕駛之心公眾號(hào)授權(quán)轉(zhuǎn)載,轉(zhuǎn)載請(qǐng)聯(lián)系出處。
論文鏈接:https://arxiv.org/abs/2307.07527
人為失誤對(duì)導(dǎo)致人員傷亡、車輛損壞和安全問題的道路碰撞的重大影響約占94%(誤差為±2.2%),因此需要探索替代方法。自動(dòng)駕駛汽車(AVs)已經(jīng)成為一種很有前途的解決方案,它用先進(jìn)的計(jì)算機(jī)輔助決策系統(tǒng)取代了人類駕駛員。然而為了讓AV有效地在道路上行駛,它們必須具備預(yù)測(cè)附近交通參與者未來行為的能力,類似于人類駕駛員的預(yù)測(cè)駕駛能力。建立在現(xiàn)有文獻(xiàn)的基礎(chǔ)上,對(duì)于推進(jìn)該領(lǐng)域并全面了解自動(dòng)駕駛背景下的軌跡預(yù)測(cè)方法至關(guān)重要。為了滿足這一需求,我們進(jìn)行了一項(xiàng)全面的綜述,重點(diǎn)關(guān)注AV的軌跡預(yù)測(cè)方法,特別強(qiáng)調(diào)機(jī)器學(xué)習(xí)技術(shù),包括基于深度學(xué)習(xí)和強(qiáng)化學(xué)習(xí)的方法。我們已經(jīng)廣泛研究了200多項(xiàng)與AVs背景下的軌跡預(yù)測(cè)相關(guān)的研究。本文首先介紹了預(yù)測(cè)車輛軌跡的一般問題,并概述了貫穿始終的關(guān)鍵概念和術(shù)語。在簡要概述了傳統(tǒng)方法之后,本文對(duì)幾種基于深度學(xué)習(xí)的技術(shù)進(jìn)行了全面評(píng)估。對(duì)每種方法進(jìn)行了簡要總結(jié),并對(duì)其優(yōu)缺點(diǎn)進(jìn)行了詳細(xì)分析。討論進(jìn)一步擴(kuò)展到基于強(qiáng)化學(xué)習(xí)的方法。本文還研究了軌跡預(yù)測(cè)任務(wù)中常用的各種數(shù)據(jù)集和評(píng)估指標(biāo)。為了鼓勵(lì)進(jìn)行公正客觀的討論,我們比較了兩種主要的學(xué)習(xí)過程,考慮到具體的功能特征。通過識(shí)別現(xiàn)有文獻(xiàn)中的挑戰(zhàn)并概述潛在的研究方向,這篇綜述對(duì)AV軌跡預(yù)測(cè)領(lǐng)域的知識(shí)進(jìn)步做出了重大貢獻(xiàn)。其主要目標(biāo)是簡化當(dāng)前的研究工作,并提供未來的視角,最終有利于該領(lǐng)域的未來發(fā)展。
動(dòng)機(jī)
軌道預(yù)測(cè)已經(jīng)獲得了巨大的發(fā)展,一些學(xué)者也在這一領(lǐng)域進(jìn)行研究。表I總結(jié)了相關(guān)的調(diào)查現(xiàn)狀,以及不同的分類方法和貢獻(xiàn)。
運(yùn)動(dòng)預(yù)測(cè)包括根據(jù)所需的抽象水平預(yù)測(cè)物體的行為、動(dòng)作或軌跡。“行為”一詞包括一般動(dòng)作及其執(zhí)行方式,如“跟隨道路并保持安全距離”。另一方面,“機(jī)動(dòng)”是指物體可以在不需要詳細(xì)說明的情況下執(zhí)行的離散動(dòng)作,如“右轉(zhuǎn)”,通過描述對(duì)象在離散時(shí)間步長上的位置來提供最詳細(xì)的預(yù)測(cè)類型。先前的調(diào)查主要強(qiáng)調(diào)自動(dòng)駕駛汽車領(lǐng)域的運(yùn)動(dòng)預(yù)測(cè)和行為預(yù)測(cè)。此外,其他綜述混合了車輛和行人的軌跡預(yù)測(cè)。關(guān)于自動(dòng)駕駛軌跡預(yù)測(cè)機(jī)器學(xué)習(xí)方法的全面而專門的綜述仍然相對(duì)未被探索。此外,近年來軌跡預(yù)測(cè)領(lǐng)域的一些進(jìn)步,包括基于計(jì)算機(jī)視覺的方法、強(qiáng)化學(xué)習(xí)等,在現(xiàn)有的調(diào)查中沒有得到解決,這些調(diào)查也需要探索。因此,在這一領(lǐng)域存在著進(jìn)一步探索和研究的巨大潛力。
趨勢(shì)
近年來,自動(dòng)駕駛在汽車行業(yè)越來越受歡迎。包括特斯拉、通用汽車和寶馬在內(nèi)的知名汽車制造商進(jìn)行了大量投資,并專注于自動(dòng)駕駛汽車的軌跡預(yù)測(cè)和相關(guān)技術(shù),以開發(fā)AD技術(shù)。與AD相關(guān)的關(guān)鍵詞的全球搜索趨勢(shì),如軌跡預(yù)測(cè)、駕駛輔助、行為預(yù)測(cè)、軌跡規(guī)劃和避障,如圖1和圖2所示。在圖1中,相關(guān)關(guān)鍵詞的比較顯示了在同一時(shí)間段內(nèi)的變化。這表明,駕駛輔助和避障在全球范圍內(nèi)產(chǎn)生了類似程度的興奮。然而,在AD領(lǐng)域,最近在軌跡預(yù)測(cè)、軌跡規(guī)劃和行為預(yù)測(cè)等關(guān)鍵詞方面取得了進(jìn)展。值得注意的是,軌跡預(yù)測(cè)專注于自動(dòng)駕駛中更具體的領(lǐng)域。在圖2中,描述了全球范圍內(nèi)與關(guān)鍵字相關(guān)的平均搜索次數(shù)。值得注意的是,與軌跡預(yù)測(cè)、軌跡規(guī)劃和行為預(yù)測(cè)等其他術(shù)語相比,駕駛輔助和避障關(guān)鍵詞的搜索次數(shù)更高。軌跡預(yù)測(cè)目前正在AD領(lǐng)域發(fā)展,這表明人們對(duì)該領(lǐng)域的興趣和發(fā)展越來越大。
主要貢獻(xiàn)
總結(jié)來說,本文的主要貢獻(xiàn)如下:
- 本文對(duì)自動(dòng)駕駛汽車軌跡預(yù)測(cè)方法進(jìn)行了實(shí)證研究,并廣泛關(guān)注基于機(jī)器學(xué)習(xí)的方法。為了更好地理解,還簡要介紹了AV的軌跡預(yù)測(cè)問題、相關(guān)術(shù)語和傳統(tǒng)方法;
- 簡要評(píng)估了軌跡預(yù)測(cè)中的傳統(tǒng)方法,如基于物理的方法、采樣方法和概率模型,并討論了它們的優(yōu)缺點(diǎn);
- 對(duì)自動(dòng)駕駛汽車軌跡預(yù)測(cè)中普遍使用的基于深度學(xué)習(xí)和強(qiáng)化學(xué)習(xí)的方法進(jìn)行了全面評(píng)估;
- 為用于評(píng)估軌跡預(yù)測(cè)方法性能的度量和數(shù)據(jù)集提供了分析總結(jié);
- 對(duì)這些方法進(jìn)行了比較,分析了每種方法的優(yōu)缺點(diǎn)。此外,還確定了挑戰(zhàn)和潛在的研究途徑。
軌跡預(yù)測(cè)方法中的應(yīng)用技術(shù)
自動(dòng)駕駛中的軌跡預(yù)測(cè)方法可以大致分為以下幾類:
傳統(tǒng)方法
傳統(tǒng)的軌跡預(yù)測(cè)方法是指在自動(dòng)駕駛(AD)中通常用于預(yù)測(cè)道路使用者未來軌跡的傳統(tǒng)方法。這些方法通常依賴于成熟的數(shù)學(xué)和統(tǒng)計(jì)技術(shù),根據(jù)歷史數(shù)據(jù)和預(yù)定義的模型進(jìn)行預(yù)測(cè)。一些常用的常規(guī)方法有:
- 基于物理的模型:這些方法依賴于物理定律和運(yùn)動(dòng)學(xué)原理來預(yù)測(cè)車輛的未來軌跡。他們考慮了當(dāng)前位置、速度、加速度和道路限制等因素來估計(jì)未來的路徑;
- 運(yùn)動(dòng)學(xué)模型:這些模型假設(shè)物體的運(yùn)動(dòng)可以用簡單的數(shù)學(xué)方程來描述,例如等速或恒加速度模型。他們根據(jù)物體的當(dāng)前狀態(tài)及其假定的運(yùn)動(dòng)動(dòng)力學(xué)來估計(jì)未來的位置;
- 卡爾曼濾波器:卡爾曼濾波器廣泛用于跟蹤和預(yù)測(cè)任務(wù)。他們將傳感器的測(cè)量與數(shù)學(xué)模型的預(yù)測(cè)相結(jié)合,以估計(jì)物體的當(dāng)前狀態(tài),并預(yù)測(cè)其未來軌跡;
- 馬爾可夫模型:馬爾可夫模型捕捉對(duì)象連續(xù)狀態(tài)之間的概率相關(guān)性。他們使用歷史數(shù)據(jù)來估計(jì)過渡概率,并根據(jù)最可能的狀態(tài)序列進(jìn)行預(yù)測(cè);
- 概率模型:概率方法通過將未來軌跡表示為概率分布來考慮軌跡預(yù)測(cè)中的不確定性。這些模型利用統(tǒng)計(jì)技術(shù)來估計(jì)最可能的軌跡,并提供置信度度量;
- 貝葉斯濾波器:貝葉斯濾波器,如卡爾曼濾波器和粒子濾波器,廣泛用于軌跡預(yù)測(cè)。這些濾波器將傳感器的測(cè)量值與動(dòng)態(tài)模型相結(jié)合,以估計(jì)車輛的未來軌跡。它們可以處理有噪聲的傳感器數(shù)據(jù)并提供實(shí)時(shí)預(yù)測(cè)。
用于軌跡預(yù)測(cè)的常規(guī)方法通常在計(jì)算上高效并且相對(duì)容易實(shí)現(xiàn)。然而,它們?cè)谔幚砭哂袕?fù)雜交互和不確定性的復(fù)雜場(chǎng)景方面可能存在局限性。因此,人們對(duì)探索更先進(jìn)的基于機(jī)器學(xué)習(xí)的方法越來越感興趣,如深度學(xué)習(xí)和強(qiáng)化學(xué)習(xí),以提高軌跡預(yù)測(cè)的準(zhǔn)確性和穩(wěn)健性。
基于深度學(xué)習(xí)的方法
近年來,基于深度學(xué)習(xí)的方法在自動(dòng)駕駛汽車(AV)的軌跡預(yù)測(cè)方面受到了極大的關(guān)注。這些方法利用人工神經(jīng)網(wǎng)絡(luò)的力量,從大量數(shù)據(jù)中學(xué)習(xí)復(fù)雜的模式和關(guān)系。以下是一些常見的基于深度學(xué)習(xí)的軌跡預(yù)測(cè)方法:
- 遞歸神經(jīng)網(wǎng)絡(luò)(RNN):由于其能夠?qū)π蛄袛?shù)據(jù)進(jìn)行建模,因此在軌跡預(yù)測(cè)中被廣泛使用。長短期記憶(LSTM)和門控遞歸單元(GRU)等模型可以捕捉時(shí)間相關(guān)性,并根據(jù)過去的觀測(cè)結(jié)果預(yù)測(cè)未來的軌跡;
- 卷積神經(jīng)網(wǎng)絡(luò)(CNNs):CNNs主要用于圖像處理任務(wù),但也可以通過將軌跡數(shù)據(jù)視為類圖像表示來應(yīng)用于軌跡預(yù)測(cè)。細(xì)胞神經(jīng)網(wǎng)絡(luò)可以從軌跡數(shù)據(jù)中提取空間特征,并學(xué)習(xí)基于這些特征預(yù)測(cè)未來軌跡;
- 生成對(duì)抗性網(wǎng)絡(luò)(GANs):GANs由生成器網(wǎng)絡(luò)和鑒別器網(wǎng)絡(luò)組成。它們可以用于軌跡預(yù)測(cè),方法是訓(xùn)練生成器生成真實(shí)的未來軌跡,訓(xùn)練鑒別器區(qū)分真實(shí)軌跡和生成軌跡。GANs可以捕捉訓(xùn)練數(shù)據(jù)的分布,并生成多樣化且合理的軌跡預(yù)測(cè);
- 變分自動(dòng)編碼器(VAE):VAE是學(xué)習(xí)輸入數(shù)據(jù)的潛在表示的生成模型。它們可以通過學(xué)習(xí)過去軌跡的潛在空間表示并基于該潛在表示生成未來軌跡來用于軌跡預(yù)測(cè)。VAE能夠生成多樣化的概率軌跡預(yù)測(cè);
- Transformer模型:最初為自然語言處理任務(wù)引入的Transformer模型在軌跡預(yù)測(cè)方面也顯示出了前景。這些模型可以捕捉場(chǎng)景中不同代理之間的長期依賴關(guān)系和交互。通過關(guān)注相關(guān)的空間和時(shí)間信息,變換器模型可以生成準(zhǔn)確的軌跡預(yù)測(cè)。
與傳統(tǒng)方法相比,基于深度學(xué)習(xí)的方法在捕捉復(fù)雜模式、處理不同場(chǎng)景和生成更準(zhǔn)確的軌跡預(yù)測(cè)方面的性能有所提高。然而,它們需要大量標(biāo)記的訓(xùn)練數(shù)據(jù)和用于訓(xùn)練和推理的計(jì)算資源。此外,學(xué)習(xí)模型的可解釋性可能是一個(gè)挑戰(zhàn),因此驗(yàn)證預(yù)測(cè)并了解模型在現(xiàn)實(shí)世界場(chǎng)景中的局限性非常重要。
基于強(qiáng)化學(xué)習(xí)的方法
強(qiáng)化學(xué)習(xí)(RL)方法已被探索用于自動(dòng)駕駛(AD)中的軌跡預(yù)測(cè),為學(xué)習(xí)預(yù)測(cè)未來軌跡的最優(yōu)策略提供了一種獨(dú)特的方法。雖然RL傳統(tǒng)上與決策和控制相關(guān),但它也可以用于軌跡預(yù)測(cè)。以下是一些用于軌跡預(yù)測(cè)的RL方法:
- 逆強(qiáng)化學(xué)習(xí)(IRL):IRL背后的關(guān)鍵思想是觀察和分析通常由人類駕駛員提供的專家演示,然后推斷激勵(lì)他們行動(dòng)的潛在獎(jiǎng)勵(lì)函數(shù)。這種推斷的獎(jiǎng)勵(lì)函數(shù)可用于預(yù)測(cè)與觀察到的專家行為一致的未來軌跡;
- 深度逆強(qiáng)化學(xué)習(xí)(Deep IRL):深度IRL是反向強(qiáng)化學(xué)習(xí)的擴(kuò)展,它將深度神經(jīng)網(wǎng)絡(luò)與IRL框架相結(jié)合,用于預(yù)測(cè)AD中的軌跡。深度IRL旨在使用深度學(xué)習(xí)技術(shù)從專家演示中推斷潛在的獎(jiǎng)勵(lì)函數(shù),從而允許獎(jiǎng)勵(lì)函數(shù)的更復(fù)雜和高維表示;
- 模仿學(xué)習(xí)(IL):用于軌跡預(yù)測(cè)的IL使自主系統(tǒng)能夠模仿人類駕駛員的行為,并生成與專家演示一致的軌跡。它利用人類駕駛員的知識(shí)和專業(yè)知識(shí),做出更像人類的預(yù)測(cè),并以類似于人類駕駛的方式在環(huán)境中導(dǎo)航。
通過將RL方法應(yīng)用于軌跡預(yù)測(cè),模型可以從數(shù)據(jù)和與環(huán)境的交互中學(xué)習(xí),從而對(duì)未來軌跡做出準(zhǔn)確的預(yù)測(cè)。然而,重要的是要考慮RL算法的復(fù)雜性和訓(xùn)練數(shù)據(jù)的可用性之間的權(quán)衡,以及在現(xiàn)實(shí)世界環(huán)境中對(duì)各種駕駛場(chǎng)景和不確定性進(jìn)行泛化的挑戰(zhàn)。
傳統(tǒng)軌跡預(yù)測(cè)方法
本節(jié)將預(yù)測(cè)方法分為三大類,即基于物理的模型、采樣方法和概率模型,表II簡要概述了軌跡預(yù)測(cè)的傳統(tǒng)方法及其局限性和優(yōu)勢(shì)。在圖6中,描述了幾種傳統(tǒng)方法及其在解決自動(dòng)駕駛汽車(AV)軌跡預(yù)測(cè)任務(wù)中的作用。對(duì)論文的分析表明,在本次調(diào)查中,56%的論文關(guān)注概率方法,35%的論文關(guān)注抽樣方法,其余9%的論文致力于抽樣方法。
基于物理的方法
第一類建議的基于物理的預(yù)測(cè)模型使用經(jīng)典力學(xué)的運(yùn)動(dòng)方程作為目標(biāo)物體未來運(yùn)動(dòng)建模的基礎(chǔ)。可以使用動(dòng)力學(xué)或運(yùn)動(dòng)學(xué)模型來描述物理行為。動(dòng)力學(xué)模型考慮了引起運(yùn)動(dòng)的輪胎橫向和縱向力,但通常選擇基本動(dòng)力學(xué)模型來平衡預(yù)測(cè)精度和計(jì)算工作量。相比之下,運(yùn)動(dòng)學(xué)模型由于其簡單的形式而更常用,并且卡爾曼濾波(KF)技術(shù)可以處理車輛當(dāng)前條件下的干擾,如不確定性或噪聲。例如,張等人提出了一種基于車-車通信和KF的方法,使宿主車輛能夠預(yù)測(cè)遠(yuǎn)程車輛的軌跡并避開障礙物。
基于采樣的方法
這些技術(shù)包括對(duì)交通參與者的未來狀態(tài)進(jìn)行采樣。這些方法不是預(yù)測(cè)單個(gè)軌跡,而是生成可能的車輛狀態(tài)分布,這使它們對(duì)噪聲和不確定性更具魯棒性。采樣主要有兩種類型:生成多個(gè)軌跡段或粒子狀態(tài)。在他們的研究中,Houenou等人將基于機(jī)動(dòng)的方法與假設(shè)恒定偏航率和加速度(CYRA)的基于模型的方法相結(jié)合,開發(fā)了一種軌跡預(yù)測(cè)方法。他們確定了機(jī)動(dòng),并從通過最小化成本函數(shù)生成的集合中選擇了最佳軌跡。
概率模型
軌跡預(yù)測(cè)中的概率框架是指使用概率論來建模和估計(jì)物體或?qū)嶓w(如車輛、行人或其他移動(dòng)物體)未來軌跡的可能性。它涉及表示預(yù)測(cè)過程中的不確定性和可變性,并為預(yù)測(cè)軌跡提供概率分布或置信度度量。在概率框架中,軌跡預(yù)測(cè)通常被公式化為條件概率問題,其中目標(biāo)是在給定觀察到的過去軌跡、傳感器測(cè)量和其他相關(guān)信息的情況下估計(jì)未來軌跡的概率分布。這包括結(jié)合概率模型、統(tǒng)計(jì)技術(shù)和機(jī)器學(xué)習(xí)算法來捕捉數(shù)據(jù)中的不確定性和相關(guān)性。
- 高斯混合模型:高斯混合模型(GMM)是一種概率模型,通常用于軌跡預(yù)測(cè),以捕捉數(shù)據(jù)的不確定性和復(fù)雜性。它將軌跡的分布表示為多個(gè)高斯分布的組合,每個(gè)高斯分布表示軌跡的可能模式或簇??傊珿MM通過捕捉數(shù)據(jù)中的復(fù)雜模式和變化,為軌跡預(yù)測(cè)提供了一種通用且穩(wěn)健的方法。它們能夠處理多模式分布,這允許表示車輛表現(xiàn)出的不同機(jī)動(dòng)類型或行為模式。然而,需要注意的是,使用GMM進(jìn)行訓(xùn)練和推理可能需要計(jì)算。此外,確定模型中高斯分量或模式的最佳數(shù)量可能是一項(xiàng)具有挑戰(zhàn)性的任務(wù)。
- 高斯過程:當(dāng)利用高斯過程(GP)進(jìn)行軌跡預(yù)測(cè)時(shí),軌跡被視為沿時(shí)間軸從GP中提取的樣本。這些樣本由N個(gè)離散點(diǎn)表示,這些離散點(diǎn)被映射到N維空間。在這個(gè)N維空間中,樣本遵循高斯分布。在建模步驟中,GP模型的主要目標(biāo)是基于這些樣本來估計(jì)GP參數(shù)。通過將GP與觀測(cè)到的軌跡樣本擬合,該模型捕捉到了數(shù)據(jù)的基本模式和動(dòng)態(tài)。GP參數(shù),如均值和協(xié)方差,定義了GP的特征,并確定了預(yù)測(cè)軌跡的形狀和不確定性??傊?,GP是AVs軌跡預(yù)測(cè)的一種有價(jià)值的工具,它具有靈活性、概率預(yù)測(cè)、適應(yīng)性以及與其他技術(shù)的潛在集成等優(yōu)點(diǎn)。然而,基于軌跡樣本的方法的一個(gè)局限性是其對(duì)新環(huán)境的適用性有限,這阻礙了其對(duì)不同場(chǎng)景和環(huán)境的適應(yīng)性。
- 隱馬爾可夫模型:在使用隱馬爾可夫模型(HMM)的軌跡預(yù)測(cè)中,觀測(cè)序列由交通參與者的先前狀態(tài)組成。HMM算法被應(yīng)用于基于這些過去的觀測(cè)來估計(jì)最有可能的未來觀測(cè)序列。總之,HMM對(duì)軌跡預(yù)測(cè)非常有益,因?yàn)樗軌虿东@時(shí)間相關(guān)性,處理丟失或有噪聲的數(shù)據(jù),并考慮到預(yù)測(cè)未來軌跡所涉及的不確定性。然而,HMM的一個(gè)假設(shè)是隱藏狀態(tài)是馬爾可夫的,這意味著過渡到未來狀態(tài)的概率僅取決于當(dāng)前狀態(tài)。
- 動(dòng)態(tài)貝葉斯網(wǎng)絡(luò):通過結(jié)合時(shí)間序列并利用貝葉斯網(wǎng)絡(luò)框架,動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)(DBN)為軌跡預(yù)測(cè)提供了一種基于機(jī)動(dòng)的方法。DBN和貝葉斯網(wǎng)絡(luò)共享進(jìn)行概率推斷的基本概念和方法??傊?dāng)用于軌跡預(yù)測(cè)時(shí),DBN考慮了交通參與者之間的互動(dòng),從而提高了傳統(tǒng)基于機(jī)器學(xué)習(xí)的方法的性能。然而,DBN在準(zhǔn)確識(shí)別機(jī)動(dòng)和生成軌跡方面仍然面臨挑戰(zhàn)。許多現(xiàn)有的方法僅限于區(qū)分兩個(gè)或三個(gè)動(dòng)作,如車道保持和變道,這限制了模型在廣泛場(chǎng)景中推廣的能力。因此,需要進(jìn)一步改進(jìn)基于DBN的方法,以增強(qiáng)其機(jī)動(dòng)識(shí)別能力,并提高模型在軌跡預(yù)測(cè)任務(wù)中的泛化能力。
總結(jié)
基于深度學(xué)習(xí)的預(yù)測(cè)方法
傳統(tǒng)的預(yù)測(cè)技術(shù)僅在基本預(yù)測(cè)場(chǎng)景和短期預(yù)測(cè)任務(wù)中有效?;谏疃葘W(xué)習(xí)的軌跡預(yù)測(cè)模型由于能夠考慮有助于準(zhǔn)確預(yù)測(cè)的各種因素而廣受歡迎。這些模型考慮了物理因素,如車輛的位置、速度、加速度、尺寸和形狀。他們還考慮了與道路相關(guān)的因素,如交通標(biāo)志、紅綠燈、道路幾何形狀和道路障礙物。此外,還考慮了與交互相關(guān)的因素,包括車輛之間的距離、相對(duì)速度和通信系統(tǒng)的存在。圖7提供了這些方法的總體概述。以下部分概述了用于自動(dòng)駕駛汽車(AV)軌跡預(yù)測(cè)的最流行的基于深度學(xué)習(xí)的方法。
序列建模
基于深度學(xué)習(xí)的軌跡預(yù)測(cè)方法通常涉及使用序列網(wǎng)絡(luò)從歷史軌跡中提取特征,并可以作為輸出層。這些網(wǎng)絡(luò)通常包括遞歸神經(jīng)網(wǎng)絡(luò)(RNN)、時(shí)序卷積神經(jīng)網(wǎng)絡(luò)(TCN)、注意力機(jī)制(AM)和變換器。圖8提供了在軌跡預(yù)測(cè)的順序建模中使用不同算法的研究論文分布的百分比視覺表示??梢杂^察到,與RNN、AM和Transformers等其他算法相比,TCN在AV軌跡預(yù)測(cè)任務(wù)中不太常用。
- RNN:遞歸神經(jīng)網(wǎng)絡(luò)(RNN)被設(shè)計(jì)用于處理時(shí)間信息,而傳統(tǒng)的機(jī)器學(xué)習(xí)方法和卷積神經(jīng)網(wǎng)絡(luò)(CNNs)擅長處理空間信息。它維護(hù)過去時(shí)間步長數(shù)據(jù)的記錄,并結(jié)合輸入和隱藏狀態(tài)以生成所需的輸出。然而,當(dāng)處理大量的時(shí)間步長時(shí),RNN的梯度可能會(huì)減弱或爆炸,從而引發(fā)問題。為了解決這個(gè)問題,已經(jīng)開發(fā)了門控RNN,如長短期記憶網(wǎng)絡(luò)(LSTM)和門控遞歸單元(GRU)?;赗NN的軌跡預(yù)測(cè)模型被分類為單個(gè)RNN模型或多個(gè)RNN模型。為了基于機(jī)動(dòng)或單模態(tài)軌跡預(yù)測(cè)來預(yù)測(cè)軌跡,使用單RNN模型。此外,它可以被納入輔助模型中,以促進(jìn)更復(fù)雜的功能,例如感知交互的預(yù)測(cè)。神經(jīng)網(wǎng)絡(luò)的發(fā)展導(dǎo)致了各種類型的RNN架構(gòu)的廣泛使用。盡管RNN被廣泛用于分析和預(yù)測(cè)數(shù)據(jù)序列,如軌跡預(yù)測(cè),但它們?cè)谀M空間關(guān)系(如車輛交互)和處理類似圖像的數(shù)據(jù)(如駕駛場(chǎng)景的上下文)方面存在局限性。這就是為什么復(fù)雜的基于RNN的解決方案通常需要多種技術(shù)來克服單個(gè)RNN的局限性。總之,RNN通過有效地建模時(shí)間相關(guān)性,為軌跡預(yù)測(cè)提供了一種強(qiáng)大的方法。它們可以處理可變長度的序列并提供可解釋性。然而,它們可能會(huì)受到梯度消失或爆炸以及順序計(jì)算限制的影響。在將RNN應(yīng)用于軌跡預(yù)測(cè)任務(wù)時(shí),了解這些因素至關(guān)重要。表III總結(jié)了基于RNN的軌跡預(yù)測(cè)方法,提供了以秒為單位的預(yù)測(cè)范圍(PH)和預(yù)測(cè)軌跡數(shù)量的信息。該表還包括用于訓(xùn)練和測(cè)試的評(píng)估指標(biāo)(EM),并強(qiáng)調(diào)了每項(xiàng)研究的優(yōu)勢(shì)和劣勢(shì)。
時(shí)序卷積網(wǎng)絡(luò)
時(shí)序卷積網(wǎng)絡(luò)(TCN)是一種流行的深度神經(jīng)網(wǎng)絡(luò)架構(gòu),用于軌跡預(yù)測(cè)任務(wù)。在軌跡預(yù)測(cè)任務(wù)中,TCN根據(jù)歷史軌跡數(shù)據(jù)進(jìn)行訓(xùn)練,并用于預(yù)測(cè)車輛或行人的未來軌跡。
總之,TCN為軌跡預(yù)測(cè)任務(wù)中的時(shí)間依賴性建模提供了一種強(qiáng)大的方法。它們擅長捕捉短期和長期動(dòng)態(tài),執(zhí)行高效的并行計(jì)算,并具有可解釋的感受野。然而,空間關(guān)系和長期記憶可能需要額外的考慮。表IV概述了基于TCN的軌跡預(yù)測(cè)方法,包括預(yù)測(cè)范圍(以秒為單位)、預(yù)測(cè)的軌跡數(shù)量以及用于訓(xùn)練和測(cè)試的評(píng)估指標(biāo)。該表還強(qiáng)調(diào)了每項(xiàng)研究的優(yōu)勢(shì)和劣勢(shì)。
注意力機(jī)制
注意力機(jī)制(AM)是一種認(rèn)知模型,通過使用有限的注意力資源從大量數(shù)據(jù)中有效提取高價(jià)值信息,來近似人類的思維過程。它經(jīng)常用于深度學(xué)習(xí)任務(wù),,自注意力是一種流行的基于輸入序列識(shí)別權(quán)重和新上下文向量的方法。最近的一些研究已經(jīng)將注意力機(jī)制用于軌跡預(yù)測(cè)和意圖估計(jì)。
總之,軌跡預(yù)測(cè)中的注意力機(jī)制提高了模型關(guān)注相關(guān)信息、處理可變長度序列、提供可解釋性以及增強(qiáng)對(duì)噪聲的魯棒性的能力。然而,它也存在與計(jì)算開銷、模型復(fù)雜性、注意力偏差和數(shù)據(jù)依賴性相關(guān)的潛在缺點(diǎn)。表五全面總結(jié)了基于注意力的軌跡預(yù)測(cè)方法。它包括重要信息,如預(yù)測(cè)范圍(以秒為單位)、預(yù)測(cè)軌跡的數(shù)量以及用于訓(xùn)練和測(cè)試的評(píng)估指標(biāo)。此外,該表還提供了對(duì)每項(xiàng)研究的優(yōu)勢(shì)和劣勢(shì)的見解。
Transformer
Transformer是一種利用注意力機(jī)制概念的神經(jīng)網(wǎng)絡(luò)設(shè)計(jì),已被用于各種項(xiàng)目??傊瑃ransformer通過捕捉復(fù)雜的依賴關(guān)系和交互作用,展示了其在軌跡預(yù)測(cè)方面的潛力。它們提供了可擴(kuò)展性、遷移學(xué)習(xí)功能以及處理多個(gè)代理的能力。然而,它們需要大量的計(jì)算資源,并且可能在可解釋性和數(shù)據(jù)效率方面存在挑戰(zhàn)。表VI總結(jié)了基于Transformer的軌跡預(yù)測(cè)方法,介紹了關(guān)鍵細(xì)節(jié),如預(yù)測(cè)范圍(以秒為單位)、預(yù)測(cè)的軌跡數(shù)量以及用于訓(xùn)練和測(cè)試的評(píng)估指標(biāo)。此外,該表強(qiáng)調(diào)了每項(xiàng)研究的優(yōu)勢(shì)和劣勢(shì)。
基于視覺建模
有兩種類型的預(yù)測(cè)方法,它們?cè)谥贫A(yù)測(cè)的方式上有所不同。第一種是鳥瞰圖(BEV)方法,它使用一種算法來處理自上而下的類似地圖的視圖中的數(shù)據(jù)。第二種是自車相機(jī)預(yù)測(cè),它涉及通過自車載體的視角來觀察世界。然而,由于各種因素,自車相機(jī)方法通常比BEV方法更具挑戰(zhàn)性。首先,BEV方法提供了更寬的視野和更準(zhǔn)確的預(yù)測(cè),而自車相機(jī)方法的視野更窄,預(yù)測(cè)范圍有限。此外,自車攝像機(jī)方法比BEV方法更容易出現(xiàn)障礙。盡管存在這些困難,但自車攝像頭方法仍然比純電動(dòng)汽車方法更有益,因?yàn)榇蠖鄶?shù)車輛都無法使用攝像頭來定位道路上的目標(biāo)代理和純電動(dòng)汽車。因此,預(yù)測(cè)系統(tǒng)應(yīng)該能夠從自車載體的角度看待世界,如圖9所示。各種基于視覺的技術(shù)及其對(duì)解決自動(dòng)駕駛汽車軌跡預(yù)測(cè)任務(wù)的貢獻(xiàn)如圖10所示。在AVs研究論文中,每種技術(shù)對(duì)軌跡預(yù)測(cè)的貢獻(xiàn)大致相等。本節(jié)重點(diǎn)介紹了卷積神經(jīng)網(wǎng)絡(luò)(CNNs)和圖神經(jīng)網(wǎng)絡(luò)(GNN)在解決該領(lǐng)域中的應(yīng)用。
CNN
卷積神經(jīng)網(wǎng)絡(luò)已成功應(yīng)用于各種計(jì)算機(jī)視覺任務(wù),包括軌跡預(yù)測(cè)。盡管細(xì)胞神經(jīng)網(wǎng)絡(luò)主要是為圖像數(shù)據(jù)設(shè)計(jì)的,但通過將軌跡序列視為結(jié)構(gòu)化網(wǎng)格狀輸入,它們可以適用于軌跡預(yù)測(cè)。
然而,大多數(shù)使用CNN框架的技術(shù)都采用鳥瞰圖(BEV)作為輸入,顯示自上而下的交通狀況視圖。BEV圖像可以使用多個(gè)數(shù)據(jù)源創(chuàng)建,包括激光雷達(dá)點(diǎn)云、占用網(wǎng)格(OG)和高精地圖(HD地圖)。最近的一些研究利用CNN從復(fù)雜的BEV表示中提取特征。
總之,CNN在捕捉空間模式和識(shí)別軌跡數(shù)據(jù)中的空間關(guān)系方面具有優(yōu)勢(shì)。它們?cè)趨?shù)共享方面是高效的,并且可以處理更大的數(shù)據(jù)集。然而,他們可能會(huì)在建模時(shí)間依賴性和處理可變長度序列方面遇到困難。表VII概述了基于CNN的軌跡預(yù)測(cè)方法,包括以秒為單位測(cè)量的預(yù)測(cè)范圍和預(yù)測(cè)的軌跡數(shù)量。該表還概述了用于訓(xùn)練和測(cè)試的評(píng)估指標(biāo),并強(qiáng)調(diào)了每項(xiàng)研究的優(yōu)勢(shì)和劣勢(shì)。以下各節(jié)將介紹基于GNN預(yù)測(cè)車輛軌跡的方法。
GNN
當(dāng)考慮將交互相關(guān)因素考慮在內(nèi)的預(yù)測(cè)技術(shù)時(shí),環(huán)境的每個(gè)元素都可以被視為圖中的一個(gè)節(jié)點(diǎn)。然而,許多現(xiàn)實(shí)世界的應(yīng)用程序從非歐幾里得空間生成數(shù)據(jù),而分析歐幾里得空間數(shù)據(jù)的傳統(tǒng)基于深度學(xué)習(xí)的方法在這種情況下表現(xiàn)不佳。每個(gè)場(chǎng)景都可以表示為具有可變大小無序節(jié)點(diǎn)的不規(guī)則圖,并且由于附近節(jié)點(diǎn)數(shù)量的變化,一些關(guān)鍵操作(如卷積)不直接適用于圖。然而,圖中的每個(gè)節(jié)點(diǎn)都通過邊連接到其他節(jié)點(diǎn),這可以用來確定各種對(duì)象的相互依賴性。圖神經(jīng)網(wǎng)絡(luò)(GNN)非常適合基于交互相關(guān)元素的車輛軌跡預(yù)測(cè)挑戰(zhàn)。方法如圖11所示。
- GCN:圖卷積網(wǎng)絡(luò)(GCN)是圖神經(jīng)網(wǎng)絡(luò)領(lǐng)域中一種流行的技術(shù)。它將卷積運(yùn)算從傳統(tǒng)的圖像數(shù)據(jù)處理擴(kuò)展到了圖形數(shù)據(jù)處理。關(guān)鍵思想是創(chuàng)建一個(gè)映射函數(shù),該函數(shù)可以從網(wǎng)絡(luò)中的節(jié)點(diǎn)特征及其相鄰節(jié)點(diǎn)中提取感知交互的特征??傊?,GCN通過顯式地建模對(duì)象之間的空間依賴性和關(guān)系,為軌跡預(yù)測(cè)提供了一種很有前途的方法。它們可以有效地捕捉上下文信息并處理不規(guī)則的圖形結(jié)構(gòu)。然而,在將GCN應(yīng)用于軌跡預(yù)測(cè)任務(wù)時(shí),應(yīng)仔細(xì)考慮可擴(kuò)展性、圖構(gòu)建和時(shí)間依賴性建模。表VIII概述了基于GCN的軌跡預(yù)測(cè)方法,包括以秒為單位測(cè)量的預(yù)測(cè)范圍和預(yù)測(cè)的軌跡數(shù)量,以及用于訓(xùn)練和測(cè)試的評(píng)估指標(biāo)。該表還強(qiáng)調(diào)了每項(xiàng)研究的優(yōu)勢(shì)和劣勢(shì)。
- GAN:從one-hop鄰域收集數(shù)據(jù)的方法在圖注意力網(wǎng)絡(luò)(GAT)和GCN之間變化很大,GAT采用注意力機(jī)制代替靜態(tài)歸一化卷積過程。總之,GAT使模型能夠關(guān)注圖中的相關(guān)節(jié)點(diǎn)(例如,車輛、行人),分配不同的權(quán)重來捕捉每個(gè)節(jié)點(diǎn)特征對(duì)預(yù)測(cè)特定對(duì)象軌跡的重要性。然而,GAT的性能在很大程度上取決于圖結(jié)構(gòu)的質(zhì)量和表示。設(shè)計(jì)合適的圖表示并考慮節(jié)點(diǎn)和邊的選擇對(duì)于獲得最佳結(jié)果至關(guān)重要。表IX總結(jié)了基于GAN的軌跡預(yù)測(cè)方法,強(qiáng)調(diào)了預(yù)測(cè)的軌跡數(shù)量和以秒為單位測(cè)量的預(yù)測(cè)范圍。該表還提供了對(duì)每項(xiàng)研究的優(yōu)勢(shì)和劣勢(shì)的見解,以及用于訓(xùn)練和測(cè)試的評(píng)估指標(biāo)。
- 其他GNN:高精地圖在自動(dòng)駕駛汽車的軌跡預(yù)測(cè)中起著至關(guān)重要的作用。高精地圖提供了有關(guān)道路網(wǎng)絡(luò)的詳細(xì)信息,包括車道標(biāo)記、交通信號(hào)和道路邊界,這有助于更準(zhǔn)確地預(yù)測(cè)車輛或行人的未來軌跡。研究人員正在探索整合多種信息來源的方法,包括高精地圖、傳感器數(shù)據(jù)和機(jī)器學(xué)習(xí)算法,以提高自動(dòng)駕駛汽車軌跡預(yù)測(cè)的準(zhǔn)確性和穩(wěn)健性。表X總結(jié)了用于軌跡預(yù)測(cè)的其他基于圖神經(jīng)網(wǎng)絡(luò)的方法,重點(diǎn)是預(yù)測(cè)的軌跡數(shù)量和以秒為單位測(cè)量的預(yù)測(cè)范圍。該表還提供了每項(xiàng)研究的優(yōu)勢(shì)和劣勢(shì),以及用于訓(xùn)練和測(cè)試的評(píng)估指標(biāo)。
CNN和GNN的結(jié)合
一些研究人員提出了使用RNN和CNN的組合來處理軌跡預(yù)測(cè)的時(shí)間和空間信息的模型。表XI總結(jié)了基于CNN的軌跡預(yù)測(cè)方法,強(qiáng)調(diào)了預(yù)測(cè)的軌跡數(shù)量和以秒為單位測(cè)量的預(yù)測(cè)范圍。該表還強(qiáng)調(diào)了每項(xiàng)研究的優(yōu)勢(shì)和劣勢(shì),包括用于訓(xùn)練和測(cè)試的評(píng)估指標(biāo)。
生成式模型
由于結(jié)果的潛在多樣性,預(yù)測(cè)多模態(tài)軌跡帶來了挑戰(zhàn)和不確定性。為了解決這個(gè)問題,一些研究人員轉(zhuǎn)向生成模型來創(chuàng)建能夠捕捉潛在多樣性的多模態(tài)軌跡。然而,為了使多模態(tài)軌跡預(yù)測(cè)模型有效,其輸出分布必須滿足一定的要求,包括多樣性、社會(huì)可接受性和可控性。僅使用一個(gè)基本事實(shí)來實(shí)現(xiàn)最優(yōu)分布可能很困難,并且可能導(dǎo)致不那么多樣化和不可接受的預(yù)測(cè)。為了克服這一挑戰(zhàn),已經(jīng)提出了生成對(duì)抗性網(wǎng)絡(luò)(GANs)和變分自動(dòng)編碼器(VAE)作為解決方案。圖12說明了兩個(gè)生成模型在協(xié)助自動(dòng)駕駛汽車(AV)完成軌跡預(yù)測(cè)任務(wù)方面的研究論文的參與情況(以百分比表示)。這兩個(gè)模型對(duì)預(yù)測(cè)過程的貢獻(xiàn)大致相等,顯示了它們?cè)谏蓽?zhǔn)確軌跡預(yù)測(cè)方面的共同責(zé)任。
- GAN:在軌跡預(yù)測(cè)任務(wù)中,生成對(duì)抗性網(wǎng)絡(luò)(GANs)用于基于輸入數(shù)據(jù)生成真實(shí)的軌跡。生成器將歷史軌跡數(shù)據(jù)作為輸入并生成未來軌跡,而鑒別器評(píng)估生成的軌跡的真實(shí)性。生成器經(jīng)過訓(xùn)練,通過欺騙鑒別器使其相信生成的軌跡是真實(shí)的,來提高生成軌跡的真實(shí)性。該方法如圖13所示。表XII總結(jié)了基于GAN的軌跡預(yù)測(cè)方法。
- VAE:自動(dòng)編碼器(AE)使用編碼器壓縮數(shù)據(jù),并使用解碼器對(duì)其進(jìn)行解碼,以產(chǎn)生重建誤差最小的重建輸出。然而,AE被批評(píng)為僅僅“記憶”數(shù)據(jù),數(shù)據(jù)生成能力有限。相反,變分自動(dòng)編碼器(VAE)具有跨越整個(gè)空間的生成能力,它解決了自動(dòng)編碼器中的非正則化潛在空間問題。VAE旨在最大限度地減少重建損失和相似性損失。表XIII總結(jié)了基于變分自動(dòng)編碼器的軌跡預(yù)測(cè)方法。
基于強(qiáng)化學(xué)習(xí)的方法
RL技術(shù)用于估計(jì)潛在成本函數(shù)或直接識(shí)別用于軌跡預(yù)測(cè)的最優(yōu)策略。在任何一種方法中,都假設(shè)被觀察的代理總是試圖通過利用基于特定成本函數(shù)的最優(yōu)策略來達(dá)到其目標(biāo)。圖15說明了RL方法在AV中的應(yīng)用。在MDP的框架內(nèi),基于RL的方法可以分為反向強(qiáng)化學(xué)習(xí)(IRL)方法、模仿學(xué)習(xí)(IL)方法和深度IRL方法,如下所述。圖14說明了RL的不同變體的研究文章的分布,以百分比表示,以及它們?cè)诮鉀QAV中的軌跡預(yù)測(cè)任務(wù)中的參與情況。
Inverse Reinforcement Learning
逆強(qiáng)化學(xué)習(xí)(IRL)背后的主要思想是學(xué)習(xí)解釋觀察到的主體行為的獎(jiǎng)勵(lì)函數(shù)。IRL的目的不是直接模仿觀察到的軌跡,而是了解驅(qū)動(dòng)這些軌跡的潛在動(dòng)機(jī)或目標(biāo)。通過推斷獎(jiǎng)勵(lì)函數(shù),該算法可以推廣到觀測(cè)到的軌跡之外,并對(duì)未來的軌跡進(jìn)行預(yù)測(cè)。總之,雖然IRL有潛力提供更深入的見解和更靈活的軌跡預(yù)測(cè),但在實(shí)際應(yīng)用中應(yīng)仔細(xì)考慮對(duì)專家演示的要求以及與質(zhì)量和計(jì)算復(fù)雜性相關(guān)的挑戰(zhàn)。
Deep Inverse Reinforcement Learning
深度逆強(qiáng)化學(xué)習(xí)(Deep IRL)是逆強(qiáng)化學(xué)習(xí)(IRL)的擴(kuò)展,在企業(yè)的深度神經(jīng)網(wǎng)絡(luò)(DNN)中,從專家演示中學(xué)習(xí)獎(jiǎng)勵(lì)函數(shù)。
總之,Deep IRL通過利用深度神經(jīng)網(wǎng)絡(luò)提供了更強(qiáng)大和自適應(yīng)的軌跡預(yù)測(cè)模型的潛力。然而,為了在自動(dòng)駕駛軌跡預(yù)測(cè)中成功應(yīng)用,需要仔細(xì)解決與數(shù)據(jù)需求、計(jì)算復(fù)雜性、可解釋性和過擬合相關(guān)的挑戰(zhàn)。
模仿學(xué)習(xí)
反向強(qiáng)化學(xué)習(xí)(IRL)算法的一個(gè)缺點(diǎn)是,它們難以在獎(jiǎng)勵(lì)很少或沒有直接獎(jiǎng)勵(lì)函數(shù)的情況下進(jìn)行訓(xùn)練。為了解決這個(gè)問題,有人建議將模仿學(xué)習(xí)(IL)作為一種解決方案。IL旨在根據(jù)專家的觀察快速確定政策,而不需要成本函數(shù)。總之,IL和GAIL是很有前途的方法,可以在獎(jiǎng)勵(lì)有限或沒有直接獎(jiǎng)勵(lì)函數(shù)的情況下解決訓(xùn)練RL算法的挑戰(zhàn)。他們?cè)诮H祟愸{駛行為和生成真實(shí)預(yù)測(cè)方面的成功為他們?cè)谄渌F(xiàn)實(shí)世界場(chǎng)景中的應(yīng)用開辟了可能性。表XIV總結(jié)了基于強(qiáng)化學(xué)習(xí)的軌跡預(yù)測(cè)方法,并強(qiáng)調(diào)了每項(xiàng)研究的優(yōu)勢(shì)和劣勢(shì)。
數(shù)據(jù)集
數(shù)據(jù)集匯總?cè)缦卤恚?/p>
評(píng)價(jià)指標(biāo)匯總?cè)缦卤恚?/p>
討論
在本節(jié)中,通過對(duì)代表性模型的比較,對(duì)所提出的模型進(jìn)行了公平的評(píng)估。所選擇的標(biāo)準(zhǔn)包括與軌跡預(yù)測(cè)任務(wù)有關(guān)的不同因素,以及在該領(lǐng)域使用模型的總體先決條件。盡管如此,該比較揭示了普遍的模式,并提供了對(duì)特定特征和使用場(chǎng)景的理解。應(yīng)比較基于深度學(xué)習(xí)的模型和基于強(qiáng)化學(xué)習(xí)的方法。比較結(jié)果匯總在表XVII中。
基于深度學(xué)習(xí)的模型已經(jīng)證明了它們?cè)诤荛L一段時(shí)間內(nèi)產(chǎn)生準(zhǔn)確預(yù)測(cè)的能力,因?yàn)樗鼈兛梢赃M(jìn)行長達(dá)8秒的長期預(yù)測(cè)。然而,這些模型通常由神經(jīng)網(wǎng)絡(luò)組成,因此被視為黑匣子模型,這降低了它們的可解釋性,并可能在驗(yàn)證和批準(zhǔn)方面帶來挑戰(zhàn)。盡管如此,這些模型具有整體性的優(yōu)勢(shì),因?yàn)樗鼈兛梢詫碜远鄠€(gè)來源的各種特征(包括對(duì)象交互和語義數(shù)據(jù))集成到神經(jīng)網(wǎng)絡(luò)中。然而,為了獲得良好的預(yù)測(cè)性能,仔細(xì)選擇有效的特征是至關(guān)重要的??臻g特征和相應(yīng)表示的使用使得能夠考慮主體之間的交互,這使得交互意識(shí)成為可能。基于深度學(xué)習(xí)的模型能夠以不同的抽象級(jí)別描述復(fù)雜的過程,并能夠?qū)④壽E作為預(yù)測(cè)結(jié)果輸出。然而,這些模型需要反映特定應(yīng)用領(lǐng)域的有效訓(xùn)練數(shù)據(jù),以實(shí)現(xiàn)全面和穩(wěn)健的預(yù)測(cè)。因此,這些模型高度依賴于數(shù)據(jù)。此外,這些模型的自適應(yīng)性僅限于模型訓(xùn)練數(shù)據(jù)范圍內(nèi)的場(chǎng)景。由于其整體方法,基于深度學(xué)習(xí)的模型通常與高計(jì)算成本有關(guān),而高計(jì)算成本受所用神經(jīng)網(wǎng)絡(luò)大小的強(qiáng)烈影響。然而,在當(dāng)前的技術(shù)狀態(tài)下,基于深度學(xué)習(xí)的模型提供了最高的預(yù)測(cè)精度。
基于強(qiáng)化學(xué)習(xí)的方法也能夠進(jìn)行長期預(yù)測(cè)。然而,可解釋性的程度因所使用的具體方法而異。間接模型生成一個(gè)映射到狀態(tài)動(dòng)作元組的成本函數(shù),該函數(shù)可用于解釋策略的提議輸出。盡管如此,解釋成本函數(shù)是如何從專家的論證中確定的還是很有挑戰(zhàn)性的。輸出政策的直接模型并沒有從演示中明確推導(dǎo)出成本函數(shù),這使得它們不太容易解釋。這些模型可以直接將多個(gè)對(duì)象之間的交互視為輸入特征。此外,可以使用廣泛的特征,包括來自道路地圖的語義信息,作為輸入,使這些模型具有整體性。
基于強(qiáng)化學(xué)習(xí)的模型能夠通過利用底層策略來描述復(fù)雜的策略。然而,模型的輸出通常由離散的操作組成,因?yàn)椴呗园▽?duì)象可以執(zhí)行的狀態(tài)-動(dòng)作元組。盡管可以從后續(xù)模塊中導(dǎo)出顯式軌跡,但這些模型在很大程度上依賴于不同的數(shù)據(jù),包括演示,用于訓(xùn)練。提取全面的成本函數(shù)或穩(wěn)健策略尤其具有挑戰(zhàn)性,因?yàn)樗鼜?qiáng)烈依賴于專家的行為觀察,因此很難進(jìn)行正確的訓(xùn)練?;趶?qiáng)化學(xué)習(xí)的模型旨在推理物體的運(yùn)動(dòng),使其能夠很好地適應(yīng)未知場(chǎng)景。然而,與基于深度學(xué)習(xí)的模型類似,基于強(qiáng)化學(xué)習(xí)方法的整體模型具有較高的計(jì)算成本。此外,學(xué)習(xí)魯棒策略的復(fù)雜性會(huì)對(duì)預(yù)測(cè)準(zhǔn)確性產(chǎn)生負(fù)面影響。
挑戰(zhàn)和未來趨勢(shì)
挑戰(zhàn)
- 不確定性:流量代理的未來軌跡本質(zhì)上是不確定的,不可能100%準(zhǔn)確地預(yù)測(cè)。各種因素,如傳感器測(cè)量中的噪聲、不可預(yù)測(cè)的環(huán)境變化和其他交通代理的未知意圖,都可能導(dǎo)致這種不確定性。
- 復(fù)雜動(dòng)力學(xué):交通代理的運(yùn)動(dòng)可能受到各種物理定律的影響,包括重力、摩擦力和空氣動(dòng)力。這些動(dòng)力學(xué)可能是高度復(fù)雜和非線性的,因此很難精確建模。
- 傳感器覆蓋范圍有限:自動(dòng)駕駛汽車依靠一套傳感器來感知環(huán)境,包括攝像頭、激光雷達(dá)和雷達(dá)。然而,如圖18所示,這些傳感器的覆蓋范圍是有限的,并且可能受到閉塞、天氣條件和其他因素的影響,這些因素可能使準(zhǔn)確跟蹤其他交通代理的運(yùn)動(dòng)變得困難。
- 有限的數(shù)據(jù):在某些情況下,可用于軌跡預(yù)測(cè)的數(shù)據(jù)可能有限或不完整。當(dāng)傳感器出現(xiàn)故障,或者歷史數(shù)據(jù)丟失或損壞時(shí),可能會(huì)發(fā)生這種情況。
- 長期預(yù)測(cè):預(yù)測(cè)長時(shí)間范圍(不少于3秒)的軌跡可能具有挑戰(zhàn)性,因?yàn)槌跏碱A(yù)測(cè)中的小誤差可能會(huì)加劇,并導(dǎo)致與真實(shí)軌跡的顯著偏差。
- 復(fù)雜的道路環(huán)境:自動(dòng)駕駛汽車在復(fù)雜動(dòng)態(tài)的道路環(huán)境中運(yùn)行,包括十字路口、環(huán)形交叉路口和擁擠的城市區(qū)域。預(yù)測(cè)這些環(huán)境中的軌跡需要能夠處理多個(gè)主體之間復(fù)雜互動(dòng)的模型,包括其他車輛、行人和騎自行車的人。
- 多模態(tài)輸出:在自動(dòng)駕駛中,代理人的行為表現(xiàn)出多模態(tài),其中一個(gè)過去的軌跡可以有多個(gè)潛在的未來軌跡,如圖19所示。
- 稀疏和嘈雜的數(shù)據(jù):來自傳感器的數(shù)據(jù)可能稀疏和嘈雜,特別是在城市地區(qū),建筑物和其他結(jié)構(gòu)可能會(huì)阻礙傳感器和被跟蹤物體之間的視線。這可能使得難以準(zhǔn)確地對(duì)其他交通代理隨時(shí)間的運(yùn)動(dòng)進(jìn)行建模。
- 多代理交互:在許多現(xiàn)實(shí)世界場(chǎng)景中,多個(gè)代理相互交互,并且它們的軌跡是相互依賴的。預(yù)測(cè)一個(gè)代理的軌跡可能取決于其他代理的行為,如圖20,這使得問題更加具有挑戰(zhàn)性。
- 異構(gòu)環(huán)境:異構(gòu)環(huán)境是指包含各種元素的環(huán)境,如各種類型的車輛、行人、騎自行車的人、不同的道路類型以及它們之間的復(fù)雜交互。為了有效地預(yù)測(cè)這種環(huán)境中的軌跡,預(yù)測(cè)模型需要考慮不同類型的代理,結(jié)合上下文信息,融合傳感器數(shù)據(jù),建模多個(gè)代理之間的交互,估計(jì)不確定性,并實(shí)現(xiàn)適應(yīng)性。
- 安全關(guān)鍵應(yīng)用:自動(dòng)駕駛汽車是安全關(guān)鍵系統(tǒng),軌跡預(yù)測(cè)中的錯(cuò)誤可能會(huì)產(chǎn)生嚴(yán)重后果,包括事故和傷害。因此,軌跡預(yù)測(cè)算法需要高度準(zhǔn)確和可靠,并具有明確的安全裕度。
- 實(shí)時(shí)約束:自動(dòng)駕駛汽車在實(shí)時(shí)環(huán)境中運(yùn)行,軌跡預(yù)測(cè)算法需要能夠?qū)崟r(shí)處理數(shù)據(jù)并生成預(yù)測(cè)。這需要能夠處理傳感器產(chǎn)生的大量數(shù)據(jù)的高效算法和硬件架構(gòu)。
未來方向
- 結(jié)合上下文和意圖:當(dāng)前軌跡預(yù)測(cè)方法的一個(gè)局限性是,它們通常只關(guān)注其他車輛的運(yùn)動(dòng),而沒有未來的研究可以探索如何結(jié)合上下文信息,如道路布局和交通規(guī)則,以及其他駕駛員的意圖,以提高軌跡預(yù)測(cè)的準(zhǔn)確性。
- 多傳感器集成:自動(dòng)駕駛汽車依靠一套傳感器來感知環(huán)境,未來的研究可以探索如何集成多個(gè)傳感器的數(shù)據(jù),以提高軌跡預(yù)測(cè)的準(zhǔn)確性。這可能涉及開發(fā)新的算法來融合來自相機(jī)、激光雷達(dá)、雷達(dá)和其他傳感器的數(shù)據(jù),以及探索新的傳感器模式,如聲學(xué)或熱傳感器。
- 不確定性建模:軌跡預(yù)測(cè)本質(zhì)上是不確定的,未來的研究可以探索如何通過預(yù)測(cè)管道建模和傳播不確定性。這可能涉及開發(fā)新的概率模型,如貝葉斯神經(jīng)網(wǎng)絡(luò),或探索不確定性量化和傳播的新技術(shù)。
- 人類感知軌跡預(yù)測(cè):自動(dòng)駕駛汽車運(yùn)行的環(huán)境不僅包括其他車輛,還包括行人和騎自行車的人。未來的研究可以探索如何開發(fā)軌跡預(yù)測(cè)方法,這些方法能夠感知人類行為,并能夠準(zhǔn)確預(yù)測(cè)擁擠城市環(huán)境中行人和騎自行車者的運(yùn)動(dòng)。
- 實(shí)時(shí)實(shí)現(xiàn)和硬件加速:自動(dòng)駕駛汽車在實(shí)時(shí)環(huán)境中運(yùn)行,軌跡預(yù)測(cè)算法需要能夠?qū)崟r(shí)處理數(shù)據(jù)和生成預(yù)測(cè)。未來的研究可以探索如何優(yōu)化軌跡預(yù)測(cè)算法以實(shí)現(xiàn)實(shí)時(shí)性能,以及開發(fā)新的硬件架構(gòu)以實(shí)現(xiàn)高效計(jì)算。
- 確保安全性和穩(wěn)健性:在自動(dòng)駕駛系統(tǒng)中,安全性至關(guān)重要。未來的研究應(yīng)該致力于開發(fā)優(yōu)先考慮安全性和穩(wěn)健性的軌跡預(yù)測(cè)方法。這包括研究處理罕見或異常事件的技術(shù),在具有挑戰(zhàn)性的天氣條件下提高預(yù)測(cè)準(zhǔn)確性,以及考慮軌跡預(yù)測(cè)算法中的倫理方面。
- 相對(duì)軌跡預(yù)測(cè):相對(duì)軌跡預(yù)測(cè)是指預(yù)測(cè)周圍物體或代理相對(duì)于自車或坐標(biāo)系的未來運(yùn)動(dòng)或路徑的任務(wù)。未來的研究應(yīng)側(cè)重于估計(jì)其他車輛、行人和騎自行車的人相對(duì)于自車的相對(duì)位移、速度和軌跡。
- 隨機(jī)障礙物感知軌跡預(yù)測(cè):這種方法是指在考慮周圍環(huán)境中存在意外或隨機(jī)障礙物的情況下預(yù)測(cè)車輛的未來軌跡。這些障礙物可能是道路之間的動(dòng)物或物體,行人的突然到來,以及導(dǎo)致道路之間不確定障礙物的道路事故。未來的研究應(yīng)側(cè)重于將罕見事件納入預(yù)測(cè)模型,并收集和分析與這些罕見事件相關(guān)的數(shù)據(jù),以開發(fā)更全面、更穩(wěn)健的預(yù)測(cè)模型。
- 具有挑戰(zhàn)性的天氣條件:惡劣的天氣條件,如大雨、雪、霧或低能見度,可能會(huì)影響傳感器的性能,并限制軌跡預(yù)測(cè)關(guān)鍵數(shù)據(jù)的可用性。未來的研究應(yīng)側(cè)重于結(jié)合傳感器融合、自適應(yīng)濾波、概率建模和機(jī)器學(xué)習(xí)等技術(shù),以提高惡劣天氣條件下軌跡預(yù)測(cè)的可靠性和準(zhǔn)確性。
- 車輛對(duì)車輛(V2V)通信和車輛對(duì)一切(V2X)通信策略:V2V通信是指車輛之間直接交換信息。V2X通信擴(kuò)展到V2V之外,包括與其他實(shí)體的通信,如基礎(chǔ)設(shè)施、行人、騎自行車的人和交通管理系統(tǒng)。通過共享位置、速度、加速度和意圖等實(shí)時(shí)數(shù)據(jù),車輛可以協(xié)作以增強(qiáng)軌跡預(yù)測(cè)。
- 幾種方法的混合:第3、4和5節(jié)提出了解決軌跡預(yù)測(cè)任務(wù)的多種策略。根據(jù)具體的環(huán)境和要求,混合可以采取不同的形式。這可以帶來更準(zhǔn)確、更穩(wěn)健的軌跡預(yù)測(cè)。