自動駕駛運動規(guī)劃真正重要的是什么?一文看盡業(yè)內(nèi)主流50+混合方法!
本文經(jīng)自動駕駛之心公眾號授權(quán)轉(zhuǎn)載,轉(zhuǎn)載請聯(lián)系出處。
寫在前面&筆者的個人理解
運動規(guī)劃是自動駕駛模塊化架構(gòu)的重要組成部分,是上游感知模塊和下游控制信號之間的橋梁。傳統(tǒng)的運動規(guī)劃最初是為特定的自動駕駛功能(ADF)設(shè)計的,但高級自動駕駛系統(tǒng)(ADS)的發(fā)展趨勢需要各種ADF的運動,包括不可預(yù)見的運動。這種需求推動了相關(guān)“混合”方法的發(fā)展,試圖通過結(jié)合各種技術(shù)來提高運動規(guī)劃性能,如數(shù)據(jù)驅(qū)動(基于學(xué)習(xí))和邏輯驅(qū)動(分析)方法。最近的研究成果為開發(fā)更高效、準(zhǔn)確和安全的戰(zhàn)術(shù)決策(TDM)和軌跡生成(TG)混合方法以及將這些算法集成到運動規(guī)劃模塊中做出了重大貢獻。由于混合方法的廣泛多樣性和潛力,本綜述強調(diào)了對當(dāng)前文獻的及時和全面的回顧。我們根據(jù)混合運動規(guī)劃包含的組件類型對其進行分類,例如基于采樣和基于優(yōu)化/基于學(xué)習(xí)的運動規(guī)劃的組合。通過評估所解決的挑戰(zhàn)和局限性,以及評估它們是否側(cè)重于TG和/或TDM,對不同類別進行比較。我們希望這種方法將使該領(lǐng)域的研究人員能夠深入了解混合運動規(guī)劃的當(dāng)前趨勢,并為未來的研究提供有希望的領(lǐng)域。
運動規(guī)劃背景
模塊化系統(tǒng)架構(gòu)是設(shè)計和實現(xiàn)自動駕駛系統(tǒng)(ADS)的常用模型,其中幾個子系統(tǒng)專門用于自動駕駛的不同任務(wù)。模塊化架構(gòu)將復(fù)雜的運動規(guī)劃問題分解為戰(zhàn)術(shù)決策(TDM)和軌跡生成(TG)。這簡化了運動規(guī)劃的設(shè)計,但也必須考慮TDM和TG之間的相互作用。ADS運動模塊的代表性模塊化系統(tǒng)架構(gòu),包括全局路線規(guī)劃、TDM和TG之間的相互作用,如圖1所示。全局路線規(guī)劃器模塊負(fù)責(zé)使用離線/在線地圖,通過道路和路徑,計算起點和終點坐標(biāo)之間的最佳路線。全局路線通常由路點組成,不提供任何進一步的細(xì)節(jié),此外,它只取決于當(dāng)前坐標(biāo)、端點和可行路徑。全局路線規(guī)劃僅按需調(diào)用(見圖1中的輸入信號A1),即,每當(dāng)指定路線不再可行時,例如,由于即將發(fā)生的交通堵塞或道路工程。其他兩個主要組件,即TDM或行為層,和TG相互作用,為車輛的低電平控制提供參考信號,以激勵其致動器(見圖1中的信號D和O1)。
接下來,在定義了AV中控制系統(tǒng)的運動規(guī)劃和I/O中使用的關(guān)鍵技術(shù)術(shù)語之后,詳細(xì)描述了TDM和TG模塊的作用。
A.術(shù)語
- 車輛在2D平面空間中的配置包括其位置和方向,其唯一地確定了車輛的每個點在空間中的位置。配置可以用笛卡爾(全局或局部)坐標(biāo)表示(圖2)、極坐標(biāo)、Frenet框架等。
- 狀態(tài)是指車輛的運動學(xué),如位置、速度、加速度等。車輛的配置可以是其狀態(tài)的子集。
- 根據(jù)車輛在車輛周圍物理空間中的碰撞檢查,車輛的配置空間分為以下三個子集:自由空間、碰撞空間和未知空間。
- 路徑被定義為來自自由(或未知)空間的一組配置,與時間等任何其他變量無關(guān)。
- 軌跡定義為車輛狀態(tài)空間中的一組狀態(tài)。圖2中的紅色曲線顯示了軌跡,該曲線上的每個點都對應(yīng)于一個特定的狀態(tài)(作為時間的函數(shù))。
- 運動是指車輛狀態(tài)的任何變化。
- 動作是可用于操縱車輛運動的所有可能的控制命令。
- 機動是指車輛運動的特征或特征,如摩托車并線、超車、轉(zhuǎn)彎、變道等。
- EGO車輛(EV)是指規(guī)劃算法針對周圍所有其他車輛和道路參與者設(shè)計的受控車輛。
- 由于車輛的運動學(xué),非完整約束限制了兩種狀態(tài)之間可能的軌跡。在這樣的系統(tǒng)中,導(dǎo)致一個狀態(tài)的軌跡會影響該狀態(tài)。在AV的情況下,3D配置(2D位置和偏航方向)僅由兩個輸入(節(jié)氣門/制動器和轉(zhuǎn)向角)控制。當(dāng)約束不能集成到運動方程中時,就會發(fā)生這種情況。
- 運動基元是一組預(yù)定義/預(yù)先計算的離散軌跡,EV可以從給定狀態(tài)中獲取這些軌跡。
B.戰(zhàn)術(shù)決策(TDM)功能
原則上,TDM功能負(fù)責(zé)根據(jù)感知的駕駛環(huán)境計算車輛的最佳行為,例如,在圖3所示的示例中,決定是變道還是保持車道。獲得對周圍區(qū)域的全面了解是在動態(tài)駕駛環(huán)境中做出正確反應(yīng)的先決條件。上下文感知決策是自動化和自主之間的主要區(qū)別,前者的概念是指在特定條件下自動控制系統(tǒng)行為的能力,后者還包括系統(tǒng)對環(huán)境中的意外變化做出適當(dāng)反應(yīng)的能力。TDM層的傳統(tǒng)設(shè)計基于有限數(shù)量的可能駕駛場景中的有限選擇或決策。最近的方法試圖在設(shè)計中增加自主性,并解決車輛在意外情況下的行為,在這種情況下,駕駛環(huán)境無法在任何預(yù)定狀態(tài)下進行分類。第三節(jié)進一步闡述了用于運動規(guī)劃的傳統(tǒng)和最新TDM方法。此外,TDM輸出也可用于其他目的,例如通過視覺顯示激活意圖信號,以告知其他道路用戶EGO車輛的操縱意圖(圖1中的信號O2),或通過修改感興趣的傳感器注意力區(qū)域(圖1的信號O3)來優(yōu)化傳感器覆蓋區(qū)域。
C.軌跡生成(TG)函數(shù)
軌跡通常被定義為物體穿過空間的“路徑”,作為“時間”的函數(shù)。這就是為什么在一些技術(shù)文本中,軌跡也被稱為“時空”函數(shù)的原因。雖然路徑和軌跡在空間域(可駕駛區(qū)域)中的幾何表示相同(見圖2),但軌跡包括車輛的額外運動學(xué)(時間)信息(狀態(tài))。在AV的情況下,工作空間或物理空間(道路網(wǎng)絡(luò))通常是平面的(2D),配置空間是3D的,其中兩個坐標(biāo)表示車輛重心的位置,第三個坐標(biāo)表示繞法向軸的旋轉(zhuǎn)。不同的TG方法可能需要使用例如Voronoi鑲嵌、成本圖或狀態(tài)格的物理空間的不同表示。TG過程負(fù)責(zé)計算低電平控制要跟蹤的最終信號,見圖1中的信號D,它將最終動作應(yīng)用于AV的執(zhí)行器。然而,在(動態(tài))基于模型的方法中,如后退地平線規(guī)劃和控制,最終的反饋/前饋控制被集成到規(guī)劃模塊中,輸出信號被直接饋送到致動器中。
現(xiàn)有方法的分類
如圖四所示現(xiàn)有方法可以分為端到端方法和模塊化兩大類方法。
A. Traditional Methods
1) TDM Algorithms
- Regulation-based Methods
- Route-based Methods
- Manoeuvre-based Methods
基于規(guī)則和路線的TDM方法分別由高級模塊(如在線/離線駕駛法規(guī)和全球路線規(guī)劃系統(tǒng))直接處理,它們被稱為基于自動化的決策。這些方法通常獨立于TG模塊進行設(shè)計和操作。相反,基于機動的TDM方法與TG相互作用并影響TG,被稱為基于自主的決策。由于TDM和TG之間的相互作用,出現(xiàn)了一些新的挑戰(zhàn),在復(fù)雜環(huán)境中對車輛進行實時控制的過程中,這些挑戰(zhàn)變得更加難以解決。例如,TG過程的輸出可能與TDM選擇的機動相矛盾,或者,TDM可以在不考慮軌跡的可行性/可容許性的情況下做出決策。一些研究已經(jīng)通過使用拓?fù)涓兄夹g(shù)將TDM和TG相結(jié)合,或者通過為每個機動組生成軌跡來解決這一挑戰(zhàn)。因此,不建議在不考慮該過程與TG之間的聯(lián)系的情況下決定操縱。
2) TG Algorithms
TG算法大多基于局部路徑規(guī)劃。為AV開發(fā)的第一個TG過程類似于路徑規(guī)劃方法,這就是為什么一些研究人員表示,TG挑戰(zhàn)可以通過能夠處理差分約束(考慮額外的時間變量)的路徑規(guī)劃技術(shù)來處理。在大量研究中,基于邏輯的TG算法(圖4)是使用以下四種方法之一開發(fā)的:基于樣本、基于搜索、基于優(yōu)化和勢場(PF)方法,這些方法將在以下段落中進一步討論和審查。
- Sampling Methods:這些方法是為移動機器人運動規(guī)劃體驗開發(fā)的首批算法之一。大多數(shù)為AV實現(xiàn)這種方法變體的現(xiàn)代參考文獻都受到DUC的啟發(fā)?;诓蓸拥姆椒ㄍㄟ^使用碰撞檢測模塊的采樣方法來探索環(huán)境,以決定樣本序列是否在物理空間上構(gòu)造有效配置。示例見圖5(b)。采樣方法計算高效,易于實現(xiàn),可以進一步分為隨機采樣和確定性采樣。
- Search Methods:基于搜索的方法通過使用一組運動基元(AV的預(yù)先計算的運動)來離散周圍環(huán)境,例如道路網(wǎng)絡(luò),然后應(yīng)用基于圖的搜索策略,例如Dijkstra或A*族算法,以根據(jù)運動規(guī)劃的啟發(fā)式或目標(biāo)來找到最佳路徑或軌跡。示例見圖5(c)。在基于搜索的方法中,處理車輛的運動學(xué)約束取決于用于構(gòu)建搜索圖的運動基元。提出了一些修改,如混合狀態(tài)A*族算法,以考慮AVs中的非完整運動學(xué)。與基于樣本的方法不同,基于搜索的方法需要提前了解道路網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)。
- Optimization Methods:基于優(yōu)化的TG旨在解決基于樣本和基于搜索的算法的缺點,即分別存在次最優(yōu)和非光滑性。在基于確定性采樣的方法中,候選軌跡是預(yù)定義的,并且不符合新環(huán)境。相反,基于優(yōu)化的方法在連續(xù)的空間中工作,并且隨著環(huán)境的變化更加靈活。消極的一面是,它們通常在計算上是昂貴的,并且由于計算周期之間的結(jié)果振蕩,它們可能會導(dǎo)致不穩(wěn)定的行為。
- Potential Field (PF) Methods:與其他傳統(tǒng)的運動規(guī)劃方法一樣,PF被引入機器人領(lǐng)域。Khatib等人提出了一種避障運動規(guī)劃方法,在該方法中,他們分別為障礙物和目標(biāo)分配排斥和吸引PF,并使用它們在機械手和移動機器人的配置空間中導(dǎo)航?;赑F的方法的主要優(yōu)點在于其簡單性,它提供了具有幾個障礙物、不規(guī)則幾何形狀和邊界的復(fù)雜環(huán)境的抽象,使它們成為運動規(guī)劃算法所需要的。然而,盡管有改進版本,它們的主要缺點是存在局部極小陷阱,排斥力和吸引力相互抵消,從而阻礙了實現(xiàn)目標(biāo)的進展。
B.人工智能與基于學(xué)習(xí)的方法
在深入研究混合運動規(guī)劃方法之前,我們在本節(jié)中討論了另一類運動規(guī)劃器(除了傳統(tǒng)的),即數(shù)據(jù)驅(qū)動的運動規(guī)劃器,根據(jù)圖4,它可以是端到端的,也可以是模塊化的。正如我們將在下一節(jié)中很快看到的那樣,數(shù)據(jù)驅(qū)動的模塊化運動規(guī)劃可以成為混合方法中使用的組件之一。
數(shù)據(jù)驅(qū)動方法的流行是隨著最近處理硬件的突破和各種駕駛場景下道路交通數(shù)據(jù)集的激增。這些方法大致可分為兩大類,即端到端規(guī)劃或模塊化規(guī)劃。前者指的是運動規(guī)劃器的輸入特征是從激光雷達(dá)、雷達(dá)、GPS或相機收集的感覺數(shù)據(jù)的方法,在后者中,感知和運動規(guī)劃在單獨的模塊中完成。在模塊化方法中,感知模塊的輸出可以作為運動規(guī)劃的輸入(見圖1),例如,提供周圍環(huán)境的語義表示,例如由邊界框表示的其他道路使用者及其速度,以及車道標(biāo)記的位置和道路幾何形狀。在模塊化和端到端方法中,運動規(guī)劃的輸出可以是用于觸發(fā)機動的決策、周圍環(huán)境的狀態(tài)預(yù)測、參考軌跡或控制命令,如轉(zhuǎn)向角和節(jié)氣門/制動器激活信號。
由于耗時的學(xué)習(xí)階段基本上是離線執(zhí)行的,因此在實時推理過程中,基于學(xué)習(xí)的方法在計算上是高效的。另一個理想的特征是,在給定足夠的訓(xùn)練數(shù)據(jù)的情況下,它們能夠適應(yīng)各種駕駛場景,而不會對主要結(jié)構(gòu)產(chǎn)生顯著變化。主要的挑戰(zhàn)是,它們的性能取決于訓(xùn)練階段提供的數(shù)據(jù)的質(zhì)量和多樣性,這意味著一旦測試情況偏離訓(xùn)練條件,性能就會開始下降(或至少可靠性水平下降)。此外,由于數(shù)據(jù)驅(qū)動技術(shù)中眾所周知的可解釋性問題,在故障或改進的情況下調(diào)試運動規(guī)劃模塊也是困難的。
為了克服上述經(jīng)典算法的挑戰(zhàn),已經(jīng)開發(fā)了一些其他技術(shù),稱為“混合”或“組合”方法。在這些方法中,前面解釋的算法的一些缺點可以通過將它們組合在各種混合框架中來解決,這可以進一步提高現(xiàn)實世界應(yīng)用的運動規(guī)劃和控制的性能。
C.Hybrid Methods
到目前為止,大多數(shù)傳統(tǒng)的運動規(guī)劃方法都不直接適用于SAE 3+級AVs,因為它們不能同時處理所有的運動規(guī)劃目標(biāo),如低計算成本、全局優(yōu)化、對動態(tài)環(huán)境的及時反應(yīng)、對一般駕駛場景的適應(yīng)性等。為了滿足高度ADS的要求,最近發(fā)表的運動規(guī)劃算法是通過結(jié)合各種傳統(tǒng)方法開發(fā)的。由此產(chǎn)生的算法被稱為混合運動規(guī)劃器,它們將TDM和TG分解為更簡單的子問題,或者它們試圖通過使用專門為特定目標(biāo)設(shè)計的適當(dāng)選擇的方法來分別解決每個運動規(guī)劃目標(biāo)。這意味著一種方法的缺點可以通過另一種方法來彌補,從而綜合提高整體性能。
為了對混合方法進行分類和回顧,我們將首先探討ADS中的運動規(guī)劃算法需要克服的挑戰(zhàn)。之后,混合方法將根據(jù)其旨在解決的挑戰(zhàn)進行分類。如圖1所示,假設(shè)其他道路使用者的行為感知和預(yù)測由其他模塊提供給運動規(guī)劃系統(tǒng)。在這篇綜述文章中,我們沒有考慮不完美的感知/預(yù)測對運動規(guī)劃的影響,這本身就需要仔細(xì)關(guān)注。
- 車輛的動力學(xué)和可行性挑戰(zhàn):設(shè)計運動規(guī)劃算法的第一個挑戰(zhàn)源于受控車輛的運動學(xué)和動力學(xué)約束。在自動駕駛的情況下,這些約束包括前輪轉(zhuǎn)向系統(tǒng)的非完整運動學(xué)以及節(jié)流/制動和轉(zhuǎn)向執(zhí)行器的變化幅度和變化率的控制力飽和。即使在沒有任何其他參與者的開放、平坦的可駕駛區(qū)域,運動規(guī)劃系統(tǒng)仍然必須應(yīng)對這一挑戰(zhàn)。忽略車輛的運動學(xué)約束可能導(dǎo)致不可行的參考軌跡,隨后在低級控制器中出現(xiàn)更多錯誤。
- 駕駛環(huán)境挑戰(zhàn):這一群體與空間結(jié)構(gòu)和駕駛場景或其他影響電動汽車駕駛環(huán)境的道路參與者所施加的環(huán)境約束有關(guān)。駕駛環(huán)境可分為結(jié)構(gòu)化(預(yù)定義路線,如道路和高速公路)和非結(jié)構(gòu)化空間(停車場和越野)。結(jié)構(gòu)化環(huán)境可進一步分為城市和公路駕駛的主要類別,其中城市場景可能包括交叉口和環(huán)形交叉口、交通堵塞等,而公路場景可能指超車、變道、車道保持、公路并線或駛離?;谏舷挛牡鸟{駛挑戰(zhàn)在確定哪種運動規(guī)劃方法適合特定情況方面起著至關(guān)重要的作用。克服這一挑戰(zhàn)的一種方法是開發(fā)通用的運動規(guī)劃方法,該方法可以在包括意外事件在內(nèi)的各種駕駛情況下運行。然而,正如文獻中現(xiàn)有的方法所強調(diào)的那樣,實現(xiàn)這一目標(biāo)并非沒有問題,該方法通常假設(shè)駕駛場景由一組有限的預(yù)先確定的機動動作組成,并隨后作為TG和TDM過程的輸入。
- 實時挑戰(zhàn):下一個挑戰(zhàn)來源于需要規(guī)劃和實施車輛的運動,使車輛能夠盡快采取行動并對環(huán)境做出反應(yīng),即TG和TDM模塊中的計算應(yīng)實時執(zhí)行。假定當(dāng)代傳感器的更新速率在100ms的數(shù)量級,實時算法應(yīng)在100ms時間段內(nèi)至少更新一次(以10Hz或更高的速率操作)。一種方法可以產(chǎn)生適用于各種駕駛環(huán)境的最安全、最可靠和交通高效的輸出,但其處理時間慢于電動汽車的狀態(tài)變化率或周圍環(huán)境的動態(tài),這是絕對沒有價值的。因此,運動規(guī)劃模塊的更新率是確定AV的最大行進速度的參數(shù)之一。
- 基于安全的挑戰(zhàn):評估運動規(guī)劃方法的最重要指標(biāo)之一是所提供的安全級別,這在算法設(shè)計中得到了明確考慮??梢允褂脦讉€公認(rèn)的關(guān)鍵性能指標(biāo)來衡量安全性,如(修改的)碰撞時間(TTC)、到周圍車輛的時間和距離,以及在某些情況下沖突區(qū)內(nèi)的侵占后時間。同時,希望提高ADS中的安全性不應(yīng)損害受控系統(tǒng)的穩(wěn)定性、乘客舒適性(乘坐質(zhì)量),并且不應(yīng)增加對安全駕駛員的不必要接管請求的數(shù)量(車輛的故障安全控制)。對于文獻中的一些方法,安全度量直接納入運動規(guī)劃問題的數(shù)學(xué)公式中,而另一些方法則通過模擬或?qū)嶒炘u估來研究安全標(biāo)準(zhǔn)。
- 基于不確定性的挑戰(zhàn):開發(fā)運動規(guī)劃算法的最后一個挑戰(zhàn)是如何處理由其他模塊(如感知、預(yù)測、定位等)提供的輸入數(shù)據(jù)中的任何類型的缺陷引起的不確定性。
針對上述挑戰(zhàn)評估的傳統(tǒng)運動規(guī)劃方法的性能總結(jié)在表I中。通過檢查該表,很明顯,沒有一種單一的方法可以解決所有挑戰(zhàn),例如,基于優(yōu)化的方法在可行性、對駕駛環(huán)境的適應(yīng)性、安全性和對不確定性的彈性方面表現(xiàn)良好,但它們的性能在實時ADS實現(xiàn)中可能會顯著降低。這個問題最近引發(fā)了所謂的混合技術(shù)的大量研究工作,該技術(shù)將各種方法結(jié)合在一起,旨在提高傳統(tǒng)方法的性能。接下來,針對相同的挑戰(zhàn)列表,將解釋、分類和評估用于運動規(guī)劃的SOTA混合方法。我們的調(diào)查研究結(jié)果也顯示在表II中。
Decomposed Geometry and Kinematic Planning
簡化TG問題的最常見方法是將幾何路徑與軌跡的運動學(xué)特性(如速度、縱向和橫向加速度)分開。這樣,復(fù)雜的時空TG問題可以分解為兩個更簡單的問題,即路徑規(guī)劃和速度剖面規(guī)劃,這兩個問題可以在分層設(shè)計模型中進行處理,見圖6的示例。例如,李等人中使用三次B樣條生成候選軌跡,以初始細(xì)化來自高級路線規(guī)劃器的輸入?yún)⒖悸窂剑缓?,為了解決安全和舒適問題,通過明確考慮運動學(xué)約束(如縱向/橫向、速度/加速度限值和交通法規(guī))來生成速度剖面。這種方法為速度剖面規(guī)劃提供了一種閉合形式的解決方案,這可以顯著降低所提出算法的實時處理能力(實現(xiàn)的更新率約為70ms)。VisLab AV的運動控制也使用了相同的概念,首先生成圓形幾何路徑,然后根據(jù)路徑的最小和最大曲線計算速度曲線,最終選擇舒適度(橫向加速度)和電動汽車輸入控制極限(最大轉(zhuǎn)向角)方面的最佳軌跡。這種方法類似于用于非完整室內(nèi)移動機器人的多級運動規(guī)劃,其中軌跡的曲線和速度特征以順序的方式得到改善。在另一項研究[54]中,使用數(shù)據(jù)驅(qū)動的方法生成路點,這些路點被用作基于貝塞爾曲線對幾何路徑進行采樣的參考,然后計算每條路徑的速度剖面。該方法已用于具有挑戰(zhàn)性的城市場景,如環(huán)形交叉口、十字路口和T形交叉口,時間范圍為3 s和6 s,最小更新率為4 Hz。
基于勢場的混合方法
人工勢場(PF)方法是對影響AV的TDM和TG過程的各種因素進行建模的合適工具。然而,該方法也存在相關(guān)挑戰(zhàn),可以通過將PF與其他運動規(guī)劃算法相結(jié)合來緩解這些挑戰(zhàn)。
大多數(shù)基于PF的混合運動規(guī)劃器的結(jié)構(gòu)都是為了簡化優(yōu)化過程。例如,在基于優(yōu)化的技術(shù)中,PF可以用作成本函數(shù)中的懲罰因子,而不是添加不等式約束來描述復(fù)雜的駕駛場景,這會抑制地增加公式化優(yōu)化問題的計算復(fù)雜性。一些研究集中在創(chuàng)建一種基于PF的混合運動規(guī)劃方法上,其中PF被設(shè)計為凸的,以簡化優(yōu)化過程。Rasekhpour等人將方形排斥PF(不可交叉/可交叉)定義為電動汽車和其他參與者之間的相對距離和速度的函數(shù)(圖7),以及車道標(biāo)記和道路邊界。所得PF用于TG的MPC成本函數(shù),并在不同場景中進行測試,包括并線、變道和超車。Dixit等人使用類PF函數(shù)來定義安全區(qū),作為MPC控制器在高速公路穿越機動中的參考。通過使用這種方法,它們彌補了PF和基于優(yōu)化的方法的缺點,并保證了規(guī)劃軌跡的可行性,同時對各種道路元素(如車道、邊界、周圍的汽車及其運動學(xué)信息)進行建模。開發(fā)了一個類似的框架,將類似人類的駕駛習(xí)慣(攻擊性/因果關(guān)系)添加到AV的運動規(guī)劃模塊中,同時由于算法的MPC部分而保持最佳軌跡。在事故不可避免的情況下,MPC和PF相結(jié)合的混合方法也被用于減輕撞車事故的嚴(yán)重程度。Hang等人將MPC和PFs與博弈論框架相結(jié)合,對類人決策行為進行建模。這一方面對于AV與人類駕駛車輛共存的混合交通條件可能是重要的。
總之,基于PF的混合運動規(guī)劃方法背后的主要思想是使用PF的并行優(yōu)化或基于搜索的方法來描述具有挑戰(zhàn)性的環(huán)境,如具有彎曲道路、(非凸)邊界和低復(fù)雜度的密集交通的城市駕駛場景。簡單地使用具有高分辨率密集網(wǎng)格的傳統(tǒng)優(yōu)化或基于搜索的方法將導(dǎo)致更高的計算工作量。
基于優(yōu)化的混合方法
基于優(yōu)化的方法的主要挑戰(zhàn)是它們的高計算開銷,這可能使它們不適合實時實現(xiàn)。緩解這一挑戰(zhàn)的一種方法是將另一種方法納入基于優(yōu)化的框架。Lattarulo等人提出了一種混合運動規(guī)劃方法,該方法由兩個主要步驟組成:首先,計算平滑的標(biāo)稱軌跡,然后使用具有解耦點-質(zhì)量動態(tài)模型的MPC架構(gòu),在考慮障礙物施加的約束和道路條件的情況下優(yōu)化軌跡/機動。在類似的方法中,Wonteak等人開發(fā)了一種分層運動規(guī)劃算法(行為和軌跡),該算法利用了優(yōu)化和采樣方法的優(yōu)勢。具體而言,采樣算法負(fù)責(zé)確定基于高級粗略行為的軌跡,然后考慮到車輛和環(huán)境引入的動態(tài)約束,生成基于低級優(yōu)化的軌跡。本質(zhì)上,采樣首先用于TDM,然后對TG進行優(yōu)化。在這個框架中,優(yōu)化方法的高性能基本上得到了保留,而總體實現(xiàn)復(fù)雜度仍然很低。Hidalgo等人通過將用于路徑規(guī)劃的參數(shù)曲線(Be′zier曲線)與用于縱向和橫向控制的MPC相結(jié)合,提高了環(huán)島合并場景中的運動規(guī)劃性能。它們成功地降低了總體計算成本,同時保持了MPC所附帶的高性能。Gu等人為TG開發(fā)了一個多層框架。在第一步中,作者優(yōu)化了無交通的粗略軌跡(曲線和速度剖面),在接下來的兩步中,他們生成了最終的平滑軌跡,并將其他交通參與者的行為作為約束。丁等人和張等人通過使用安全時空走廊(SSC)將可駕駛環(huán)境定義為時間的函數(shù),簡化了優(yōu)化問題。
總之,基于優(yōu)化的混合方法背后的主要思想是通過小心地減小解空間的大小來簡化耗時的優(yōu)化過程。這通常是通過在調(diào)用基于優(yōu)化的技術(shù)來生成搜索空間內(nèi)的最優(yōu)軌跡之前,使用另一種(傳統(tǒng))運動規(guī)劃方法修剪一些可行的駕駛行為來實現(xiàn)的。
Combination of Logical and Learning-Based Methods
最近,基于人工智能(AI)的方法與其他眾所周知的運動規(guī)劃算法一起在混合框架中使用,以提高整體性能。在本節(jié)中,我們將在以下段落中回顧各種類型的邏輯學(xué)習(xí)混合運動規(guī)劃器。
基于優(yōu)化的軌跡生成方法也可以納入基于學(xué)習(xí)的運動規(guī)劃框架。在[82]中,通過開發(fā)人工神經(jīng)網(wǎng)絡(luò)(ANN)來減少優(yōu)化方法的計算時間,該網(wǎng)絡(luò)經(jīng)過訓(xùn)練以學(xué)習(xí)優(yōu)化算法的輸出。優(yōu)化算法在生成最終軌跡之前監(jiān)督ANN的輸出,以確保滿足安全約束。類似地,Alexandru等人使用從非線性MPC獲得的軌跡以及相應(yīng)的輸入,并訓(xùn)練替代的ANN來解決基于優(yōu)化的算法的高計算成本挑戰(zhàn)。在另一項研究中,作者在[84]中提出了一種分層結(jié)構(gòu),解決了計算復(fù)雜性的挑戰(zhàn),其中第一層由MPC訓(xùn)練的神經(jīng)網(wǎng)絡(luò)組成,下一層負(fù)責(zé)保證計劃軌跡的可行性。在他們的出版物中,電動汽車和人類駕駛車輛之間的互動是在TDM期間通過基于學(xué)習(xí)的方法捕捉的,而隨后的TG過程負(fù)責(zé)生成優(yōu)化軌跡,以滿足混合交通流背景下的上游決策。
總之,在離線訓(xùn)練期間,基于學(xué)習(xí)的方法可以監(jiān)督使用傳統(tǒng)的基于優(yōu)化的方法來實現(xiàn)接近最優(yōu)性能的運動規(guī)劃器。同時,PF可以用來降低訓(xùn)練的復(fù)雜性,因為它們在以簡化的方式描述復(fù)雜的駕駛場景/環(huán)境方面非常有效。
Hybrid Cooperative Planning
在前面的TG和TDM部分中回顧的方法是基于EV的獨立硬件和軟件功能。然而,無線車輛到一切(V2X)通信技術(shù)的出現(xiàn),如專用短程通信(DSRC)、ITS-G5和蜂窩V2X(C-V2X),將實現(xiàn)車輛之間或車輛與基礎(chǔ)設(shè)施或云之間的廣泛連接。[106]-[108]中廣泛研究了這些通信技術(shù)對ADS的影響。具體而言,通過將車載傳感器數(shù)據(jù)與通過V2X通信系統(tǒng)[109]、[110]接收的車外信息融合,可以增強電動汽車在視野有限或閉塞的挑戰(zhàn)性駕駛情況下的感知。本小節(jié)介紹了利用共享信息進一步提高駕駛效率和改善交通流量的混合運動規(guī)劃方法。
基于TDM和TG交互的分類
表II中還總結(jié)了迄今為止調(diào)查的混合運動規(guī)劃方法,其中可以很容易地檢索每種方法的組合元素以及所解決的運動規(guī)劃挑戰(zhàn)。在比較迄今為止文獻中出現(xiàn)的各種混合方法之前,我們還想注意的是,這些方法可以根據(jù)潛在的TDM和TG過程之間的相互作用進行進一步分類。這可以進一步闡明每種混合方法所針對的運動規(guī)劃挑戰(zhàn)。如表III所示,雖然一些混合運動規(guī)劃器(單獨的)專注于TG或TDM過程,但也有一些混合方法(交互的)導(dǎo)致TG和TDM算法的組合,這兩個過程之間存在隱式或顯式的交互。根據(jù)(i)作為構(gòu)建塊元素的經(jīng)典方法,(ii)已解決的挑戰(zhàn),以及(iii)TDM和TG的相互作用,對AVs的混合運動規(guī)劃方法的現(xiàn)有文獻進行分類,是這篇綜述文章的另一個貢獻,也將有助于確定研究空白。
討論和公開挑戰(zhàn)
盡管已調(diào)查的混合運動規(guī)劃方法尚未使用相同的數(shù)據(jù)集進行評估或比較,但在本節(jié)中,將根據(jù)其旨在解決的挑戰(zhàn)對其性能進行討論和評估。此外,本節(jié)后半部分還強調(diào)了研究差距和未來工作的潛在方向。
Performance Assessment and Comparison
表II總結(jié)了所述五組下約50項混合運動規(guī)劃研究的分類,以及對其在五項挑戰(zhàn)(“a”至“e”)中的表現(xiàn)的評估。人們可以在那里看到,目前還沒有一種混合方法可以解決三個以上的挑戰(zhàn)。最流行的類別是“解耦的幾何和運動學(xué)規(guī)劃”,它通過單獨設(shè)計路徑(使用參數(shù)曲線)和軌跡的運動學(xué)特征來減少運動規(guī)劃的高計算負(fù)荷。盡管能夠?qū)崿F(xiàn)實時應(yīng)用,但計劃的軌跡可能是次優(yōu)的,此外,由于沒有明確考慮車輛的非完整約束,其可行性也無法保證。
“利用勢場的混合方法”在文獻中以各種形式出現(xiàn),但研究人員主要將PFs納入“PF優(yōu)化”和“PF學(xué)習(xí)”混合結(jié)構(gòu)中,以提高TG和/或TDM的性能。在“PF優(yōu)化”混合框架中,除了用于量化駕駛安全性和舒適性的其他語義信息(如車道標(biāo)線)作為成本函數(shù)外,還通過抽象可駕駛區(qū)域的幾何形狀和其他道路使用者的相對距離/速度來生成PF。PF與包括車輛動態(tài)模型在內(nèi)的后退視界優(yōu)化方法相結(jié)合,實現(xiàn)了反應(yīng)性和可行的運動規(guī)劃。盡管這種混合方法可以用于各種場景的TG(甚至TDM),但由于駕駛上下文的語義信息被高度抽象為標(biāo)量成本值,因此需要進行微調(diào)以適應(yīng)新的場景。在“PF學(xué)習(xí)”混合結(jié)構(gòu)中,PF用于修改ANN的輸入或輸出。在前一種情況下,PF用于將語義信息解釋為風(fēng)險圖,以降低端到端算法的復(fù)雜性。在后一種情況下,PF用于通過對神經(jīng)網(wǎng)絡(luò)輸出處的人工排斥力進行編碼來確??刂苿幼鳎ㄝ敵觯┑陌踩院秃侠硇浴M瑯?,“模糊邏輯”也被用于通過對神經(jīng)元網(wǎng)絡(luò)輸出中的相關(guān)性進行編碼來降低基于學(xué)習(xí)的方法的復(fù)雜性,以實現(xiàn)更平滑、更合乎邏輯和更安全的輸出。最后,“基于學(xué)習(xí)的邏輯組合方法”的主要目標(biāo)是提高可解釋性和便于調(diào)試,同時提供適用于多種駕駛場景的通用運動規(guī)劃,只需改變訓(xùn)練數(shù)據(jù),而不會對神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)產(chǎn)生重大變化。
上面討論的混合方法也被用于“協(xié)同控制”。hybrid automata是一種用于協(xié)同運動規(guī)劃的特殊框架,其范圍是解決TDM和TG之間的相互作用,這兩個系統(tǒng)分別是離散和連續(xù)的系統(tǒng)(過程)。盡管一些研究報告稱,考慮到排隊等分布式系統(tǒng)的運動規(guī)劃,混合自動機方法具有良好的性能,但該方法可以處理的機動次數(shù)相當(dāng)有限,并且該方法中使用的預(yù)定義(原始)運動對規(guī)劃軌跡的可行性提出了挑戰(zhàn)。
研究差距與未來研究的機遇
根據(jù)本調(diào)查中回顧的工作,混合框架是一種很有前途的方法,可以克服與AV的運動規(guī)劃問題相關(guān)的幾個挑戰(zhàn)?,F(xiàn)有文獻大多涵蓋了基于車輛和環(huán)境的挑戰(zhàn),然而,安全性,尤其是與不確定性相關(guān)的挑戰(zhàn)還有待深入研究。表二也證明了這一事實,可以看出,到目前為止,挑戰(zhàn)“e”(基于不確定性的挑戰(zhàn))并不是研究的主要目標(biāo)。為了強調(diào)各種不確定性對運動規(guī)劃的影響,例如,考慮由于各種系統(tǒng)/傳感器故障引起的感知和定位的可靠性與AVs的故障安全控制密切相關(guān)。因此,進一步研究對感知和定位方面的缺陷具有彈性的(混合)運動規(guī)劃方法是一個很有前途的方向。
此外,由于現(xiàn)有的混合運動規(guī)劃方法ods僅適用于有限數(shù)量的場景,未來的研究可以集中在開發(fā)一個通用框架上,在該框架中,考慮各種TDM和TG算法之間的相互作用,以從一種模式或機動安全過渡到另一種模式。這也可能減少向安全駕駛員提出移交(或回退)請求的頻率,從而提高SAE的自主權(quán)。雖然有幾項研究試圖設(shè)計通用運動規(guī)劃器并涵蓋挑戰(zhàn)“b”(駕駛環(huán)境挑戰(zhàn)),但根據(jù)表II,其中只有兩項研究同時考慮了生成軌跡的可行性,即挑戰(zhàn)“a”(車輛動力學(xué)和可行性)。因此,開發(fā)通用運動規(guī)劃器,同時解決剩余的挑戰(zhàn)仍然是懸而未決的。
最后,另一個值得追求的研究方向源于運動規(guī)劃與其他道路使用者的行為/意圖預(yù)測之間的強耦合。決策應(yīng)考慮其他道路使用者的預(yù)測意圖,然而,考慮到電動汽車的決策/行為,他們的意圖可能會動態(tài)變化,反之亦然。預(yù)計這種耦合將進一步增加運動規(guī)劃和控制算法(挑戰(zhàn)“c”)的實時實現(xiàn)要求,特別是在高速環(huán)境中,如摩托車并線和摩托車駕駛員。因此,進一步研究混合方法以降低其計算復(fù)雜性,將對此類場景非常有益。
總結(jié)和結(jié)論
這篇綜述表明,當(dāng)前設(shè)計AVs運動規(guī)劃算法的趨勢是基于將各種傳統(tǒng)算法結(jié)合在一起的混合框架。據(jù)我們所知,我們定義了四類混合運動規(guī)劃器,包括現(xiàn)有文獻中的所有混合方法,即(i)解耦幾何和運動學(xué)規(guī)劃,(ii)使用勢場的混合,(iii)基于優(yōu)化的混合,以及(iv)邏輯和基于學(xué)習(xí)的方法的組合。我們還將混合動力協(xié)同運動規(guī)劃定義為一個單獨的類別,它使用V2X通信來幫助單個車輛進行運動規(guī)劃或車隊的批量控制。對屬于上述類別的大約50種混合方法的性能評估表明,將兩種或多種傳統(tǒng)的運動規(guī)劃方法結(jié)合在一起是一種很有前途的方法,可以幫助消除每種單獨方法的缺點,而不會犧牲其組件的優(yōu)勢。根據(jù)圖8(頂部)所示的時間表,過去兩年的主流方法是將邏輯方法和基于學(xué)習(xí)的方法相結(jié)合。隨著計算能力和機器學(xué)習(xí)的不斷進步,我們預(yù)計這一趨勢將持續(xù)發(fā)展。
此外,我們已經(jīng)確定了運動規(guī)劃的以下關(guān)鍵挑戰(zhàn),并將其作為比較不同方法的指標(biāo):(a)車輛的動力學(xué)和可行性,(b)駕駛環(huán)境,(c)實時實施,(d)基于安全的挑戰(zhàn)和(e)基于不確定性的挑戰(zhàn)。我們的綜述表明,現(xiàn)有混合方法的主要重點是對駕駛環(huán)境進行適當(dāng)建模并減少計算時間,以實現(xiàn)可靠、安全的實時運動規(guī)劃。盡管如此,仍有一些遺留問題需要克服,例如感知和定位方面的不確定性,這些問題可能會影響生成軌跡的安全性。解決基于不確定性的挑戰(zhàn)的混合方法在現(xiàn)有文獻中的代表性不足。例如,與感知/定位模塊的輸出相關(guān)聯(lián)的置信區(qū)間可以被納入運動規(guī)劃器中,以確保安全,這是未來工作的一個有希望的方向。
最后,本綜述的另一個貢獻是根據(jù)戰(zhàn)術(shù)決策(TDM)和軌跡生成(TG)模塊之間的相互作用對混合技術(shù)進行分類。這揭示了TDM和TG方法在駕駛場景方面缺乏通用性,這是進一步研究的建議方向。通用運動規(guī)劃器可以幫助減少安全駕駛員摔倒的頻率,并實現(xiàn)更高的SAE自主性水平。目前的趨勢是TDM和TG之間的交互式隱含設(shè)計,見圖8(底部),預(yù)計這種設(shè)計將繼續(xù)下去,培養(yǎng)這兩個過程之間的全面互動,以涵蓋廣泛的可能駕駛場景。我們相信,這篇調(diào)查論文將引發(fā)更多關(guān)于模塊化自動駕駛系統(tǒng)運動規(guī)劃的研究活動,并幫助研究人員和行業(yè)更好地定位混合運動規(guī)劃的構(gòu)建塊算法、所解決的挑戰(zhàn)以及潛在TDM和TG過程之間的相互作用。