不確定環(huán)境下的自動(dòng)駕駛?cè)绾螌?shí)現(xiàn)?
本文經(jīng)自動(dòng)駕駛之心公眾號(hào)授權(quán)轉(zhuǎn)載,轉(zhuǎn)載請(qǐng)聯(lián)系出處。
Automated Driving in Uncertain Environments: Planning with Interaction and Uncertain Maneuver Prediction,Constantin Hubmann1, Jens Schulz2, Marvin Becker3, Daniel Althoff4, and Christoph Stiller5。
文章采用了pomdp的方式建模環(huán)境的不確定性問題,從而達(dá)到處理環(huán)境車輛意圖和感知的不確定性。這里處理的環(huán)境主要是十字路口環(huán)境,決策是先固定了空間軌跡,然后進(jìn)行縱向決策,體現(xiàn)在自動(dòng)的速度變化上。是一種解耦的思路。這個(gè)文章還有一個(gè)更早的版本,不過內(nèi)容是一樣的,所以不必去看了,Decision making for autonomous driving considering interaction and uncertain prediction of surrounding vehicles。
而對(duì)于目標(biāo)車,由于其route是hidden variable, 是我們希望估計(jì)的東西,這個(gè)東西會(huì)通過后面的貝葉斯推斷的方式進(jìn)行更新,所以對(duì)于目標(biāo)車,我們關(guān)注的狀態(tài)中有一個(gè)route r, 此外由于后面是通過這個(gè)車的空間位置和車速進(jìn)行貝葉斯推斷的,所以觀測(cè)空間中有位置和速度的信息,這里其他車的state包括:
離散空間的狀態(tài)轉(zhuǎn)移方程:
這里的加速度,通過heuristic的方式計(jì)算得到,這個(gè)值可以用數(shù)據(jù)訓(xùn)練獲得,也可以用一些簡(jiǎn)單的規(guī)則的方式獲得:
接下來是觀測(cè)空間,這個(gè)觀測(cè)上面說了,要用貝葉斯推斷來更新概率,且用了空間位置和車速,所以這里的觀測(cè)狀態(tài)對(duì)于自己來說是:
而對(duì)于其他車輛則是:
對(duì)于觀測(cè)函數(shù)來說,觀測(cè)特征是:
采用貝葉斯推斷:
pomdp的求解采用了ABT算法,沒有仔細(xì)研究過ABT, 這里就不多寫了。下面可以看一下實(shí)驗(yàn)數(shù)據(jù)。一個(gè)是十字路口場(chǎng)景:
這目標(biāo)車有可能直行,也有可能右轉(zhuǎn),所以存在一定與本車發(fā)生交互的可能性。
可以看到上圖中的對(duì)比,如果只是采用不考慮不確定性的算法,我們會(huì)選擇保守的策略,而考慮了不確定性之后,則會(huì)看到軌跡的車速并不會(huì)非常保守,這種特點(diǎn)非常像contingency plan出來的效果。往后看實(shí)驗(yàn)數(shù)據(jù),在這個(gè)類似的場(chǎng)景中:
我們可以看到本車的車速,也就是下圖中的藍(lán)色線,首先在不確定目標(biāo)意圖的時(shí)候,在兩車逼近到9s的時(shí)候發(fā)生了減速,然后隨著目標(biāo)意圖的收斂,從直行變成了右轉(zhuǎn),不與本車發(fā)生交互,本車在接下來就開始加速。而在 v-t圖中的對(duì)比可以看到,別的兩種軌跡,分別是假設(shè)目標(biāo)100%右轉(zhuǎn)或者直行的情況下的本車軌跡,考慮不確定性的軌跡事實(shí)上是介于兩者中間的,所以有一次非常像contingency plan的結(jié)果:
從s-t圖上面可以看到類似的效果:
可以看到本車的藍(lán)色線也是介于另外兩種極端可能性之間的。考慮不確定性后可以將軌跡粘合在兩種極端可能性之間,起到contingency的效果。
原文鏈接:https://mp.weixin.qq.com/s/uBOG8XzE5DKYxwTMB9Shkg?poc_token=HG1FAWWjK2Gour3uC1UlGWQ6eowaEestvkP6mi6J