求解自動(dòng)駕駛倫理困境:轉(zhuǎn)化道德規(guī)范為數(shù)學(xué)方程
一輛失控的列車在鐵軌上行駛,在它行進(jìn)的軌道上,有五個(gè)人被綁起來,列車即將要碾壓過他們。此時(shí),你站在改變列車軌道的操縱桿旁。如果拉動(dòng)此桿,則列車將切換到另一條軌道上。但是,另一條軌道上也有一個(gè)人被綁著。面對(duì)以下僅有兩種選擇,你會(huì)如何做?
- 什么也不做,讓列車按照正常路線碾壓過這五個(gè)人。
- 拉下操縱桿,改變?yōu)榱硪粭l軌道,使列車壓過另一條軌道上的那個(gè)人。
這就是倫理學(xué)中著名實(shí)驗(yàn)——“電車難題”(Trolley problem)。
對(duì)于最終在公共道路上引入自動(dòng)駕駛汽車,技術(shù)角度只是一個(gè)方面。另一個(gè)非常重要的難題是,在一些情景下自動(dòng)駕駛汽車將不得不做出對(duì)人類來說也非常困難的道德抉擇。
在不可避免的汽車碰撞中,自動(dòng)駕駛汽車該如何選擇前進(jìn)方向或碰撞的目標(biāo)?
當(dāng)前關(guān)于自動(dòng)駕駛倫理已經(jīng)有了很多理論研究,但是將這些倫理問題整合起來并實(shí)際應(yīng)用于自動(dòng)駕駛軌跡規(guī)劃中的研究卻少之又少。近日,來自德國慕尼黑工業(yè)大學(xué)的Maximilian Geisslinger、Franziska Poszler等研究團(tuán)隊(duì)在《哲學(xué)與技術(shù)》(Philosophy & Technology)上發(fā)表了一篇標(biāo)題為《自動(dòng)駕駛倫理:從電車問題到風(fēng)險(xiǎn)倫理》(Autonomous Driving Ethics: from Trolley Problem to Ethics of Risk)的研究報(bào)告,將道德規(guī)范轉(zhuǎn)化為數(shù)學(xué)方程,提出了一個(gè)用于軌跡規(guī)劃的風(fēng)險(xiǎn)成本函數(shù),綜合考慮了整體風(fēng)險(xiǎn)的最小化、最壞情況的優(yōu)先級(jí)和人類的平等性。
論文從電車難題引入,進(jìn)行倫理準(zhǔn)則方面的討論。電車難題代表一種困境:兩個(gè)維度創(chuàng)造出一個(gè)道題沖突。第一個(gè)維度是,五個(gè)人的生命是否比一個(gè)人的更有價(jià)值?第二個(gè)維度涉及干預(yù)的程度,沒有做出努力避免讓一個(gè)人死亡與主動(dòng)殺死一個(gè)人區(qū)別很大,這不僅僅是法律意義上的。從道德角度來看,需要的干預(yù)越強(qiáng),人們越難積極做出有利于挽救更多生命的決定。
與電車不同的是,自動(dòng)駕駛汽車的軌跡規(guī)劃沒有任何初始設(shè)置,但算法會(huì)計(jì)算出所有的軌跡。對(duì)自動(dòng)駕駛來說,算法可以在一秒內(nèi)計(jì)算并做出決定,而人類在這種情境下會(huì)驚慌而按照本能行動(dòng)。
自動(dòng)駕駛軌跡規(guī)劃的示意圖,藍(lán)色區(qū)域代表所有可能的所有物理上的可能軌跡。虛線是可能區(qū)域內(nèi)的示例性離散軌跡。
現(xiàn)有的倫理原則:功利主義、美德倫理與風(fēng)險(xiǎn)倫理
為了構(gòu)造一個(gè)令人滿意的倫理結(jié)果,作者介紹了應(yīng)用于自動(dòng)駕駛算法中處理道德困境的原則:現(xiàn)實(shí)代表性、技術(shù)可行性、通用性、社會(huì)接受性、可解釋性和透明性。
功利主義道德原則由英國哲學(xué)家杰里米·邊沁(Jeremy Bentham)提出,強(qiáng)調(diào)整體收益最大化。功利主義允許并提倡犧牲一個(gè)人以拯救更多人來做決策,因此可以通過設(shè)計(jì)成本函數(shù)來讓決策算法計(jì)算可能選項(xiàng)的成本,并從而選擇成本最低的一種,如可以選擇最大限度地減少車禍?zhǔn)芎θ说牟呗缘取?/p>
然而這里的核心問題是,為了讓整個(gè)社會(huì)獲得更大效用,抑制個(gè)人的效用是否正確和被允許。想象一下,一個(gè)人是否愿意選擇一輛自己會(huì)在危險(xiǎn)情況下為了保護(hù)其他人而犧牲自己的自動(dòng)駕駛汽車?
這背后還有一個(gè)根本性的問題,是應(yīng)該由實(shí)施自動(dòng)駕駛汽車通用行業(yè)標(biāo)準(zhǔn)的制造商對(duì)整個(gè)社會(huì)實(shí)施強(qiáng)制性的道德設(shè)置,還是每個(gè)駕駛員都應(yīng)該選擇自己個(gè)人的道德設(shè)置?
而在功利主義之外,具有浪漫主義特征的美德倫理則是傾向于強(qiáng)調(diào)美德是一種個(gè)人的特質(zhì)。謹(jǐn)慎、勇氣、節(jié)制和正義均為人類的基本美德,因此在如今的人工智能倫理發(fā)展中,相關(guān)理論認(rèn)為:認(rèn)知機(jī)器應(yīng)該類比地展現(xiàn)這些優(yōu)點(diǎn)。
但是,機(jī)器內(nèi)的美德沒法進(jìn)行有解釋性地預(yù)先編程,這是其相對(duì)于功利主義的一個(gè)不足?,F(xiàn)在的自動(dòng)駕駛算法往往基于機(jī)器學(xué)習(xí)算法,可能產(chǎn)生不同的模式。開發(fā)者可以通過在訓(xùn)練模型的過程中將美德作為一種積極的獎(jiǎng)勵(lì)信號(hào)加入,最終算法應(yīng)該可以識(shí)別需要進(jìn)行道德行動(dòng)的情況,并且采取相應(yīng)的行動(dòng)。
由此,這樣基于美德倫理學(xué)的策略也可以具有很好的通用性,但問題在于訓(xùn)練數(shù)據(jù)是無法很好表示極端情況的正確決策,同時(shí),可解釋性和歸責(zé)也很難實(shí)現(xiàn)。
作者接著論述了第三種選擇:風(fēng)險(xiǎn)倫理(處理在風(fēng)險(xiǎn)情況下的道德正確行為)。風(fēng)險(xiǎn)倫理有三種既定的決策參考:貝葉斯規(guī)則、最大化原則以及預(yù)防原則。
貝葉斯決策標(biāo)準(zhǔn)要求,當(dāng)面對(duì)不同的行動(dòng)選擇時(shí),選擇產(chǎn)生最大預(yù)期效用的特定行動(dòng)。該預(yù)期效用由不同事件的發(fā)生概率和這些后果的指數(shù)/評(píng)級(jí)組成。
最大化原則可以被理解為,在無法獲得有關(guān)每種后果發(fā)生概率的信息的情況下避免最大損害。因此,決策者會(huì)選擇在最壞的預(yù)期情況下產(chǎn)生最少壞結(jié)果的替代行動(dòng)。
預(yù)防原則遵循“安全總比后悔好”的座右銘,提倡謹(jǐn)慎和規(guī)避風(fēng)險(xiǎn),通過制定特定的法律來主動(dòng)防止?jié)撛诘奈磥頁p害。
風(fēng)險(xiǎn)倫理具有高透明度(在更可預(yù)測的意義上)、通用性(對(duì)風(fēng)險(xiǎn)的考慮與具體情況無關(guān))、現(xiàn)實(shí)代表性(充分考慮不確定性),因此具有比較高的社會(huì)接受度。
然后,作者提出,據(jù)他所知,在軌跡規(guī)劃中還沒有實(shí)施了風(fēng)險(xiǎn)倫理的技術(shù)方法。然后,理論上,策略結(jié)果的積累風(fēng)險(xiǎn)可以很容易地計(jì)算和比較,從而反映在可被編程實(shí)現(xiàn)的數(shù)學(xué)表達(dá)中。
風(fēng)險(xiǎn)倫理如何形成和實(shí)現(xiàn)?
為了對(duì)于風(fēng)險(xiǎn)倫理框架的理解,可以想象一個(gè)具體情景:一輛自動(dòng)駕駛汽車在自行車和卡車之間行駛,他的位置決定了其帶來的風(fēng)險(xiǎn),減少與自行車之間的距離,會(huì)將風(fēng)險(xiǎn)轉(zhuǎn)移到騎車人身上,因?yàn)樵谂c汽車發(fā)生碰撞的情況下,騎車人的后果被認(rèn)為要大得多,減少與卡車的距離則會(huì)導(dǎo)致風(fēng)險(xiǎn)向自動(dòng)駕駛汽車轉(zhuǎn)移??偟膩碚f,最大限度降低自動(dòng)駕駛汽車乘員的風(fēng)險(xiǎn)是以犧牲弱勢道路使用者為代價(jià)的,例如騎自行車的人或行人。
盡管這種為了保護(hù)自己而將風(fēng)險(xiǎn)轉(zhuǎn)移給弱勢者的行為可能不符合最苛刻的倫理審視,也和康德強(qiáng)調(diào)的人的尊嚴(yán)不相容,但是Bonnefon等人的研究表明,大多數(shù)的參與者仍然傾向于稱作一個(gè)會(huì)不惜一切代價(jià)保護(hù)自己的自動(dòng)駕駛汽車,而且也可能導(dǎo)致汽車制造商和自動(dòng)駕駛技術(shù)提供者以這個(gè)準(zhǔn)備為指導(dǎo)進(jìn)行相關(guān)策略的設(shè)計(jì)。
當(dāng)考慮對(duì)風(fēng)險(xiǎn)的計(jì)算和建模時(shí),一般來說,其被定義為發(fā)生概率和估計(jì)后果的乘積。借助于這種定量的計(jì)算和對(duì)于策略后果的估計(jì),前人已經(jīng)提出了相關(guān)的具體算法實(shí)驗(yàn),其中Leben強(qiáng)調(diào)了對(duì)于參與者生存幾率的估計(jì)和最大化,本文的作者提出的方法強(qiáng)調(diào)了概率和相關(guān)后果的風(fēng)險(xiǎn)性的疊加。
在這個(gè)二維的概率疊加中,需要同時(shí)估計(jì)碰撞的概率和對(duì)應(yīng)的后果的危害情況。其中碰撞概率的估計(jì)來自于自動(dòng)駕駛過程中的各種不確定性的共同后果,而這些不確定性在上圖描述的運(yùn)動(dòng)規(guī)劃的全過程中被逐步疊加,來自于車輛傳感器、感知系統(tǒng)和預(yù)測算法。
而危害的估計(jì)則更加的困難了,主要挑戰(zhàn)的便是對(duì)于“危害”這個(gè)抽象的數(shù)量的量化。從倫理的角度來看,尚不清楚應(yīng)如何量化不同類型的傷害并相互權(quán)衡。尤其是涉及到可能造成致命后果的極端事故時(shí),這給我們帶來了巨大的困難。例如,我們無法權(quán)衡終身殘疾的嚴(yán)重傷害與死亡之間的關(guān)系。從道德的角度來看,將財(cái)產(chǎn)損失與人身傷害進(jìn)行比較就更加困難了。而使用經(jīng)濟(jì)后果(如貨幣價(jià)值)對(duì)傷害進(jìn)行量化的方法則需要準(zhǔn)確了解事故后果。事實(shí)上,在實(shí)踐中,事故的嚴(yán)重程度只能在一定程度上預(yù)測。但是這種危害量化預(yù)測的困難就帶來了對(duì)整個(gè)風(fēng)險(xiǎn)道德模型的實(shí)現(xiàn)的困境。
基于這種困難,本文的作者出于對(duì)碰撞產(chǎn)生危害的物理性質(zhì)的思考,提出了參考物體動(dòng)能和物體運(yùn)動(dòng)狀態(tài)的風(fēng)險(xiǎn)分布。這種分布的考察對(duì)于駕駛車輛和其他的道路參與者進(jìn)行了分別考慮,使得后續(xù)的策略制定可以實(shí)行不同的風(fēng)險(xiǎn)偏好。
“三原則”在風(fēng)險(xiǎn)估計(jì)中的運(yùn)用
根據(jù)貝葉斯原理的要求,總的社會(huì)效益應(yīng)當(dāng)被盡量最大化,并且滿足功利考慮的需求。這意味需要尋找一個(gè)對(duì)于所有的參與者的收益期望最高的策略。但是另一方便,這種方法只追求總體風(fēng)險(xiǎn)的最小化,沒有提供有關(guān)風(fēng)險(xiǎn)關(guān)系的任何信息而且也沒有考慮公平性。出于對(duì)這種缺陷的改良,作者還加入了“平等原則”(Equality principle)的約束,要求通過最小化所考慮風(fēng)險(xiǎn)的差異來平等分配風(fēng)險(xiǎn)。
而這種平等原則在不加額外限制的情況下,可能會(huì)帶來人們預(yù)期之外的結(jié)果,比如在只有兩個(gè)參與者的情況下,單純地強(qiáng)調(diào)平等原則,可能會(huì)讓決策策略比起“一個(gè)人受輕傷另外一個(gè)不受傷”更喜歡兩個(gè)人均死亡。
最后,作者還強(qiáng)調(diào)了“極大極小原則”(Maximin principle),其被設(shè)計(jì)用來讓決策策略尋找使得“最大傷害”盡量最小的方案。而如果單獨(dú)考慮 這個(gè)原則,也有顯而易見的缺陷:單純強(qiáng)調(diào)最小化“可能”的最大傷害,而不考慮這種可能性的量化比較,這使得一個(gè)極大概率的較大傷害可能被認(rèn)為優(yōu)于極小概率的巨大傷害,這在很多時(shí)候不但于前文所述的基于概率分析的功利化的考慮矛盾,而且潛在地和人們樸素的道德取向不兼容。
因此,本文提出的所有三個(gè)原則都存在系統(tǒng)性缺陷。而作者嘗試通過同時(shí)結(jié)合三種原則而取得一個(gè)更好的策略。因此,作者最后提出了基于對(duì)三種策略因素的加權(quán)得到最后的風(fēng)險(xiǎn)量化計(jì)算的結(jié)果。這種權(quán)重的設(shè)置提供了比較不同道德設(shè)置的機(jī)會(huì)。對(duì)于個(gè)人道德設(shè)置,權(quán)重可以從反映用戶道德直覺的實(shí)證研究中得出。將這些見解與法律和倫理學(xué)科的基本原則和規(guī)則(例如人類尊嚴(yán))相結(jié)合,可以作為一個(gè)起點(diǎn),使自動(dòng)駕駛汽車更接近強(qiáng)制性道德設(shè)置(在傳統(tǒng)意義上,這意味著唯一允許和需要的行動(dòng)) 。
除了對(duì)風(fēng)險(xiǎn)計(jì)算需要的三個(gè)原則的考慮,作者還強(qiáng)調(diào)了風(fēng)險(xiǎn)分布函數(shù)中的時(shí)間因素,這就要求對(duì)于迫在眉睫的風(fēng)險(xiǎn)的排除(算法中常被概括為局部貪婪的策略),并且利用了“折扣因子”來對(duì)不同時(shí)間之后的風(fēng)險(xiǎn)進(jìn)行量化,使得這種對(duì)于更緊迫的風(fēng)險(xiǎn)的考慮可以被執(zhí)行。