特斯拉FSD V12如何誕生?馬斯克:大屏實時顯示無干預(yù)里程數(shù)、員工每解決一個問題都要敲鑼
本文經(jīng)AI新媒體量子位(公眾號ID:QbitAI)授權(quán)轉(zhuǎn)載,轉(zhuǎn)載請聯(lián)系出處。
馬斯克最新直播的端到端自動駕駛:
特斯拉FSD V12,是如何煉成的?
傳記作家Walter Isaacson在他即將出版的《Elon Musk》中,提前劇透了一部分內(nèi)容。
據(jù)介紹,為了實現(xiàn)完全神經(jīng)網(wǎng)絡(luò)而非代碼控制,該系統(tǒng)每天從特斯拉車隊獲取約1600億幀視頻用于訓(xùn)練。
但其中最有用的視頻只有不到1%,比如一些奇怪和異常繁忙的十字路口數(shù)據(jù)。
馬斯克稱,他們設(shè)想的這個神經(jīng)網(wǎng)絡(luò)必須接受至少100萬個視頻訓(xùn)練才能work。
而到今年年初,F(xiàn)SD V12已完成了1000萬個視頻分析。
除了這些數(shù)字,在實際開發(fā)過程中,馬斯克也設(shè)立了一些特別的管理辦法。
例如,據(jù)書中描寫,團隊成員們所在工區(qū)裝有一個85英寸的巨大監(jiān)視屏,會實時顯示汽車在沒有干預(yù)的狀態(tài)下行駛了多少英里。
老馬就讓員工通過觀看數(shù)字的刷新產(chǎn)生動力。
更有意思的是,他還給大伙搞了一面鑼,工程師們每解決掉一個干預(yù)問題,就必須去敲一把。
那么,特斯拉FSD V12背后的開發(fā)故事究竟是怎樣的?我們這就來看。
每天獲取1600億幀視頻訓(xùn)練
在FSD v12之前,特斯拉的自動駕駛系統(tǒng)一直依賴于規(guī)則判斷。
即先靠汽車的攝像頭識別車道、行人、車輛、標(biāo)志和交通信號燈等,然后通過特斯拉工程師們手動編寫的數(shù)十萬行C++代碼來應(yīng)對各種情況,比如紅燈停、綠燈行、在沒有足夠快的車輛沖撞時才通過十字路口等等。
任何一個行為都有規(guī)則和條件判斷代碼。
但現(xiàn)在,作為特斯拉自動駕駛系統(tǒng)最重要的一次升級,F(xiàn)SD v12只是通過分析數(shù)十億幀人類如何駕駛汽車的視頻自學(xué)了駕駛。
馬斯克是從8個月前開始讓員工們?nèi)ν度脒@一新方法的。
在團隊中的一位年輕工程師Dhaval Shroff看來:
這就像ChatGPT的訓(xùn)練,但針對的是汽車。
那么,要經(jīng)過多少訓(xùn)練,他們設(shè)想的這個神經(jīng)網(wǎng)絡(luò)才能正常工作呢?
答案是至少100萬個視頻片段。
對此,馬斯克表示問題不大:
我們擁有天然的優(yōu)勢。
相比其他汽車廠商和AI公司,特斯拉在全球各地總共擁有近200萬車隊,可以每天收集駕駛片段。
書中也披露,特斯拉每天從該車隊中獲取約1600億幀視頻用于訓(xùn)練。
不過,馬斯克在推特回應(yīng):
管理這么多數(shù)據(jù)太困難了,其實大多數(shù)最終都被丟掉。重要的是那些占比不到1%的稀有視頻,比如一些奇怪或者車流量異常大的十字路口數(shù)據(jù)。
但不管怎么說,今年年初的時候,V12的神經(jīng)網(wǎng)絡(luò)規(guī)劃器就已經(jīng)完成了1000萬個視頻片段的分析。
一個問題是:
由于它全部模仿人類,是不是只能達到人類駕駛員的平均水平?
對此,年輕工程師Dhaval Shroff告訴大家:
并不,因為特斯拉只使用人類好好處理情況時的數(shù)據(jù)。
因此,數(shù)據(jù)標(biāo)注員的工作功不可沒。
在紐約州的“水牛城”布法羅,他們被馬斯克告知:尋找一些“五星級優(yōu)步司機”的行為。
“沒有分?jǐn)?shù)的電子游戲很無聊”
在V12的開發(fā)過程中,馬斯克經(jīng)常去往特斯拉總部、直入一線工作區(qū),和工程師們來一些即興討論。
按照書中的描寫,是跪在他們旁邊。
值得一提的是,由于馬斯克堅信“永遠不應(yīng)該使用巡航導(dǎo)彈來殺死蒼蠅、蒼蠅拍即可”,所以他也產(chǎn)生過質(zhì)疑:
我們是否真的需要神經(jīng)網(wǎng)絡(luò)?會不會有點過?
團隊用神經(jīng)網(wǎng)絡(luò)比代碼法效果更好的例子,打消了他的“雜念”。
在那場演示中,道路上散落著各種垃圾、被放倒的錐形等等障礙,神經(jīng)網(wǎng)絡(luò)規(guī)劃器順利引導(dǎo)汽車?yán)@過它們、越過車道線并在必要時違反一些規(guī)則實現(xiàn)成功穿越。
員工一邊演示一邊告訴馬斯克:
從代碼法轉(zhuǎn)向神經(jīng)網(wǎng)絡(luò)后,即使在非結(jié)構(gòu)化環(huán)境中,汽車也永遠不會發(fā)生碰撞。
這讓老馬很是滿意,并產(chǎn)生了一些“007式”幻想:
炸彈在四面八方爆炸,不明飛行物從天而降,而汽車卻疾馳而過,沒有撞到任何東西。
正如 “沒有分?jǐn)?shù)的電子游戲很無聊”,為了激勵員工,馬斯克還給大伙兒設(shè)立了一個指標(biāo):
全自動駕駛模式下,車在沒有人類干預(yù)的情況下行駛的英里數(shù)。
馬斯克希望員工每天觀看這一指標(biāo),看它不斷刷新,產(chǎn)生動力。
因此,大家工作的區(qū)域安裝了一塊85英寸的巨型監(jiān)視器,實時顯示里程數(shù)。
而每產(chǎn)生了一個干預(yù)事件,員工就要去解決問題根源,解決掉之后,他們還必須去敲鑼以示祝賀。
這個鑼也安裝在辦公桌附近。
可以說是相當(dāng)獨特的一個管理辦法了。
只待監(jiān)管批準(zhǔn)后發(fā)布
V12進展飛速。
今年4月中旬,馬斯克就首次測試了該系統(tǒng)。
隨行的是特斯拉自動駕駛軟件總監(jiān)Ashok Elluswamy,以及后排也坐滿了三名團隊成員。
老馬雙手移開方向盤,從地圖上選好了目的停車場,從特斯拉總部辦公大樓出發(fā)。
測試全程25分鐘,歷經(jīng)快速路和社區(qū)街道,遇到了復(fù)雜轉(zhuǎn)彎,也包括自行車、行人和寵物。
結(jié)果是除了幾次他認(rèn)為車輛過于謹(jǐn)慎之時進行了干預(yù),全程都沒碰過方向盤。
馬斯克稱,甚至有一次,系統(tǒng)產(chǎn)生了比他還要好的處理方法。
這次測試后的Autopilot例行周會上, 20名幾乎都穿著黑色T恤的工程師圍坐在會議桌旁聆聽裁決。
最終,馬斯克宣布,他相信未來就是該方法的天下,特斯拉應(yīng)該動用資源來推動這一計劃的發(fā)展。
然后,故事就是四個月后,馬斯克正式對外宣布了FSD V12,它將取代舊方法。
而眼下,就等監(jiān)管機構(gòu)批準(zhǔn)后就可立即發(fā)布了(可能是今年年底,也可能是明年)。
只不過,有一個問題需要監(jiān)管機構(gòu)好好考慮:
新的FSD V12完全是通過模仿人類進行駕駛,但人類駕駛員,即使是最優(yōu)秀的那種,有時也會篡改交通規(guī)則。
我們應(yīng)該允許自動駕駛汽車也這樣做嗎?
One More Thing
關(guān)于馬斯克要造一輛只售25000萬美元(約合人民幣18萬元)特斯拉汽車的消息傳了很久。
在這本傳記中,作者終于帶來了一點新消息,那就是它將采用類似賽博皮卡的外形設(shè)計。
另外,自動駕駛出租車也仍在馬斯克的愿景之列。
馬斯克透露:
它的誕生,會讓特斯拉價值直接通往十萬億美元之列。