編譯 | 言征
出品 | 51CTO技術棧(微信號:blog51cto)
ChatGPT在互聯(lián)網(wǎng)上引起轟動后不久,2022年12月,特斯拉的帕洛阿爾托總部也在進行類似的開發(fā)。該公司自動駕駛系統(tǒng)的工程師達瓦爾·施羅夫向首席執(zhí)行官埃隆·馬斯克提出了一個概念。施羅夫提出了一個專為汽車量身定制的類似于ChatGPT的系統(tǒng)。
他們的目標不是依靠預定義的規(guī)則來確定汽車的最佳路徑,而是使用從大量訓練數(shù)據(jù)中學習的神經(jīng)網(wǎng)絡。擁有十年經(jīng)驗的特斯拉團隊經(jīng)驗豐富的成員Shroff解釋說,這些數(shù)據(jù)包括數(shù)百萬個人類駕駛行為的例子。
八個月后,馬斯克體驗到全自動駕駛(FSD)汽車的性能與他之前駕駛的數(shù)百輛相比有所提高。流暢性和可靠性歸功于引入新概念的新版本FSD12。
圖源:Elon Musk FSD 12 Livestream
馬斯克認為,這項創(chuàng)新不僅有可能改造自動駕駛汽車,而且代表著向能夠在現(xiàn)實世界場景中運行的通用人工智能的飛躍。Shroff提出的新系統(tǒng)不是傳統(tǒng)上依賴數(shù)十萬行代碼,而是通過處理數(shù)十億個描述人類駕駛行為的視頻幀來學習駕駛。這種方法反映了新的LLM聊天機器人所采用的自我訓練方法,該方法通過處理人類文本中的數(shù)十億個單詞來產(chǎn)生響應。
1.端到端的自動駕駛
特斯拉并不是唯一一家采用端到端技術的公司,還有Comma.ai和OpenPilot,班加羅爾男孩曼卡蘭·辛格用它通過一部舊的安卓手機為他的Alto供電。他在印度進行FSD之旅的消息引起了人們的關注,因為汽車制造商經(jīng)常告訴我們船上有多少計算能力才能實現(xiàn)這一點。
Wayve.ai甚至決定用倫敦最艱難的街道來測試其自動駕駛技能。該團隊取得了一些令人印象深刻的成果。八個月前,他們發(fā)布了一個使用視頻、文本和動作輸入來訓練系統(tǒng)在路上行為的90億參數(shù)世界模型。
圖片
2022年5月,Wayve與微軟合作,利用科技巨頭的基于云的超級計算機Azure來訓練其神經(jīng)網(wǎng)絡。
馬斯克指出了端到端方法的一個重要方面:車輛不再接收明確的指令,如“在紅燈處停車”或“在變道前驗證”。相反,它通過“模仿”在訓練過程中使用的1000萬個視頻中觀察到的行為來自主判斷這些動作。
這意味著他們一直在使用數(shù)百萬個視頻的數(shù)據(jù)集,并對每個視頻中的駕駛員進行了評估。機器學習模型已經(jīng)過訓練,可以模仿被認為“駕駛技術好”的駕駛員的行為。
從理論上講,這具有巨大的潛力,因為當面對不熟悉的場景時,模型可以更有效地進行概括。從本質(zhì)上講,該模型可以根據(jù)其訓練來確定最恰當?shù)男袨?,而不是陷入預定義的指令中。
2.投入巨資登月計劃的三分之一自動駕駛依舊發(fā)展緩慢
然而,還有一個問題有待解決。即使是技術最嫻熟的駕駛員,也經(jīng)常違反交通規(guī)則。例如,超過95%的人傾向于緩慢通過停車標志,而不是完全停下來。
由于新的FSD系統(tǒng)是有意設計來模仿人類行為的,因此美國國家公路安全委員會負責人目前正在調(diào)查這種行為是否可被視為自動駕駛汽車可接受的行為。
此外,盡管過去十五年來不計成本地揮霍和無休止的道路測試,但無人駕駛技術仍然停滯在試點階段?!拔覀兛吹酵度肓舜罅康馁Y金,但得到的成果卻非常有限,”Wayve的創(chuàng)始人兼首席執(zhí)行官亞歷克斯·肯德爾指出。
這促使了總部位于英國的Wayve公司以及Waabi和Ghost等初創(chuàng)公司大力關注神經(jīng)網(wǎng)絡。他們將其稱為AV2.0,并樂觀地認為,更勝任且成本效益更高的技術將使他們超越當前的市場領導者。
多年來,自動駕駛汽車因各種高調(diào)錯誤而備受關注,這些錯誤很難被忽視。投資者在開發(fā)自動駕駛汽車方面投入了超過1000億美元,占NASA將人類送上月球所花費的三分之一。總之目前看,人類的一大步比能自動駕駛的汽車要便宜。