特斯拉使用人工智能改進(jìn)自動(dòng)駕駛
特斯拉(Tesla)在上周的投資者會(huì)議上表示,一旦Dojo超級(jí)計(jì)算機(jī)加入其高性能計(jì)算基礎(chǔ)設(shè)施,特斯拉的自動(dòng)駕駛能力將顯著提高。
特斯拉Autopilot軟件總監(jiān)Ashok Elluswamy在投資者日會(huì)議上發(fā)表演講時(shí)表示,運(yùn)行FSD(全自動(dòng)駕駛)軟件的特斯拉汽車(目前約有40萬(wàn)客戶)將能夠通過硬件升級(jí)做出更智能的自動(dòng)駕駛決策,這將提高整體人工智能(AI)能力。
該公司目前擁有一個(gè)人工智能系統(tǒng),實(shí)時(shí)收集車上八個(gè)攝像頭的視覺數(shù)據(jù),并生成一個(gè)3D輸出,識(shí)別障礙物及其運(yùn)動(dòng)、車輛、道路和交通信號(hào)燈,并對(duì)幫助汽車做出決策的任務(wù)進(jìn)行建模。
特斯拉挖掘其汽車網(wǎng)絡(luò)以獲取更多的視覺數(shù)據(jù),并將其輸入到訓(xùn)練模型中。訓(xùn)練模型不斷學(xué)習(xí)以解決新的問題,有助于AI更好地理解路上的模式。通過FSD軟件升級(jí),新的知識(shí)被輸入到汽車中。
“如果我們運(yùn)行并重復(fù)這個(gè)過程,它會(huì)越來越好?!盓lluswamy說,“可擴(kuò)展FSD的解決方案是讓架構(gòu)、數(shù)據(jù)和計(jì)算變得恰到好處,我們已經(jīng)組建了一個(gè)世界級(jí)的團(tuán)隊(duì)來執(zhí)行這項(xiàng)工作。他們正在將這三項(xiàng)工作推向前沿?!?/span>
FSD并非一帆風(fēng)順,軟件故障迫使特斯拉召回了36萬(wàn)多輛汽車。該公司通過無線更新提供了軟件修復(fù)。特斯拉客戶可以從每月99美元開始購(gòu)買FSD。一些使用舊款特斯拉車型的客戶還需要額外付費(fèi)安裝FSD電腦。Elluswamy聲稱,有FSD的特斯拉仍然比美國(guó)全國(guó)平均水平安全高五到六倍。
Elluswamy說:“隨著我們提高系統(tǒng)的安全性、可靠性和舒適性,他們可以解鎖無人駕駛操作,從而將汽車的使用方式更新并超越目前的使用方式?!?/span>
如今,該公司在其數(shù)據(jù)中心的14000個(gè)GPU上運(yùn)行其人工智能系統(tǒng),并可以利用30 PB的視頻緩存,而視頻緩存正在增長(zhǎng)到200 PB。約4000個(gè)GPU用于自動(dòng)標(biāo)記,其余10000個(gè)GPU用于人工智能的數(shù)據(jù)訓(xùn)練。
Elluswamy說:“一旦我們將Dojo(我們的訓(xùn)練計(jì)算機(jī))引入這一領(lǐng)域,所有這些都將顯著增加?!?/span>
Dojo系統(tǒng)基于特斯拉自主研發(fā)的D1芯片,可提供22.6萬(wàn)億次的FP32性能。它擁有500億個(gè)晶體管和10TBps的片上帶寬,以及4TBps的片外帶寬。
一組D1芯片將安裝在高密度ExaPOD機(jī)柜中,它將提供1.1 EB的BFP16和CFP8性能。特斯拉的車載FSB計(jì)算機(jī)可以提供150萬(wàn)億次的性能,主要用于推理。
特斯拉硬件高級(jí)主管Ganesh Venkataraman在去年的Hot Chips大會(huì)上發(fā)表演講時(shí)表示,特斯拉之所以制造D1芯片,是因?yàn)樵贕PU和CPU擴(kuò)展方面存在缺陷。
Venkataraman說:“我們注意到了許多瓶頸。首先是在推理方面,這是我們做FSD計(jì)算機(jī)的原因。然后我們開始注意到類似的訓(xùn)練規(guī)模問題,了解工作量后……我們可以根據(jù)輸出需求優(yōu)化我們的系統(tǒng)。”
在早期,特斯拉的人工智能系統(tǒng)依賴于單攝像頭和單幀視頻,然后在自動(dòng)汽車規(guī)劃系統(tǒng)的后期處理中進(jìn)行拼接。
“這是非常脆弱的,并沒有帶來顯著成功,”Elluswamy說。
在過去幾年中,特斯拉已經(jīng)轉(zhuǎn)變?yōu)橐粋€(gè)“多攝像頭視頻世界”。每輛車都有八個(gè)攝像頭,將視覺信息輸入AI系統(tǒng),然后生成一個(gè)3D輸出空間。人工智能對(duì)障礙物的存在、它們的運(yùn)動(dòng)、車道、道路和交通燈等做出決定。
任務(wù)建模超越了計(jì)算機(jī)視覺,并使用了ChatGPT等人工智能系統(tǒng)中使用的技術(shù),包括轉(zhuǎn)換器(Transformers)、注意力模塊(attention modules)和令牌(Token)的自回歸建模。
Elluswamy說:“有了這樣一個(gè)端到端的解決感知的系統(tǒng),我們真的去除了脆弱的后處理步驟,為規(guī)劃系統(tǒng)提供了高質(zhì)量的輸出。即使是規(guī)劃系統(tǒng)也沒有一成不變。它現(xiàn)在開始使用越來越多的人工智能系統(tǒng)來解決這個(gè)問題。”
自動(dòng)駕駛汽車需要快速響應(yīng),以便實(shí)時(shí)做出平穩(wěn)、安全的決策。Elluswamy舉了一個(gè)50毫秒響應(yīng)時(shí)間的例子,自動(dòng)駕駛汽車可以在與周圍環(huán)境(包括行人、紅綠燈)交互后做出駕駛決定。
這是大量數(shù)據(jù),而在傳統(tǒng)計(jì)算中,“每項(xiàng)數(shù)據(jù)都需要10毫秒的計(jì)算時(shí)間,很容易就超過了1000毫秒。這是不可接受的?!盓lluswamy說,“但使用AI,我們將所有這些都打包成了50毫秒的計(jì)算量,這樣它就可以實(shí)時(shí)運(yùn)行?!?/span>
特斯拉正在通過收集世界各地不同路況和交通趨勢(shì)的汽車數(shù)據(jù)來擴(kuò)充其原始數(shù)據(jù)。特斯拉使用算法重建車道、道路邊界、路緣、人行橫道和其他圖像,然后將其作為幫助汽車導(dǎo)航的基礎(chǔ)。
Elluswamy說:“這是通過收集車隊(duì)中不同汽車的各種片段,并將所有片段組合成汽車周圍世界的統(tǒng)一表示來實(shí)現(xiàn)的?!?/span>
隨著更多數(shù)據(jù)被輸入到系統(tǒng)中,訓(xùn)練模型被不斷地重構(gòu)。為了訓(xùn)練網(wǎng)絡(luò),特斯拉在收集的數(shù)據(jù)上建立了一個(gè)復(fù)雜的自動(dòng)標(biāo)記管道,在該管道上運(yùn)行計(jì)算算法,然后生成標(biāo)簽來訓(xùn)練這些網(wǎng)絡(luò)。
Elluswamy說:“一旦我們完成了基礎(chǔ)重建,我們就可以在基礎(chǔ)上構(gòu)建各種模擬,以產(chǎn)生無限多樣的數(shù)據(jù)進(jìn)行訓(xùn)練。”特斯拉擁有強(qiáng)大的模擬器,可以合成對(duì)抗性天氣、照明條件,甚至其他物體的運(yùn)動(dòng)。“每次我們添加數(shù)據(jù)時(shí),性能都會(huì)提高?!?/span>