自動駕駛熱潮引燃AI芯片大戰(zhàn),爆點不止特斯拉一家
之前被炒的沸沸揚揚、多次被媒體尋找蛛絲馬跡來證明真實性的“特斯拉自研AI芯片”傳聞,這個月初被馬斯克親自敲了實錘。在今年12月初的神經(jīng)信息處理系統(tǒng)大會NIPS上,馬斯克承認(rèn),特斯拉自動駕駛硬件工程副總裁JimKeller正在領(lǐng)導(dǎo)AI芯片的開發(fā)工作。同時他表示,堅信Keller可以打造出“世界上***的AI定制硬件”。
Keller如此被馬斯克信任也不是沒有原因。他可以稱得上是天才架構(gòu)師,最早時在DEC工作時,參與設(shè)計了Alpha 21164和21264處理器,被應(yīng)用在許多大型主機(jī)中,包括中國超級計算濟(jì)南中芯的神威藍(lán)光超級計算器;在AMD期間,設(shè)計出了K7和K8等知名架構(gòu),業(yè)界首款突破GHz的CPU架構(gòu)便是出自其手;后來又在蘋果設(shè)計出了A4、A5處理器,這是當(dāng)年iPhone最核心的部件;在回到AMD之后,Keller奉獻(xiàn)了Zen架構(gòu),基于此架構(gòu)的Ryzen讓AMD在2017年咸魚翻身。
在2016年跳槽到特斯拉之后,Jim Keller從AMD帶走了一批架構(gòu)師和高管,根據(jù)CNBC在9月份的一則報道,特斯拉已經(jīng)有超過50人在從事AI芯片的開發(fā)了,從中也可以看出特斯拉早已置下的自研AI芯片的野心。
AI芯片事關(guān)特斯拉自動駕駛的未來
在自動輔助駕駛系統(tǒng)Autopilot直至8.0版本之前,特斯拉一直采用的是Mobileye的Eye Q3芯片。Mobileye是一家創(chuàng)立于以色列的公司,專注于ADAS(高級輔助駕駛系統(tǒng))的軟硬件開發(fā),其特有的EyeQ視覺識別芯片以及ADAS軟件被應(yīng)用于多家汽車廠商,如沃爾沃、寶馬、奧迪等。Mobileye的優(yōu)勢很明顯:自由空間標(biāo)記、啟發(fā)式路徑尋找、道路避障和路牌識別。
不過,特斯拉并沒有完全采用Mobileye的軟件,而是通過自己的軟件結(jié)合Mobileye以及英偉達(dá)硬件來實現(xiàn)自己的自動輔助駕駛。Mobileye的Amnon博士曾親口證實過,特斯拉的自動輔助駕駛使用了一部分EyeQ3的計算能力,而沒有使用其自有的功能,如紅綠燈識別,無中間黃線的雙行道識別等;另外,去年5月發(fā)生的***起自動輔助駕駛中產(chǎn)生的車禍也能證明此事。
當(dāng)時,一位司機(jī)駕駛特斯拉的Model S在佛羅里達(dá)一條未封閉的高速上因為與橫穿馬路的大卡車相撞而喪命,Mobileye的發(fā)言人澄清說自己的系統(tǒng)主要是應(yīng)對于追尾導(dǎo)致的碰撞,而不能勝任這樣的碰撞檢測,類似這樣的情況會在2018年左右的新系統(tǒng)中解決,而特斯拉的發(fā)言人則回應(yīng)說,特斯拉雖然使用了Mobileye的芯片,但是技術(shù)上已經(jīng)涵蓋了這種碰撞處理,只是由于當(dāng)時環(huán)境條件導(dǎo)致失誤,沒能阻止慘劇發(fā)生。
在發(fā)生這起車禍時,攝像頭剛好遇到太陽下山時強(qiáng)烈的背光導(dǎo)致識別能力不足,收集到的數(shù)據(jù)不完備,而這不完備的2D數(shù)據(jù)又經(jīng)過圖像識別加工成錯誤的3D場景,讓車誤判了前方的路況,從而釀成慘禍。
這次車禍?zhǔn)窃谝粋€非常極端的情況下,各種負(fù)面因素累加而成的結(jié)果,屬于系統(tǒng)的一次“漏報”,然而這也暴露了Mobileye技術(shù)的不足。此次教訓(xùn)讓特斯拉延遲了計劃中的8.0系統(tǒng)的發(fā)布,且直接加速雷達(dá)主導(dǎo)的自動輔助駕駛時代的來臨。
2016年7月,特斯拉與Mobileye分道揚鑣,同年10月,搭載Autopilot 2.0自動駕駛輔助系統(tǒng)的車型開始量產(chǎn)。
Autopilot 1.0是基于Mobileye的圖像識別技術(shù),主要數(shù)據(jù)來自于車頂?shù)腗obileye攝像頭,車首的雷達(dá)和周邊雷達(dá)只是提供輔助信息;而Autopilot 2.0則是基于雷達(dá)識別環(huán)境,主要數(shù)據(jù)來源于車身上的雷達(dá),而輔助數(shù)據(jù)則來源于車隊學(xué)習(xí)的高精度地圖和白名單。
在硬件部分,Autopilot 2.0使用了3個前置攝像頭(不同視角 廣角、長焦、中等)、2個側(cè)邊攝像頭(一左一右)、3個后置攝像頭、12個超聲波傳感器(傳感距離增加一倍)、一個前置雷達(dá)(增強(qiáng)版)、一個后置倒車攝像頭,而芯片則使用了英偉達(dá)DrivePX 2(40x Autopilot 1.0處理速度)。
英偉達(dá)CEO黃仁勛曾表示:“英偉達(dá)Drive PX 2是全球首款專為主動駕馭轎車規(guī)劃的AI超級計算機(jī),它的運算才能與150臺MacBook Pro相當(dāng)。”
馬斯克接受采訪時表明,在芯片挑選上,AMD和英偉達(dá)并沒有太大區(qū)別,當(dāng)然特斯拉終究挑選了英偉達(dá)。但這番表述好像表明,特斯拉在芯片挑選上是十分靈敏的。
不過,特斯拉才投向英偉達(dá)的方案沒多久,為何又想移情別戀?這要從GPU架構(gòu)的先天限制說起。
GPU的功耗極為龐大,且推理能力差,基于GPU架構(gòu)的自動駕駛方案也有同樣的問題。以自動駕駛最常用的CNN卷積神經(jīng)網(wǎng)絡(luò)來說,英偉達(dá)的Drive PX2推理性能上其實并不算特別出色。為了達(dá)到L3、甚至L4以上的自動駕駛功能,Drive PX2***端的完整自動駕駛版本功耗達(dá)250w,性能卻只有20 TFLOPS,因此特斯拉要求英偉達(dá)為其定制了一個特殊版本,將***端版本的規(guī)模減半,性能只剩下10 TFLOPS,功耗也大幅降低到100W左右,降低對電池壽命的影響,避免行駛里程過低,但也因此,其自動駕駛能力勉強(qiáng)只能達(dá)到L3的程度,而不是其宣稱的L5。
據(jù)稱,英偉達(dá)推出的下一代Xavier自動駕駛平臺在增加性能同時又大幅降低了功耗,理論上特斯拉只要直接升級就好,但根據(jù)NVIDIA自己的說法,L5級別的自動駕駛需要兩套Xavier共同合作才能達(dá)成。如此一來,成本上的負(fù)擔(dān)又會增加了。完整版Drive PX2要價1.5萬美元,Xavier只會更貴,若要達(dá)成L5自動駕駛則必須搭配兩套Xavier以及周邊傳感器,成本恐怕是天價。
另外,曾經(jīng)的好伙伴Mobileye也即將推出高一級的Eye Q4和Eye Q5。前者可以在3W的功耗下達(dá)到2.5 TFLOPS的效率,后者則是在10W的功耗下達(dá)到24 TFLOPS。Eye Q系列都是采用CPU混搭向量加速單元來做自動駕駛所需要的卷積神經(jīng)網(wǎng)絡(luò)計算,嚴(yán)格上來說,就是CPU結(jié)合ASIC處理單元的異構(gòu)產(chǎn)品。
下一代Eye Q4方案要到2018年才會量產(chǎn)。前不久宣布正式上市的蔚來首款量產(chǎn)車ES8就是全球首款安裝Mobileye Eye Q4芯片的車型;而唯一具競爭力的EyeQ5要到2019年甚至更晚才有機(jī)會面世,急于推出更高等級自動駕駛功能的特斯拉無法繼續(xù)等待,這恐怕是特斯拉打定主意開發(fā)自己的AI芯片的原因之一。
自動駕駛的火熱引燃了AI芯片大戰(zhàn)
特斯拉與Mobileye、英偉達(dá)的分分合合只是自動駕駛芯片大戰(zhàn)中的冰山一角,其他如英特爾、高通等巨頭也在火力全開加速創(chuàng)新。
2016年,英特爾以167億美元完成了對世界第二大FPGA公司Altera的收購。
目前主流的自動駕駛芯片解決方案主要包括GPU、FPGA、DSP和ASIC四種。相對而言,F(xiàn)PGA高實時,低功耗,可靈活編程,這全都切中了自動駕駛對計算芯片的要求。英特爾在年初推出的自動駕駛計算平臺Intel Go中,就使用了FPGA芯片。奧迪新A8自動駕駛所仰賴的核心計算單元zFAS,也使用了Altera的FPGA芯片,內(nèi)建被英特爾收購的Movidius視覺算法,負(fù)責(zé)物體數(shù)據(jù)和地圖數(shù)據(jù)的融合,與自動停車功能的實現(xiàn)。
另外,結(jié)合FPGA,英特爾可以在云端處理大量并發(fā)的實時計算。這種模式尤其適合人們對智慧城市大腦的設(shè)想:每一輛無人車的數(shù)據(jù)都上傳到一個中樞,由其處理并洞悉每一輛車的狀態(tài),再命令他們?nèi)绾务{駛。要實現(xiàn)如此,需要5G高寬帶、時延低的數(shù)據(jù)通道,為此英特爾在今年推出了首款車載5G通信平臺。
然而,雖然這一套設(shè)想很先進(jìn),但是目前短期內(nèi)實現(xiàn)難度較大,英特爾今年3月以153億美元價格收購了以色列ADAS公司Mobileye,是以先參與進(jìn)自動輔助駕駛技術(shù)的落地。
Mobileye一方面為英特爾提供了切入自動駕駛市場的渠道——前者在全球ADAS市場的份額超過70%;另一方面,Mobileye的核心產(chǎn)品——ADAS專用芯片Eye Q系列,使英特爾形成了針對車輛端的計算芯片解決方案——英特爾的凌動/至強(qiáng)+Mobileye的EyeQ+Altera的FPGA。這153億美元,其實是英特爾為自動駕駛買的門票。
至于高通,由于專注于移動端,其在高性能計算上的積累不如英特爾與英偉達(dá)。驍龍SoC雖然在單位能耗上相對英特爾與英偉達(dá)的計算平臺都占據(jù)優(yōu)勢,但在峰值性能輸出上則被其功耗限制。加之驍龍SoC又并非為ADAS專門打造的計算平臺,因此想要打開自動駕駛汽車的市場,面臨的阻力不小。
去年10月,高通宣布與全球***的汽車半導(dǎo)體廠商恩智浦達(dá)成收購協(xié)議。恩智浦在被高通宣布收購之前,就已推出了ADAS專用芯片S32V234,主要用于處理視覺信號,可同時處理兩路視頻。值得一提的是,考慮到ADAS對安全性的要求,S32V234在設(shè)計之初就加入了ECC(錯誤檢查與糾正),F(xiàn)CCU(故障收集與控制單元)等安全機(jī)制。
隨后在此基礎(chǔ)上,恩智浦發(fā)布了BlueBox車載電腦,內(nèi)部除了搭載S32V234芯片,還加上了應(yīng)用8核A72的高性能處理器LS2088以及其他傳感器芯片,除了支持ADAS,還能夠?qū)崿F(xiàn)多傳感器數(shù)據(jù)的融合。恩智浦稱,BlueBox能夠為L4級別的自動駕駛提供運算支持,而功耗不超過40W。
不過,高通對恩智浦的收購并非一帆風(fēng)順,由于雙方未能提供相關(guān)文件,歐盟反壟斷機(jī)構(gòu)于今年6月暫停了對這一收購的反壟斷調(diào)查,交易遲遲未能完成,高通便無法同恩智浦作為一個整體施行其戰(zhàn)略。此外,持有恩智浦半導(dǎo)體股份的埃利奧特管理公司認(rèn)為高通低估了恩智浦半導(dǎo)體股票的價格,要求將每股的收購價格有110美元提高到135美元,不過高通拒絕提高收購報價,表示每股110美元公平合理,此事也為這一收購案再添風(fēng)波。
好在,高通還可以專注于V2X車聯(lián)網(wǎng)。今年9月,高通推出新一代V2X通信芯片組9150C-V2X,符合3GPP標(biāo)準(zhǔn),同時支持4G與5G網(wǎng)絡(luò),無需SIM卡,就能夠?qū)崿F(xiàn)車對車(V2V),車對基礎(chǔ)設(shè)施(V2I),車對行人(V2P)三種場景的通信。如果能夠利用5G的高速傳輸,將數(shù)據(jù)送至云端再快速處理下發(fā),高通或許可以通過車聯(lián)網(wǎng)來實現(xiàn)自動駕駛功能,也算是在這場激烈的芯片競爭中另辟蹊徑。
在自動駕駛方面,我們還不得不提到谷歌。谷歌的自動駕駛方案使用了英特爾提供的至強(qiáng)處理器、Altera提供的Arria FPGA芯片以及英特爾家的XMM通信芯片。不過,負(fù)責(zé)推斷的部分究竟用的谷歌自家的TPU,還是英特爾的芯片,或是英偉達(dá)的GPU,都不明朗。需要說明的是,谷歌的TPU,就是一種專用于推斷階段的ASIC。當(dāng)然,在其第二代Cloud TPU上,谷歌也為其增添了深度學(xué)習(xí)訓(xùn)練的能力。
而在國內(nèi),近日地平線正式發(fā)布兩款計算機(jī)視覺嵌入式AI芯片——旭日和征程,分別面向智能駕駛和智能攝像頭。這是中國首款嵌入式人工智能芯片,相較于其他芯片,旭日和征程在性能、功耗、面積等方面都有了較大的提升,不僅可同時識別200個對象,芯片乘法器利用率峰值更高達(dá)100%,可強(qiáng)耦合于各種應(yīng)用場景。
我們不難看出,在AI行業(yè)快速發(fā)展的當(dāng)下,計算能力成為技術(shù)發(fā)展和應(yīng)用落地***的關(guān)鍵因素,而作為主要承載硬件計算功能的芯片,也隨之成為了“革新”的對象。如今AI芯片正處在不斷突破的黃金年代,創(chuàng)新再創(chuàng)新,成為現(xiàn)階段AI芯片的主題。