寒武紀(jì)行歌 - 智能駕駛大算力芯片入局者
引言
2021年10月12日,中國(guó)電動(dòng)車(chē)百人會(huì)在南京舉辦的“推動(dòng)車(chē)用半導(dǎo)體產(chǎn)業(yè)可持續(xù)發(fā)展”的峰會(huì)上,寒武紀(jì)行歌執(zhí)行總裁-王平發(fā)表了主題為“單車(chē)智能突破,云邊端車(chē)協(xié)同”的演講。
演講中提到:“寒武紀(jì)行歌在正在研發(fā)一款基于7nm制程的、算力大于200TOPS的SoC產(chǎn)品,未來(lái)還會(huì)通過(guò)各種車(chē)規(guī)認(rèn)證,在車(chē)上實(shí)現(xiàn)SOP。”
寒武紀(jì)行歌剛成立,首款產(chǎn)品就是7nm制程,算力大于200TOPS智能駕駛AI芯片。帶著很多的疑問(wèn),九章智駕近日專(zhuān)訪了寒武紀(jì)行歌執(zhí)行總裁王平先生。
正文:
九章智駕:寒武紀(jì)本身是做云邊端芯片相關(guān)業(yè)務(wù)的,又是出于什么樣的考慮,成立子公司寒武紀(jì)行歌入局車(chē)載領(lǐng)域,開(kāi)始去做智能駕駛AI芯片的?
寒武紀(jì)行歌:首先,我們認(rèn)為車(chē)載領(lǐng)域是一個(gè)很有前景的市場(chǎng)。汽車(chē)產(chǎn)業(yè)體量很大,自動(dòng)駕駛領(lǐng)域是AI的很好的一個(gè)落地場(chǎng)景;從人工智能的產(chǎn)業(yè)應(yīng)用來(lái)講的話,自動(dòng)駕駛是一個(gè)不可或缺的市場(chǎng)。
這個(gè)領(lǐng)域?qū)τ趪?guó)家和社會(huì)的戰(zhàn)略意義是不一樣的,智能汽車(chē)不僅僅是一個(gè)消費(fèi)品,還會(huì)涉及到數(shù)據(jù)安全、社會(huì)安全等方面的因素,因此智能駕駛的大算力、先進(jìn)制程芯片很有必要國(guó)產(chǎn)化。
最后,主要從寒武紀(jì)自身來(lái)講,在寒武紀(jì)沒(méi)有上市之前,主要還是專(zhuān)注于把云邊端的AI芯片做出來(lái)。成立行歌科技入局這個(gè)領(lǐng)域,是因?yàn)闊o(wú)論從知識(shí)的積累,人才的積累,還是財(cái)力的積累上,都已經(jīng)達(dá)到了能夠支撐我們進(jìn)入該領(lǐng)域的條件,所以我們覺(jué)得是在合適的時(shí)間做了一個(gè)正確的選擇。
九章智駕:車(chē)載領(lǐng)域AI芯片從體量來(lái)講,相比手機(jī)芯片要小不少,市場(chǎng)上已有多家有實(shí)力的廠商,并且一些OEM又打算自研AI芯片,行歌直接入局車(chē)載領(lǐng)域會(huì)不會(huì)有些冒險(xiǎn),您是如何考慮這個(gè)事情或者去評(píng)估這種風(fēng)險(xiǎn)的?
寒武紀(jì)行歌:第一點(diǎn):我認(rèn)為車(chē)載領(lǐng)域芯片市場(chǎng),如果單從片數(shù)來(lái)講,也許比不過(guò)手機(jī)市場(chǎng)的。但是單車(chē)上芯片所占的價(jià)值量每年都是在增長(zhǎng)的,這是一個(gè)很大的增量市場(chǎng)。比如,高端的大算力芯片-英偉達(dá)的OrinX,幾百美元一顆,蔚來(lái)ET7單車(chē)就要裝配4顆這樣的智能駕駛芯片。
智能駕駛主控芯片這個(gè)市場(chǎng)還是非??捎^的一個(gè)市場(chǎng),全球新車(chē)一年銷(xiāo)量差不多9000萬(wàn)輛左右吧,中國(guó)銷(xiāo)量接近3000萬(wàn)輛,未來(lái)智能駕駛AI芯片應(yīng)該會(huì)是標(biāo)配,所以滲透率會(huì)越來(lái)越高。
第二點(diǎn),我認(rèn)為主機(jī)廠自研AI芯片這件事情并不容易。雖然說(shuō)特斯拉現(xiàn)在已經(jīng)自研出AI芯片了,但畢竟是專(zhuān)供自己使用的,相對(duì)整個(gè)汽車(chē)行業(yè)的規(guī)模而言,占比還是很小的。
未來(lái)能夠像特斯拉這樣把芯片自研出來(lái),并且成功運(yùn)用的OEM,我認(rèn)為會(huì)很少。因?yàn)樾酒残枰瞬藕拖嚓P(guān)技術(shù)的積累,這個(gè)是需要很長(zhǎng)時(shí)間的。我覺(jué)得應(yīng)該是由專(zhuān)業(yè)的人去做專(zhuān)業(yè)的事兒,產(chǎn)業(yè)鏈有分工才更有利于整個(gè)汽車(chē)行業(yè)的發(fā)展。
九章智駕:寒武紀(jì)行歌的定位是去做通用、大算力芯片;大算力好理解,那么通用化是怎么理解的?通用到什么程度,有哪些通用性特征?
寒武紀(jì)行歌:說(shuō)我們的車(chē)載智能駕駛芯片是通用芯片,嚴(yán)格來(lái)講這個(gè)也是不準(zhǔn)確的。準(zhǔn)確來(lái)講,應(yīng)該叫車(chē)載SoC芯片,它是一個(gè)異構(gòu)芯片,不僅包括AI模塊,還包括CPU、GPU、DSP以及ISP等其它處理模塊。
我們講所謂的通用性,指得是SoC上AI模塊的通用性;它具有一個(gè)通用的AI軟件?;蛘哒f(shuō)基礎(chǔ)軟件平臺(tái),可以讓OEM車(chē)廠或者算法公司在上面比較靈活的、方便地移植或者開(kāi)發(fā)他們自己的算法。也就是說(shuō),它的靈活性和兼容性比較好。
反之,所謂的專(zhuān)用AI模塊,它的軟件平臺(tái)不具有通用性。它的軟件棧是專(zhuān)門(mén)針對(duì)某一種芯片或者說(shuō)某種算法進(jìn)行了專(zhuān)門(mén)的定制優(yōu)化,雖然可以在一定程度上降低功耗,提升性能,但是它也會(huì)導(dǎo)致一個(gè)不好的后果。
因?yàn)樗菍?zhuān)用的,所以能夠適配的算法受到局限,這就導(dǎo)致當(dāng)OEM或者算法公司要去移植或者是開(kāi)發(fā)其他算法的時(shí)候,需要重新花大量的時(shí)間和精力去做適配工作,投入到軟件開(kāi)發(fā)的工作量會(huì)非常大,甚至無(wú)法實(shí)現(xiàn)。比如Mobileye的芯片即使開(kāi)放AI部分給OEM廠商,也很難有人能把感知算法在它上面跑起來(lái)。
九章智駕:寒武紀(jì)行歌在車(chē)載領(lǐng)域這塊起步較晚,國(guó)內(nèi)一些芯片公司,有的現(xiàn)在已經(jīng)具有量產(chǎn)裝車(chē)經(jīng)驗(yàn),并且也在打造生態(tài),行歌有哪些需要追趕的地方,或者說(shuō)會(huì)面臨哪些挑戰(zhàn)?
寒武紀(jì)行歌:第一點(diǎn),雖然我們真正開(kāi)始做車(chē)載芯片在時(shí)間上是晚一些,但是寒武紀(jì)之前是做云邊端芯片的,很多能力是可以遷移到車(chē)端上去應(yīng)用,也就是說(shuō)我們是具備一定的技術(shù)基礎(chǔ)的。說(shuō)起步早或起步晚,其實(shí)只是相對(duì)的,或者說(shuō)只是針對(duì)不同的模塊來(lái)說(shuō)的。
第二點(diǎn),我認(rèn)為車(chē)載智能駕駛AI芯片這個(gè)賽道很長(zhǎng),從輔助駕駛到真正的無(wú)人駕駛還有很長(zhǎng)的路要走,我們預(yù)計(jì)至少10-20年甚至更長(zhǎng)的時(shí)間。
剛才問(wèn)寒武紀(jì)行歌現(xiàn)在的差距是什么?首先,關(guān)于大算力、通用性AI架構(gòu)設(shè)計(jì)能力,我們可以基于母公司的云端及邊緣端芯片架構(gòu)設(shè)計(jì)能力直接搭建。其次,在基礎(chǔ)軟件這部分,我們的積累也是夠的。現(xiàn)在唯一不足的地方,我覺(jué)得是在車(chē)規(guī)級(jí)要求、可靠性和功能安全方面。這塊是一個(gè)新的課題,需要我們抓緊時(shí)間去提升。雖然說(shuō)做云端和做車(chē)端對(duì)能力的要求是不太一樣的,難度是有的,但是我們有信心去克服這樣的一個(gè)挑戰(zhàn)。
九章智駕:剛才您也講了,寒武紀(jì)行歌做車(chē)載AI芯片,母公司寒武紀(jì)做云邊端AI芯片的一些能力是可以直接遷移過(guò)來(lái)復(fù)用的,能具體講一講,具體都有哪些能力能遷移過(guò)來(lái)復(fù)用么?
寒武紀(jì)行歌:實(shí)際上,我們可以把車(chē)規(guī)芯片的設(shè)計(jì)分三大部分來(lái)看:第一部分:芯片架構(gòu)設(shè)計(jì);第二部分:基礎(chǔ)軟件平臺(tái)設(shè)計(jì);第三部分:車(chē)規(guī)級(jí)設(shè)計(jì)要求。
我們一開(kāi)始的定位就是做一款大尺寸、大算力的智能駕駛芯片。大尺寸和大算力芯片的架構(gòu)設(shè)計(jì)能力,以及基礎(chǔ)軟件開(kāi)發(fā)這兩部分的能力是寒武紀(jì)之前就具備的,這兩部分能力我們大多可以直接遷移過(guò)來(lái)復(fù)用。
當(dāng)然了,母公司之前的產(chǎn)品主要是針對(duì)工業(yè)產(chǎn)品來(lái)設(shè)計(jì)的,或者說(shuō)高端的工業(yè)產(chǎn)品,工業(yè)級(jí)規(guī)格;車(chē)規(guī)級(jí)芯片有更高的一個(gè)要求,比如在可靠性和功能安全等方面,它是需要根據(jù)車(chē)規(guī)級(jí)要求具體去調(diào)整和優(yōu)化的,但核心的基礎(chǔ)模塊是一樣的。
九章智駕:前面您說(shuō)了,寒武紀(jì)行歌的車(chē)載智能駕駛AI芯片的通用性主要是體現(xiàn)在AI模塊,那么把AI模塊做成通用型的技術(shù)壁壘和挑戰(zhàn)是什么?
寒武紀(jì)行歌:首先,需要大量的軟件人員,寒武紀(jì)現(xiàn)在約1500人,大概60%的人是軟件人員,為什么?因?yàn)樽鲆惶淄ㄓ玫腁I硬件架構(gòu)去適應(yīng)不同的網(wǎng)絡(luò),就需要對(duì)不同的算子去做適配,所有做通用AI處理器的都要面對(duì)這個(gè)問(wèn)題。
關(guān)于視覺(jué)感知的算子是大概有1000個(gè),如果做成通用的,這1000個(gè)算子便都需要投入人力去做適配,這需要很大的工作量。如果是做專(zhuān)用的AI感知模塊,就無(wú)需這么麻煩,因?yàn)樗皇褂靡徊糠志W(wǎng)絡(luò),也許只用到了幾十種算子,那么只需要針對(duì)這幾十種算子做適配就好了,其他的900多種都不用管。做AI模塊本身的技術(shù)原理很簡(jiǎn)單,難的是怎么把那些千奇百怪的算法適配到我們的硬件上來(lái)。把通用性和網(wǎng)絡(luò)利用率做好的同時(shí),還能兼顧低功耗,這是關(guān)鍵,也是困難的部分。
這個(gè)通用型,考驗(yàn)兩方面的能力,一方面是處理器架構(gòu)能力,如何用一個(gè)處理器架構(gòu)支持好不同類(lèi)型的眾多算法和算子。另外一個(gè)就是算法工具鏈的能力,如何做一個(gè)好用易用的SDK,快速適配新的算法算子。
其次是工藝,要把算力做大,性能做強(qiáng),最主要的就是工藝方面的限制。高制程的芯片,不僅制造工藝難,而且設(shè)計(jì)也比成熟制程難得多。以7nm制程為例,需要芯片設(shè)計(jì)公司和晶圓廠家協(xié)作把所有7nm相關(guān)的、所能用到的IP全部都得驗(yàn)證一遍。每前進(jìn)一個(gè)工藝節(jié)點(diǎn)是需要花費(fèi)很長(zhǎng)時(shí)間努力以及大量人力、財(cái)力等資源的投入。
九章智駕:提升AI芯片算力的方案,除了工藝手段,通過(guò)采用先進(jìn)制程能提升算力外,通過(guò)改進(jìn)架構(gòu)是否能夠提升算力?目前的芯片架構(gòu)大多還是馮若依曼架構(gòu),未來(lái)會(huì)不會(huì)出現(xiàn)一種新的架構(gòu)會(huì)顛覆這種傳統(tǒng)架構(gòu)?比如說(shuō)存算一體芯片,未來(lái)的前景如何?
寒武紀(jì)行歌:從本質(zhì)上講,提升算力的方法就是增加晶體管數(shù)量,增加里面乘法器的和累加器的數(shù)量;在傳統(tǒng)的架構(gòu)下,無(wú)論如何改進(jìn)軟件架構(gòu),只能提升硬件利用率,提升不了實(shí)際算力。硬件不會(huì)隨著的軟件變化而變化,芯片流片出來(lái)就固定了,里面有多少個(gè)乘加器,有多少個(gè)晶體管是可以數(shù)出來(lái)的。
從宏觀的角度看,想要大幅度提升算力就一個(gè)辦法,就是提升工藝。除非不用深度學(xué)習(xí),不用CNN網(wǎng)絡(luò),那是另外一個(gè)概念了;改變AI處理器架構(gòu)只是改變了對(duì)不同網(wǎng)絡(luò)的適應(yīng)程度;
有可能出現(xiàn)新的架構(gòu),不過(guò)至少目前還沒(méi)有看到批量應(yīng)用或者是實(shí)際產(chǎn)品落地的。
傳統(tǒng)的架構(gòu)處理器跟存儲(chǔ)器分離,中間需要通過(guò)總線來(lái)通信,性能受到限制;所謂的存算一體,就是要把計(jì)算單元和存儲(chǔ)器一體化的。也就是說(shuō)同一個(gè)處理單元既可以做計(jì)算,又可以存儲(chǔ);這種設(shè)計(jì)相比之前,整個(gè)架構(gòu)將會(huì)產(chǎn)生很大的一個(gè)變化。這不是一個(gè)簡(jiǎn)單的事情,所有的上層的軟件以及系統(tǒng)都得跟著改變和調(diào)整。
九章智駕:對(duì)于乘用車(chē)來(lái)說(shuō),L4有點(diǎn)遙遙無(wú)期,中短期內(nèi)車(chē)上的智能駕駛配置還會(huì)是以L2級(jí)為主,對(duì)于該級(jí)別來(lái)講,14nm或者16nm制程的高性?xún)r(jià)比芯片基本已經(jīng)滿足需求了。為什么行歌還要選擇從7nm制程的大算力芯片入局?行歌在7nm制程上的優(yōu)勢(shì)在L2級(jí)別這個(gè)市場(chǎng)會(huì)不會(huì)反而成了成本上的劣勢(shì)?
寒武紀(jì)行歌:首先,之所以我們從做大算力芯片開(kāi)始,是因?yàn)槲覀兛吹絆EM對(duì)大算力芯片有比較強(qiáng)烈的需求。尤其是新能源車(chē),由于它的電池和電動(dòng)機(jī)是用液冷,大算力域控制器的散熱問(wèn)題相對(duì)來(lái)說(shuō)要好解決;其次,電動(dòng)車(chē)上用“數(shù)字發(fā)動(dòng)機(jī)”-大算力芯片代替了燃油車(chē)的發(fā)動(dòng)機(jī)”,OEM都需要在這個(gè)地方下功夫去實(shí)現(xiàn)差異化,給消費(fèi)者更好的駕乘體驗(yàn)。
第三,從做大算力開(kāi)始,可以更好搶得市場(chǎng),更快塑造我們的品牌力。很明顯,當(dāng)前做低算力的芯片廠商相對(duì)較多,市場(chǎng)競(jìng)爭(zhēng)也比較激烈,做大算力、先進(jìn)制程這種技術(shù)壁壘更高的智能駕駛芯片更符合我們品牌的定位,也更容易切入車(chē)載領(lǐng)域市場(chǎng)。
在L2這個(gè)級(jí)別上,用7nm制程的話,成本上的劣勢(shì)也許會(huì)比較明顯,所以我們也會(huì)準(zhǔn)備好低一些的工藝制程的。只是我們的產(chǎn)品計(jì)劃是一步一步來(lái)的,先從做大算力芯片開(kāi)始,然后再往下探。
小結(jié):
未來(lái)很長(zhǎng)一段時(shí)間內(nèi),算力的比拼將是智能汽車(chē)重點(diǎn)比拼的性能參數(shù)之一;大算力AI芯片的需求也會(huì)越來(lái)越高;針對(duì)車(chē)用半導(dǎo)體及其供應(yīng)鏈痛點(diǎn),需要整個(gè)產(chǎn)業(yè)同心協(xié)力,分工合作,讓國(guó)內(nèi)的大算力、先進(jìn)制程的AI芯片在未來(lái)也能盡早的實(shí)現(xiàn)國(guó)產(chǎn)化。