毫末智行發(fā)布中國(guó)首個(gè)自動(dòng)駕駛數(shù)據(jù)智能體系——MANA
原創(chuàng)【51CTO.com原創(chuàng)稿件】 在自動(dòng)駕駛領(lǐng)域,數(shù)據(jù)智能是AI自動(dòng)駕駛技術(shù)的“明珠”,是最終成為勝利者的成功要素。完善的數(shù)據(jù)智能體系是AI自動(dòng)駕駛科技公司成功的基石。在業(yè)內(nèi),誰(shuí)能高效低成本的挖掘數(shù)據(jù)價(jià)值,誰(shuí)就能成為競(jìng)爭(zhēng)的王者。
12月23日,毫末智行(以下簡(jiǎn)稱毫末)發(fā)布了中國(guó)首個(gè)自動(dòng)駕駛數(shù)據(jù)智能體系MANA,中文名雪湖。毫末喜歡借助《三體》命名,雪湖就來(lái)自《三體》第二部《黑暗森林》,這個(gè)名字代表了毫末以AI通向自動(dòng)駕駛夢(mèng)想的思考。
AI DAY前一日,毫末剛剛宣布完成A輪近10億元融資,成為中國(guó)第一家實(shí)現(xiàn)規(guī)模量產(chǎn)的自動(dòng)駕駛獨(dú)角獸公司。投資方為美團(tuán)、高瓴創(chuàng)投、高通創(chuàng)投、首程控股、九智資本等。
目前,毫末的小魔盒平臺(tái)輔助駕駛里程已經(jīng)突破400萬(wàn)公里,在2年內(nèi)有5款乘用車、5款無(wú)人物流車、2款無(wú)人跟隨設(shè)備搭載了毫末的產(chǎn)品。毫末計(jì)劃在未來(lái)三年,將有超過(guò)100萬(wàn)輛乘用車搭載毫末智行輔助駕駛系統(tǒng)。
MANA體系的構(gòu)成
毫末通過(guò)對(duì)400萬(wàn)公里用戶行駛里程數(shù)的沉淀與思考,總結(jié)出與數(shù)據(jù)規(guī)模相關(guān)的函數(shù):F(x)=Z+M(x),它展示出一條代表自動(dòng)駕駛能力發(fā)展的曲線。
F代表產(chǎn)品力,Z0代表毫末第一代產(chǎn)品,M是一個(gè)把數(shù)據(jù)轉(zhuǎn)化為知識(shí)的函數(shù),包括數(shù)據(jù)獲取、表達(dá)、存儲(chǔ)、傳輸、計(jì)算、驗(yàn)證,以及對(duì)成本和速度的影響。
MANA就是這個(gè)最核心的M。MANA由TARS(數(shù)據(jù)原型系統(tǒng))、LUCAS(數(shù)據(jù)泛化系統(tǒng))、VENUS(數(shù)據(jù)可視化平臺(tái))、BASE(底層系統(tǒng))四個(gè)子系統(tǒng)組成。
具體來(lái)看:
BASE包括了數(shù)據(jù)的獲取,傳輸,存儲(chǔ),計(jì)算,以及新的數(shù)據(jù)分析和數(shù)據(jù)服務(wù);
TARS是一些關(guān)于計(jì)算的核心算法原型,用于感知、認(rèn)知、車端建圖和驗(yàn)證的實(shí)踐;
LUCAS是對(duì)算法在應(yīng)用場(chǎng)景上的實(shí)踐,包括高性能計(jì)算、診斷、驗(yàn)證、轉(zhuǎn)化等核心能力;
VENUS是數(shù)據(jù)可視化化系統(tǒng),包括軟件和算法的執(zhí)行情況,對(duì)場(chǎng)景的還原,以及數(shù)據(jù)洞察等能力。
而MANA將是毫末AI的底層系統(tǒng),作為毫末自動(dòng)駕駛能力進(jìn)化的核心動(dòng)力。
數(shù)據(jù)在MANA中的實(shí)踐
毫末CEO顧維灝從感知、認(rèn)知、標(biāo)注、仿真、計(jì)算五個(gè)方面,對(duì)毫末如何實(shí)踐作出進(jìn)一步的分享。
毫末智行CEO顧維灝
感知
目前毫末核心的感知設(shè)備是車載攝像頭和激光雷達(dá),核心問(wèn)題是如何實(shí)現(xiàn)1+1≧4的效果。相較于過(guò)往標(biāo)準(zhǔn)的結(jié)果融合方法,毫末做兩種數(shù)據(jù)源的過(guò)程融合,這種方法更高效。
系統(tǒng)中,首先把攝像頭和激光雷達(dá)的數(shù)據(jù)在backbone中進(jìn)行計(jì)算,然后經(jīng)過(guò)Transformer的多模態(tài)融合,把數(shù)據(jù)映射到tensor space中。再經(jīng)過(guò)一層特征提取后,加入時(shí)間的特征,在這個(gè)過(guò)程中使用RNN和光流SLAM進(jìn)行時(shí)空融合。這樣就有了時(shí)空一體的模型,在此基礎(chǔ)上再進(jìn)行多Head的計(jì)算,計(jì)算出所需要的結(jié)果。
這種多數(shù)據(jù)源的時(shí)空融合,會(huì)快速拉升感知能力,讓自動(dòng)駕駛系統(tǒng)能夠更準(zhǔn)確的刻畫現(xiàn)實(shí)世界。
認(rèn)知
感知要解決的是從傳感器信號(hào)中重建客觀世界的問(wèn)題,而認(rèn)知要解決的是從客觀世界到駕駛動(dòng)作的映射問(wèn)題。
顧維灝提出認(rèn)知三要素:安全、舒適、高效。安全上,毫末擁有全棧自研安全認(rèn)知模型CSS,其核心是自動(dòng)駕駛系統(tǒng)不只局限在從純機(jī)械的角度保證自己不主動(dòng)犯錯(cuò),而是充分考慮從數(shù)據(jù)中學(xué)習(xí)到的對(duì)其他交通參與者行為的理解和超時(shí)空的歷史經(jīng)驗(yàn);
在安全底線之上,從數(shù)據(jù)中學(xué)習(xí)舒適和更高效的量化標(biāo)準(zhǔn),以及這三要素之間的制約關(guān)系,讓自動(dòng)駕駛算法可以更好的處理復(fù)雜的駕駛場(chǎng)景,制定更符合用戶喜好的駕駛策略。
具體方法是把影響我們駕駛行為的細(xì)節(jié),從宏觀上分成幾個(gè)影響因素:天氣、道路結(jié)構(gòu)、交通參與者、交通流密度、彼此方位、主車路線、碰撞風(fēng)險(xiǎn)和碰撞時(shí)距。毫末從已有的數(shù)據(jù)中挖掘和表達(dá)這些屬性,然后在進(jìn)行聚類和分類,形成下圖這個(gè)結(jié)果。它們將駕駛場(chǎng)景做出宏觀維度的劃分。
將駕駛場(chǎng)景做宏觀維度的劃分
毫末正在研究一種端到端的模擬學(xué)習(xí),就是以過(guò)往的事例為指導(dǎo),從數(shù)字化的場(chǎng)景中得到具體的本車動(dòng)作。模擬學(xué)習(xí),需要更大的數(shù)據(jù)樣本,特別是標(biāo)注好的數(shù)據(jù),然后從數(shù)據(jù)中學(xué)習(xí)得到規(guī)律。
模擬學(xué)習(xí)是自動(dòng)駕駛的最好的認(rèn)知學(xué)習(xí)方式,最為直接,因?yàn)樗械膱?chǎng)景都可以被數(shù)字化感知,所有的標(biāo)注都已經(jīng)在我們自己開車的過(guò)程中自動(dòng)被標(biāo)注。我們需要做的,就是挑選更符合要求的駕駛行為,并在不同場(chǎng)景下持續(xù)的訓(xùn)練。
毫末首先定義好能夠得分的目標(biāo)函數(shù),它是一個(gè)概率函數(shù),表征了在某個(gè)場(chǎng)景下人類動(dòng)作和交通規(guī)則約束下該做的動(dòng)作的概率。
根據(jù)前面提到的細(xì)分場(chǎng)景分類,訓(xùn)練自車動(dòng)作和全局最優(yōu)的網(wǎng)絡(luò)。毫末實(shí)踐了6種強(qiáng)化深度學(xué)習(xí)的算法(下圖),發(fā)現(xiàn)RSAC算法更適用于我們研究的場(chǎng)景,能夠更快收斂,得分最高,走的更遠(yuǎn)。
圖右上為6種強(qiáng)化算法
標(biāo)注
感知的進(jìn)步需要很多標(biāo)注的數(shù)據(jù)。面對(duì)大規(guī)模量產(chǎn),尤其要關(guān)注這個(gè)問(wèn)題。比如,Tesla標(biāo)注了60億個(gè)物體,包括精準(zhǔn)的3D信息、深度、速度。毫末現(xiàn)在也有幾百人在幫助我們做標(biāo)注,但是如果做到這60億,達(dá)到如此的精度,按照今天的市場(chǎng)價(jià)格,這樣的方法并不高效也不經(jīng)濟(jì)。
所以毫末要做一個(gè)高效的標(biāo)注系統(tǒng)。毫末把閉環(huán)的思路用上,把無(wú)監(jiān)督自動(dòng)標(biāo)注算法用上。比如車道線識(shí)別,目前大部分是通過(guò)自動(dòng)標(biāo)注完成的,目前性能是市場(chǎng)上其它很多家的幾倍。
驗(yàn)證
驗(yàn)證現(xiàn)在有種流行的說(shuō)法叫自動(dòng)駕駛元宇宙。毫末的主要方法就是通過(guò)仿真制造訓(xùn)練數(shù)據(jù),在仿真世界中整個(gè)世界的數(shù)據(jù)都是被標(biāo)注好的,是天然的數(shù)字世界。在仿真世界中可以呼風(fēng)喚雨,在不同的光照,天氣、道路摩擦系數(shù)下,也可以快速完善算法的迭代。
MANA超算中心和HSD
人類的數(shù)據(jù)規(guī)模在從文本向圖像轉(zhuǎn)變,其規(guī)模非常龐大。因此毫末MANA超算中心正在籌備中,主要用于自動(dòng)駕駛的數(shù)據(jù)處理、訓(xùn)練、推理和驗(yàn)證等需求。
此外,顧維灝表示,2022年年中,毫末輔助駕駛系統(tǒng)HPilot即將推出“城市NOH”這一全新功能。2022年下半年,毫末將計(jì)劃交付全場(chǎng)景NOH,并在2023年推出擁有HSD(HAOMO Self-Driving)的車隊(duì)。
隨著毫末智行MANA——中國(guó)第一個(gè)自動(dòng)駕駛數(shù)據(jù)智能體系的建立,相信國(guó)內(nèi)自動(dòng)駕駛核心技術(shù)將迎來(lái)更快、更好的發(fā)展。相信未來(lái)毫末能夠在乘用車、無(wú)人物流車等領(lǐng)域成為行業(yè)的領(lǐng)導(dǎo)者。
【51CTO原創(chuàng)稿件,合作站點(diǎn)轉(zhuǎn)載請(qǐng)注明原文作者和出處為51CTO.com】