智駕“重感知,輕地圖”技術(shù)趨勢和可長期支持的業(yè)務(wù)場景的思考
本文經(jīng)自動(dòng)駕駛之心公眾號授權(quán)轉(zhuǎn)載,轉(zhuǎn)載請聯(lián)系出處。
前言
2023年智駕領(lǐng)域的熱門話題是“重感知,輕地圖”方案,也稱“無圖”方案(無圖指不依賴離線高精地圖),這種方案降低了對傳統(tǒng)離線建圖和在線高精定位技術(shù)的需求,讓包括我自己在內(nèi)的很多SLAM技術(shù)從業(yè)者擔(dān)心自己要被“卷沒了”,對智駕的技術(shù)發(fā)展是否仍然長期需要SLAM技術(shù)產(chǎn)生了疑惑。這篇文章是對這個(gè)問題的調(diào)研和思考。
一 從智駕系統(tǒng)框架說起
智駕系統(tǒng)分為規(guī)劃控制,地圖定位和實(shí)時(shí)感知三個(gè)核心模塊,其中感知提供實(shí)時(shí)車輛周圍的動(dòng)靜態(tài)信息,為規(guī)劃控制的行為決策和執(zhí)行動(dòng)作的推演提供局部環(huán)境的實(shí)時(shí)約束。如果只是讓車輛在局部空間內(nèi)自主移動(dòng),并假設(shè)在線感知能力足夠強(qiáng),是不需要地圖定位模塊的,但是在智駕系統(tǒng)目前經(jīng)典的技術(shù)棧中,定位和建圖卻是非常重要的一環(huán)。理解清楚規(guī)劃控制對地圖定位的需求,是分析重感知輕地圖下SLAM技術(shù)需求的“變”與“不變”的一把鑰匙。
智駕系統(tǒng)框架[1]
二 規(guī)控對地圖和定位的需求
按照規(guī)劃控制經(jīng)典的子模塊劃分,本質(zhì)上可以理解為一個(gè)仿生系統(tǒng),它類比了人類開車的整個(gè)的行為過程。一個(gè)典型的駕駛行為如下:
- 早上你要開車去公司上班,上車之后的第一個(gè)動(dòng)作是呼叫車載語音助手導(dǎo)航到xxx公司,語音助手喚起車載的高德地圖,提供一條或者多條導(dǎo)航路線顯示給你做選擇。(全局路徑規(guī)劃)
- 當(dāng)你沿著導(dǎo)航路線朝著公司方向行進(jìn)時(shí),語音助手提示你前方路口需要左轉(zhuǎn),你發(fā)現(xiàn)前方只有最左側(cè)車道是可以左轉(zhuǎn)的,并且左側(cè)前方有車,同時(shí)前方路口時(shí)紅燈,你決定提前變換到左側(cè)車道,并控制油門和前車保持一定距離,在路口提前決定剎車以等待紅綠燈,當(dāng)左轉(zhuǎn)綠燈亮起,你知道可以左轉(zhuǎn)了。這里的變道,跟車,左轉(zhuǎn)在規(guī)劃控制中被定義為行為決策
- 在上述變道的切換中,你無意識地朝向左側(cè)車道前方某個(gè)大概位置,根據(jù)自車和那個(gè)大概位置的距離和方位,不斷地調(diào)整油門和左打方向盤的角度,完成變道的決策。畫出一條絲滑的切換軌跡。在這個(gè)過程中,我們的大腦其實(shí)假象了一條從當(dāng)前自車位置到左側(cè)目標(biāo)位置的一條局部軌跡,并不斷的動(dòng)態(tài)調(diào)整車輛位置讓其沿著這條局部軌跡駛向目標(biāo)點(diǎn)。在規(guī)控中,將一條局部軌跡的跟蹤問題定義為局部規(guī)劃或者運(yùn)動(dòng)規(guī)劃模塊。局部規(guī)劃模塊給出一系列動(dòng)作期望的油門,轉(zhuǎn)向等控制指令,運(yùn)動(dòng)控制器則負(fù)責(zé)實(shí)施期望的油門和轉(zhuǎn)向等指令。
規(guī)控系統(tǒng)框架[1]
為了實(shí)現(xiàn)上述過程的自動(dòng)駕駛,產(chǎn)生了規(guī)劃控制模塊對地圖定位的需求。其中,全局路徑規(guī)劃僅需要規(guī)格稍低的SD地圖(即高德地圖等手機(jī)導(dǎo)航級別的地圖)和米級精度的全局定位,以實(shí)現(xiàn)從起點(diǎn)(由全局定位模塊提供)到終點(diǎn)(在SD地圖里指定)的全局路徑規(guī)劃。對于行為決策和局部規(guī)劃模塊,需要局部環(huán)境更為豐富和精確的道路信息,比如道路的拓?fù)浣Y(jié)構(gòu),停止線,道路曲率等。如果感知能力足夠強(qiáng),是可以直接在線提供這些信息,但是早期感知能力有限時(shí),則通過額外高精度設(shè)備離線采集環(huán)境數(shù)據(jù),離線計(jì)算并保存這些信息的方式提供,即離線高精地圖(HDMap)。
規(guī)控對離線高精地圖的使用,產(chǎn)生了對高精地圖定位的需求,即矢量地圖定位。高精地圖構(gòu)建了一個(gè)由各種道路元素組成的虛擬世界,規(guī)控其實(shí)是在這個(gè)虛擬的世界進(jìn)行決策控制。而矢量地圖定位是實(shí)現(xiàn)虛擬地圖世界和真實(shí)世界的映射,以保證規(guī)控在地圖上的行為動(dòng)作結(jié)果和實(shí)際世界一一對應(yīng)。具體來說,矢量地圖定位通過感知提供的單幀語義矢量(真實(shí)世界)如車道線,路燈桿等,結(jié)合GNSS組合導(dǎo)航提供的定位初值,和離線高精地圖中的對應(yīng)語義矢量進(jìn)行匹配。由此可見,離線高精地圖和矢量定位是一對鎖和鑰匙,兩者依賴對方的存在才有意義。
規(guī)控各個(gè)子模塊對地圖和定位的需求[1]
三 重感知輕地圖的技術(shù)趨勢
高精地圖的不足
以上分析可以發(fā)現(xiàn),離線高精地圖是對實(shí)時(shí)感知能力不足的一種彌補(bǔ)。離線高精地圖的主要問題是鮮度變化導(dǎo)致的維護(hù)成本。當(dāng)?shù)缆方Y(jié)構(gòu)發(fā)生變化時(shí),高精地圖需要持續(xù)更新,目前智駕一般把場景分為高速,城區(qū)和低速三類。高速是智駕落地的第一個(gè)場景,它總里程相對有限(全國高速里程數(shù)30多萬公里[5]),且道路維護(hù)較好,道路變更發(fā)生比例較小,通過一兩家圖商為所有業(yè)務(wù)方提供離線高精度地圖的方式,更新和維護(hù)成本基本可控。
但是隨著高速智駕落地,大家目光轉(zhuǎn)向城區(qū)的智駕時(shí),鮮度和采集成本問題變得突出,導(dǎo)致高速場景依賴離線高精地圖實(shí)現(xiàn)高階智駕的方案基本不可行。首先城區(qū)的道路里程相對于高速場景里程有數(shù)量級的增加(全國城區(qū)道路總里程1000多萬公里[5]),且道路信息變更頻繁。而隨著傳感器和感知能力的提升,通過實(shí)時(shí)感知方式生成道路信息的“重感知,輕地圖”方案成為各家追求的避開高精地圖實(shí)現(xiàn)高階智駕的實(shí)現(xiàn)方式。
圖商和部分車企通過運(yùn)營車輛采集進(jìn)行離線高精地圖更新和擴(kuò)場的方式,還存在一個(gè)明顯的問題是它造成建圖能力和單機(jī)能力的脫離,限制了汽車規(guī)?;圃炜梢云綌偢黜?xiàng)成本的優(yōu)勢。建圖和定位統(tǒng)一為單機(jī)能力的一部分,是未來機(jī)器人能力研發(fā)的趨勢,“重感知,輕地圖”符合這個(gè)趨勢。讓建圖能力成為單機(jī)能力的一部分,實(shí)現(xiàn)的路徑是眾包建圖,或者一些特殊場景下適用的單機(jī)單用的車端建圖。眾包建圖可以實(shí)現(xiàn)低成本的高精地圖更新,也是充分發(fā)揮主機(jī)廠數(shù)據(jù)閉環(huán)優(yōu)勢的場景之一,在感知能力不能cover住全部城區(qū)場景(如復(fù)雜或異形道路拓?fù)浣Y(jié)構(gòu)等場景),且傳統(tǒng)運(yùn)營采集成本高到無法負(fù)擔(dān)的情況下,會發(fā)揮非常核心的作用。眾包建圖的核心支撐是數(shù)據(jù)閉環(huán),數(shù)據(jù)閉環(huán)能力對于眾包建圖甚至是比建圖算法本身更重要的基礎(chǔ)能力,同時(shí)目前高階智駕硬件在各家新車型的標(biāo)配,也讓眾包建圖不再是無米之炊的幻想。眾包建圖讓每輛汽車都成為了數(shù)據(jù)源,從這個(gè)角度理解,車企尤其是新勢力車企,是城區(qū)高階智駕真正的主角。圖商除了偶爾站出來喊兩句世道變了,不再會有太大的作為。
蔚來NT2車型 高階智駕硬件
高精地圖除了以上問題外,在出海銷售時(shí)也存在很大問題,由于法律法規(guī)的限制,要么只能適配國外本土的高精地圖;要么像一些非洲國家,短期內(nèi)不太可能有高精地圖,導(dǎo)致智駕功能無法使用。所以,特斯拉在很早之前就堅(jiān)定的走不依賴離線高精地圖的方案。馬斯克牛逼。
實(shí)時(shí)Local Map的生成
重感知輕地圖最核心的邏輯,簡單來說就是在感知能力cover住的場景,把規(guī)控制需要高精道路元素,由加載離線高精地圖的方式改變?yōu)橥ㄟ^在線感知能力生成,進(jìn)而避免了鮮度和規(guī)?;膯栴}。實(shí)時(shí)感知提供高精地圖元素的功能通過在線構(gòu)建局部環(huán)境地圖(LocalMap)的方式實(shí)現(xiàn)。而智駕的整體架構(gòu)從規(guī)控角度并沒有發(fā)生本質(zhì)變化,行為決策和局部規(guī)劃模塊需要的道路要素的精度和規(guī)格沒有太大變化,只是從離線加載演變?yōu)閷?shí)時(shí)生成。
這里的LocalMap存在兩種技術(shù)方案,一種是偏傳統(tǒng)的在線將單幀感知結(jié)果進(jìn)行局部語義矢量建圖,并進(jìn)行道路拓?fù)渫评恚夹g(shù)棧上仍然依賴傳統(tǒng)的SLAM建圖方法。一種則是端到端直接生成局部地圖,在這方面,清華大學(xué)的趙行老師做了一些很不錯(cuò)的開創(chuàng)性工作[8]。
而實(shí)時(shí)感知cover不住的復(fù)雜場景,則通過眾包方式構(gòu)建離線的高精地圖,在地圖規(guī)模上,相對于全量構(gòu)建全國城區(qū)的高精地圖,里程數(shù)降低了很多。而這些城區(qū)復(fù)雜場景的離線高精地圖,除了在智駕系統(tǒng)中彌補(bǔ)感知能力的不足,也成為感知離線訓(xùn)練的真值標(biāo)注數(shù)據(jù),進(jìn)一步反哺提升感知的模型能力,實(shí)現(xiàn)數(shù)據(jù)驅(qū)動(dòng)的感知能力的閉環(huán)迭代。
以上,是筆者理解的“重感知,輕地圖”方案。市場上目前也出現(xiàn)了一些“記憶行車”類產(chǎn)品功能,如大疆車載的“記憶行車”,理想汽車的“城市通勤NOA”,小鵬的“AI代駕”。以目前方案公開度較高的理想的“通勤NOA”為例,它使用深度學(xué)習(xí)特征先驗(yàn)替代傳統(tǒng)的地圖元素[10],但本質(zhì)上仍然是一種離線地圖,這種地圖既丟失了離線高精地圖的規(guī)范性和可解釋性,又沒有根本上避免傳統(tǒng)離線高精地圖的缺陷。筆者認(rèn)為只是一種在當(dāng)前無圖能力或算力不足情況下,配合商業(yè)宣傳的短暫形態(tài),不會長久存在。
理想汽車的NMP先驗(yàn)地圖[10]
四 SLAM有長期需求的業(yè)務(wù)
根據(jù)以上分析,筆者分析存在以下3類業(yè)務(wù),即使在重感知輕地圖的技術(shù)趨勢下,對經(jīng)典SLAM技術(shù)仍然會有長久需求。
智駕中對經(jīng)典SLAM方法存在長久需求的業(yè)務(wù)
需求場景1: 多傳感器的離線和在線標(biāo)定
多傳感器內(nèi)外參標(biāo)定是機(jī)器人和智能硬件一直存在的需求,在智駕上也是,主要分為出廠的離線標(biāo)定和出廠后的在線標(biāo)定。多傳感器的內(nèi)外參標(biāo)定,可以看成是建圖定位的鏡像問題,他們共用相似的觀測方程,只是定義的狀態(tài)量發(fā)生了鏡像,建圖和定位是假設(shè)內(nèi)外參已知的情況下,估計(jì)各個(gè)時(shí)刻的位姿,而內(nèi)外參標(biāo)定則是在假設(shè)位姿已知的情況下,估計(jì)系統(tǒng)的內(nèi)外參。
出廠的離線標(biāo)定,借助高精度的輔助設(shè)備,可以獲取精度較高的出廠參數(shù)。但是車輛出廠之后,由于碰撞等導(dǎo)致的結(jié)構(gòu)形變,傳感器的老化等,會造成車輛的內(nèi)外參發(fā)生動(dòng)態(tài)變化,使得出廠參數(shù)不再適用,因此需要在線標(biāo)定系統(tǒng)對車輛的內(nèi)外參進(jìn)行實(shí)時(shí)或者半實(shí)時(shí)的估計(jì)。
離線標(biāo)定[11]
在線標(biāo)定和離線標(biāo)定最大的區(qū)別是沒有高精度的位姿真值估計(jì)系統(tǒng)作為參考,而是借助車端的定位和感知系統(tǒng)的中間結(jié)果,構(gòu)建觀測約束,實(shí)現(xiàn)參數(shù)的估計(jì)。
在很多經(jīng)典的SLAM論文中,在線標(biāo)定的實(shí)現(xiàn)方式是把內(nèi)外參作為狀態(tài)向量的子狀態(tài)之一,和位姿等狀態(tài)進(jìn)行聯(lián)合優(yōu)化。但在現(xiàn)實(shí)工程系統(tǒng)中,其實(shí)并不是一個(gè)很好的方式。理由有以下幾點(diǎn):
- 首先,內(nèi)外參的估計(jì)一般依賴較強(qiáng)的觀測約束和運(yùn)動(dòng)激勵(lì),這往往意味著較大算力的需求,這和定位等實(shí)時(shí)狀態(tài)估計(jì)系統(tǒng)要朝著低延遲的需求相違背。而且,由于車輛很多時(shí)候是二維平面的勻速運(yùn)動(dòng),導(dǎo)致系統(tǒng)部分狀態(tài)處于欠激勵(lì)的不可觀狀態(tài),使得內(nèi)外參的在線估計(jì)無法收斂。
- 內(nèi)外參是低時(shí)變的,保證一個(gè)天級或周級的更新就基本滿足需求,讓這樣一個(gè)低時(shí)變的參數(shù)以幾十毫秒級別隨著定位系統(tǒng)進(jìn)行狀態(tài)估計(jì)和更新,是一種浪費(fèi)算力的非必要行為。
- 內(nèi)外參的估計(jì)是非實(shí)時(shí)的需求,完全可以在車輛停泊等空閑狀態(tài)時(shí)再啟動(dòng),實(shí)現(xiàn)算力的分時(shí)復(fù)用。一種是讓在線標(biāo)定需求每時(shí)每刻都占據(jù)定位系統(tǒng)0.3核的算力,一種是在車輛閑置時(shí),讓在線標(biāo)定系統(tǒng)占據(jù)系統(tǒng)1個(gè)核的算力,顯然后者更容易實(shí)現(xiàn)更高精度的結(jié)果。
以上,在線標(biāo)定更合理的方式是做成一個(gè)獨(dú)立的非實(shí)時(shí)或半實(shí)時(shí)模塊,它不斷的收集運(yùn)動(dòng)激勵(lì)較好情況下的定位和感知系統(tǒng)的數(shù)據(jù)片段,在車輛空閑時(shí),進(jìn)行一次算力較重的聯(lián)合優(yōu)化,保證內(nèi)外參估計(jì)的精度。
在線標(biāo)定[11]
需求場景2: 低速無GNSS場景的定位建圖
無GNSS的低速場景,主要是指地下停車場環(huán)境,它和高速以及城區(qū)環(huán)境相比,存在一些特殊性。回顧上述提到的無圖方案,它并沒有脫離對米級全局定位和SD地圖進(jìn)行全局路徑規(guī)劃的需求。但是在地下停車場,由于沒有GNSS提供全局定位,就需要另外一種替代品,為全局路徑規(guī)劃提供全局定位能力,目前主流的替代方案則是通過SLAM方式構(gòu)建定位地圖,使用地圖定位的方式提供全局定位。同時(shí),很多非公共商場的地下停車場,數(shù)量龐大且圖商無法提供SD地圖,也需要以眾包建圖的方式構(gòu)建SD地圖。這些都是圖商沒有先發(fā)優(yōu)勢,而主機(jī)廠能做而且可以做的更好的地方。
下面的視頻,是華為在阿維塔上線的AVP代客泊車功能,通過一次性的單車單用的車端建圖,構(gòu)建從地庫入口到車主停車位的矢量地圖。地圖構(gòu)建完成之后,則可以實(shí)現(xiàn)自動(dòng)將車輛開到指定或者沿途停車位的功能。產(chǎn)品體驗(yàn)上,基本達(dá)到了讓用戶愿意買單的程度。這是一個(gè)令人興奮的事情,它已經(jīng)證明了在AVP場景,智駕大有可為,SLAM技術(shù)大有可為。
以下是我整理的低速無GNSS場景下的定位建圖技術(shù)棧,它分為車端和云端兩部分。是一個(gè)非常典型的傳統(tǒng)SLAM技術(shù)棧發(fā)揮作用的場景。在具體的技術(shù)方案的實(shí)施上,會有2個(gè)主要分歧,一個(gè)是建圖是采用單車單用的單次車端建圖還是選擇多車眾包的云端聚合,另外就是定位方案是采用矢量地圖定位還是基于傳統(tǒng)幾何特征的特征地圖定位。在這里介紹下自己的一些思考。
低速無GNSS場景建圖定位技術(shù)棧
首先關(guān)于地圖形式,單次車端建圖的形態(tài),華為和一些記憶泊車類產(chǎn)品采用的是類似方式,這種方式優(yōu)點(diǎn)是所見即所得,可以比較快速的獲取一張停車場局部的地圖,缺點(diǎn)是沒有充分利用車輛間共享的地圖信息,這種方法適合有長期固定車位的小區(qū)停車場。多車眾包的云端聚合的地圖形態(tài),實(shí)現(xiàn)方式是車端單次幾何和矢量建圖結(jié)果,在云端進(jìn)行多車的地圖聚合,是一種眾包形式的建圖方法,優(yōu)點(diǎn)是可以生成一張范圍更完整的地圖,地圖質(zhì)量更有保障。缺點(diǎn)是依賴數(shù)據(jù)閉環(huán)能力,鏈路較長,地圖做不到所見即所得,適合沒有固定車位但范圍較大的公共停車場,比商場和辦公場景的地下停車場。同時(shí),建圖方案也需要考慮數(shù)據(jù)復(fù)用的問題,以上兩種方式都有可以實(shí)現(xiàn)的路徑,前者可以在車端保存一份原始的建圖數(shù)據(jù),在建圖算法更新時(shí),重新“訓(xùn)練”更新一張新地圖,后者則可以通過回傳更加原始形態(tài)的數(shù)據(jù)來實(shí)現(xiàn)。
在定位方案上,矢量地圖定位是目前主流的一種定位方案,優(yōu)點(diǎn)是地圖規(guī)模和算力消耗都較小,缺點(diǎn)是依賴感知,新舊停車場內(nèi)部環(huán)境差異較大,感知存在泛化性問題,導(dǎo)致部分停車場定位退化。另外一種方式是選擇SLAM中的幾何特征地圖,又細(xì)分為基于視覺幾何特征和基于激光幾何特征的地圖,幾何特征擺脫了對感知泛化性的依賴,但主流觀點(diǎn)是基于幾何特征的地圖規(guī)模和算力占用會明顯高于矢量定位。且兩者都存在通用性的問題,視覺特征地圖存在依賴鏡頭模型,導(dǎo)致相機(jī)鏡頭老化或型號變化導(dǎo)致鏡頭畸變產(chǎn)生較大差異時(shí),特征匹配效果退化的問題。激光特征地圖存在依賴車輛需要配置激光雷達(dá),且地圖形態(tài)在無激光雷達(dá)車型上較難復(fù)用的問題。具體采用何種方式,是見仁見智的選擇。筆者認(rèn)為如果能夠很好地解決無激光雷達(dá)車型復(fù)用激光特征地圖的問題,基于激光特征地圖的定位方式在泛化性上和穩(wěn)定性上可以做到比矢量定位更優(yōu),且算力和地圖規(guī)模和矢量定位相似的水平。
地下停車場尤其是大型停車場和多層停車場,對SLAM的建圖和定位都有比較大的挑戰(zhàn),地下停車場無GNSS信號,建圖更加依賴相對里程計(jì)和回環(huán)匹配的效果,且因?yàn)闆]有GNSS的全局約束,建圖軌跡存在局部的扭曲變形,導(dǎo)致局部環(huán)境的失真。在相對里程計(jì)精度有限存在Drift的情況下,對初值和視角偏差較大的回環(huán)能力有較大的依賴。同時(shí)在多層停車場,多層的高度一致性也是一個(gè)非常大的挑戰(zhàn)。此外,由于地庫視野遮擋比室外嚴(yán)重,在內(nèi)部路不可能完全遍歷一遍的情況下,導(dǎo)致地圖的局部缺失。
地庫地圖的局部的缺失和質(zhì)量退化問題,是定位在系統(tǒng)設(shè)計(jì)上需要消化的問題,這就給地庫的定位提出了挑戰(zhàn)。但地庫定位的挑戰(zhàn)遠(yuǎn)不止于此,由于地庫內(nèi)部沒有GNSS信號,所以目前上線的產(chǎn)品中,多是需要先從室外啟動(dòng),以借助GNSS組合導(dǎo)航獲取定位初值;而地庫內(nèi)部的定位初始化,以及定位失敗下的初始化,在車端算力有限的情況下要做出很好的效果,是一個(gè)非常有挑戰(zhàn)性的事情。對于多層停車場,也存在多層的定位高度穩(wěn)定性問題,是影響定位穩(wěn)定性的關(guān)鍵因素,高度的drift會導(dǎo)致地圖匹配效果的急劇退化和錯(cuò)樓層匹配。
此外,部分圖商也在嘗試提供地下停車場地圖,但和高速高精地圖不同的是,室內(nèi)停車場地圖,在定位圖層上并未完全統(tǒng)一,各家的定位方式都不太相同,也依賴各家車廠的傳感器方案,目前較難統(tǒng)一。且車廠有眾包優(yōu)勢,停車場場景下的定位和建圖的任務(wù),筆者認(rèn)為短期內(nèi)還是個(gè)家自研為主。
百度手機(jī)地圖提供的停車場車位地圖
需求場景3: 4DGT 感知標(biāo)注
4DGT是2021年Tesla AI Day首次提出的一種新的感知數(shù)據(jù)標(biāo)注方法,與傳統(tǒng)的直接在2D 圖片上進(jìn)行標(biāo)注不同,它借助SLAM技術(shù)為核心的三位重建方法,構(gòu)建出2D感知語義的精確3D模型,然后將3D模型投影到圖片上,實(shí)現(xiàn)低成本高效率的標(biāo)注。4DGT服務(wù)于位感知提供真值訓(xùn)練數(shù)據(jù),是目前SLAM定位建圖技術(shù)應(yīng)用的非常好的一個(gè)業(yè)務(wù)場景。同時(shí),針對于不同的感知任務(wù),4DGT技術(shù)也有一些新的發(fā)展,具體信息可以參考前段時(shí)間地平線隋偉大哥的一個(gè)報(bào)告[14],對這里涉及的技術(shù)棧和細(xì)節(jié)介紹的已經(jīng)非常詳細(xì),這里不做贅述。
4D GT Pipeline[13,14]
The Last Choice:打不過就加入
雖然技術(shù)手段不斷地更新迭代,但幫助機(jī)器人理解3D世界的目標(biāo)沒有發(fā)生變化,保持一顆迎接變化的心態(tài)會給自己帶來更開闊的思路。除了繼續(xù)深耕經(jīng)典SLAM技術(shù),目前行業(yè)也涌現(xiàn)出一些新的基于Learning 3D技術(shù)的方向,如Occupancy Network,3D Objects Detection,以及NeRF,這些方向非常依賴扎實(shí)的狀態(tài)估計(jì)等傳統(tǒng)SLAM技術(shù)基礎(chǔ),是SLAM從業(yè)者可以發(fā)揮優(yōu)勢的技術(shù)方向。
Learning 3D的技術(shù)方向[15,16,17,18]
智駕之外: 通用機(jī)器人
令人興奮的是,2023年也是通用機(jī)器人行業(yè)新機(jī)會涌現(xiàn)的一年。在通用機(jī)器人潛在應(yīng)用場景,智駕上的大部分技術(shù)棧,從底層芯片,傳感器,到軟件層面的感知,地圖定位和規(guī)劃控制,都可以遷移進(jìn)來,這給相關(guān)智駕從業(yè)者更多的選擇,未來大有可為。
Tesla Optimus 機(jī)器人,使用和Tesla電動(dòng)汽車一樣的Occupancy Network[19]
原文鏈接:https://mp.weixin.qq.com/s/gJEtzZ7wo73Kki43idnrUw