清華大學(xué)類腦芯片天機芯X登Science子刊封面,機器人版貓捉老鼠上演
?清華大學(xué)舉辦的一場機器人版貓捉老鼠游戲,登上了Science子刊封面。
這里的湯姆貓有了新的名字:“天機貓”,它搭載了清華大學(xué)類腦芯片的最新研究成果 ——一款名為TianjicX的28nm神經(jīng)形態(tài)計算芯片。
它的任務(wù)是抓住一只隨機奔跑的電子老鼠:在復(fù)雜的動態(tài)環(huán)境下,各種障礙被隨機地、動態(tài)地放置在不同的位置,“天機貓”需要通過視覺識別、聲音跟蹤或兩者結(jié)合的方式來追蹤老鼠,然后在不與障礙物碰撞的情況下向老鼠移動,最終追上它。
在此過程中,“天機貓”需要實現(xiàn)實時場景下的語音識別、聲源定位、目標(biāo)檢測、避障和決策,而TianjicX能夠以節(jié)能的方式同時運行跨計算范式的多種 AI 算法,并處理多種機器人協(xié)調(diào)方式;在相同的任務(wù)下,TianjicX的功耗比英偉達(dá)AI 芯片的低一半,跑多個網(wǎng)絡(luò)的延遲大幅降低了79.09倍!
“人工智能領(lǐng)域的重要里程碑”再獲突破
2019年8月,清華大學(xué)施路平教授團(tuán)隊研發(fā)了全球首款類腦計算芯片“天機(Tianjic)芯” ,登上了Nature封面,還被Nature總編斯基珀博士贊譽為“人工智能領(lǐng)域的重要里程碑”!
當(dāng)時,搭載了“天機芯”的自行車實現(xiàn)了真正的自行,能自主控制平衡、避障,識別語音指令、探測前方行人。
那是中國芯片第一次登上Nature,也成為了2019年科學(xué)界的年度熱點研究之一。
而這次,清華大學(xué)團(tuán)隊在之前的基礎(chǔ)上研發(fā)出了TianjicX 芯片,支持計算資源的自適應(yīng)分配和每項任務(wù)的執(zhí)行時間調(diào)度,解決了目前移動智能機器人計算硬件研發(fā)的難題。
說到難題,使用神經(jīng)網(wǎng)絡(luò)(NN)算法讓機器人智能化的道路已經(jīng)走了很久,但既要實現(xiàn)多種NN的并發(fā)執(zhí)行,又要延遲低、效率高,還得能異步執(zhí)行、靈活交互,這恐怕目前還沒有人能做到。
克服神經(jīng)擬態(tài)芯片關(guān)鍵挑戰(zhàn)
所謂神經(jīng)形態(tài)計算芯片,就是模仿人類的神經(jīng)系統(tǒng)計算框架、計算模式的芯片,它基于分散的非-馮諾依曼架構(gòu),可以同時執(zhí)行多個神經(jīng)網(wǎng)絡(luò)模型。
然而,一般的神經(jīng)形態(tài)芯片通常使用空間切片以流水線方式預(yù)配置內(nèi)核并處理神經(jīng)網(wǎng)絡(luò),每次都要重復(fù)執(zhí)行預(yù)先配置的操作,這種固有瓶頸阻礙了現(xiàn)有計算硬件在本地實現(xiàn)多個密集型算法,無法實現(xiàn)低延遲、高效率。
因此,TianjicX 芯片的研發(fā)就面臨了兩個關(guān)鍵挑戰(zhàn):
一是要滿足延遲?并發(fā)?功率 (LCP) 的性能要求,特別是對于各種神經(jīng)網(wǎng)絡(luò)的實現(xiàn);
二是保持每個任務(wù)的獨立執(zhí)行不受干擾,同時為任務(wù)間交互提供支持。
為了克服這些挑戰(zhàn),研發(fā)人員從架構(gòu)、芯片和模型部署等不同層面進(jìn)行了一系列設(shè)計。
1.基礎(chǔ)架構(gòu)—— Rivulet執(zhí)行模型?
在該模型中,每個空間單元都有其內(nèi)存和控制器用于計算,將神經(jīng)網(wǎng)絡(luò)和SNN統(tǒng)一為“靜態(tài)數(shù)據(jù)”和“動態(tài)數(shù)據(jù)”,靜態(tài)數(shù)據(jù)固定在相應(yīng)的內(nèi)存中,動態(tài)數(shù)據(jù)則在相鄰的執(zhí)行單元之間流動。
這使Rivulet成為了機器人算力要求和硬件實現(xiàn)之間的一座橋梁,通過靜態(tài)數(shù)據(jù)的分發(fā)和動態(tài)數(shù)據(jù)的流化,抽象化了神經(jīng)網(wǎng)絡(luò)任務(wù)的執(zhí)行,采用時間和空間切片實現(xiàn)對每個活動進(jìn)行彈性資源分配,并進(jìn)行可配置的混合同步異步分組。
2.芯片的硬件?
以Rivulet模型為基礎(chǔ),清華研究人員設(shè)計并制作了基于28nm制程的互補金屬氧化物半導(dǎo)體(CMOS)的TianjicX芯片。它集成了160個可配置的交叉計算范式內(nèi)核(FCore),具有海量并行計算單元、豐富的片上內(nèi)存以及每個內(nèi)核可任意配置的原語序列。
控制器僅占FCore面積的1%左右,但顯著提高了任務(wù)執(zhí)行和交互的靈活性和效率。核心內(nèi)存模塊由五個靜態(tài)隨機存取內(nèi)存 (SRAM) 塊組成,總?cè)萘繛?nbsp; 144 KB。通過高位寬并行讀寫訪問接口,整個芯片在400MHz時可以擁有高達(dá)5.12TB/s的內(nèi)存訪問帶寬,由于優(yōu)化了片上內(nèi)存利用率,實現(xiàn)了單位面積計算能力高達(dá)0.2 TOPS/mm2 。
為了自動生成快速、適當(dāng)?shù)牟呗?,編譯器堆棧采用時空映射方法,統(tǒng)一了各種神經(jīng)網(wǎng)絡(luò)以滿足硬件功能約束,包括原始變換和量化,能根據(jù)不同場景的實際需要,靈活配置多個任務(wù)。
3.顯著提高機器人性能?
為了展示TianjicX的能力,研究人員將4個TianjicX陣列部署在了多智能任務(wù)移動機器人中,并配備了多模態(tài)傳感器,每個芯片可以單獨激活,而在貓捉老鼠的實驗中,天機貓僅激活了一個TianjicX。
在復(fù)雜動態(tài)的環(huán)境中,天機貓展示了在使用極少能量的情況下,利用多種神經(jīng)網(wǎng)絡(luò)算法來完成實時場景中的語音識別、聲源定位、物體檢測、避障和決策。
檢測特定物體:
在昏暗室內(nèi)追逐老鼠:
具有多個障礙物的復(fù)雜環(huán)境:
未來,進(jìn)一步探索更多可能
TianjicX為移動智能機器人計算硬件的研發(fā)開辟了一條新的道路,對于大多數(shù)商業(yè)化的機器人,通常在倉庫或工廠中遵循可預(yù)測的例程運作,對于更復(fù)雜的場景中也會依賴于人類的遠(yuǎn)程操縱,或者必須與遠(yuǎn)程數(shù)據(jù)中心保持無線連接。
TianjicX芯片展現(xiàn)出的強大能力,不僅可以用于提高機器人的智能水平,還可以為替代計算架構(gòu)設(shè)計方法提供思路?!皩τ跈C器人來說,這種能力非常重要,可以讓自主系統(tǒng)在難以到達(dá)的環(huán)境中自動運行更長時間”,加州大學(xué)Irvine分校的Jeffrey Krichmar對此表示。
論文的結(jié)尾,作者寫到:“未來,我們將繼續(xù)研究神經(jīng)形態(tài)計算硬件與機器人計算的結(jié)合,探索更多無人機器人的可能性?!?/p>
論文標(biāo)題:Neuromorphic computing chip with spatiotemporal elasticity for multi-intelligent-tasking robots
DOI: 10.1126/scirobotics.abk2948?