這只線蟲不簡單!大腦被高精度還原,可動態(tài)蠕動前行
最高精度“線蟲大腦”,它來了。
這顆“大腦”所模擬的是一只秀麗隱桿線蟲的全生物神經(jīng)系統(tǒng)。
(注:秀麗隱桿線蟲是“最簡單的生命智能體”,擁有302個神經(jīng)元)
這一次,國內(nèi)的學者不僅把秀麗線蟲全部的神經(jīng)元網(wǎng)絡還原了出來,更是細到了它們的亞細胞級連接關系。
據(jù)了解,它的精細程度已經(jīng)達到了當前已知的最高水平:
此前,一項研究對單個生物神經(jīng)元的計算復雜度進行了研究,文章指出,一個深度神經(jīng)網(wǎng)絡需要 5 到 8 層互聯(lián)神經(jīng)元才能表征單個生物神經(jīng)元的復雜度。
而通過這樣的精細構建的“大腦”,已可以讓這只“智能線蟲”完成動態(tài)蠕動前行。
這,便是來自北京智源人工智能研究院的最新研究成果,背后的“利器”則是天演項目。
而且這只“智能線蟲”——天寶(MetaWorm)1.0的誕生,不僅僅是生命模擬精度上的一次突破,根據(jù)研究團隊的介紹:
這是邁出人造智能生命關鍵一步。
最高精度大腦,是怎么煉成的?
這次大腦選擇的秀麗隱桿線蟲,可以說是“擁有神經(jīng)系統(tǒng)的最簡單生物之一”——
它既具有完整的神經(jīng)系統(tǒng),感知逃逸覓食交配都能完成,整體結構又非常簡單,成蟲只有大約1000多個體細胞。
就是這只長約1mm的透明小生物,已經(jīng)是科學研究界的“??汀保?0年來有三次諾貝爾獎都與它有關。
對于神經(jīng)科學家們來說,秀麗隱桿線蟲的神經(jīng)系統(tǒng)已經(jīng)被完整破解,實時圖譜還登上了當年的Nature封面,非常適合用來研究并模擬“腦回路”。
△雌雄同體,共有302個神經(jīng)細胞
更重要的是,線蟲體內(nèi)存在的乙酰膽堿、多巴胺等神經(jīng)遞質(zhì),在哺乳動物體內(nèi)也同樣存在。
研究它的神經(jīng)系統(tǒng),對于研究人類神經(jīng)系統(tǒng)的調(diào)控機制也有重要作用。
但研究結構是一回事,用計算機建模又是另一回事了。
要知道,模擬一個生物的神經(jīng)元可不是簡單地像卷積那樣,做個線性變換就完事,它所模擬的(如細胞間)物質(zhì)交換、神經(jīng)元間動作電位的產(chǎn)生和傳導等行為非常復雜。
例如,僅僅是突觸之間遞質(zhì)的傳遞,就涉及數(shù)量、速度、濃度、反流、方向等多個參數(shù),用數(shù)學模型來計算模擬還會更加復雜。
即便模擬出了完整的神經(jīng)系統(tǒng),如何用計算機模擬出接近真實環(huán)境的“賽博空間”,并在其中訓練“智能線蟲”模型,又是另一大研究難點。
此前,雖然已經(jīng)有不少團隊在進行線蟲仿真方面的研究,但無論是精度、還是仿真環(huán)境都與現(xiàn)實有一定差距,就像我們常見的仿生機器魚遠達不到魚的精度一樣。
這次,天演團隊成功建模出了最高精度的智能“賽博線蟲”,實現(xiàn)了讓它在3D流體仿真環(huán)境下動態(tài)蠕動前行、并具備簡單趨利避害的能力。
那么,這只“智能線蟲”究竟長啥樣?
首先,團隊利用大量公式和模型,建模出線蟲的“電子神經(jīng)元”。
用到的模型主要有三種:多種離子通道模型、Hodgkin-Huxley模型和多艙室(多房室)模型(Multi-compartment Model)。
其中,多種離子通道模型顧名思義,用于模擬細胞膜上的各種離子通道,天寶 1.0模型使用了14種離子通道;
Hodgkin-Huxley模型 (HH模型),能將神經(jīng)元的每個部分都模擬成不同的電路元件;
△HH模型示例,圖片來源于維基百科—真·生物是一臺精密的電子儀器
多艙室模型,將神經(jīng)元視為一個系統(tǒng),按動力學特點分為若干個艙室,每個艙室所包含的離子通道數(shù)目也各不相同。
△圖片來源于江小芳, 劉深泉, 張煦晨著論文《中等多棘神經(jīng)元的多房室模型分析》
這三種模型組合起來,就能將神經(jīng)元的構造、神經(jīng)元細胞膜上動作電位和梯度電位的形成與傳導、以及物質(zhì)在各機體部分間傳導的速率模擬出來。
施工完成后的這只“智能線蟲”,精細建模了秀麗隱桿線蟲(雌雄同體)的302個神經(jīng)元、以及這些神經(jīng)元之間的數(shù)千個連接,使用了14種離子通道,細節(jié)達到了亞細胞級別。
線蟲的302個神經(jīng)元分為感官神經(jīng)元、中間神經(jīng)元和運動神經(jīng)元等,在這其中,團隊又針對106個感知和運動神經(jīng)元進行了高精度建模,高度擬合了它們的電生理動力學。
統(tǒng)計下來,單個神經(jīng)元最多艙室(compartment)數(shù)2313個,最少10個。302個神經(jīng)元平均每個52個艙室。神經(jīng)元之間的突觸連接精細到神經(jīng)突(樹突、軸突)的水平:
然后,團隊構造了一個3D流體動態(tài)仿真環(huán)境,讓線蟲在接近真實的場景下運動起來。
注意,模擬環(huán)境這一步尤為重要,它是研究線蟲如何自適應微觀環(huán)境運動方式的關鍵步驟。
線蟲建模精細到亞細胞(微米級別)后,物理定律的尺度都縮小了,摩擦力與粘滯力的作用要比重力大上幾個數(shù)量級。
在這種情況下,線蟲還能自如地吃飯喝水供能,與其和環(huán)境交互的巧妙方式密不可分。
因此,天演團隊結合計算神經(jīng)學、運動力學、圖形學等多學科交叉,為智能線蟲“天寶”構造了逼真的線蟲肌肉和身體軟體模型,建立了更適合人工智能體訓練的流體仿真環(huán)境。
具體來說,這個環(huán)境框架由包含三維建模、有限元求解、簡化流體模型、強化學習、可視化等多個模塊,能最大程度上模擬線蟲與環(huán)境的交互方式。
相比目前國際領先的OpenWorm線蟲仿真項目,天演團隊的流體仿真環(huán)境規(guī)模更大,也更適合作為生命體的多體/群體智能行為仿真環(huán)境、完成智各種能體學習訓練復雜任務等。
最后,團隊將線蟲模型放到仿真環(huán)境中,完成了初步訓練。
這些都是未來天演平臺的組成部分。具體來說,這是一個還在建造中的多GPU集群平臺,可用于高精度、大規(guī)模生物神經(jīng)元的模擬。
在場景尺度超過1300個線蟲身長的仿真環(huán)境下,團隊現(xiàn)在已經(jīng)初步訓練出了能夠根據(jù)環(huán)境化學信號分布自主行動的“智能線蟲”,而這一場景也能支持更大空間和多線蟲群體仿真。
據(jù)團隊表示,“智能線蟲”模型能夠高效、精準地計算與流體環(huán)境相互作用的規(guī)律,在相同計算資源下,單線蟲單次仿真時間小于0.1秒。
下一階段,天演團隊計劃讓這只“賽博線蟲”實現(xiàn)避障、覓食等更復雜的智能任務。
事實上,類腦智能研究一直是個全球性課題。
國際上,包括歐盟腦計劃支持的Blue Brain項目、美國腦計劃等都在進行類腦研究;科技巨頭如谷歌,近5年一直在發(fā)布腦圖譜、腦工具;高校研究機構如MIT,用19個線蟲模擬神經(jīng)元實現(xiàn)了自動駕駛控制……
然而,單從類腦研究來看,各團隊的研究方向卻有很大不同,甚至有相當一部分團隊藉由先設計芯片、再設計算法的方式來實現(xiàn)類腦計算。
但這樣的研究,反而會被芯片等硬件約束了算法的設計與實現(xiàn),最終與實現(xiàn)類腦智能的目標相距甚遠。
相較之,天演團隊選擇從實現(xiàn)AI的角度,去研究并實現(xiàn)類腦智能。
但即便如此,費盡心力建模一個線蟲大腦,真的有意義嗎?
線蟲“大腦”,有什么用?
若是用一句話來概括這個問題,那便是:
這是邁出人造智能生命的關鍵一步。
自人工智能誕生以來,把“機器打造得像人一樣”,便成為了研究人員一直努力研發(fā)的方向。
然而隨著時間的推移,哪怕到了現(xiàn)今以深度學習為主的發(fā)展階段,人工智能還是沒有達到真正意義上的智能程度。
即便是像2016年AlphaGo轟動世界的那場圍棋比賽,也只是刷新了人們對于人工智能的認知。
但也正如CMU教授Hans Moravec所述:
要讓電腦像成年人一樣下棋是相對容易的;但是要讓電腦擁有一歲小孩水平的感知和行動能力,卻是相當困難,甚至是不可能的。
那么,問題到底出在了哪里?
在2016年的時候,智源研究院院長黃鐵軍就給出過答案。
他認為,深度學習本質(zhì)上依賴于人工神經(jīng)網(wǎng)絡,而生物的智能所依靠的是生物神經(jīng)網(wǎng)絡。
其中,人工神經(jīng)網(wǎng)絡更接近于“實現(xiàn)功能”,而生物神經(jīng)網(wǎng)絡模擬的則是“實現(xiàn)功能的結構”,二者在“體量”上便不是一個級別的,后者明顯要龐大得多,也更重要——
因為結構決定功能,而生物神經(jīng)網(wǎng)絡才是智能的載體。
因此,黃鐵軍基于這種情況下所提出的“解法”是:
從腦機理模擬的角度出發(fā)。
簡單來說,就是要去探索生腦大腦內(nèi)部的“運作模式”,這才是通向通用人工智能的途徑之一。
無獨有偶,在更早的2009年,瑞士洛桑聯(lián)邦理工學院的Henry Markram教授也提出過類似的觀點。
當時他宣布了一個計劃——將在理解大腦結構的基礎之上,用超級計算機建立大腦模型。
這項計劃后來得到了歐盟的大力支持和關注,因為這種方式的意義不僅僅是理解人類大腦智能的本身,甚至還可能為腦疾病找到別樣的治療方法。
但問題也接踵而至,要想模擬人類整個大腦神經(jīng)網(wǎng)絡,靠計算機是相當困難的。
這不僅僅是因為計算模擬的復雜度,更是因為生物大腦本身的復雜度。
畢竟人類大腦的含有神經(jīng)元數(shù)量高達1011,其所需的計算量和成本可見一斑。
而人類實際上通過大腦去做推理、創(chuàng)作等一系列行為時,所消耗的功耗僅為20-25瓦。
也就是說生物大腦具備了“高智能”、“低功耗”的特性。
這也就是為什么說研究生物大腦,是通向通用人工智能最佳藍本的原因所在了。
而且這種信號也已經(jīng)開始浮現(xiàn)。
例如2021年發(fā)表于頂刊NEURON上的Single Cortical Neurons as Deep Artificial Neural
Networks研究表明——
一個深度神經(jīng)網(wǎng)絡需要5到8層互聯(lián)神經(jīng)元才能表征單個生物神經(jīng)元的復雜度。
這也就證明了單個神經(jīng)元所具備的計算力之強,所以若是能夠?qū)蝹€神經(jīng)元做非常精細化的刻畫,便可更加逼近生物處理信息的復雜過程。
但更精細化地模擬生物大腦的意義還遠不止于此。
目前人類在大腦方面仍然存在許多較為棘手的疾病,例如阿爾茲海默癥、抑郁癥和腦損傷等。
研究各種腦疾病的過程更是消耗巨大人力和物力的過程,若是能夠精細地模擬具備生物性質(zhì)的大腦,那么或許會在解決方案上提供另一種可能性。
……
總而言之,更好地模擬和認識大腦,是在認識大腦本身的同時,也是在重視人類自己。