3300萬(wàn)美元,谷歌開(kāi)啟5年腦計(jì)劃!繪制小鼠大腦2-3%圖譜,大約一個(gè)珠穆朗瑪峰的數(shù)據(jù)量
人腦是現(xiàn)存最復(fù)雜的計(jì)算機(jī)器,由數(shù)十億個(gè)細(xì)胞網(wǎng)絡(luò)組成。
而直到現(xiàn)在,研究人員也沒(méi)能大腦中的細(xì)胞網(wǎng)絡(luò)機(jī)制的缺陷是如何導(dǎo)致了精神疾病和癡呆等其他疾病。
然而,新興的連接組學(xué)領(lǐng)域可以幫助解決這一問(wèn)題。
連接組學(xué)旨在精確繪制大腦中每個(gè)細(xì)胞之間的連接圖,現(xiàn)在,學(xué)界已繪制了較為簡(jiǎn)單的生物體的大腦圖譜,如果蠅。
但想要繪制更復(fù)雜一點(diǎn)的生物體,就變得十分困難。
而繪制更大的大腦圖譜的技術(shù)進(jìn)步可以促進(jìn)對(duì)人腦是如何工作的了解,以及如何治療腦部疾病。
近期,在美國(guó)國(guó)立衛(wèi)生研究院(NIH)的創(chuàng)新神經(jīng)技術(shù)(BRAIN)大腦研究項(xiàng)目的支持下,谷歌研究院的Connectomics團(tuán)隊(duì)將與哈佛、艾倫研究所、MIT、劍橋大學(xué),普林斯頓大學(xué)和約翰霍普金斯大學(xué)的多學(xué)科專家團(tuán)隊(duì),以及哈佛大學(xué)醫(yī)學(xué)研究所Janelia研究園區(qū)的顧問(wèn)一起展開(kāi)研究。
這項(xiàng)耗資3300萬(wàn)美元的項(xiàng)目,目標(biāo)是解決神經(jīng)科學(xué)領(lǐng)域的巨大挑戰(zhàn):繪制小鼠大腦的極小部分圖譜(2~3%)。
這項(xiàng)研究將特別瞄準(zhǔn),小鼠大腦中負(fù)責(zé)記憶編碼、注意力和空間導(dǎo)航的海馬區(qū)。
谷歌Connectomics團(tuán)隊(duì)將為該項(xiàng)目提供計(jì)算和分析資源,這也引出了一個(gè)關(guān)鍵問(wèn)題:
我們能否通過(guò)擴(kuò)大和加快數(shù)字化技術(shù),從而繪制出小鼠大腦的整個(gè)連接組?
現(xiàn)代的連接組學(xué)
繪制小鼠大腦的2~3%,聽(tīng)起來(lái)似乎也不是什么大目標(biāo)。但實(shí)際上,連接組學(xué)走到這一步,已經(jīng)花費(fèi)了數(shù)十年的創(chuàng)新和積累。
2021年,谷歌和哈佛大學(xué)合作成功繪制了一立方毫米的人腦地圖,并將其作為H01數(shù)據(jù)集發(fā)布。
這成為了研究人腦和擴(kuò)展連接組學(xué)技術(shù)的寶貴資源。
但人腦的神經(jīng)網(wǎng)絡(luò)的復(fù)雜性甚至可以與宇宙的星系網(wǎng)絡(luò)相比擬,繪制整個(gè)人腦連接組將需要收集和分析多達(dá)澤字節(jié)(十億個(gè)TB)的數(shù)據(jù)。
這遠(yuǎn)遠(yuǎn)超出了現(xiàn)有技術(shù)的能力。
圖片
于是人們把目光轉(zhuǎn)向了同為哺乳動(dòng)物,并且與人類基因組相似程度達(dá)到90%的小鼠身上。
將其選為繪制大腦連接組的原因有兩點(diǎn):
首先,小鼠的大腦足夠小,在技術(shù)上是可行的。
其次,小鼠的大腦有可能提供與我們自己的大腦相關(guān)的見(jiàn)解,如神經(jīng)科學(xué)家已經(jīng)用小鼠來(lái)研究人類大腦的功能和功能障礙。
通過(guò)合作繪制10-15立方毫米的小鼠大腦圖譜,開(kāi)發(fā)出新的方法,讓我們能夠繪制小鼠大腦的其余部分,以及之后完整的人類大腦圖譜。
圖片
幾十年來(lái),神經(jīng)科學(xué)家一直致力于繪制越來(lái)越大、更復(fù)雜的連接體圖譜
生物學(xué)上最大的數(shù)據(jù)集之一
谷歌Connectomics團(tuán)隊(duì)將繪制小鼠大腦海馬體形成的連接組,它能將短期記憶轉(zhuǎn)化為長(zhǎng)期記憶并幫助小鼠在空間中進(jìn)行導(dǎo)航。
通過(guò)繪制小鼠大腦的海馬體的連接組,可以幫助我們了解大腦中最大的區(qū)域,同時(shí)創(chuàng)建生物學(xué)領(lǐng)域里最大的數(shù)據(jù)集之一,其中包含約25000TB或25PB的大腦數(shù)據(jù)。
作為參考,銀河系中大約有2500億顆恒星。如果這些恒星中的每一顆都是一個(gè)字節(jié),那么需要10萬(wàn)個(gè)銀河系才能匹配該項(xiàng)目繪制小鼠大腦一小塊區(qū)域時(shí)收集的25 PB數(shù)據(jù)。
圖片
為了說(shuō)明海馬項(xiàng)目的規(guī)模,谷歌計(jì)算了需要多少臺(tái)有512GB儲(chǔ)存空間的Pixel手機(jī)(如下所示的Pixel手機(jī)堆疊)來(lái)存儲(chǔ)完成的連接組項(xiàng)目所繪制的線蟲(chóng)和果蠅大腦的圖像數(shù)據(jù),以及剛剛啟動(dòng)的小鼠海馬區(qū)和整個(gè)小鼠大腦項(xiàng)目。
然后,我們將每個(gè)Pixel(單個(gè)Pixel的厚度9mm)堆疊的高度與熟悉的物體和地標(biāo)進(jìn)行了比較:
圖片
存儲(chǔ)大腦蛔蟲(chóng)大腦的圖像數(shù)據(jù)需要2臺(tái)Pixel手機(jī),高度與一個(gè)橄欖差不多。
存儲(chǔ)果蠅大腦的圖像數(shù)據(jù)需要100臺(tái)Pixel手機(jī),高度與一個(gè)四歲的女孩一樣高。
相比之下,小鼠海馬連接組項(xiàng)目將需要相當(dāng)于48,800多臺(tái)Pixel手機(jī)的存儲(chǔ)空間,高度與帝國(guó)大廈相當(dāng)。
而存儲(chǔ)整個(gè)小鼠大腦的連接組數(shù)據(jù)則需要堆疊的Pixel手機(jī)與珠穆朗瑪峰高度相同。
打開(kāi)拍字節(jié)PB級(jí)(10^15)管道
過(guò)去的數(shù)十年來(lái),谷歌Connectomics團(tuán)隊(duì)一直致力開(kāi)發(fā)用于管理海量連接組數(shù)據(jù)集的工具,并從中提取科學(xué)價(jià)值。
谷歌曾幫助果蠅建立了大腦大部分區(qū)域的連接組,但小鼠大腦的神經(jīng)元數(shù)量是果蠅大腦的1000倍。
構(gòu)建小鼠大腦連接組的數(shù)據(jù)對(duì)現(xiàn)有技術(shù)提出了挑戰(zhàn),團(tuán)隊(duì)必須要以前所未有的速度才能繪制更多數(shù)據(jù)。
對(duì)此,谷歌表示將會(huì)繼續(xù)改進(jìn)其洪水填充網(wǎng)絡(luò)(flood-filling networks),該網(wǎng)絡(luò)使用深度學(xué)習(xí)來(lái)追蹤或“分割”每個(gè)神經(jīng)元在電子顯微鏡數(shù)據(jù)制成的三維腦體積中的路徑。
圖片
除此之外,谷歌將通過(guò)擴(kuò)展的自我監(jiān)督學(xué)習(xí)技術(shù)SegCLR的功能,從分割的三維腦體積中自動(dòng)提取關(guān)鍵信息:
例如識(shí)別細(xì)胞類型(如錐體神經(jīng)元、籃子神經(jīng)元等)和每個(gè)神經(jīng)元的部分(如軸突、樹(shù)突等)。
圖片
同時(shí),谷歌還表示將會(huì)進(jìn)一步提升和增強(qiáng)核心連接組學(xué)基礎(chǔ)設(shè)施的可擴(kuò)展性和性能,例如用于存儲(chǔ)的TensorStore和用于可視化的Neuroglancer。
這將使所有的計(jì)算管道和人類分析工作流程都能在這些新的數(shù)據(jù)規(guī)模下運(yùn)行。
一葉知秋,探索小鼠的大腦將會(huì)是人類在攻克莫測(cè)難解的腦科學(xué)路上的又一沖鋒。
我們也可以期待,或許完全解析大腦奧秘的這一天,就在眼前了。
參考資料:
https://blog.research.google/2023/09/google-research-embarks-on-effort-to.html