GAN靠「偽造思維」登上Nature子刊:首次合成神經活動數(shù)據(jù)
本文經AI新媒體量子位(公眾號ID:QbitAI)授權轉載,轉載請聯(lián)系出處。
GAN這回玩了票大的,把手伸向了“人腦思維”。
沒錯,直接就是一個“合成思維”——生成用來喂給腦機接口的那種大腦活動數(shù)據(jù)。
作者表示,這是AI首次在該領域被應用。
并且這項技術一舉把訓練腦機接口系統(tǒng)提取、分析大腦信號的時間,提高了整整20倍。

此項研究來自南加大華人博士溫士賢團隊。
論文已發(fā)表在Nature子刊上。

而在我們與作者溫士賢的深入交談中,他表示會繼續(xù)推進相關研究:
這項研究成果未來可以用于諸多神經解碼問題上,自己也會繼續(xù)在失眠、自閉癥、多動癥、阿茲海默癥等疾病的個性化的干預和阻斷上進行研究。
首次用AI合成“思維”
可是問題就來了,為什么要用AI去“偽造”神經活動數(shù)據(jù)呢?
直接用人類的不好嗎?
還真不一定好。
比如,今年5月份登上Nature封面的意念打字研究,這位代號T5,全身癱瘓的老爺子是唯一的受試者:
模型所需的訓練數(shù)據(jù),就是這位老爺子在腦中一筆一畫“寫”出來的字母:

在腦海中想象文字的軌跡和手動書寫本來就難度不同,而模型需要的還不僅是幾個字母,而是大量重復的書寫數(shù)據(jù)。
要讓一位殘疾人每天花幾個小時去做重復任務,不僅辛苦,數(shù)據(jù)收集的速度和數(shù)據(jù)集最終的大小自然都非常有限。
而在要讓算法解讀神經活動信號的腦機接口,本身也是一個機器學習問題。
因此,算法效果當然會依賴于巨量訓練數(shù)據(jù)的支撐,而在實際實驗中,真不一定弄得到那么多數(shù)據(jù)。
就算有充足的可用數(shù)據(jù),不同受試對象的神經元信號也存在差異。
一個人的數(shù)據(jù)訓練出來的解碼算法要應用到另一個人身上,就必須重頭再來。
除此之外,就算是同主體上的解碼算法的效果,也會隨著時間推移而變差,需要定期重新校準。
更何況,有些最需要腦機接口幫助的殘障人士,因神經系統(tǒng)損壞已經無法發(fā)送相應的信號了。
那么,要如何解決或者改善上面這些問題呢?
溫士賢博士表示:
GAN就完事兒了。
讓猴子玩貪吃蛇
這次研究的被試者是兩只小猴子,它們需要完成的任務很簡單。
屏幕上會有物體在隨機位置出現(xiàn),小猴子要用搖桿控制屏幕上的光標去接觸這個物體。
結合論文的配圖一看,大概類似于貪吃蛇?

小猴子手臂處植入的電極陣列會采集神經的運動控制(Motor Control)信號。
初級運動皮層的神經元會以1-2毫秒間隔釋放100毫伏左右的間歇性脈沖,神經元每次激發(fā)就會產生一個峰值。
這種活動模式被叫做峰電位序列 (Spike Train)。
△真實神經元的峰電位序列
研究人員先用雙向LSTM網(wǎng)絡設計了GAN中的生成器和鑒別器,用采集到的神經數(shù)據(jù)加上隨機高斯噪聲來合成新的數(shù)據(jù)。

研究要解決的關鍵問題,是如何只用少量真實采集的數(shù)據(jù)來生產可用的合成數(shù)據(jù)。
△合成的峰電位序列
對于神經信號來說,合成數(shù)據(jù)的可用性面臨兩個問題:
不同個體產生的信號有不同模式,就連同一個體在不同時間的神經信號也會不同。
而之前的步驟就相當于預訓練,下一步就是針對這些情況來微調。
結合另一只猴子或同一只猴子在不同時間采集的數(shù)據(jù)來作微調,最終產生大量可適用于不同情況的峰電位序列。

最后一步就是驗證用少量真實數(shù)據(jù)+大量合成的數(shù)據(jù)訓練腦機接口解碼器,以驗證效果。

最終他們只用不到1分鐘的真實數(shù)據(jù)加上合成數(shù)據(jù),就能當20分鐘的真實數(shù)據(jù)用。
論文最后提到,雖然這次研究只實驗了猴子的運動控制信號,不過研究所用的方法是純數(shù)據(jù)驅動的,不對運動控制問題有額外的設計。
換句話說,這篇論文提出的方法是通用的,如果用于其他神經的編碼解碼問題,只需要做最小限度的修改即可。
論文第一作者溫士賢在與杜克大學腦機接口專家Miguel Nicolelis合作的另一項研究中還做了讓小猴子玩跑步機的實驗。

溫士賢表示,這是AI第一次用于合成思維或運動信號,能推進腦機接口技術的進一步應用落地。
不過還有最后一個問題,以猴子為實驗對象做出來的方法能不能遷移到人類身上?
在與量子位的交流中,溫士賢認為僅從解碼算法的角度來看問題不大,研究中已經考慮到了這一點。
更多的問題是腦機接口硬件和材料的設計問題,比如設備和人類生物細胞的兼容度,還有采集芯片怎么快速和安全地植入到正確的位置等。
“腦機接口的重點還是科學”
論文的一作溫士賢本科畢業(yè)于北京交通大學,現(xiàn)在是一名南加州大學維特比工程學院的博士生,就讀于計算機系,主要研究方向是AI和神經科學。
而他的導師是南加州大學的計算機科學,心理學和神經科學的教授,CS系副主任Laurent Itti。
Laurent Itti主要研究視覺注意、場景理解、眼球運動控制等領域,同時也是多個開源的神經形態(tài)視覺軟件工具包的開發(fā)者。
腦機接口其實并不是導師Itti的主要研究方向,神經科學一開始只是溫士賢自己的興趣。
在研究生期間,又一次他看到杜克大學腦機接口專家Miguel Nicolelis教授著名的TED演講,介紹了他們如何用腦機接口幫助一個癱瘓青年用意念在巴西足球世界杯上開了第一球。
后來更是有機會到Nicolelis教授的實驗室實習。
這算是我第一次和腦機接口“結緣”。
而這次的論文是溫士賢自己拉來日內瓦大學和美國西北大學的研究者一起合作完成。
現(xiàn)在,溫士賢即將博士畢業(yè),而他也選擇繼續(xù)在AI+神經科學的方向從業(yè)。
目前他已經面試了一些國內的大學和研究機構,以及當紅的腦機接口公司,已經拿到一些不錯的Offer。
而關于腦機接口,神經科學的行業(yè)現(xiàn)狀和趨勢,溫士賢表示:
腦科學的市場本身有巨大的需求,比如Neuralink的腦疾病治療、Apple的mental health評估、Meta的Ctrl lab在元宇宙中改善人機交互的硬件等等。
所以它的重點還是科學,而不是比誰的市場化做得更好。
因此,這種商業(yè)模式是最有利于我們這種科研人員創(chuàng)業(yè)的。
論文地址:
https://www.nature.com/articles/s41551-021-00811-z