華人團(tuán)隊用大模型實現(xiàn)“讀心術(shù)”:大腦活動直接變文字
NeurIPS收錄的一項新研究,讓大模型也學(xué)會“讀心術(shù)”了!
通過學(xué)習(xí)腦電波數(shù)據(jù),模型成功地把受試者的腦電圖信號翻譯成了文本。
而且整個過程不需要大型設(shè)備,只要一塊特制的“頭巾”就能實現(xiàn)。
這項成果名為DeWave,能在不通過侵入式設(shè)備和MRI的情況下解讀腦電波并翻譯成文本。
由于用了大模型來讀腦,因此報道DeWave的iFLScience也管它叫BrainGPT。
DeWave雖然不是最早實現(xiàn)腦電波解碼的技術(shù),但是它第一個做到了非侵入且無需MRI的腦電波-文本轉(zhuǎn)換。
如果能夠規(guī)模化運(yùn)用,DeWave將為腦部癱瘓的人群提供交流上的幫助。
那么,DeWave的表現(xiàn)到底怎么樣呢?
測評成績超SOTA
由于DeWave采用非侵入式方法,信號中的噪聲更強(qiáng),解析難度更高,但相比于此前的SOTA方法,DeWave的測試成績還是有所提高。
研究團(tuán)隊采用了公開的ZuCo數(shù)據(jù)集,其中包含了一萬多個不重復(fù)的句子;受試者進(jìn)行自然閱讀的同時,研究團(tuán)隊對他們的腦信號和正在閱讀的文本進(jìn)行記錄。腦電波信號采樣頻率為500Hz,包含128個信道。
如果輸入的EEG信息已經(jīng)按照眼動追蹤方式的特征切分好,那么DeWave大概可以準(zhǔn)確解讀出句子的三分之一;即使不切分也能夠成功捕捉一部分的關(guān)鍵詞。
研究結(jié)果還顯示,DeWave對單詞的解析準(zhǔn)確率高于整句,對動詞的準(zhǔn)確率高于名詞。
數(shù)據(jù)方面,研究團(tuán)隊一共讓DeWave對29名受試者的腦電圖進(jìn)行了采集和解析。
結(jié)果顯示,有切分時,DeWave在BLUE-N數(shù)據(jù)集上成績比傳統(tǒng)方法高出了3-18%,在ROUGE-1數(shù)據(jù)集上也有最高6.35%的提升。
如果不做切分,DeWave與相同條件的傳統(tǒng)方法相比,表現(xiàn)最多提升了120%。
為了評估DeWave的魯棒性,團(tuán)隊對其進(jìn)行了跨受試者(Cross-subject)測試。
這輪測試一共有18名受試者,其中一人的腦電波相信被用于訓(xùn)練。
然后,研究團(tuán)隊觀察了模型在其他17人上進(jìn)行測試時的表現(xiàn),與被用于訓(xùn)練的人差距越小,說明模型的魯棒性越強(qiáng)。
結(jié)果顯示,DeWave的分?jǐn)?shù)下降值低于傳統(tǒng)模型,顯示出了更強(qiáng)的魯棒性和泛化能力。
那么,DeWave是如何實現(xiàn)腦電波解碼的呢?
用大模型解讀腦電波
DeWave的核心是引入了名為“離散碼本”的概念。
通過向量化編碼器,連續(xù)的腦電圖信號被拆分為離散形式,分別與詞匯進(jìn)行對齊。
之后,研究團(tuán)隊將離散化的數(shù)據(jù)送入Transformer編碼器,得到上下文語義融合的向量表示。
將向量化的文本信息作為監(jiān)督數(shù)據(jù),用得到的向量化信號對BART大模型進(jìn)行訓(xùn)練,就得到了DeWave。
新的信號解析過程也與之相似——先進(jìn)行離散化和向量化編碼,然后用BART對其進(jìn)行解讀,就得到了文本信息。
同時,為了增強(qiáng)可解碼性研究團(tuán)隊還通過正負(fù)樣本對編碼進(jìn)行調(diào)節(jié),使DeWave解析出的語義更接近目標(biāo)文本詞向量。
作者簡介
DeWave團(tuán)隊一共有五名成員,全都是華人。
第一作者是悉尼科技大學(xué)的Yiqun Duan,來自H(Human-centric)AI研究中心,研究方向是機(jī)器智能和腦機(jī)接口。
除了DeWave,Duan此前還有一項基于擴(kuò)散模型的“反向成果”——把文字轉(zhuǎn)換成腦電波的工具BrainDiffusion。
該研究中心主任Chin-Teng Lin教授是本文的通訊作者。
同實驗室的Jinzhao Zhou和Yu-Kai Wang,以及悉尼大學(xué)的Zhen Wang也參與了此項目。