研究人員訓練人工智能解碼人類思想
得克薩斯大學奧斯汀分校的研究人員開發(fā)了一種新的人工智能系統(tǒng),可以將人的大腦活動轉化為連續(xù)的文本流。
該系統(tǒng)被稱為語義解碼器,是一種非侵入性方法。首先使用fMRI(功能磁共振)掃描儀測量大腦活動(fMRI掃描儀是一種跟蹤大腦不同部位血流的成像機器)。當患者在掃描儀中收聽數小時的播客時,語義解碼器通過這種成像進行訓練。
在這項研究中,三個人在功能磁共振成像掃描儀中用耳機收聽播客,每人長達16個小時。大部分聽力材料都是“Moth Radio Hour”的故事,這是一個受歡迎的公共廣播節(jié)目,每周都有播客。
根據UT News的一篇報道,在解碼器接受這種方法的訓練后,如果患者愿意解碼他們的想法,他們可以聽一個新故事或想象講一個故事,機器將從大腦活動中生成相應的文本。
對于預測文本生成,解碼器使用了一個轉換器語言模型,該模型可與為ChatGPT提供動力的大型語言模型相媲美。該系統(tǒng)生成的文本與原始單詞的預期含義僅部分匹配,而不是患者想法的逐字記錄。
這項研究由計算機科學博士生Jerry Tang和UT Austin神經科學和計算機科學助理教授Alex Huth領導。這項研究結果發(fā)表在《自然神經科學》雜志上的一篇論文中。這篇論文解決了人們對患者隱私的擔憂以及濫用這項技術的可能性。只有自愿參與解碼器訓練的患者才能進行解碼。研究指出,對于那些沒有使用解碼器訓練或有目的地思考其他事情的人來說,結果是不連貫的。
據UT新聞報道,研究人員表示,他們正在認真對待隱私和安全問題,并希望確保人們自愿使用這項技術,并幫助他人。
盡管該系統(tǒng)由于需要一臺體積龐大的fMRI機器,并不實用,但研究人員認為,該技術可能會轉向更便攜的大腦成像格式,如功能性近紅外光譜(fNIRS)。這項技術可以為那些因中風或神經系統(tǒng)疾病等健康問題而無法說話的患者提供解決方案。