MIT研發(fā)出腦控機器人:可使用腦波為機器人糾錯
為了讓機器人按照人類想法行事,它們就得理解我們。很多時候,這意味著不得不做出妥協(xié):教機器學懂得人類語言的玄妙,比如,為它們提供特定任務的具體指令。
但是,如果可以研發(fā)出一種類似人類自然延伸的機器人,讓它們可以按照我們的想法自如行動,又會怎么樣?
麻省理工學院的計算機科學和人工智能實驗室(CSAIL)的團隊和波士頓大學正在攻克這一難題,他們打造出了一種反饋系統(tǒng),讓人類僅用大腦就可以迅速糾正機器人犯下的錯誤,這款 MIT 研發(fā)出的反饋系統(tǒng)能夠讓人類操作者僅通過大腦信號就能實時糾正機器人做出的選擇。
使用腦電圖(EGG)檢測器(用來記錄大腦活動的)輸出的數(shù)據(jù),當機器人執(zhí)行某個目標分類任務時,該系統(tǒng)可以識別出人類是否注意到機器人犯錯了。這一團隊研發(fā)的新的機器學習算法能夠幫助系統(tǒng)分類 10 到 30 微秒空間中的腦電波。
盡管該系統(tǒng)當前只能處理相對簡單的二項選擇,但是,這篇論文的資深作者表示,該研究表明,人類有一天能夠以更加充滿直覺的方式控制機器人。
「想象一下你無需輸入命令、按按鈕或口頭命令,就可以迅速告訴機器人做出某個動作?!笴SAIL 主任 Daniela Rus 說,「這種高效的解決方案將提升人類監(jiān)管工廠機器人、無人駕駛汽車以及其它尚未發(fā)明技術的能力?!?/p>
在該項研究中,團隊使用了一臺「Baxter」人形機器人,該機器人的生產(chǎn)廠商是 Rethink Robotics,其負責人是前 CSAIL 主任,也是 iRobot 的聯(lián)合創(chuàng)始人 Rodney Brooks。
這篇論文的作者是波士頓大學(BU)的 PhD candidate Andres F. Salazar-Gomez、CSAIL 的 PhD candidate Joseph DelPreto 和 CSAIL 研究科學家 Stephanie Gil,指導老師為 Rus 和波士頓大學的教授 Frank H. Guenther。該論文已經(jīng)被將于今年 5 月在新加坡舉辦的 IEEE 機器人與自動化國際會議(ICRA)接收。
通過直覺與機器人互動
在過去,通過 EEG-控制的機器人需要人類以計算機可識別的固定方式進行「思考」。例如,一個操作人員面前有兩束亮光,他必須要看其中一個才能讓機器進行特定工作,因為每一束亮光都與機器人的特定工作任務有關。
這種方法的缺陷在于訓練過程和對人思維活動的建模是非常耗時耗力的,特別是對那些監(jiān)督導航與構建工作的人來說更是如此,因為這些任務需要高強度的注意力。
Rus 的團隊想把這整個過程變得更自然點。為了實現(xiàn)該目標,他們聚焦于一種稱為「誤差相關電位(error-related potential,ErrP)」的大腦信號,只要我們的大腦意識到了一個錯誤,這種信號就會生成。當機器人給出它打算做哪一種選擇時,該系統(tǒng)就會使用 ErrP 信號來判斷人類是否同意機器的這個決定。
「當你看著這個機器人時,你所需要做的僅僅是在大腦中同意或者反對它正在做的事情就可以了,」Rus 說道,「你不必訓練自己一定要以某種特定方式來思考——我們的機器會來適應你,而不是反過來?!?/p>
大腦 ErrP 信號非常微弱,也就是說該系統(tǒng)必須要調整得足夠到位才能讓它既可以分類這些信號又可以配合反饋回路中的人類操作員。除了首要檢測 ErrP 信號外,當系統(tǒng)沒有意識到來自人類的糾錯信號時,團隊也讓機器去偵測所謂的「次要錯誤(secondary errors)」。
「如果機器人不確定自己的決定,它可以觸發(fā)一種人類反饋機制來獲得更加準確的答案,」Gil 說道,」這些信號可以非常有效地改善精度,創(chuàng)造一個人機之間持續(xù)交流相互決策的對話過程?!?/p>
盡管該系統(tǒng)還仍然無法實時識別第二類錯誤信號,但 Gil 預計該模型在能夠識別該信號后可以提升 90% 的精度。
此外,由于 ErrP 信號的強度已被證明可以顯示機器人的錯誤到底有多嚴重,所以,該團隊相信未來的系統(tǒng)可以擴展到更加復雜的多選項任務中去。
Salazar-Gomez 指出,該系統(tǒng)甚至也適用于那些無法進行口語交流的人:像拼寫這樣的任務可以通過一系列離散的二元選擇(discrete binary choices)來完成,Salazar-Gomez 將其比作一種高級版本的眨眼機制,該機制允許中風患者 Jean-Dominique Bauby 可以撰寫自己的回憶錄《潛水鐘與蝴蝶(Le Scaphandre et le Papillon)》。
「該項工作讓我們距開發(fā)有效腦控制機器人和假體的目標更近了一步,」弗萊堡大學計算機教授 Wolfram Burgard 說道(他沒有參與此項研究),「考慮到將人類語言翻譯成一種有意義的機器可識別的信號是件異常困難的事情,該領域的工作對于未來的人機協(xié)作實在是具有深遠影響?!?/p>
該項目的部分資助來自波音公司(Boeing)與美國國家科學基金會(National Science Foundation)。以下是對原論文的摘要介紹:
論文題目:通過 EEG 信號實時糾正機器人所犯的錯(Correcting Robot Mistakes in Real Time Using EEG Signals )
摘要:借由人類合作者大腦活動與機器人進行交流能夠提供一種直接而且快速的反饋回路,對人類合作者來說,這一交流方式簡單而且自然,從而使得根據(jù)直覺與機器人互動完成各種任務就不再是夢。這一論文探索了將誤差相關電位(ErrP)應用到閉環(huán)機器人控制的方法。ErrP 信號對機器人任務特別有用,因為它們是大腦活動對預期之外誤差做出反應的過程中自然出現(xiàn)的。我們解碼了人類操作員實時控制一臺 Rethink Robotics Baxter 機器人完成一個兩項選擇任務過程中的 ErrP 信號。我們也表明,利用這一閉環(huán)機器人任務期間生成的、與潛在誤差相關的次要互動信號能夠大大提升機器人的分類任務表現(xiàn),這也暗示著新的讓機器人獲取人類反饋的手段。我們完整描述了整個系統(tǒng)的設計和應用,也展現(xiàn)了實時閉環(huán)以及開環(huán)控制實驗結果,以及對主要(primary)和次要(secondary)ErrP 信號的離線分析。我們使用了一般人群的受試者完成實驗任務,這些受試者之前未經(jīng)訓練或篩選。因此,這一研究證實了 EGG 為基礎的回路方法的潛力,有望實現(xiàn)無縫的機器人控制,也朝著實時直覺互動這一目標更進了一步。
圖 1:基于實時解碼觀察者的 EEG 信號,機器人被告知它的***動作是錯誤的,并且它會根據(jù)合適的物體類別做出正確選擇
圖 4:系統(tǒng)包含一個主要的實驗控制器、Baxter 機器人、一個 EEG 獲取與分類系統(tǒng)。一個 Arduino 系統(tǒng)轉播控制器和 EEG 系統(tǒng)之間的信息。機械連接開關檢測機械臂動作啟動。
圖 6:識別一次 EEG 數(shù)據(jù)緩沖中的 ErrP 的各種預處理和分類階段。這個決策會立即影響到機器人的行為,而機器人的行為又會影響到 EEG 信號,從而形成反饋回路的閉環(huán)。
【本文是51CTO專欄機構機器之心的原創(chuàng)譯文,微信公眾號“機器之心( id: almosthuman2014)”】