向“我懂你”邁進:機器人實現(xiàn)“換位思考”
“你是機器人嗎?為什么不能站在我的位置上想想?”
每當人們發(fā)生爭執(zhí)時,這種“靈魂拷問”總讓人啞口無言。
然而,現(xiàn)實是,也許現(xiàn)在的機器人比你更懂得“換位思考”。
近日,中國科學院自動化研究所研究員、類腦智能研究中心副主任曾毅團隊提出機器人類腦思維揣測模型,實現(xiàn)了機器人的自我經驗學習,使其可以對他人信念進行揣測和預測,這種“換位思考”距離“我懂你”更進一步,相關研究成果發(fā)表于Frontiers in Neurorobotics。
曾毅在接受《中國科學報》采訪時表示:“類腦思維揣測模型為將來智能體獲得更深刻的情感共情奠定了基礎,只有具備認知共情與情感共情等能力,才能使未來人工智能與人類和諧共生。”
機器人正在進行“不透明—透明眼罩測試”。 曾毅供圖
從“冷冰冰”走向“我懂你”
智能體的思維揣測模型旨在使人工智能獲得思維揣測的能力,簡單而言,就是幫機器人實現(xiàn)“換位思考”。
然而,思維揣測作為一種高級認知功能,其神經基礎和神經機制尚未明確。
“如何結合現(xiàn)有研究基礎,探索思維揣測機制,構建可行的類腦思維揣測理論模型是需要解決的關鍵問題。”曾毅表示。
為此,曾毅團隊結合認知心理學、神經影像學、腦科學等學科在思維揣測領域的成果,確定了思維揣測的神經基礎,并采用脈沖神經網(wǎng)絡對所涉腦區(qū)進行認知功能建模,詳細構建了腦區(qū)間信息環(huán)路的連接結構。
此外,曾毅團隊還融合抑制控制機制,構建了類腦思維揣測模型,使智能體可以利用自身經驗完成對其他個體信念的推理。
“這是繼機器人通過鏡像測試,獲得初步自我感知能力后開展的又一次大膽嘗試。”曾毅說。
從“類腦”走向“類人”
與其他模型不同,曾毅團隊提出的思維揣測模型強調自身經驗和腦區(qū)發(fā)育對思維揣測能力的影響。
研究人員模擬了包括顳頂聯(lián)合區(qū)、內側前額葉在內的多個腦區(qū)及腦區(qū)間信息傳遞的通路,特別是額下回和顳頂聯(lián)合區(qū)的自我視角抑制、額下回和腹內側前額葉的自我信念抑制,然后將模型部署到機器人上,通過“不透明—透明眼罩測試”驗證了模型的效果。
該眼罩測試包括訓練和測試部分。首先將機器人分為兩組,一組為“不透明眼罩組”,一組為“透明眼罩組”,兩組外觀一致。
在訓練中,首先將瓢蟲放在兩個黑色矩形框中的一個上,然后分別將不透明眼罩和透明眼罩插入到機器人和物體之間,問機器人“瓢蟲在哪”,使機器人學習眼罩的特性。
隨后,研究團隊開展了讓被試機器人(紅色機器人)推理表演機器人(藍色機器人)信念的測試。
首先,研究人員將瓢蟲放在其中一個黑色矩形框上,再將瓢蟲藏在黃色盒子中,隨后將眼罩插入到藍色機器人和瓢蟲之間,然后又將瓢蟲藏在綠色盒子中,最后將眼罩移開。
“對藍色機器人來說,瓢蟲在哪里?” 當研究人員向紅色機器人提問時,根據(jù)自身經驗的不同,“透明眼罩組”的紅色機器人和藍色機器人對物體位置的信念一致,都會指向綠色盒子;而“不透明眼罩組”紅色機器人會指向黃色盒子。
隨后,研究人員又向紅色機器人提問:“對你自己來說,瓢蟲在哪里?”結果顯示,“不透明眼罩組”和“透明眼罩組”的紅色機器人都會指向綠色盒子。
曾毅解釋道:“抑制控制是思維揣測過程中的重要機制,我們認為額下回和顳頂聯(lián)合區(qū)之間、額下回和腹內側前額葉之間的成熟連接是自我視角抑制和自我信念抑制的神經基礎。”
為驗證抑制控制對實驗的影響,曾毅團隊設定了不同的連接強度。
研究發(fā)現(xiàn),當額下回和顳頂聯(lián)合區(qū)的連接未成熟時,被試機器人無法抑制自我感知的信息,因此無法正確推理表演機器人對物體位置的信念;當額下回和顳頂聯(lián)合區(qū)的連接成熟,但額下回和腹內側前額葉的連接未成熟時,雖然被試機器人可以正確推理表演機器人對物體位置的信念,但無法抑制自身的信念。
當這些連接都成熟時,被試機器人不僅可以抑制自我感知的信息,還能抑制自我信念。
從“學習”走向“遵守”
論文主要作者之一趙宇軒說:“我們通過降低額下回和顳頂聯(lián)合區(qū)之間、額下回和腹內側前額葉的連接強度使抑制控制機制失效,計算模型顯示無法正確輸出從他人視角感知的信息和推理他人的信念,同時機器人在行為上也無法通過測試。因此,從計算建模的角度可以證明抑制控制是思維揣測的核心機制之一。”
對于未來的計劃,曾毅坦言:“對思維揣測的計算建模,構建具有思維揣測能力的智能體只是第一步。接下來,要將類腦思維揣測模型應用于使智能體自主習得與環(huán)境、其他智能體以及人類交互過程中應當遵守的‘道德’規(guī)范。”
美國卡內基·梅隆大學心理學博士、上海交通大學凱原法學院訪問特聘教授秦裕林認為,為了使人工智能技術健康發(fā)展并造福人類,既要從法律法規(guī)層面預防、制止可能有損人類根本利益的人工智能技術,也要倡導符合人類根本利益、負責任的人工智能技術。“在這一方面,曾毅團隊邁出了可喜的一步。”