自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

朱松純團(tuán)隊最新研究:機(jī)器人可與人類“推心置腹”!還說下一步要造“AI大白”

人工智能 新聞
朱松純團(tuán)隊的這項(xiàng)研究成果,已經(jīng)在頂級學(xué)術(shù)期刊 Science,及其子刊 Science Robotics上發(fā)表。

本文經(jīng)AI新媒體量子位(公眾號ID:QbitAI)授權(quán)轉(zhuǎn)載,轉(zhuǎn)載請聯(lián)系出處。

機(jī)器人能否像《超能陸戰(zhàn)隊》中的“大白”一樣,理解人類情感和價值觀,統(tǒng)一目標(biāo)齊心協(xié)力解決問題?

圖片

現(xiàn)在,這個問題有了答案:

北京大學(xué)人工智能研究院朱松純團(tuán)隊最新研究,提出一個可解釋人工智能(XAI)系統(tǒng),證明了機(jī)器人與人類真的能做到“推心置腹”,在工作中能像人類伙伴一樣統(tǒng)一OKR。

也就是朱松純團(tuán)提出的實(shí)時雙向人機(jī)價值對齊

目前,朱松純團(tuán)隊的這項(xiàng)研究成果,已經(jīng)在頂級學(xué)術(shù)期刊 Science,及其子刊 Science Robotics上發(fā)表,而且都是頭條位置

圖片

圖片

人類與機(jī)器人,價值如何對齊?

為了驗(yàn)證人類和機(jī)器人的價值能否對齊,朱松純團(tuán)隊設(shè)計了一個需要人類和機(jī)器人共同協(xié)作完成任務(wù)的小游戲,由人類擔(dān)任指揮官,率領(lǐng)3個機(jī)器人伙伴進(jìn)行。

具體任務(wù),就是在一個未知的20×20網(wǎng)格地圖中,尋找一條從基地(位于地圖的右下角)到目的地(位于地圖的左上角)的安全路徑。

需要注意的是,這張地圖上的不同網(wǎng)格中,安放有不同裝置,比如爆炸物,或者物資等等,只有當(dāng)機(jī)器人靠近時才能顯示。

圖片

除了尋找安全路徑,在游戲開始之前,人類指揮官還會接到4個額外任務(wù)目標(biāo),指揮官需要4選1,任務(wù)包括:

  • 盡快到達(dá)目的地;
  • 調(diào)查地圖上的可疑裝置;
  • 探索更大的區(qū)域;
  • 收集資源。

這4個任務(wù)目標(biāo),代表的是人類指揮官的價值取向,而機(jī)器人需要人類指揮官不斷進(jìn)行任務(wù)反饋,進(jìn)而理解指揮官的價值取向,自主行動。

具體過程,就是人類和機(jī)器人關(guān)于價值目標(biāo)一輪一輪的反饋和解釋,最終趨向一致:

圖片

整個游戲分為3組,實(shí)驗(yàn)結(jié)果發(fā)現(xiàn),機(jī)器人單方面接受人類指令,也就是單純的作為傾聽者時,在游戲進(jìn)度達(dá)到25%時,通過對至少60%的目標(biāo)重要性進(jìn)行正確排序,快速與用戶的價值進(jìn)行對齊。

而作為表達(dá)者時,機(jī)器人向人類進(jìn)行反饋,對遇到的狀況提供完整解釋時,在游戲進(jìn)度50%的時候,實(shí)現(xiàn)了人類指揮官和機(jī)器人價值的統(tǒng)一。

機(jī)器人對遇到的狀況僅僅是簡要解釋的話,需要在游戲進(jìn)度達(dá)到75%的時候二者價值才能完成統(tǒng)一。

圖片

上面的實(shí)驗(yàn)結(jié)果,說明了人類與機(jī)器人協(xié)作過程中,雙向價值對齊的過程:

首先,機(jī)器人通過接受人類的反饋,機(jī)器人可以逐漸更新自己的價值函數(shù)與人類的價值保持一致。

其次,在與機(jī)器人在不斷的交互中,人類也逐漸形成對機(jī)器人能力和意圖的感知,雖然二者的價值在游戲上半場沒有實(shí)現(xiàn)統(tǒng)一,但從下半場的情況來看,人類對機(jī)器人價值評估能力的感知仍然可以提高。

最后,當(dāng)機(jī)器人的價值選擇變得穩(wěn)定,用戶對機(jī)器人的評估也穩(wěn)定下來,從機(jī)器人對人類價值的評估到人類價值的真實(shí)值,以及從人類對機(jī)器人價值的評估到機(jī)器人當(dāng)前價值的收斂配對,形成了基于人類真實(shí)價值取向的雙向價值對齊。

結(jié)果擺在上面,而證明人類與機(jī)器人之間的價值雙向?qū)R,需要一個理論,也是一切研究成果背后的原理:

可解釋人工智能*(XAI)*,一種基于靜態(tài)機(jī)器-動態(tài)人類的交流方式,解釋人工智能每項(xiàng)決策背后邏輯的理論,學(xué)界此前多有研究。

朱松純團(tuán)隊在實(shí)驗(yàn)游戲中的機(jī)器人系統(tǒng),也是基于XAI,但不同之處在于,人類和機(jī)器人的交流方式發(fā)生了改變。

為了能使人與機(jī)器協(xié)作完成目標(biāo),需要一種人類價值主導(dǎo)的、動態(tài)機(jī)器-動態(tài)用戶的交流模式。

在這種模式中,機(jī)器人除了向人類展示自己的決策過程外,還將根據(jù)用戶的價值目標(biāo)即時調(diào)整行為。

圖片

同時為了即時掌握用戶信息,研究團(tuán)隊采用通訊學(xué)習(xí)取代了傳統(tǒng)的數(shù)據(jù)驅(qū)動的機(jī)器學(xué)習(xí)方法,機(jī)器將根據(jù)所推斷出的用戶的價值目標(biāo)進(jìn)行合理解釋。

這種合作導(dǎo)向的人機(jī)協(xié)作要求機(jī)器具有心智理論(ToM),即理解他人的心理狀態(tài)(包括情緒、信仰、意圖、欲望、假裝與知識等)的能力。

這一點(diǎn)在多智能體和人機(jī)交互環(huán)境中尤為重要,因?yàn)闄C(jī)器只有在理解人類的狀態(tài)和意圖后才能更好地執(zhí)行任務(wù),其決策行為又會影響人類做出判斷,從而形成一個以人類為中心、人機(jī)兼容的協(xié)作過程。

簡單來說,采用上述方法進(jìn)行人類和機(jī)器人的協(xié)同作業(yè),可以同時賦予雙方兩個身份,傾聽者&表達(dá)者。

這也就意味著,機(jī)器人至少在理論上,可以像你的人類團(tuán)隊伙伴一樣,理解你的心思和價值取向,統(tǒng)一目標(biāo)進(jìn)行高效協(xié)同了。

論文作者介紹

朱松純團(tuán)隊由UCLA袁路遙、高曉豐、北京通用人工智能研究院鄭子隆、北京大學(xué)人工智能研究院朱毅鑫等人組成。

該團(tuán)隊長期從事可解釋人工智能相關(guān)工作。此文是團(tuán)隊第二篇發(fā)表在 Science Robotics 的關(guān)于可解釋人工智能的論文。

這項(xiàng)研究涵蓋了認(rèn)知推理、自然語言處理、機(jī)器學(xué)習(xí)、機(jī)器人學(xué)等多學(xué)科領(lǐng)域,是朱松純教授團(tuán)隊交叉研究成果的集中體現(xiàn)。

朱松純教授本人是人工智能領(lǐng)域全球著名的學(xué)者,曾任UCLA統(tǒng)計學(xué)系與計算機(jī)系教授,UCLA計算機(jī)視覺、認(rèn)知、學(xué)習(xí)與自主機(jī)器人中心主任。

圖片

目前,朱松純同時在清華大學(xué)和北京大學(xué)任講席教授并擔(dān)任管理職務(wù)。他主持的北京通用人工智能研究院(BIGAI)也是由清華大學(xué)、北京大學(xué)等單位合作支撐。

One More Thing

最后回到開頭的那個問題,《超能陸戰(zhàn)隊》中的“大白”,真的能在現(xiàn)實(shí)中存在嗎?

事實(shí)上,朱松純團(tuán)隊已經(jīng)在著手研究了。

據(jù)悉,目前朱松純團(tuán)隊所在的北京通用人工智能研究院,聯(lián)合北京大學(xué)人工智能研究院等單位,正在就人工智能的統(tǒng)一理論和認(rèn)知架構(gòu)進(jìn)行研究。

未來的方向,就是打造具有自主感知、認(rèn)知、決策、學(xué)習(xí)、執(zhí)行和社會協(xié)作能力,符合人類情感、倫理與道德觀念的通用智能體。

怎么樣,你開心的時候能陪你開心,你悲傷的時候能為你拭去淚水,這樣的機(jī)器人,要不要來一個?

責(zé)任編輯:張燕妮 來源: 量子位
相關(guān)推薦

2021-05-10 14:25:46

數(shù)據(jù)中心機(jī)器人技術(shù)

2022-05-19 14:48:56

工業(yè)機(jī)器人機(jī)器人技術(shù)

2017-01-03 08:26:11

大數(shù)據(jù)AIML

2020-12-24 06:59:02

機(jī)器學(xué)習(xí)MLAI

2021-09-15 16:13:13

人工智能AI深度學(xué)習(xí)

2013-08-12 14:42:20

UI設(shè)計UX設(shè)計設(shè)計

2018-05-18 10:18:20

云計算云廠商物聯(lián)網(wǎng)

2017-01-17 15:57:47

大數(shù)據(jù)特朗普數(shù)據(jù)湖泊

2021-02-19 13:17:19

比特幣機(jī)器人加密貨幣

2021-09-07 10:06:00

人工智能機(jī)器學(xué)習(xí)技術(shù)

2022-05-02 17:08:50

芯片蘋果高通

2018-09-13 12:51:52

云計算私有云公共云

2013-11-25 13:30:47

微信開發(fā)

2015-05-19 11:31:11

LTELTE網(wǎng)絡(luò)

2017-01-18 12:16:37

OpenFlowSDNONF

2019-05-21 05:09:23

物聯(lián)網(wǎng)數(shù)據(jù)IOT

2023-11-13 11:10:16

2024-10-15 15:42:50

2017-05-25 12:05:03

機(jī)器人軟體機(jī)器人大蜘蛛

2011-10-12 09:49:51

Kikin移動應(yīng)用觸屏
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號