自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

吊打90%人類,Meta首個(gè)「AI外交模型」登上Science!網(wǎng)友:請(qǐng)把小扎送上法庭

人工智能 新聞
外交官的活兒,AI也能干了?

幾十年來(lái),外交一直被認(rèn)為是「AI絕不可能接管的工作」。

因?yàn)樗笸婕艺莆?、理解他人的觀點(diǎn)以及背后的動(dòng)機(jī),制定復(fù)雜的計(jì)劃并及時(shí)調(diào)整,然后應(yīng)用語(yǔ)言與他人達(dá)成合作,最后說(shuō)服他們建立伙伴關(guān)系和聯(lián)盟等。

對(duì)溝通、信任背叛的關(guān)注,使外交與圍棋和國(guó)際象棋等更注重規(guī)則的「游戲」截然不同。

然而Meta的最新研究表明:外交官的活兒,AI也很可能能干了!

在2022年8月至10月進(jìn)行的線上外交游戲比賽中,CICERO在所有「選手」中高居前10%。它的平均得分為25.8%,是其82名對(duì)手平均得分(12.4%)的兩倍還多。

更加值得一提的是,在實(shí)際的比賽過(guò)程中,沒(méi)有一名玩家——發(fā)現(xiàn)是人工智能在打比賽!

如今,這項(xiàng)最新成果也以論文的形式發(fā)表在了Science上。

圖片

CICERO的推出,必將成為自然語(yǔ)言處理領(lǐng)域的一項(xiàng)重大成就。

因?yàn)檫@預(yù)示著人工智能有潛力「更好、更自然地與人類合作」,代表著人類向AGI邁進(jìn)的一大步。

吊打90%人類,無(wú)人發(fā)現(xiàn)AI參與

《外交》是一款七人制經(jīng)典策略游戲,可以說(shuō)是棋盤(pán)游戲Risk、紙牌游戲撲克和電視節(jié)目Survivor的結(jié)合,由美國(guó)著名玩具公司孩之寶(Hasbro)于1950年代開(kāi)發(fā)。

通過(guò)對(duì)20世紀(jì)初歐洲七大國(guó)的「角色扮演」,玩家需要與其他選手建立信任、談判和合作,并盡可能多地占領(lǐng)領(lǐng)土。

為避免因?qū)κ值姆磽舳蛔柚?,玩家?huì)私下交流、討論潛在的協(xié)調(diào)行動(dòng),然后將他們的行動(dòng)付諸紙上,遵守或違反對(duì)其他參與者的承諾。

這樣一款充滿欺騙與權(quán)術(shù)的游戲,也被一些玩家視為失去朋友的理想方式,堪稱「友盡賽」!

正如上文所言,與國(guó)際象棋和圍棋等游戲不同,外交是一種更關(guān)乎于「人」而不是「規(guī)則」的游戲。

如果模型無(wú)法識(shí)別某人可能在虛張聲勢(shì),或者精準(zhǔn)識(shí)別其他玩家某步棋中的進(jìn)攻性,它顯然會(huì)很快輸?shù)舯荣悺?/span>

同樣,如果它不像一個(gè)真人那樣說(shuō)話,表現(xiàn)出同理心、建立關(guān)系、談?wù)撚螒?,它就不?huì)找到其他愿意與它一起工作的玩家。

在過(guò)去的幾十年里,研究人員一直在構(gòu)建一種自然語(yǔ)言交流能力的「AI外交官」。然而因?yàn)檫@一重大挑戰(zhàn)已經(jīng)遠(yuǎn)遠(yuǎn)超出了現(xiàn)有AI的能力范疇,因此從來(lái)沒(méi)有一名研究員成功過(guò)。

直到近期CICERO的橫空出世,才徹底顛覆了這個(gè)事實(shí)。

圖片

CICERO本質(zhì)上是一臺(tái)「聊天機(jī)器人」,可以與其他外交玩家溝通,從而在游戲中采取有效行動(dòng)。

西塞羅則是一名古羅馬著名政治家、哲學(xué)家、演說(shuō)家,誕生于公元前106年1月3日,以善于雄辯而聞名于羅馬政界。

Meta將在這款A(yù)I模型取名于此,意義不言而喻。

2022年8月至10月,CICERO在webDiplomacy組織的線上《外交》比賽中,共參加了40場(chǎng)比賽,在所有參與者中成績(jī)高居前10%;在打了五場(chǎng)或更多比賽的19人中,西塞羅則排名第二。

40場(chǎng)比賽中,CICERO的平均得分為25.8%,是其他82名對(duì)手平均得分(12.4%)的兩倍還多,并將其戰(zhàn)略對(duì)話和游戲能力展現(xiàn)得淋漓盡致。

會(huì)思考又能表述,如此AI誰(shuí)能不愛(ài)?

CICERO基于一個(gè)27億參數(shù)的類BART語(yǔ)言模型,該模型根據(jù)來(lái)自互聯(lián)網(wǎng)的文本進(jìn)行預(yù)訓(xùn)練,并使用 webDiplomacy.net上在線玩的4萬(wàn)多場(chǎng)外交游戲的數(shù)據(jù)集進(jìn)行了擴(kuò)充。

這些數(shù)據(jù)中還包含玩家之間交流時(shí)產(chǎn)生的超過(guò)1200萬(wàn)條消息。

CICERO的模型主要由兩部分組成,分別是「戰(zhàn)略推理」「自然語(yǔ)言處理」

兩項(xiàng)技術(shù)的整合使CICERO能夠針對(duì)玩家的動(dòng)機(jī)進(jìn)行推理并制定策略,然后使用自然語(yǔ)言進(jìn)行交流,達(dá)成一致以實(shí)現(xiàn)共同目標(biāo),形成聯(lián)盟并協(xié)調(diào)計(jì)劃,主要體現(xiàn)在「合作」、「談判」「協(xié)調(diào)」三方面。

例如,CICERO可以推斷在游戲的后期,它將需要某個(gè)特定玩家的支持,然后制定策略來(lái)贏得此人的青睞——甚至識(shí)別該玩家的風(fēng)險(xiǎn)和機(jī)會(huì)。

對(duì)話感知策略模塊能夠幫助CICERO預(yù)測(cè)其他玩家可能采取的行動(dòng),以及別的玩家認(rèn)為CICERO可能采取的行動(dòng),給定他們過(guò)去的對(duì)話和游戲板的狀態(tài)。

由此,CICERO將根據(jù)這些預(yù)測(cè)為自己和其他參與者制定互惠互利的計(jì)劃。這些規(guī)劃不僅能讓CICERO找到互利合作的機(jī)會(huì),也能幫助它在無(wú)法合作的時(shí)候找到有效的舉措。

CICERO中有一個(gè)可控對(duì)話模型,它與控制對(duì)話生成的戰(zhàn)略推理算法相結(jié)合。

圖片

可控對(duì)話模型允許CICERO在一組精心選擇的計(jì)劃中進(jìn)行對(duì)話,通常是對(duì)CICERO和其他玩家都有利的計(jì)劃。

CICERO的對(duì)話深深植根于正在進(jìn)行的游戲中的自由形式對(duì)話中生成的。

例如,CICERO可能會(huì)與另一位玩家協(xié)商戰(zhàn)術(shù)計(jì)劃,向盟友保證其意圖,討論游戲中更廣泛的戰(zhàn)略動(dòng)態(tài),甚至只是進(jìn)行隨意的閑聊——包括幾乎任何人類玩家可能會(huì)討論的內(nèi)容。

圖片

「西塞羅在使用自然語(yǔ)言與外交人員談判方面非常有效,以至于他們往往更喜歡與西塞羅合作,而不是其他人類參與者。」Meta在自家的Twitter中表示。

Meta AI副總裁兼首席人工智能科學(xué)家嚴(yán)樂(lè)存則認(rèn)為,「能夠在像外交這樣戰(zhàn)略極其復(fù)雜的游戲中上演人類級(jí)別的表現(xiàn),預(yù)示了人類與人工智能合作的巨大潛力」。

雖然CICERO只能玩外交,但這項(xiàng)成就背后的技術(shù)卻與許多現(xiàn)實(shí)世界的應(yīng)用息息相關(guān),例如通過(guò)規(guī)劃和RL控制自然語(yǔ)言的生成,可以緩解人類與人工智能模型之間的溝通障礙。

例如,今天的人工智能助手只能進(jìn)行簡(jiǎn)單的問(wèn)答,比如告訴你今天的天氣等,但如果他們通過(guò)長(zhǎng)期對(duì)話教你一項(xiàng)新技能呢?

亦或者想象一個(gè)視頻游戲,其中的非玩家角色 (NPC) 可以像人們一樣自由計(jì)劃和交談——了解你的動(dòng)機(jī)并相應(yīng)調(diào)整對(duì)話,從而幫助你完成攻城掠地的任務(wù)。

當(dāng)然,就連Meta自己也承認(rèn)「CICERO還不夠完美」——在游戲的某些重要時(shí)刻,CICERO經(jīng)常會(huì)出現(xiàn)十分離譜的錯(cuò)誤。

因此,Meta選擇將CICERO的代碼開(kāi)源發(fā)布,希望借助AI開(kāi)發(fā)者社區(qū)的力量進(jìn)一步完善它。

網(wǎng)友:請(qǐng)把小扎送上法庭!

全球首款與人類同等水平的「AI外交官」的發(fā)布,也引發(fā)了網(wǎng)友們的熱議。

不少網(wǎng)友紛紛表示:

「實(shí)在太期待這項(xiàng)研究接下來(lái)的發(fā)展了。」

「擊敗人類可以說(shuō)是最人性化的游戲。這簡(jiǎn)直太迷人了…」

圖片

圖片

雖然CICERO初出茅廬,卻也有人對(duì)這項(xiàng)「AI黑科技」在現(xiàn)實(shí)生活中的應(yīng)用前景進(jìn)行了展望:

「它能構(gòu)建一個(gè)版本來(lái)幫助應(yīng)對(duì)集體行動(dòng)挑戰(zhàn)嗎,比如#COP28?」

圖片

該網(wǎng)友所言的「COP28」,應(yīng)該是指第28屆聯(lián)合國(guó)氣候大會(huì)。

在剛剛結(jié)束的27屆氣候大會(huì)上,經(jīng)過(guò)持續(xù)數(shù)天的緊張談判,各國(guó)代表最終同意設(shè)立一個(gè)基金機(jī)制,以補(bǔ)償因氣候變化引發(fā)的損失和損害。

此外,CICERO的推出也引發(fā)了不少網(wǎng)友的擔(dān)心,「這將直接激勵(lì)研究人員建立擅長(zhǎng)欺騙的模型」。

圖片

「以模仿人類行為的方式欺騙并贏得外交游戲,可愛(ài)又有趣?!?/span>

「真不知道它還能用來(lái)做什么?我們需要警覺(jué)此類工具的發(fā)展?!?/span>

圖片

「人工智能很擅長(zhǎng)創(chuàng)作藝術(shù)等。但現(xiàn)在,它的說(shuō)服能力被『激活』了?!?/span>

「如果你能說(shuō)服一個(gè)人,就能控制他們的選擇,從而控制他們的生活。」

「因此最終結(jié)局會(huì)是——AI通過(guò)說(shuō)服來(lái)奴役人類!」

圖片

最后,也有不少人逗比的網(wǎng)友調(diào)侃道:

「這東西靠譜嗎?西塞羅最終可是被砍了頭的!」

「請(qǐng)將小扎送到海牙(國(guó)際法庭)!」

圖片

就在前兩天,因?yàn)閷⒅e言陳述為事實(shí),由Meta AI推出的大型語(yǔ)言模型Galactica上線僅3天便倉(cāng)皇下架。如今CICERO的推出,可謂是再一次在AI科技圈掀起了層層波瀾。

責(zé)任編輯:張燕妮 來(lái)源: 新智元
相關(guān)推薦

2022-12-02 15:25:03

2024-09-26 14:07:30

2022-10-26 11:42:18

AI元宇宙

2022-06-06 11:07:29

ARAI

2024-04-15 12:53:00

模型訓(xùn)練

2022-12-27 13:36:09

2021-12-20 10:07:35

AI 數(shù)據(jù)人工智能

2022-07-28 14:22:50

元宇宙AI

2019-10-31 14:37:55

技術(shù)人工智能開(kāi)發(fā)

2024-05-13 13:37:10

模型數(shù)據(jù)

2025-04-30 14:12:36

DeepSeekAIApp

2018-05-08 14:56:37

2023-06-20 09:24:20

AI開(kāi)源

2022-02-11 15:16:54

AI機(jī)器人技術(shù)

2024-10-30 13:13:07

2023-02-28 13:02:51

AIChatGPT

2023-09-28 12:06:23

AI模型

2022-06-06 14:27:14

Facebook算法扎克伯格

2023-04-18 17:23:00

Meta開(kāi)源

2024-02-02 21:39:04

AI模型
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)