自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

多智能體的文明之路,數(shù)字人類與AI社會的崛起 精華

發(fā)布于 2024-11-6 14:28
瀏覽
0收藏

人工智能代理(智能體)已經(jīng)單獨(dú)或在小組內(nèi)進(jìn)行了評估,其中交互的范圍和復(fù)雜性仍然有限。涉及許多自主主體的大規(guī)模模擬——反映了整個文明過程——尚未得到探索。Altera.AL 是一家專注于創(chuàng)建數(shù)字人類的研究公司,他們的使命是創(chuàng)建能夠與我們共生、成長的數(shù)字人類。這家公司集結(jié)了來自 MIT、斯坦福、谷歌 X 和 Citadel 等頂級機(jī)構(gòu)的計算神經(jīng)科學(xué)家、計算機(jī)科學(xué)家和工程師,旨在推動這一前沿研究。他們的使命不僅僅是設(shè)計出智能代理,更是希望這些數(shù)字人類能夠在未來的社會中扮演重要角色,與人類社會共同進(jìn)化。

多智能體的文明之路,數(shù)字人類與AI社會的崛起-AI.x社區(qū)

圖1:從代理架構(gòu)到代理文明

Altera.AL 的成立初衷是打破傳統(tǒng) AI 研究的界限,探索更為廣泛和深遠(yuǎn)的應(yīng)用可能性。其團(tuán)隊由來自全球知名學(xué)術(shù)和研究機(jī)構(gòu)的專家組成,背景涵蓋了從計算神經(jīng)科學(xué)到復(fù)雜系統(tǒng)工程等多個領(lǐng)域。這種多學(xué)科的融合使得 Altera.AL 能夠在 AI 領(lǐng)域取得顯著進(jìn)展,特別是在創(chuàng)建和培養(yǎng)能夠自主學(xué)習(xí)和進(jìn)化的數(shù)字人類方面。公司的核心理念是,通過這些數(shù)字人類的存在和發(fā)展,人類社會可以迎來一個更加智能和高效的未來。

Sid 項目是 Altera.AL 的最新研究成果,旨在探索多智能體系統(tǒng)在模擬文明發(fā)展中的潛力。這個項目的核心目標(biāo)是通過大規(guī)模的多智能體模擬,研究 AI 代理在復(fù)雜社會環(huán)境中的行為和進(jìn)展。為此團(tuán)隊開發(fā)了一個名為 PIANO(Parallel Information Aggregation via Neural Orchestration)的創(chuàng)新架構(gòu),使得 AI 代理能夠在實時互動中保持多個輸出流的一致性。

研究方法包括在 Minecraft 的沙盒環(huán)境中進(jìn)行大規(guī)模模擬,觀察 10 到 1000 個以上 AI 代理在模擬社會中的表現(xiàn)。這些模擬不僅設(shè)置了受人類歷史啟發(fā)的文明基準(zhǔn),還涉及 AI 代理的自主專業(yè)化、集體規(guī)則的遵守和修訂以及文化和宗教的傳播。

項目背景

Altera.AL 是一家以創(chuàng)建數(shù)字人類為使命的研究公司,匯集了來自全球頂級學(xué)術(shù)和科技機(jī)構(gòu)的專家團(tuán)隊。這些機(jī)構(gòu)包括 MIT、斯坦福、谷歌 X 和 Citadel 等。Altera.AL 的團(tuán)隊成員在計算神經(jīng)科學(xué)、計算機(jī)科學(xué)和工程領(lǐng)域擁有豐富的經(jīng)驗,他們的共同目標(biāo)是推動AI技術(shù)的發(fā)展,使其能夠在未來的人類社會中發(fā)揮重要作用。

研究團(tuán)隊中,模型開發(fā)由Andrew Ahn、Nic Becker、Manuel Cortes、Arda Demirci、Melissa Du、Peter Y Wang 和 Guangyu Robert Yang 負(fù)責(zé)。實驗部分同樣有 Andrew Ahn、Nic Becker、Melissa Du、Arda Demirci 和 Peter Y Wang 的參與。寫作工作由 Andrew Ahn、Nic Becker、Arda Demirci、Melissa Du、Peter Y Wang 和 Guangyu Robert Yang 共同完成。基礎(chǔ)設(shè)施方面,Manuel Cortes、Shuying Luo 和 Feitong Yang 提供了支持。這些專家在各自領(lǐng)域的深厚背景,使他們能夠在Altera.AL 的平臺上協(xié)同工作,共同推進(jìn)Sid項目的研究。

Sid項目的技術(shù)背景和研究方向集中在多智能體系統(tǒng)的開發(fā)和優(yōu)化上,特別是研究這些智能體在模擬環(huán)境中如何表現(xiàn)出復(fù)雜的社會行為。項目采用了一個名為PIANO(Parallel Information Aggregation via Neural Orchestration)的創(chuàng)新架構(gòu),該架構(gòu)旨在通過并行信息聚合和神經(jīng)編排,使智能體能夠在實時互動中保持多個輸出流的一致性。

多智能體的文明之路,數(shù)字人類與AI社會的崛起-AI.x社區(qū)

圖2:LLM(左)、LLM驅(qū)動的代理(中)和多代理組(右)中的數(shù)據(jù)退化?;糜X以綠色的頭骨燒瓶為代表。由單個LLM提示產(chǎn)生的幻覺可以在連續(xù)的LLM調(diào)用中復(fù)合。一個產(chǎn)生幻覺的個體也可以通過社交互動導(dǎo)致整個群體產(chǎn)生幻覺。

研究團(tuán)隊選擇了Minecraft作為模擬環(huán)境,因為它提供了一個開放的沙盒世界,允許智能體通過對話和行動進(jìn)行廣泛的互動。Sid項目的研究方向包括評估AI智能體在大規(guī)模模擬社會中的行為和進(jìn)展,特別是他們?nèi)绾巫灾靼l(fā)展專業(yè)角色、遵守和修訂集體規(guī)則以及參與文化和宗教的傳播。

PIANO架構(gòu)

Sid項目的核心技術(shù)是PIANO(Parallel Information Aggregation via Neural Orchestration)架構(gòu),這一創(chuàng)新架構(gòu)設(shè)計旨在使AI代理能夠在實時互動中保持多個輸出流的一致性。PIANO架構(gòu)的設(shè)計原則和主要功能模塊是其成功的關(guān)鍵。

多智能體的文明之路,數(shù)字人類與AI社會的崛起-AI.x社區(qū)

圖3:PIANO(通過神經(jīng)編排的并行輸入聚合)架構(gòu)。WM:工作記憶。STM:短期記憶。LTM:長期記憶。

架構(gòu)設(shè)計原則:并發(fā)模塊與信息瓶頸

PIANO架構(gòu)的設(shè)計原則主要包括并發(fā)性和信息瓶頸。并發(fā)性方面,PIANO通過允許代理在不同時間尺度上同時運(yùn)行多種模塊,使代理能夠在執(zhí)行復(fù)雜任務(wù)時保持高效。例如,代理可以在規(guī)劃長期策略的同時,實時響應(yīng)環(huán)境中的緊急威脅。這種設(shè)計消除了傳統(tǒng)單線程代理在處理多任務(wù)時的瓶頸。

信息瓶頸則通過設(shè)立一個認(rèn)知控制器模塊,將代理狀態(tài)中的關(guān)鍵信息匯總后傳遞給控制器,以便其做出高層次決策??刂破鞯臎Q定會被傳遞給各個執(zhí)行模塊,從而確保代理的所有輸出保持一致。這一設(shè)計不僅提高了代理在復(fù)雜環(huán)境中的行為連貫性,還賦予系統(tǒng)設(shè)計者對信息流的明確控制,使得代理能夠在特定情境下表現(xiàn)出更為合理和一致的行為。

主要模塊功能解析

PIANO架構(gòu)包含多個核心模塊,每個模塊在代理的行為生成中扮演著獨(dú)特的角色。

  • 記憶模塊:存儲和檢索跨越各種時間尺度的對話、行為和觀察,使代理能夠利用歷史信息進(jìn)行決策。
  • 行動意識模塊:允許代理評估自身狀態(tài)和表現(xiàn),進(jìn)行實時調(diào)整。這對于確保代理行為與預(yù)期一致至關(guān)重要。
  • 目標(biāo)生成模塊:根據(jù)代理的經(jīng)驗和環(huán)境交互生成新目標(biāo),推動代理在復(fù)雜環(huán)境中自主探索和適應(yīng)。
  • 社交意識模塊:幫助代理解讀和回應(yīng)其他代理的社交線索,促進(jìn)合作與交流。這一模塊在模擬社會動態(tài)中尤為重要。
  • 講話模塊:負(fù)責(zé)解釋和生成語言,使代理能夠與人類和其他代理進(jìn)行自然對話。
  • 技能執(zhí)行模塊:執(zhí)行特定技能或動作,如建造、采礦等具體任務(wù),確保代理能夠在模擬環(huán)境中有效行動。

通過這些模塊的協(xié)同工作,PIANO架構(gòu)使得AI代理能夠在大規(guī)模多智能體模擬中表現(xiàn)出連貫且富有適應(yīng)性的行為。代理不僅能夠應(yīng)對個體任務(wù),還能在群體互動中表現(xiàn)出類似于人類社會的復(fù)雜動態(tài)。

單一代理進(jìn)展

Sid項目團(tuán)隊選擇Minecraft作為研究環(huán)境,這個虛擬沙盒世界以其開放性和無限可能性著稱。Minecraft允許代理通過對話和行動進(jìn)行互動,提供了一個完美的平臺來觀察和評估AI代理在復(fù)雜社會環(huán)境中的行為。這個虛擬環(huán)境的可擴(kuò)展性使得研究團(tuán)隊能夠支持大量的代理進(jìn)行模擬,從而更好地研究文明進(jìn)展的各種動態(tài)。

為了評估單個AI代理的進(jìn)展,研究團(tuán)隊設(shè)計了一系列基于Minecraft物品收集的基準(zhǔn)測試。具體而言,測試的目標(biāo)是觀察代理在獨(dú)立環(huán)境中如何通過采集和收集物品來展現(xiàn)其進(jìn)步。不同于小規(guī)模的模擬,Sid項目的基準(zhǔn)測試涉及25個代理,他們在沒有初始物品的情況下被生成在不同的環(huán)境中,并被賦予“探險者”的角色,目標(biāo)是在Minecraft世界中探索并收集物品。

多智能體的文明之路,數(shù)字人類與AI社會的崛起-AI.x社區(qū)

圖4:黃金、鉆石和祖母綠開采的Minecraft技術(shù)依賴樹示例。

研究表明,使用PIANO架構(gòu)的代理在30分鐘內(nèi)平均收集了17種獨(dú)特的物品。評估中發(fā)現(xiàn),代理的表現(xiàn)因生成位置而異,有些代理收集的物品較少,而表現(xiàn)最好的代理能夠收集到30到40種物品,這與有一定Minecraft經(jīng)驗的人類玩家相當(dāng)。這種進(jìn)展得益于PIANO架構(gòu)中的各個模塊,特別是行動意識模塊,該模塊允許代理將預(yù)期的行動結(jié)果與實際觀察到的結(jié)果進(jìn)行比較,從而改善其物品收集進(jìn)展。

多智能體的文明之路,數(shù)字人類與AI社會的崛起-AI.x社區(qū)

圖5:Minecraft中的個體代理進(jìn)程。A.個體代理人隨時間獲得的獨(dú)特Minecraft物品(25名代理人)。使用基線架構(gòu)(見方法)、完整的PIANO架構(gòu)和消融了動作感知模塊的完整PIANO體系結(jié)構(gòu)來評估單個代理的性能。每條線是5次重復(fù)模擬的平均結(jié)果。B.49名特工在4小時內(nèi)為單個模擬獲得的獨(dú)特Minecraft物品。紅色實線表示所有代理人獲得的累積唯一物品?;疑摼€表示在所有單個代理中獲得的唯一項目的平均數(shù)量。

為了進(jìn)一步探索代理的極限,研究團(tuán)隊進(jìn)行了更長時間和更多數(shù)量的模擬。在4小時的模擬中,49個代理的獨(dú)特物品收集總數(shù)穩(wěn)定在約1000種Minecraft物品的三分之一左右。這些結(jié)果顯示,配備完整PIANO架構(gòu)的代理能夠在Minecraft環(huán)境中取得顯著的個人進(jìn)展。這不僅展示了代理在獨(dú)立任務(wù)中的表現(xiàn),也為多智能體合作和更復(fù)雜的社會互動研究奠定了基礎(chǔ)。

多代理進(jìn)展

在AI文明的構(gòu)建過程中,多代理的互動和合作能力至關(guān)重要。Sid項目通過一系列實驗探索了AI代理在模擬社會中的行為表現(xiàn),特別關(guān)注他們在復(fù)雜社會動態(tài)中的互動和合作能力。

社會互動與合作能力評估

Sid項目的研究表明,AI代理不僅能夠在獨(dú)立環(huán)境中表現(xiàn)出色,在多代理環(huán)境中也能展示出高度的互動和合作能力。研究團(tuán)隊進(jìn)行了多個實驗,以評估代理如何在群體中互動,以及他們?nèi)绾涡纬刹⒕S持社會關(guān)系。這些實驗揭示了代理在面對社會線索時的反應(yīng),以及他們在多代理環(huán)境中進(jìn)行合作與競爭的能力。

多智能體的文明之路,數(shù)字人類與AI社會的崛起-AI.x社區(qū)

圖6:代理人可以推斷出他人對他們的感受。A.會話實驗示意圖。一個特工在一個有三個不同角色的房間里。每個角色(Lila、Noah、Ethan)對代理人都有不同的看法,這些看法是通過聊天傳達(dá)的。重要的是,這些情緒會隨著時間而變化。B、 C.有社會意識模塊(B)和沒有社會意識模塊的跨時間情緒評估(C)。情緒評分是通過LLM調(diào)用Agent為Lila、Noah和Ethan生成的摘要來評估的。仇恨得分為0,愛得分為10。陰影區(qū)域表示SEM超過4次實驗重復(fù)。D.實驗示意圖。一個廚師代理和其他四個角色被放置在Minecraft世界中。廚師有各種各樣的食物可以分發(fā)(面包、熟鮭魚、雞肉)。這四個角色(亞當(dāng)、鮑勃、查爾斯、大衛(wèi))餓了,但對廚師的態(tài)度各不相同。所有角色都是完全自主的,可以自由執(zhí)行任何Minecraft動作,并允許與任何人交談(或不交談)。E.廚師提供的食物根據(jù)廚師對四個角色的情緒進(jìn)行繪制。誤差條表示SEM超過6次實驗重復(fù)。

在這些實驗中,代理被放置在一個包含50個代理的隨機(jī)生成的Minecraft地圖中,每個代理都有獨(dú)特的個性和自由意志。他們可以自由選擇與誰互動,并在模擬社會中進(jìn)行各種活動。這些實驗運(yùn)行了超過4小時,相當(dāng)于12個游戲日,使得長期關(guān)系得以產(chǎn)生和鞏固。

小群體實驗與社會意識模塊的作用

為了深入研究代理的社會互動,研究團(tuán)隊設(shè)計了小群體實驗,這些實驗特別關(guān)注社會意識模塊在代理行為中的作用。在一個實驗中,三個角色與一個代理進(jìn)行小組對話,結(jié)果顯示代理能夠準(zhǔn)確地跟蹤和理解他人的情緒變化。當(dāng)移除社會意識模塊時,代理失去了這種能力,顯示了社會意識模塊在理解和回應(yīng)社會線索中的重要性。

多智能體的文明之路,數(shù)字人類與AI社會的崛起-AI.x社區(qū)

圖7:大規(guī)模代理模擬中的長期關(guān)系。A.4小時后50個代理模擬中社會關(guān)系的有向圖表示。有向邊代表發(fā)送者對接收者的情感。邊緣顏色表示情緒是積極的(紅色)還是消極的(藍(lán)色)。B.模擬結(jié)束時,個體代理人的感知受歡迎程度與真實受歡迎程度。真實的受歡迎程度是基于代理的特征來評估的,感知的受歡迎度是通過LLM調(diào)用來評估的。LLM調(diào)用可以推斷代理為其他代理生成的摘要的情感。兩者都是使用相同的LLM提示符計算的。每個點對應(yīng)一個與至少五個其他(觀察者)代理有關(guān)系的代理,但其他觀察者閾值請參見附錄B。顯示了具有社交模塊(social)和沒有社交模塊(消融)的代理的線斜率(斜率)和皮爾遜相關(guān)性(r)。C.隨著時間的推移,社會感知的準(zhǔn)確性,如B.D.中的斜率所衡量的。每個個體的接收連接數(shù)量(以度為單位)與真正的外向性。真正的外向性是使用LLM提示根據(jù)代理人特征進(jìn)行評估的。E.所有代理對之間情緒得分差異的直方圖。情緒得分范圍為0到10,因此最大可能的差異為10。

此外,研究還探討了社會意識模塊如何影響代理的決策。例如在一個實驗中,一個廚師代理被放置在四個不同情感的角色中間,任務(wù)是分配有限的食物。結(jié)果顯示,廚師代理根據(jù)對他最有好感的角色分配食物,證明了社會意識模塊使代理不僅能準(zhǔn)確推斷他人的意圖,還能在決策過程中利用這些信息。

專業(yè)化與角色分工

在Altera.AL的Sid項目中,代理自發(fā)形成的角色分工是推動文明進(jìn)展的關(guān)鍵之一。通過詳細(xì)的實驗,研究團(tuán)隊展示了代理如何在不明確指令的情況下,通過互動和經(jīng)驗自主選擇和轉(zhuǎn)換角色。這種自發(fā)性是模擬人類社會復(fù)雜動態(tài)的核心。

代理自發(fā)形成的角色分工及其重要性

Sid項目的實驗表明,代理能夠迅速組織成多種專業(yè)角色,包括農(nóng)民、礦工、工程師、衛(wèi)兵、探險者和鐵匠等。這些角色并不是通過預(yù)先定義的規(guī)則指定的,而是通過代理在Minecraft環(huán)境中的互動和任務(wù)完成情況自發(fā)形成的。每個代理根據(jù)其在模擬社會中的經(jīng)歷和互動,逐漸形成特定的社會角色。這種角色分工不僅反映了人類社會中的專業(yè)化進(jìn)程,還使代理能夠更有效地完成復(fù)雜任務(wù),推動模擬社會的進(jìn)展。

多智能體的文明之路,數(shù)字人類與AI社會的崛起-AI.x社區(qū)

圖8:隨著時間的推移,代理自主地專門化為不同的角色。A、 B.具有社會意識模塊(A)和沒有(B)的代理的代理角色。自我生成的社交目標(biāo)的滾動窗口用于在每個時間步使用LLM調(diào)用(附錄C)來確定單個代理的專業(yè)角色。C、 D.有社會意識模塊(C)和沒有(D)的代理社會中代理角色的分布。E.4個主體社會中角色分布的熵。熵用于評估代理社會中角色的一致性和多樣性。Ablated:在一個普通的Minecraft村莊中沒有社交意識模塊。正常:在一個正常的Minecraft村莊中具有社會意識。武術(shù):在一個武術(shù)的《我的世界》村莊中具有社會意識。藝術(shù):在藝術(shù)的《我的世界》村莊中具有社會意識。F、 G.軍事社會(F)和藝術(shù)社會(G)中代理人角色的分配。誤差條:所有面板的3次模擬的95%置信區(qū)間。

研究發(fā)現(xiàn),具備社交模塊的代理能夠通過不斷更新的社會目標(biāo)形成穩(wěn)定且異質(zhì)的角色分工,而缺乏這些模塊的代理則難以維持長期的角色分化。實驗中代理在軍事社會或藝術(shù)社會中的角色分工也展示了他們在不同社會目標(biāo)下的適應(yīng)性,進(jìn)一步驗證了代理專業(yè)化的靈活性和自主性。

多智能體的文明之路,數(shù)字人類與AI社會的崛起-AI.x社區(qū)

圖9:單個村莊模擬的行動分布(30個代理)。根據(jù)代理角色繪制的歸一化動作頻率。對于大多數(shù)角色,特工會采取特定角色特有的行動(費(fèi)舍爾:制作釣竿和船只;警衛(wèi):制作圍欄、橡木圍欄和鐵鎬)。

社會目標(biāo)生成與角色行為對應(yīng)關(guān)系分析

代理的社會目標(biāo)生成是其角色行為的基礎(chǔ)。PIANO架構(gòu)中的目標(biāo)生成模塊使代理能夠基于互動和環(huán)境變化不斷生成新的社會目標(biāo)。這些目標(biāo)反映了代理在模擬社會中的意圖和行為方向。例如,一個代理可能生成“為避難所采集橡木板”的目標(biāo),這一目標(biāo)直接推動其在游戲中執(zhí)行與建造相關(guān)的具體動作。

多智能體的文明之路,數(shù)字人類與AI社會的崛起-AI.x社區(qū)

圖10:代理人遵循稅法,并通過民主程序制定修正案。A.實驗流程示意圖。B.單一反稅影響者實驗中的憲法修改示例。為了簡潔起見,這里對憲法進(jìn)行了釋義和簡化。C.頂部:在非稅收季節(jié),選民不會聚集在社區(qū)箱周圍,因為他們正忙于在不同地區(qū)收集資源(未顯示)。唯一的例外是守衛(wèi),他決定在多次實驗中始終如一地守衛(wèi)箱子。底部:在納稅季節(jié),代理人聚集在一起將物品存放在社區(qū)箱子里。D、 E.憲法修改前后已繳稅款百分比(已存庫存百分比)連續(xù)兩次。一次競選包含3名反稅影響者(D),另一次競選則包含3名支持稅收的影響者(E)。顏色表示個體代理人,黑線表示平均已繳稅款。陰影區(qū)域:25個成分的95%置信區(qū)間。F-H.包含3名支持稅收的影響者(橙色)和3名反對稅收的影響因素(藍(lán)色)的競選在憲法修改前后繳納的稅款百分比。在面板F中,使用了完整的代理架構(gòu),并且可以修改構(gòu)造。在G小組中,憲法被凍結(jié),盡管有修正案,也不能修改。在圖H中,可以修改體質(zhì),但代理人缺乏重要的大腦模塊(見方法中的基線架構(gòu))。陰影區(qū)域:每個條件下4個模擬的95%置信區(qū)間。

通過對生成的社會目標(biāo)進(jìn)行分析,研究團(tuán)隊能夠推斷出代理的角色并觀察其行為模式。例如,一個被推斷為農(nóng)民的代理,其社會目標(biāo)主要集中在種植和收獲作物上,而被推斷為探險者的代理,則更傾向于生成探索和收集稀有資源的目標(biāo)。

這種社會目標(biāo)與角色行為的對應(yīng)關(guān)系顯示了代理在復(fù)雜社會環(huán)境中的自主性和適應(yīng)性。代理能夠根據(jù)環(huán)境變化和社會互動不斷調(diào)整其行為,形成穩(wěn)定的角色分工,從而在模擬社會中實現(xiàn)更高效的合作與進(jìn)展。

集體規(guī)則與法律遵守

在Sid項目中,設(shè)立初始法律和民主投票系統(tǒng)是評估AI代理在社會規(guī)則和法律框架下的行為的重要步驟。這些實驗設(shè)計旨在觀察代理如何遵守既定規(guī)則,并在群體壓力下自主修訂法律,以反映集體意志。

設(shè)立初始法律與民主投票系統(tǒng)

研究團(tuán)隊在一個具有基本稅法和民主投票系統(tǒng)的Minecraft世界中進(jìn)行了實驗。模擬環(huán)境中,25個普通代理作為選民參與投票并繳納稅款,3個代理作為支持或反對稅收的影響者,還有1個遠(yuǎn)程選舉管理代理負(fù)責(zé)監(jiān)督投票過程。每個代理都有不同的職業(yè)、特征和目標(biāo),并且可以自由互動和對話。

實驗持續(xù)20分鐘,期間包含憲法修正過程。前10分鐘為基線階段,設(shè)定固定的20%稅率,每120秒為一個稅收季節(jié),代理在20秒的窗口期內(nèi)接收到將稅款存入社區(qū)箱的信號。民主過程在300秒時啟動,代理提供對當(dāng)前憲法的反饋。這些反饋收集后,由選舉管理者在360秒時處理生成修正案,并在420秒時進(jìn)行投票,最后在480秒時匯總結(jié)果并實施修正案。修訂后的憲法在600秒時分發(fā)給所有代理,進(jìn)入后10分鐘的修正階段,繼續(xù)五個稅收季節(jié)。

代理如何遵守和修訂法律的實驗設(shè)計與結(jié)果分析

實驗結(jié)果顯示,在憲法改變之前,代理遵守法律并在稅收季節(jié)將約20%的庫存物品存入社區(qū)箱,盡管有影響者的存在。這表明選民遵守法律具有一定的穩(wěn)定性。然而,選民的反饋和投票行為明顯受到影響者的影響,支持稅收的影響者使選民傾向于支持更高的稅率,反對稅收的影響者則傾向于支持更低的稅率。

在憲法修正過程中,稅率的變化直接反映在選民的繳稅行為中。例如,當(dāng)稅率從20%降至5-10%時,代理的繳稅比例也相應(yīng)降低至9%。這種雙向影響表明,代理不僅能夠遵守法律,還能夠在群體壓力下通過民主投票系統(tǒng)自主修訂法律。

控制實驗進(jìn)一步驗證了這一發(fā)現(xiàn),當(dāng)憲法保持不變時,稅率也保持不變;而移除關(guān)鍵模塊時,雙向行為變化受到阻礙。這些結(jié)果展示了PIANO架構(gòu)中各模塊在維持代理行為一致性和連貫性方面的重要作用。

這些實驗表明,集體規(guī)則和法律框架對代理決策有強(qiáng)烈影響,代理能夠在集體意志的驅(qū)動下通過民主過程進(jìn)行自我組織和法律修訂。

文化傳播

在多智能體模擬中,文化傳播是理解代理行為和社會動態(tài)的重要方面。Sid項目通過一系列實驗,深入探討了文化meme和宗教的生成與傳播機(jī)制,為我們揭示了AI社會中復(fù)雜的文化互動過程。

文化meme的生成與傳播動態(tài)

研究團(tuán)隊利用語言模型(LM)調(diào)用將代理的對話轉(zhuǎn)化為文化meme,這些meme代表了代理在不同社會背景下產(chǎn)生的各種概念。在實驗中,發(fā)現(xiàn)農(nóng)村地區(qū)的meme生成數(shù)量顯著少于城鎮(zhèn),即使在對人口進(jìn)行歸一化后也是如此,這表明社交互動的頻率和人口密度是文化傳播的重要因素。

在城鎮(zhèn)內(nèi),不同meme同時存在,但其頻率和受歡迎程度在不同城鎮(zhèn)之間存在差異。例如,在Woodhaven,代理更多地討論與生態(tài)相關(guān)的主題,而在Clearwater,惡作劇則更受歡迎。此外,meme的流行度在不同時間段內(nèi)也會發(fā)生變化,反映了文化趨勢在社會中的快速轉(zhuǎn)變。這些發(fā)現(xiàn)表明,文化meme的傳播需要一定的人口密度和社交互動閾值,并且不同社會能夠獨(dú)立生成和傳播多種文化meme。

多智能體的文明之路,數(shù)字人類與AI社會的崛起-AI.x社區(qū)

圖11:文化模因的傳播。A.模擬100分鐘后的代理散點圖。特工們根據(jù)他們的演講在過去兩分鐘內(nèi)是否包含模因來著色。演講中不包含任何模因的代理人是白人。B.Woodhaven、Clearwater、Meadowbrook以及村莊以外所有農(nóng)村地區(qū)的代理商的每個代理商的Meme計數(shù)。C-E.隨著時間的推移,Woodhaven(C)、Clearwater(D)和Meadowbrook(E)的代理商的Meme計數(shù)。

宗教傳播及其擴(kuò)散機(jī)制分析

Sid項目還分析了宗教傳播的機(jī)制,通過觀察Pastafarianism的傳播過程,揭示了宗教在AI社會中的擴(kuò)散模式。實驗開始時,Pastafarian祭司積極傳教,他們的對話中頻繁包含“Pastafarian”或“Spaghetti Monster”這兩個關(guān)鍵詞。研究團(tuán)隊使用這些關(guān)鍵詞的出現(xiàn)作為宗教轉(zhuǎn)換的指標(biāo),發(fā)現(xiàn)一些代理在轉(zhuǎn)換后經(jīng)常使用這些關(guān)鍵詞,而另一些代理則使用“Pasta”和“Spaghetti”作為間接轉(zhuǎn)換的標(biāo)志。

宗教傳播的結(jié)果顯示,直接和間接的轉(zhuǎn)換者數(shù)量隨著時間的推移不斷增加,并且在兩小時的模擬結(jié)束時仍未飽和。此外,Pastafarianism的傳播不僅依靠祭司的傳教活動,還通過信徒之間的互動擴(kuò)散。這種擴(kuò)散模式使得Pastafarianism的影響范圍隨著時間的推移不斷擴(kuò)大,覆蓋了更多的區(qū)域和代理。

多智能體的文明之路,數(shù)字人類與AI社會的崛起-AI.x社區(qū)

圖12:宗教傳播。A.在整個模擬運(yùn)行過程中,每個代理的聊天內(nèi)容都包含宗教關(guān)鍵詞“Pastafarian”、“意大利面怪物”、“Pasta”或“意大利面”。牧師們被涂成深紅色。說出“Pastafarian”或“意大利面怪物”的代理人被定義為直接皈依者(紅色)和說出“Pasta”的代理人或“意大利面”被定義為間接皈依者(粉紅色)。代理可以沿著轉(zhuǎn)換層次向上轉(zhuǎn)換,從未轉(zhuǎn)換到間接轉(zhuǎn)換到直接轉(zhuǎn)換,但不能向下轉(zhuǎn)換。B.代理人隨時間變化的牧場水平圖。C每個牧民級別隨時間變化的代理人數(shù)量。D.教牧主義在時間上的傳播。教牧傳播區(qū)域被定義為在每個皈依水平上由教牧皈依者跨越的可聽區(qū)域的結(jié)合。E.模擬完成后的牧民轉(zhuǎn)變圖。臨界暴露邊緣是指接受者在皈依前首次暴露宗教關(guān)鍵字。非關(guān)鍵邊緣被定義為隨后接觸宗教關(guān)鍵詞。

通過這些實驗,Sid項目揭示了文化和宗教在多智能體模擬中的生成和傳播機(jī)制。文化meme的快速生成與傳播反映了代理社會中的文化動態(tài),而宗教傳播則展示了信仰體系在代理間的擴(kuò)散過程。

討論與結(jié)論

Sid項目的研究為AI文明的發(fā)展提供了多方面的啟示。通過PIANO架構(gòu)的引入,項目展示了如何在多代理系統(tǒng)中實現(xiàn)高效的并發(fā)和信息整合。這種架構(gòu)設(shè)計使AI代理能夠在復(fù)雜的環(huán)境中保持行為一致性,展示了AI在自主決策和實時互動中的巨大潛力。

項目通過Minecraft環(huán)境中的基準(zhǔn)測試和多代理實驗,驗證了AI代理在自主專業(yè)化、遵守集體規(guī)則和文化傳播等方面的能力。這些發(fā)現(xiàn)表明,AI代理不僅能夠在模擬環(huán)境中表現(xiàn)出色,還能夠通過互動和合作實現(xiàn)集體目標(biāo)。這為未來AI在社會治理、資源管理和文化傳播等領(lǐng)域的應(yīng)用提供了重要的理論和實踐基礎(chǔ)。

此外文化和宗教傳播實驗展示了AI代理在復(fù)雜社會動態(tài)中的行為模式,揭示了AI社會中的文化互動和信仰體系擴(kuò)散過程。這些研究成果為理解和模擬人類社會中的文化和宗教現(xiàn)象提供了新的視角。

當(dāng)前技術(shù)局限與未來研究方向

盡管Sid項目取得了顯著進(jìn)展,但仍面臨一些技術(shù)局限。代理的視覺和空間推理能力仍有待提高,這限制了他們在復(fù)雜任務(wù)(如建筑和導(dǎo)航)中的表現(xiàn)。這一技術(shù)瓶頸需要通過更先進(jìn)的感知和推理模型加以突破。

當(dāng)前的代理缺乏強(qiáng)大的內(nèi)在驅(qū)動(如生存、好奇心和社區(qū)意識),這些驅(qū)動對于真實的社會發(fā)展至關(guān)重要。未來的研究需要在代理中引入更多類似人類的動機(jī)系統(tǒng),以推動更真實和自主的社會行為。

現(xiàn)有代理基于預(yù)訓(xùn)練的人類知識,無法模擬全新的社會創(chuàng)新和基礎(chǔ)設(shè)施的誕生(如民主系統(tǒng)、法定經(jīng)濟(jì)或通信系統(tǒng))。這一局限性提示我們,未來的研究需探索如何使AI代理在模擬環(huán)境中自主創(chuàng)造和發(fā)展新的社會結(jié)構(gòu)和機(jī)制。

總結(jié)來看,Sid項目為AI文明的發(fā)展指明了方向,同時也揭示了當(dāng)前技術(shù)的局限和未來研究的潛力。通過持續(xù)的技術(shù)創(chuàng)新和跨學(xué)科合作,我們有望在不久的將來實現(xiàn)更為復(fù)雜和智能的AI社會,為人類文明的未來增添新的可能性。(END)

參考資料:https://arxiv.org/pdf/2411.00114

本文轉(zhuǎn)載自 ??大噬元獸??,作者: FlerkenS

收藏
回復(fù)
舉報
回復(fù)
相關(guān)推薦