自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<sub id="5sokf"></sub>

^{<blockquote id="5sokf"></blockquote>}

<sub id="5sokf"></sub>

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺

51CTO學(xué)堂

IT職業(yè)在線教育平臺

多智能體的文明之路，數(shù)字人類與AI社會的崛起精華

發(fā)布于 2024-11-6 14:28

瀏覽

0收藏

人工智能代理（智能體）已經(jīng)單獨(dú)或在小組內(nèi)進(jìn)行了評估，其中交互的范圍和復(fù)雜性仍然有限。涉及許多自主主體的大規(guī)模模擬——反映了整個文明過程——尚未得到探索。Altera.AL 是一家專注于創(chuàng)建數(shù)字人類的研究公司，他們的使命是創(chuàng)建能夠與我們共生、成長的數(shù)字人類。這家公司集結(jié)了來自 MIT、斯坦福、谷歌 X 和 Citadel 等頂級機(jī)構(gòu)的計算神經(jīng)科學(xué)家、計算機(jī)科學(xué)家和工程師，旨在推動這一前沿研究。他們的使命不僅僅是設(shè)計出智能代理，更是希望這些數(shù)字人類能夠在未來的社會中扮演重要角色，與人類社會共同進(jìn)化。

多智能體的文明之路，數(shù)字人類與AI社會的崛起-AI.x社區(qū)

圖1：從代理架構(gòu)到代理文明

Altera.AL 的成立初衷是打破傳統(tǒng) AI 研究的界限，探索更為廣泛和深遠(yuǎn)的應(yīng)用可能性。其團(tuán)隊由來自全球知名學(xué)術(shù)和研究機(jī)構(gòu)的專家組成，背景涵蓋了從計算神經(jīng)科學(xué)到復(fù)雜系統(tǒng)工程等多個領(lǐng)域。這種多學(xué)科的融合使得 Altera.AL 能夠在 AI 領(lǐng)域取得顯著進(jìn)展，特別是在創(chuàng)建和培養(yǎng)能夠自主學(xué)習(xí)和進(jìn)化的數(shù)字人類方面。公司的核心理念是，通過這些數(shù)字人類的存在和發(fā)展，人類社會可以迎來一個更加智能和高效的未來。

Sid 項目是 Altera.AL 的最新研究成果，旨在探索多智能體系統(tǒng)在模擬文明發(fā)展中的潛力。這個項目的核心目標(biāo)是通過大規(guī)模的多智能體模擬，研究 AI 代理在復(fù)雜社會環(huán)境中的行為和進(jìn)展。為此團(tuán)隊開發(fā)了一個名為 PIANO（Parallel Information Aggregation via Neural Orchestration）的創(chuàng)新架構(gòu)，使得 AI 代理能夠在實時互動中保持多個輸出流的一致性。

研究方法包括在 Minecraft 的沙盒環(huán)境中進(jìn)行大規(guī)模模擬，觀察 10 到 1000 個以上 AI 代理在模擬社會中的表現(xiàn)。這些模擬不僅設(shè)置了受人類歷史啟發(fā)的文明基準(zhǔn)，還涉及 AI 代理的自主專業(yè)化、集體規(guī)則的遵守和修訂以及文化和宗教的傳播。

項目背景

Altera.AL 是一家以創(chuàng)建數(shù)字人類為使命的研究公司，匯集了來自全球頂級學(xué)術(shù)和科技機(jī)構(gòu)的專家團(tuán)隊。這些機(jī)構(gòu)包括 MIT、斯坦福、谷歌 X 和 Citadel 等。Altera.AL 的團(tuán)隊成員在計算神經(jīng)科學(xué)、計算機(jī)科學(xué)和工程領(lǐng)域擁有豐富的經(jīng)驗，他們的共同目標(biāo)是推動AI技術(shù)的發(fā)展，使其能夠在未來的人類社會中發(fā)揮重要作用。

研究團(tuán)隊中，模型開發(fā)由Andrew Ahn、Nic Becker、Manuel Cortes、Arda Demirci、Melissa Du、Peter Y Wang 和 Guangyu Robert Yang 負(fù)責(zé)。實驗部分同樣有 Andrew Ahn、Nic Becker、Melissa Du、Arda Demirci 和 Peter Y Wang 的參與。寫作工作由 Andrew Ahn、Nic Becker、Arda Demirci、Melissa Du、Peter Y Wang 和 Guangyu Robert Yang 共同完成。基礎(chǔ)設(shè)施方面，Manuel Cortes、Shuying Luo 和 Feitong Yang 提供了支持。這些專家在各自領(lǐng)域的深厚背景，使他們能夠在Altera.AL 的平臺上協(xié)同工作，共同推進(jìn)Sid項目的研究。

Sid項目的技術(shù)背景和研究方向集中在多智能體系統(tǒng)的開發(fā)和優(yōu)化上，特別是研究這些智能體在模擬環(huán)境中如何表現(xiàn)出復(fù)雜的社會行為。項目采用了一個名為PIANO（Parallel Information Aggregation via Neural Orchestration）的創(chuàng)新架構(gòu)，該架構(gòu)旨在通過并行信息聚合和神經(jīng)編排，使智能體能夠在實時互動中保持多個輸出流的一致性。

多智能體的文明之路，數(shù)字人類與AI社會的崛起-AI.x社區(qū)

圖2:LLM（左）、LLM驅(qū)動的代理（中）和多代理組（右）中的數(shù)據(jù)退化?；糜X以綠色的頭骨燒瓶為代表。由單個LLM提示產(chǎn)生的幻覺可以在連續(xù)的LLM調(diào)用中復(fù)合。一個產(chǎn)生幻覺的個體也可以通過社交互動導(dǎo)致整個群體產(chǎn)生幻覺。

研究團(tuán)隊選擇了Minecraft作為模擬環(huán)境，因為它提供了一個開放的沙盒世界，允許智能體通過對話和行動進(jìn)行廣泛的互動。Sid項目的研究方向包括評估AI智能體在大規(guī)模模擬社會中的行為和進(jìn)展，特別是他們?nèi)绾巫灾靼l(fā)展專業(yè)角色、遵守和修訂集體規(guī)則以及參與文化和宗教的傳播。

PIANO架構(gòu)

Sid項目的核心技術(shù)是PIANO（Parallel Information Aggregation via Neural Orchestration）架構(gòu)，這一創(chuàng)新架構(gòu)設(shè)計旨在使AI代理能夠在實時互動中保持多個輸出流的一致性。PIANO架構(gòu)的設(shè)計原則和主要功能模塊是其成功的關(guān)鍵。

多智能體的文明之路，數(shù)字人類與AI社會的崛起-AI.x社區(qū)

圖3:PIANO（通過神經(jīng)編排的并行輸入聚合）架構(gòu)。WM：工作記憶。STM：短期記憶。LTM：長期記憶。

架構(gòu)設(shè)計原則：并發(fā)模塊與信息瓶頸

PIANO架構(gòu)的設(shè)計原則主要包括并發(fā)性和信息瓶頸。并發(fā)性方面，PIANO通過允許代理在不同時間尺度上同時運(yùn)行多種模塊，使代理能夠在執(zhí)行復(fù)雜任務(wù)時保持高效。例如，代理可以在規(guī)劃長期策略的同時，實時響應(yīng)環(huán)境中的緊急威脅。這種設(shè)計消除了傳統(tǒng)單線程代理在處理多任務(wù)時的瓶頸。

信息瓶頸則通過設(shè)立一個認(rèn)知控制器模塊，將代理狀態(tài)中的關(guān)鍵信息匯總后傳遞給控制器，以便其做出高層次決策?？刂破鞯臎Q定會被傳遞給各個執(zhí)行模塊，從而確保代理的所有輸出保持一致。這一設(shè)計不僅提高了代理在復(fù)雜環(huán)境中的行為連貫性，還賦予系統(tǒng)設(shè)計者對信息流的明確控制，使得代理能夠在特定情境下表現(xiàn)出更為合理和一致的行為。

主要模塊功能解析

PIANO架構(gòu)包含多個核心模塊，每個模塊在代理的行為生成中扮演著獨(dú)特的角色。

記憶模塊：存儲和檢索跨越各種時間尺度的對話、行為和觀察，使代理能夠利用歷史信息進(jìn)行決策。
行動意識模塊：允許代理評估自身狀態(tài)和表現(xiàn)，進(jìn)行實時調(diào)整。這對于確保代理行為與預(yù)期一致至關(guān)重要。
目標(biāo)生成模塊：根據(jù)代理的經(jīng)驗和環(huán)境交互生成新目標(biāo)，推動代理在復(fù)雜環(huán)境中自主探索和適應(yīng)。
社交意識模塊：幫助代理解讀和回應(yīng)其他代理的社交線索，促進(jìn)合作與交流。這一模塊在模擬社會動態(tài)中尤為重要。
講話模塊：負(fù)責(zé)解釋和生成語言，使代理能夠與人類和其他代理進(jìn)行自然對話。
技能執(zhí)行模塊：執(zhí)行特定技能或動作，如建造、采礦等具體任務(wù)，確保代理能夠在模擬環(huán)境中有效行動。

通過這些模塊的協(xié)同工作，PIANO架構(gòu)使得AI代理能夠在大規(guī)模多智能體模擬中表現(xiàn)出連貫且富有適應(yīng)性的行為。代理不僅能夠應(yīng)對個體任務(wù)，還能在群體互動中表現(xiàn)出類似于人類社會的復(fù)雜動態(tài)。

單一代理進(jìn)展

Sid項目團(tuán)隊選擇Minecraft作為研究環(huán)境，這個虛擬沙盒世界以其開放性和無限可能性著稱。Minecraft允許代理通過對話和行動進(jìn)行互動，提供了一個完美的平臺來觀察和評估AI代理在復(fù)雜社會環(huán)境中的行為。這個虛擬環(huán)境的可擴(kuò)展性使得研究團(tuán)隊能夠支持大量的代理進(jìn)行模擬，從而更好地研究文明進(jìn)展的各種動態(tài)。

為了評估單個AI代理的進(jìn)展，研究團(tuán)隊設(shè)計了一系列基于Minecraft物品收集的基準(zhǔn)測試。具體而言，測試的目標(biāo)是觀察代理在獨(dú)立環(huán)境中如何通過采集和收集物品來展現(xiàn)其進(jìn)步。不同于小規(guī)模的模擬，Sid項目的基準(zhǔn)測試涉及25個代理，他們在沒有初始物品的情況下被生成在不同的環(huán)境中，并被賦予“探險者”的角色，目標(biāo)是在Minecraft世界中探索并收集物品。

多智能體的文明之路，數(shù)字人類與AI社會的崛起-AI.x社區(qū)

圖4：黃金、鉆石和祖母綠開采的Minecraft技術(shù)依賴樹示例。

研究表明，使用PIANO架構(gòu)的代理在30分鐘內(nèi)平均收集了17種獨(dú)特的物品。評估中發(fā)現(xiàn)，代理的表現(xiàn)因生成位置而異，有些代理收集的物品較少，而表現(xiàn)最好的代理能夠收集到30到40種物品，這與有一定Minecraft經(jīng)驗的人類玩家相當(dāng)。這種進(jìn)展得益于PIANO架構(gòu)中的各個模塊，特別是行動意識模塊，該模塊允許代理將預(yù)期的行動結(jié)果與實際觀察到的結(jié)果進(jìn)行比較，從而改善其物品收集進(jìn)展。

多智能體的文明之路，數(shù)字人類與AI社會的崛起-AI.x社區(qū)

圖5:Minecraft中的個體代理進(jìn)程。A.個體代理人隨時間獲得的獨(dú)特Minecraft物品（25名代理人）。使用基線架構(gòu)（見方法）、完整的PIANO架構(gòu)和消融了動作感知模塊的完整PIANO體系結(jié)構(gòu)來評估單個代理的性能。每條線是5次重復(fù)模擬的平均結(jié)果。B.49名特工在4小時內(nèi)為單個模擬獲得的獨(dú)特Minecraft物品。紅色實線表示所有代理人獲得的累積唯一物品?；疑摼€表示在所有單個代理中獲得的唯一項目的平均數(shù)量。

為了進(jìn)一步探索代理的極限，研究團(tuán)隊進(jìn)行了更長時間和更多數(shù)量的模擬。在4小時的模擬中，49個代理的獨(dú)特物品收集總數(shù)穩(wěn)定在約1000種Minecraft物品的三分之一左右。這些結(jié)果顯示，配備完整PIANO架構(gòu)的代理能夠在Minecraft環(huán)境中取得顯著的個人進(jìn)展。這不僅展示了代理在獨(dú)立任務(wù)中的表現(xiàn)，也為多智能體合作和更復(fù)雜的社會互動研究奠定了基礎(chǔ)。

多代理進(jìn)展

在AI文明的構(gòu)建過程中，多代理的互動和合作能力至關(guān)重要。Sid項目通過一系列實驗探索了AI代理在模擬社會中的行為表現(xiàn)，特別關(guān)注他們在復(fù)雜社會動態(tài)中的互動和合作能力。

社會互動與合作能力評估

Sid項目的研究表明，AI代理不僅能夠在獨(dú)立環(huán)境中表現(xiàn)出色，在多代理環(huán)境中也能展示出高度的互動和合作能力。研究團(tuán)隊進(jìn)行了多個實驗，以評估代理如何在群體中互動，以及他們?nèi)绾涡纬刹⒕S持社會關(guān)系。這些實驗揭示了代理在面對社會線索時的反應(yīng)，以及他們在多代理環(huán)境中進(jìn)行合作與競爭的能力。

多智能體的文明之路，數(shù)字人類與AI社會的崛起-AI.x社區(qū)

圖6：代理人可以推斷出他人對他們的感受。A.會話實驗示意圖。一個特工在一個有三個不同角色的房間里。每個角色（Lila、Noah、Ethan）對代理人都有不同的看法，這些看法是通過聊天傳達(dá)的。重要的是，這些情緒會隨著時間而變化。B、 C.有社會意識模塊（B）和沒有社會意識模塊的跨時間情緒評估（C）。情緒評分是通過LLM調(diào)用Agent為Lila、Noah和Ethan生成的摘要來評估的。仇恨得分為0，愛得分為10。陰影區(qū)域表示SEM超過4次實驗重復(fù)。D.實驗示意圖。一個廚師代理和其他四個角色被放置在Minecraft世界中。廚師有各種各樣的食物可以分發(fā)（面包、熟鮭魚、雞肉）。這四個角色（亞當(dāng)、鮑勃、查爾斯、大衛(wèi)）餓了，但對廚師的態(tài)度各不相同。所有角色都是完全自主的，可以自由執(zhí)行任何Minecraft動作，并允許與任何人交談（或不交談）。E.廚師提供的食物根據(jù)廚師對四個角色的情緒進(jìn)行繪制。誤差條表示SEM超過6次實驗重復(fù)。

在這些實驗中，代理被放置在一個包含50個代理的隨機(jī)生成的Minecraft地圖中，每個代理都有獨(dú)特的個性和自由意志。他們可以自由選擇與誰互動，并在模擬社會中進(jìn)行各種活動。這些實驗運(yùn)行了超過4小時，相當(dāng)于12個游戲日，使得長期關(guān)系得以產(chǎn)生和鞏固。

小群體實驗與社會意識模塊的作用

為了深入研究代理的社會互動，研究團(tuán)隊設(shè)計了小群體實驗，這些實驗特別關(guān)注社會意識模塊在代理行為中的作用。在一個實驗中，三個角色與一個代理進(jìn)行小組對話，結(jié)果顯示代理能夠準(zhǔn)確地跟蹤和理解他人的情緒變化。當(dāng)移除社會意識模塊時，代理失去了這種能力，顯示了社會意識模塊在理解和回應(yīng)社會線索中的重要性。

多智能體的文明之路，數(shù)字人類與AI社會的崛起-AI.x社區(qū)

圖7：大規(guī)模代理模擬中的長期關(guān)系。A.4小時后50個代理模擬中社會關(guān)系的有向圖表示。有向邊代表發(fā)送者對接收者的情感。邊緣顏色表示情緒是積極的（紅色）還是消極的（藍(lán)色）。B.模擬結(jié)束時，個體代理人的感知受歡迎程度與真實受歡迎程度。真實的受歡迎程度是基于代理的特征來評估的，感知的受歡迎度是通過LLM調(diào)用來評估的。LLM調(diào)用可以推斷代理為其他代理生成的摘要的情感。兩者都是使用相同的LLM提示符計算的。每個點對應(yīng)一個與至少五個其他（觀察者）代理有關(guān)系的代理，但其他觀察者閾值請參見附錄B。顯示了具有社交模塊（social）和沒有社交模塊（消融）的代理的線斜率（斜率）和皮爾遜相關(guān)性（r）。C.隨著時間的推移，社會感知的準(zhǔn)確性，如B.D.中的斜率所衡量的。每個個體的接收連接數(shù)量（以度為單位）與真正的外向性。真正的外向性是使用LLM提示根據(jù)代理人特征進(jìn)行評估的。E.所有代理對之間情緒得分差異的直方圖。情緒得分范圍為0到10，因此最大可能的差異為10。

此外，研究還探討了社會意識模塊如何影響代理的決策。例如在一個實驗中，一個廚師代理被放置在四個不同情感的角色中間，任務(wù)是分配有限的食物。結(jié)果顯示，廚師代理根據(jù)對他最有好感的角色分配食物，證明了社會意識模塊使代理不僅能準(zhǔn)確推斷他人的意圖，還能在決策過程中利用這些信息。

專業(yè)化與角色分工

在Altera.AL的Sid項目中，代理自發(fā)形成的角色分工是推動文明進(jìn)展的關(guān)鍵之一。通過詳細(xì)的實驗，研究團(tuán)隊展示了代理如何在不明確指令的情況下，通過互動和經(jīng)驗自主選擇和轉(zhuǎn)換角色。這種自發(fā)性是模擬人類社會復(fù)雜動態(tài)的核心。

代理自發(fā)形成的角色分工及其重要性

Sid項目的實驗表明，代理能夠迅速組織成多種專業(yè)角色，包括農(nóng)民、礦工、工程師、衛(wèi)兵、探險者和鐵匠等。這些角色并不是通過預(yù)先定義的規(guī)則指定的，而是通過代理在Minecraft環(huán)境中的互動和任務(wù)完成情況自發(fā)形成的。每個代理根據(jù)其在模擬社會中的經(jīng)歷和互動，逐漸形成特定的社會角色。這種角色分工不僅反映了人類社會中的專業(yè)化進(jìn)程，還使代理能夠更有效地完成復(fù)雜任務(wù)，推動模擬社會的進(jìn)展。

多智能體的文明之路，數(shù)字人類與AI社會的崛起-AI.x社區(qū)

圖8：隨著時間的推移，代理自主地專門化為不同的角色。A、 B.具有社會意識模塊（A）和沒有（B）的代理的代理角色。自我生成的社交目標(biāo)的滾動窗口用于在每個時間步使用LLM調(diào)用（附錄C）來確定單個代理的專業(yè)角色。C、 D.有社會意識模塊（C）和沒有（D）的代理社會中代理角色的分布。E.4個主體社會中角色分布的熵。熵用于評估代理社會中角色的一致性和多樣性。Ablated：在一個普通的Minecraft村莊中沒有社交意識模塊。正常：在一個正常的Minecraft村莊中具有社會意識。武術(shù)：在一個武術(shù)的《我的世界》村莊中具有社會意識。藝術(shù)：在藝術(shù)的《我的世界》村莊中具有社會意識。F、 G.軍事社會（F）和藝術(shù)社會（G）中代理人角色的分配。誤差條：所有面板的3次模擬的95%置信區(qū)間。

研究發(fā)現(xiàn)，具備社交模塊的代理能夠通過不斷更新的社會目標(biāo)形成穩(wěn)定且異質(zhì)的角色分工，而缺乏這些模塊的代理則難以維持長期的角色分化。實驗中代理在軍事社會或藝術(shù)社會中的角色分工也展示了他們在不同社會目標(biāo)下的適應(yīng)性，進(jìn)一步驗證了代理專業(yè)化的靈活性和自主性。

多智能體的文明之路，數(shù)字人類與AI社會的崛起-AI.x社區(qū)

圖9：單個村莊模擬的行動分布（30個代理）。根據(jù)代理角色繪制的歸一化動作頻率。對于大多數(shù)角色，特工會采取特定角色特有的行動（費(fèi)舍爾：制作釣竿和船只；警衛(wèi)：制作圍欄、橡木圍欄和鐵鎬）。

社會目標(biāo)生成與角色行為對應(yīng)關(guān)系分析

代理的社會目標(biāo)生成是其角色行為的基礎(chǔ)。PIANO架構(gòu)中的目標(biāo)生成模塊使代理能夠基于互動和環(huán)境變化不斷生成新的社會目標(biāo)。這些目標(biāo)反映了代理在模擬社會中的意圖和行為方向。例如，一個代理可能生成“為避難所采集橡木板”的目標(biāo)，這一目標(biāo)直接推動其在游戲中執(zhí)行與建造相關(guān)的具體動作。

多智能體的文明之路，數(shù)字人類與AI社會的崛起-AI.x社區(qū)

圖10：代理人遵循稅法，并通過民主程序制定修正案。A.實驗流程示意圖。B.單一反稅影響者實驗中的憲法修改示例。為了簡潔起見，這里對憲法進(jìn)行了釋義和簡化。C.頂部：在非稅收季節(jié)，選民不會聚集在社區(qū)箱周圍，因為他們正忙于在不同地區(qū)收集資源（未顯示）。唯一的例外是守衛(wèi)，他決定在多次實驗中始終如一地守衛(wèi)箱子。底部：在納稅季節(jié)，代理人聚集在一起將物品存放在社區(qū)箱子里。D、 E.憲法修改前后已繳稅款百分比（已存庫存百分比）連續(xù)兩次。一次競選包含3名反稅影響者（D），另一次競選則包含3名支持稅收的影響者（E）。顏色表示個體代理人，黑線表示平均已繳稅款。陰影區(qū)域：25個成分的95%置信區(qū)間。F-H.包含3名支持稅收的影響者（橙色）和3名反對稅收的影響因素（藍(lán)色）的競選在憲法修改前后繳納的稅款百分比。在面板F中，使用了完整的代理架構(gòu)，并且可以修改構(gòu)造。在G小組中，憲法被凍結(jié)，盡管有修正案，也不能修改。在圖H中，可以修改體質(zhì)，但代理人缺乏重要的大腦模塊（見方法中的基線架構(gòu)）。陰影區(qū)域：每個條件下4個模擬的95%置信區(qū)間。

通過對生成的社會目標(biāo)進(jìn)行分析，研究團(tuán)隊能夠推斷出代理的角色并觀察其行為模式。例如，一個被推斷為農(nóng)民的代理，其社會目標(biāo)主要集中在種植和收獲作物上，而被推斷為探險者的代理，則更傾向于生成探索和收集稀有資源的目標(biāo)。

這種社會目標(biāo)與角色行為的對應(yīng)關(guān)系顯示了代理在復(fù)雜社會環(huán)境中的自主性和適應(yīng)性。代理能夠根據(jù)環(huán)境變化和社會互動不斷調(diào)整其行為，形成穩(wěn)定的角色分工，從而在模擬社會中實現(xiàn)更高效的合作與進(jìn)展。

集體規(guī)則與法律遵守

在Sid項目中，設(shè)立初始法律和民主投票系統(tǒng)是評估AI代理在社會規(guī)則和法律框架下的行為的重要步驟。這些實驗設(shè)計旨在觀察代理如何遵守既定規(guī)則，并在群體壓力下自主修訂法律，以反映集體意志。

設(shè)立初始法律與民主投票系統(tǒng)

研究團(tuán)隊在一個具有基本稅法和民主投票系統(tǒng)的Minecraft世界中進(jìn)行了實驗。模擬環(huán)境中，25個普通代理作為選民參與投票并繳納稅款，3個代理作為支持或反對稅收的影響者，還有1個遠(yuǎn)程選舉管理代理負(fù)責(zé)監(jiān)督投票過程。每個代理都有不同的職業(yè)、特征和目標(biāo)，并且可以自由互動和對話。

實驗持續(xù)20分鐘，期間包含憲法修正過程。前10分鐘為基線階段，設(shè)定固定的20%稅率，每120秒為一個稅收季節(jié)，代理在20秒的窗口期內(nèi)接收到將稅款存入社區(qū)箱的信號。民主過程在300秒時啟動，代理提供對當(dāng)前憲法的反饋。這些反饋收集后，由選舉管理者在360秒時處理生成修正案，并在420秒時進(jìn)行投票，最后在480秒時匯總結(jié)果并實施修正案。修訂后的憲法在600秒時分發(fā)給所有代理，進(jìn)入后10分鐘的修正階段，繼續(xù)五個稅收季節(jié)。

代理如何遵守和修訂法律的實驗設(shè)計與結(jié)果分析

實驗結(jié)果顯示，在憲法改變之前，代理遵守法律并在稅收季節(jié)將約20%的庫存物品存入社區(qū)箱，盡管有影響者的存在。這表明選民遵守法律具有一定的穩(wěn)定性。然而，選民的反饋和投票行為明顯受到影響者的影響，支持稅收的影響者使選民傾向于支持更高的稅率，反對稅收的影響者則傾向于支持更低的稅率。

在憲法修正過程中，稅率的變化直接反映在選民的繳稅行為中。例如，當(dāng)稅率從20%降至5-10%時，代理的繳稅比例也相應(yīng)降低至9%。這種雙向影響表明，代理不僅能夠遵守法律，還能夠在群體壓力下通過民主投票系統(tǒng)自主修訂法律。

控制實驗進(jìn)一步驗證了這一發(fā)現(xiàn)，當(dāng)憲法保持不變時，稅率也保持不變；而移除關(guān)鍵模塊時，雙向行為變化受到阻礙。這些結(jié)果展示了PIANO架構(gòu)中各模塊在維持代理行為一致性和連貫性方面的重要作用。

這些實驗表明，集體規(guī)則和法律框架對代理決策有強(qiáng)烈影響，代理能夠在集體意志的驅(qū)動下通過民主過程進(jìn)行自我組織和法律修訂。

文化傳播

在多智能體模擬中，文化傳播是理解代理行為和社會動態(tài)的重要方面。Sid項目通過一系列實驗，深入探討了文化meme和宗教的生成與傳播機(jī)制，為我們揭示了AI社會中復(fù)雜的文化互動過程。

文化meme的生成與傳播動態(tài)

研究團(tuán)隊利用語言模型（LM）調(diào)用將代理的對話轉(zhuǎn)化為文化meme，這些meme代表了代理在不同社會背景下產(chǎn)生的各種概念。在實驗中，發(fā)現(xiàn)農(nóng)村地區(qū)的meme生成數(shù)量顯著少于城鎮(zhèn)，即使在對人口進(jìn)行歸一化后也是如此，這表明社交互動的頻率和人口密度是文化傳播的重要因素。

在城鎮(zhèn)內(nèi)，不同meme同時存在，但其頻率和受歡迎程度在不同城鎮(zhèn)之間存在差異。例如，在Woodhaven，代理更多地討論與生態(tài)相關(guān)的主題，而在Clearwater，惡作劇則更受歡迎。此外，meme的流行度在不同時間段內(nèi)也會發(fā)生變化，反映了文化趨勢在社會中的快速轉(zhuǎn)變。這些發(fā)現(xiàn)表明，文化meme的傳播需要一定的人口密度和社交互動閾值，并且不同社會能夠獨(dú)立生成和傳播多種文化meme。

多智能體的文明之路，數(shù)字人類與AI社會的崛起-AI.x社區(qū)

圖11：文化模因的傳播。A.模擬100分鐘后的代理散點圖。特工們根據(jù)他們的演講在過去兩分鐘內(nèi)是否包含模因來著色。演講中不包含任何模因的代理人是白人。B.Woodhaven、Clearwater、Meadowbrook以及村莊以外所有農(nóng)村地區(qū)的代理商的每個代理商的Meme計數(shù)。C-E.隨著時間的推移，Woodhaven（C）、Clearwater（D）和Meadowbrook（E）的代理商的Meme計數(shù)。

宗教傳播及其擴(kuò)散機(jī)制分析

Sid項目還分析了宗教傳播的機(jī)制，通過觀察Pastafarianism的傳播過程，揭示了宗教在AI社會中的擴(kuò)散模式。實驗開始時，Pastafarian祭司積極傳教，他們的對話中頻繁包含“Pastafarian”或“Spaghetti Monster”這兩個關(guān)鍵詞。研究團(tuán)隊使用這些關(guān)鍵詞的出現(xiàn)作為宗教轉(zhuǎn)換的指標(biāo)，發(fā)現(xiàn)一些代理在轉(zhuǎn)換后經(jīng)常使用這些關(guān)鍵詞，而另一些代理則使用“Pasta”和“Spaghetti”作為間接轉(zhuǎn)換的標(biāo)志。

宗教傳播的結(jié)果顯示，直接和間接的轉(zhuǎn)換者數(shù)量隨著時間的推移不斷增加，并且在兩小時的模擬結(jié)束時仍未飽和。此外，Pastafarianism的傳播不僅依靠祭司的傳教活動，還通過信徒之間的互動擴(kuò)散。這種擴(kuò)散模式使得Pastafarianism的影響范圍隨著時間的推移不斷擴(kuò)大，覆蓋了更多的區(qū)域和代理。

多智能體的文明之路，數(shù)字人類與AI社會的崛起-AI.x社區(qū)

圖12：宗教傳播。A.在整個模擬運(yùn)行過程中，每個代理的聊天內(nèi)容都包含宗教關(guān)鍵詞“Pastafarian”、“意大利面怪物”、“Pasta”或“意大利面”。牧師們被涂成深紅色。說出“Pastafarian”或“意大利面怪物”的代理人被定義為直接皈依者（紅色）和說出“Pasta”的代理人或“意大利面”被定義為間接皈依者（粉紅色）。代理可以沿著轉(zhuǎn)換層次向上轉(zhuǎn)換，從未轉(zhuǎn)換到間接轉(zhuǎn)換到直接轉(zhuǎn)換，但不能向下轉(zhuǎn)換。B.代理人隨時間變化的牧場水平圖。C每個牧民級別隨時間變化的代理人數(shù)量。D.教牧主義在時間上的傳播。教牧傳播區(qū)域被定義為在每個皈依水平上由教牧皈依者跨越的可聽區(qū)域的結(jié)合。E.模擬完成后的牧民轉(zhuǎn)變圖。臨界暴露邊緣是指接受者在皈依前首次暴露宗教關(guān)鍵字。非關(guān)鍵邊緣被定義為隨后接觸宗教關(guān)鍵詞。

通過這些實驗，Sid項目揭示了文化和宗教在多智能體模擬中的生成和傳播機(jī)制。文化meme的快速生成與傳播反映了代理社會中的文化動態(tài)，而宗教傳播則展示了信仰體系在代理間的擴(kuò)散過程。

討論與結(jié)論

Sid項目的研究為AI文明的發(fā)展提供了多方面的啟示。通過PIANO架構(gòu)的引入，項目展示了如何在多代理系統(tǒng)中實現(xiàn)高效的并發(fā)和信息整合。這種架構(gòu)設(shè)計使AI代理能夠在復(fù)雜的環(huán)境中保持行為一致性，展示了AI在自主決策和實時互動中的巨大潛力。

項目通過Minecraft環(huán)境中的基準(zhǔn)測試和多代理實驗，驗證了AI代理在自主專業(yè)化、遵守集體規(guī)則和文化傳播等方面的能力。這些發(fā)現(xiàn)表明，AI代理不僅能夠在模擬環(huán)境中表現(xiàn)出色，還能夠通過互動和合作實現(xiàn)集體目標(biāo)。這為未來AI在社會治理、資源管理和文化傳播等領(lǐng)域的應(yīng)用提供了重要的理論和實踐基礎(chǔ)。

此外文化和宗教傳播實驗展示了AI代理在復(fù)雜社會動態(tài)中的行為模式，揭示了AI社會中的文化互動和信仰體系擴(kuò)散過程。這些研究成果為理解和模擬人類社會中的文化和宗教現(xiàn)象提供了新的視角。

當(dāng)前技術(shù)局限與未來研究方向

盡管Sid項目取得了顯著進(jìn)展，但仍面臨一些技術(shù)局限。代理的視覺和空間推理能力仍有待提高，這限制了他們在復(fù)雜任務(wù)（如建筑和導(dǎo)航）中的表現(xiàn)。這一技術(shù)瓶頸需要通過更先進(jìn)的感知和推理模型加以突破。

當(dāng)前的代理缺乏強(qiáng)大的內(nèi)在驅(qū)動（如生存、好奇心和社區(qū)意識），這些驅(qū)動對于真實的社會發(fā)展至關(guān)重要。未來的研究需要在代理中引入更多類似人類的動機(jī)系統(tǒng)，以推動更真實和自主的社會行為。

現(xiàn)有代理基于預(yù)訓(xùn)練的人類知識，無法模擬全新的社會創(chuàng)新和基礎(chǔ)設(shè)施的誕生（如民主系統(tǒng)、法定經(jīng)濟(jì)或通信系統(tǒng)）。這一局限性提示我們，未來的研究需探索如何使AI代理在模擬環(huán)境中自主創(chuàng)造和發(fā)展新的社會結(jié)構(gòu)和機(jī)制。

總結(jié)來看，Sid項目為AI文明的發(fā)展指明了方向，同時也揭示了當(dāng)前技術(shù)的局限和未來研究的潛力。通過持續(xù)的技術(shù)創(chuàng)新和跨學(xué)科合作，我們有望在不久的將來實現(xiàn)更為復(fù)雜和智能的AI社會，為人類文明的未來增添新的可能性。（END）

參考資料：https://arxiv.org/pdf/2411.00114

本文轉(zhuǎn)載自 ??大噬元獸??，作者： FlerkenS

標(biāo)簽

贊

收藏

回復(fù)

舉報

回復(fù)

相關(guān)推薦

向數(shù)字世界AGI邁進(jìn)！讓智能體直接控制鍵盤、鼠標(biāo)，與一切軟件交互

zhangyannni ? 3752瀏覽 ? 0回復(fù)
費(fèi)米悖論與收益遞減，超級人工智能與人類社會將會怎樣相互作用

xuxiangda ? 2458瀏覽 ? 0回復(fù)
人工智能利維坦：從霍布斯社會契約論視角探索LLM 智能體的社會進(jìn)化

xuxiangda ? 3787瀏覽 ? 0回復(fù)
多智能體合作的新路徑，PRD-MAPPO的設(shè)計與實現(xiàn)

xuxiangda ? 4983瀏覽 ? 0回復(fù)
多智能體新進(jìn)展 | 斯坦福大學(xué)提出新模型'Hypothetical Minds'，讓AI更懂人類思維

AI論文解讀 ? 2945瀏覽 ? 0回復(fù)
解密心智理論：從人類社會到人工智能的集體智慧提升之路

xuxiangda ? 3434瀏覽 ? 0回復(fù)
人工智能智能體(AI Agent)發(fā)展趨勢2024年總結(jié)與2025年展望

十一月雨_55 ? 8306瀏覽 ? 0回復(fù)
探索基于大型語言模型的智能體：定義、方法與前景

AIRoobt ? 4051瀏覽 ? 0回復(fù)
微軟發(fā)布Magma：跨越數(shù)字與物理世界的多模態(tài)AI基礎(chǔ)模型

Halo咯咯 ? 1998瀏覽 ? 0回復(fù)
從傳統(tǒng)到智能：LLM操作系統(tǒng)的崛起與變革

十一月雨_55 ? 1618瀏覽 ? 0回復(fù)
多智能體的魔法就得這么玩

AIGC前沿技術(shù)追蹤 ? 1309瀏覽 ? 0回復(fù)
Manus AI ：如何讓AI從 "動口" 到 "動手" 的多智能體架構(gòu)！

Halo咯咯 ? 1837瀏覽 ? 0回復(fù)
API智能體與GUI智能體：差異與融合，誰才是未來？

十一月雨_55 ? 1047瀏覽 ? 0回復(fù)
一文讀懂AI智能體融合與數(shù)據(jù)隱私安全問題

數(shù)字化助推器 ? 1081瀏覽 ? 0回復(fù)
多智能體（Multi Agent）AI系統(tǒng)：企業(yè)智能化轉(zhuǎn)型的未來

Halo咯咯 ? 1129瀏覽 ? 0回復(fù)
AI智能體與應(yīng)用程序：悄然發(fā)生的革命

十一月雨_55 ? 416瀏覽 ? 0回復(fù)
AI 對齊失敗 = 文明終結(jié)？《AI 2027》報告的殘酷警示與“硬傷”分析

上堵吟1 ? 475瀏覽 ? 0回復(fù)
構(gòu)建基于LangGraph的RAG多智能體研究工具

Halo咯咯 ? 410瀏覽 ? 0回復(fù)
基礎(chǔ)智能體的進(jìn)展與挑戰(zhàn)：智能體的七個核心組件構(gòu)建認(rèn)知基石

數(shù)字化助推器 ? 150瀏覽 ? 0回復(fù)

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

熱門推薦

大半精銳盡出！o1下線！滿血o3之后，模型本身就是Manus，最大賣點：替代人干真活！ 1回復(fù)

王炸！MCP 架構(gòu)設(shè)計深度剖析 & 使用 Spring AI + MCP 四步教你實現(xiàn) Agent 智能體開發(fā) 0回復(fù)

Dify從入門到高階系列二：手把手教學(xué)！超詳細(xì)的Dify知識庫配置全攻略 0回復(fù)

Crawl4AI：GitHub榜首40K星標(biāo)！LLM專屬極速開源爬蟲神器 0回復(fù)

只需5分鐘，教你用Python搭建MCP Server 0回復(fù)

上一篇：智能體協(xié)作進(jìn)化論，從心智理論到逆向注意力

下一篇：《自然》科學(xué)報告：大模型在社會情境判斷方面可以勝過人類

社區(qū)精華內(nèi)容

目錄

<sub id="oilhe"><p id="oilhe"></p></sub>

<sub id="oilhe"></sub>

<center id="oilhe"><input id="oilhe"></input></center>