自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

阿里巴巴與人民大學(xué)聯(lián)合團(tuán)隊的成果,AgentScope提升多智能體模擬效率

發(fā)布于 2024-7-31 00:46
瀏覽
0收藏

多智能體系統(tǒng)(MAS)是一種通過多個智能體的協(xié)作來解決復(fù)雜問題的技術(shù)。這些智能體可以是軟件代理、機(jī)器人或其他自主系統(tǒng),能夠在動態(tài)環(huán)境中進(jìn)行交互和決策。MAS在許多領(lǐng)域有廣泛的應(yīng)用,包括交通管理、金融市場模擬、災(zāi)害應(yīng)急響應(yīng)、社會行為研究等。隨著應(yīng)用規(guī)模的擴(kuò)大,現(xiàn)有的多智能體系統(tǒng)面臨擴(kuò)展性和效率問題、智能體多樣性不足、管理過程復(fù)雜的問題。

近日由來自阿里巴巴集團(tuán)和中國人民大學(xué)組成的聯(lián)合研究團(tuán)隊推出AgentScope平臺,對超大規(guī)模多智能體模擬中的最新改進(jìn)取得非常的技術(shù)成果。AgentScope是一個用戶友好的多智能體平臺,旨在解決現(xiàn)有平臺在擴(kuò)展性、效率、智能體多樣性和管理過程方面的挑戰(zhàn)。通過引入基于actor模型的分布式機(jī)制、靈活的環(huán)境支持、易用的配置工具和自動背景生成管道,AgentScope顯著提升了大規(guī)模多智能體模擬的便利性和靈活性。

同時,研究團(tuán)隊發(fā)表的論文《Very Large-Scale Multi-Agent Simulation in AgentScope》探討了大規(guī)模多智能體模擬在不同領(lǐng)域的潛力,通過一系列綜合模擬實驗,展示AgentScope在支持大規(guī)模多智能體模擬方面的有效性,并提供詳細(xì)的觀察和討論,強(qiáng)調(diào)多智能體系統(tǒng)在大規(guī)模模擬中的巨大潛力。

研究團(tuán)隊里阿里巴巴集團(tuán)的人員有Xuchen Pan、Dawei Gao、Yuexiang Xie、Yaliang Li、Bolin Ding、Jingren Zhou,這些研究人員在阿里巴巴集團(tuán)工作,專注于大規(guī)模多智能體系統(tǒng)和相關(guān)技術(shù)的研究與開發(fā)。中國人民大學(xué)的人員有Zhewei Wei、Ji-Rong Wen,這兩位研究人員來自中國人民大學(xué),致力于多智能體系統(tǒng)和人工智能領(lǐng)域的研究。

論文的源代碼已在GitHub上發(fā)布(鏈接地址https://github.com/modelscope/agentscope),該項目在GitHub上有3.9k顆星和249個分支。這一開源項目為研究人員和開發(fā)者提供了一個強(qiáng)大的工具,支持他們在大規(guī)模多智能體模擬領(lǐng)域進(jìn)行創(chuàng)新和探索。

多智能體系統(tǒng)的現(xiàn)狀與挑戰(zhàn)

多智能體系統(tǒng)(MAS)在許多領(lǐng)域中都有廣泛的應(yīng)用,如交通管理、金融市場模擬、災(zāi)害應(yīng)急響應(yīng)和社會行為研究等。然而,現(xiàn)有的多智能體模擬平臺在擴(kuò)展性、效率、智能體多樣性和管理過程等方面仍存在諸多局限性。

隨著智能體數(shù)量的增加,現(xiàn)有平臺在組織智能體執(zhí)行任務(wù)和通信方面的效率顯著下降。在大規(guī)模模擬中,智能體需要按照一定的順序執(zhí)行任務(wù),并進(jìn)行頻繁的通信和協(xié)作。然而,現(xiàn)有平臺在處理大量智能體時,往往難以高效地組織這些任務(wù),導(dǎo)致模擬時間過長,結(jié)果不準(zhǔn)確。大規(guī)模模擬需要大量的計算資源,現(xiàn)有平臺在資源分配和利用方面存在不足,無法充分利用多核處理器和分布式計算資源,導(dǎo)致計算效率低下。智能體之間的通信是多智能體系統(tǒng)的重要組成部分,但在大規(guī)模模擬中,通信開銷往往成為瓶頸,限制了系統(tǒng)的擴(kuò)展性和效率。

大規(guī)模模擬需要智能體表現(xiàn)出多樣化的行為,以便更真實地再現(xiàn)復(fù)雜系統(tǒng)的行為。然而現(xiàn)有平臺在智能體背景設(shè)置和行為多樣性方面的支持有限,現(xiàn)有平臺通常只提供簡單的背景設(shè)置,難以生成具有豐富背景和多樣化行為的智能體。這使得模擬結(jié)果缺乏現(xiàn)實性和代表性。由于背景設(shè)置的單一性,智能體的行為模式往往趨于同質(zhì)化,難以模擬真實世界中的復(fù)雜場景和多樣化行為?,F(xiàn)有平臺在智能體間的互動設(shè)計上存在不足,難以支持復(fù)雜的互動行為和動態(tài)變化,限制了模擬的深度和廣度。

管理大量分布在多個設(shè)備上的智能體,包括初始化、執(zhí)行和終止智能體,以及監(jiān)控其狀態(tài)和交互,過程繁瑣且耗時。在大規(guī)模模擬中,初始化和配置大量智能體需要耗費大量時間和精力,現(xiàn)有平臺缺乏高效的配置工具和自動化支持。在模擬執(zhí)行過程中,監(jiān)控智能體的狀態(tài)和行為是一個復(fù)雜的任務(wù),現(xiàn)有平臺在監(jiān)控工具和界面設(shè)計上存在不足,難以提供全面和實時的監(jiān)控。在模擬結(jié)束后,終止和清理大量智能體同樣是一個耗時的過程,現(xiàn)有平臺缺乏高效的終止和清理機(jī)制。

為了提升多智能體模擬的現(xiàn)實性和可靠性,減少人力干預(yù),論文提出了對AgentScope平臺的多項改進(jìn),旨在解決上述挑戰(zhàn),支持超大規(guī)模多智能體模擬。

通過引入基于actor模型的分布式機(jī)制、靈活的環(huán)境支持、易用的配置工具和自動背景生成管道,AgentScope顯著提升了大規(guī)模多智能體模擬的現(xiàn)實性和可靠性?;赼ctor模型的分布式架構(gòu)支持自動并行執(zhí)行和集中工作流編排,顯著提升了模擬的擴(kuò)展性和效率。多層環(huán)境結(jié)構(gòu)和高頻訪問支持能夠靈活模擬各種現(xiàn)實場景,增強(qiáng)了模擬的現(xiàn)實性。配置工具和自動背景生成管道簡化了創(chuàng)建多樣化智能體的過程,提升了智能體的多樣性和行為的現(xiàn)實性。

通過提供易用的配置工具和自動化支持,AgentScope顯著減少了大規(guī)模多智能體模擬中的人力干預(yù)。用戶可以定義模擬的總?cè)丝?,并從多個角度指定人口分布,提供常用的分布模板,支持?jǐn)U展新的方面,簡化了智能體的初始化和配置過程。根據(jù)配置工具提供的分布,自動生成詳細(xì)且多樣化的背景設(shè)置,引入更多多樣性,減少了手動設(shè)置的工作量?;赪eb的界面提供了全面和實時的監(jiān)控,簡化了智能體的執(zhí)行和監(jiān)控過程,提高了管理效率。

AgentScope平臺的改進(jìn)

AgentScope平臺在大規(guī)模多智能體模擬中引入了多項關(guān)鍵改進(jìn),旨在解決現(xiàn)有平臺在擴(kuò)展性、效率、智能體多樣性和管理過程方面的挑戰(zhàn)。

分布式機(jī)制

AgentScope采用了基于actor模型的分布式架構(gòu),這種架構(gòu)在并行計算和分布式系統(tǒng)中具有顯著優(yōu)勢。actor模型是一種并發(fā)計算的數(shù)學(xué)模型,其中每個actor作為基本計算單元,獨立接收消息并進(jìn)行計算。通過這種方式,AgentScope能夠?qū)崿F(xiàn)高效的任務(wù)分配和執(zhí)行。

阿里巴巴與人民大學(xué)聯(lián)合團(tuán)隊的成果,AgentScope提升多智能體模擬效率-AI.x社區(qū)

圖1:自動并行執(zhí)行的一個示例,其中圓圈表示代理,有向邊表示消息傳遞流。

在AgentScope中,每個智能體被視為一個獨立的actor,能夠并行執(zhí)行任務(wù)并與其他智能體進(jìn)行通信。這種設(shè)計不僅提高了系統(tǒng)的擴(kuò)展性,還減少了任務(wù)執(zhí)行的時間。具體來說,AgentScope通過通信圖動態(tài)識別可執(zhí)行的智能體,這些智能體可以自動并行執(zhí)行,利用最大可用資源。

為了進(jìn)一步提升效率,AgentScope引入了自動并行執(zhí)行和集中工作流編排機(jī)制。自動并行執(zhí)行通過格式化智能體間的交互為通信圖,實現(xiàn)了智能體的并行執(zhí)行。每個智能體在接收到所需的消息后才會觸發(fā)內(nèi)部計算,這樣可以確保智能體僅依賴于必要的消息,從而實現(xiàn)高效的并行執(zhí)行。

阿里巴巴與人民大學(xué)聯(lián)合團(tuán)隊的成果,AgentScope提升多智能體模擬效率-AI.x社區(qū)

圖2:占位符如何在模擬中發(fā)揮作用,以使用戶能夠集中協(xié)調(diào)工作流程。

集中工作流編排則通過代理機(jī)制在中心進(jìn)程中管理分布式智能體的通信。代理機(jī)制隱藏了遠(yuǎn)程計算的復(fù)雜性,使用戶能夠在中心進(jìn)程中指定分布式智能體之間的通信。為了確保工作流執(zhí)行不被分布式智能體的計算阻塞,AgentScope引入了占位符概念。當(dāng)代理接收到消息時,會立即返回占位符,并將消息轉(zhuǎn)發(fā)給對應(yīng)的分布式智能體。智能體在接收到所有實際值后才會執(zhí)行內(nèi)部計算,從而實現(xiàn)了獨立分布式智能體的并行運行。

這種設(shè)計不僅提高了智能體間通信的效率,還簡化了用戶的操作,使得大規(guī)模多智能體模擬變得更加便捷和高效。

靈活的環(huán)境支持

AgentScope提供了多層環(huán)境結(jié)構(gòu),支持組內(nèi)信息同步和組間信息差異化,增強(qiáng)了模擬的靈活性。在多智能體模擬中,環(huán)境是智能體交互的重要組成部分。AgentScope通過抽象環(huán)境操作為注冊、查詢、更新、刪除和監(jiān)控等基本操作,支持高頻訪問和數(shù)據(jù)同步。

阿里巴巴與人民大學(xué)聯(lián)合團(tuán)隊的成果,AgentScope提升多智能體模擬效率-AI.x社區(qū)

圖3:基于代理的模擬的多層環(huán)境結(jié)構(gòu)。

多層環(huán)境結(jié)構(gòu)允許為不同的智能體組建立獨立的環(huán)境,以提供交互項和共享信息。在這些環(huán)境之上,還可以設(shè)置一個全局環(huán)境進(jìn)行全局同步。這種設(shè)計特別適用于需要組內(nèi)協(xié)作和組間信息差異化的模擬場景,例如社會行為模擬和團(tuán)隊合作模擬。

為了滿足大規(guī)模模擬中高頻訪問的需求,AgentScope實現(xiàn)了分布式節(jié)點的環(huán)境模塊,通過遠(yuǎn)程過程調(diào)用(RPC)與智能體進(jìn)行通信。環(huán)境模塊在接收到智能體的請求后,會根據(jù)訪問的數(shù)據(jù)將請求分類到不同的隊列中,并同時處理這些隊列中的請求,以解決數(shù)據(jù)沖突問題。

用戶可以根據(jù)可用的硬件資源設(shè)置最大并發(fā)數(shù),從而優(yōu)化環(huán)境模塊的性能。此外,AgentScope還提供了時間線和位置兩個維度的交互,支持智能體根據(jù)全局時間調(diào)整行為,并在地圖上與附近的智能體或物品進(jìn)行交互。這種設(shè)計提供了靈活的環(huán)境支持,能夠模擬各種現(xiàn)實場景,增強(qiáng)了模擬的現(xiàn)實性和多樣性。

易用的配置工具與自動背景生成

AgentScope集成了易用的配置工具,用戶可以定義模擬的總?cè)丝?,并從多個角度指定人口分布。配置工具提供了一些常用的分布模板,例如年齡、性別、職業(yè)、國籍和教育水平等,用戶也可以根據(jù)需要擴(kuò)展新的方面。

通過配置工具,用戶只需簡單地指定人口分布,即可生成大量具有詳細(xì)且多樣化特征的智能體。這些智能體可以通過AgentScope-Manager模塊方便地管理和監(jiān)控,該模塊簡化了大規(guī)模智能體模擬的組織和觀察過程。

在配置工具提供的分布基礎(chǔ)上,AgentScope還提供了自動背景生成管道,用于生成詳細(xì)且多樣化的背景設(shè)置。當(dāng)用戶啟動模擬時,系統(tǒng)會根據(jù)配置工具提供的分布,從中抽取具體值,并將其轉(zhuǎn)換為JSON格式,填充到元提示中,生成完整的背景設(shè)置指令。

阿里巴巴與人民大學(xué)聯(lián)合團(tuán)隊的成果,AgentScope提升多智能體模擬效率-AI.x社區(qū)

圖4:基于網(wǎng)頁的可視化界面,適用于大規(guī)模代理商管理。

這些指令由大語言模型(LLMs)使用,以生成異構(gòu)的背景設(shè)置。為了引入更多的多樣性,生成過程會調(diào)整隨機(jī)種子和溫度。通過這種方式,AgentScope能夠自動生成具有豐富背景和多樣化行為的智能體,減少了手動設(shè)置的工作量,提高了模擬的現(xiàn)實性和代表性。

AgentScope通過引入基于actor模型的分布式機(jī)制、靈活的環(huán)境支持、易用的配置工具和自動背景生成管道,顯著提升了大規(guī)模多智能體模擬的擴(kuò)展性、效率和多樣性。這些改進(jìn)不僅解決了現(xiàn)有平臺的局限性,還為研究人員和開發(fā)者提供了一個強(qiáng)大的工具,支持他們在大規(guī)模多智能體模擬領(lǐng)域進(jìn)行創(chuàng)新和探索。

實驗與結(jié)果分析

研究團(tuán)隊通過一系列實驗驗證了AgentScope在大規(guī)模多智能體模擬中的性能和效果。以下是實驗設(shè)置、擴(kuò)展性與效率分析以及模擬結(jié)果與分析的詳細(xì)解讀。

實驗設(shè)置

實驗在一個包含多個設(shè)備的集群上進(jìn)行,每個設(shè)備配備8個A100-80G GPU、64核CPU和1TB內(nèi)存。為了處理高并發(fā)的服務(wù)請求,研究團(tuán)隊采用了vLLM作為LLM推理引擎。實驗中使用了六種不同大小的開源LLM,包括Llama3-8B、Llama3-70B、Qwen2-7B、Qwen2-72B、MistralAI-8×7B和MistralAI-8×22B。

在實驗中,除非特別說明,每個設(shè)備上部署八個Qwen2-7B或Llama3-8B模型,兩個Qwen2-72B、Llama3-70B或MistralAI-8×7B模型,或一個MistralAI-8×22B模型。所有LLM的生成溫度設(shè)置為1.0,以促進(jìn)響應(yīng)的多樣性。此外,為了防止響應(yīng)格式錯誤,每個智能體在每輪游戲中執(zhí)行兩次LLM服務(wù)器調(diào)用。第一次調(diào)用用于生成響應(yīng),包括其思維過程和報告的數(shù)字,第二次調(diào)用用于正確提取報告的數(shù)字。

阿里巴巴與人民大學(xué)聯(lián)合團(tuán)隊的成果,AgentScope提升多智能體模擬效率-AI.x社區(qū)

圖5:基于代理的模擬,具有不同規(guī)模的代理(a、b)和不同數(shù)量的設(shè)備(c、d)。

為了指導(dǎo)智能體在游戲中的行為,研究團(tuán)隊為智能體提供了系統(tǒng)提示。這些提示包括游戲規(guī)則、響應(yīng)格式以及行為指導(dǎo)。例如,為了鼓勵智能體逐步思考,系統(tǒng)提示中加入了“鏈?zhǔn)剿季S”研究的啟發(fā),要求智能體在報告數(shù)字前逐步思考。

在進(jìn)一步的實驗中,研究團(tuán)隊還在系統(tǒng)提示中加入了更詳細(xì)的行為指導(dǎo),提醒智能體所有競爭對手都是理性的,并會通過分析他人的策略來調(diào)整報告的數(shù)字。這些詳細(xì)指令旨在使智能體在報告數(shù)字前進(jìn)行更深入的思考和多樣化的考慮,從而使模擬更加實際、有意義和有趣。

擴(kuò)展性與效率

為了展示AgentScope在大規(guī)模智能體模擬中的擴(kuò)展性和效率,研究團(tuán)隊進(jìn)行了多項實驗,記錄了不同規(guī)模智能體模擬的運行時間。實驗結(jié)果顯示,AgentScope能夠支持包含100萬個智能體的模擬,使用4臺設(shè)備可在12分鐘內(nèi)完成。

具體來說,當(dāng)使用Llama3-8B和基本系統(tǒng)提示(Prompt 1)時,模擬包含100萬個智能體的運行時間為12分鐘;而使用“鏈?zhǔn)剿季S”提示(Prompt 2)時,由于響應(yīng)的平均令牌數(shù)增加了150倍以上,運行時間增加到85分鐘。對于最重的推理工作負(fù)載,即使用Llama3-70B和Prompt 2時,模擬運行時間約為10.6小時。

為了更好地展示基于actor模型的分布式機(jī)制帶來的效率提升,研究團(tuán)隊采用了虛擬模型請求(即智能體休眠1秒并生成隨機(jī)數(shù)而不是發(fā)送請求)進(jìn)行模擬,以消除LLM推理速度的影響。實驗結(jié)果顯示,使用基于actor模型的分布式機(jī)制,完成包含100萬個智能體的模擬僅需40秒,而使用串行執(zhí)行或Python中的異步模式(現(xiàn)有工作采用的模式)則分別需要約12天和8.6小時。

阿里巴巴與人民大學(xué)聯(lián)合團(tuán)隊的成果,AgentScope提升多智能體模擬效率-AI.x社區(qū)

圖6:具有不同 LLM 和系統(tǒng)提示的代理報告的數(shù)字分布。

此外,增加設(shè)備數(shù)量可以成比例地減少模擬運行時間。例如,當(dāng)智能體數(shù)量固定為10,000時,增加設(shè)備數(shù)量從1臺到4臺,模擬運行時間從22分鐘減少到5.6分鐘。這表明,通過增加設(shè)備數(shù)量,AgentScope能夠顯著提升模擬的擴(kuò)展性和效率。

模擬結(jié)果與分析

實驗結(jié)果顯示,不同系統(tǒng)提示對智能體的行為有顯著影響。使用基本系統(tǒng)提示(Prompt 1)時,大多數(shù)智能體報告的數(shù)字約為50。然而使用“鏈?zhǔn)剿季S”提示(Prompt 2)時,智能體報告的數(shù)字顯著減少,接近0。這表明詳細(xì)指令比一般指導(dǎo)(如“逐步思考”)更有效,能夠促使智能體進(jìn)行更深入的思考和更理性的決策。

阿里巴巴與人民大學(xué)聯(lián)合團(tuán)隊的成果,AgentScope提升多智能體模擬效率-AI.x社區(qū)

圖7:多輪比賽中報告數(shù)字的平均值。

在進(jìn)一步的實驗中,研究團(tuán)隊在系統(tǒng)提示中加入了更詳細(xì)的行為指導(dǎo)(Prompt 3和Prompt 4),提醒智能體所有競爭對手都是理性的,并會通過分析他人的策略來調(diào)整報告的數(shù)字。實驗結(jié)果顯示,使用詳細(xì)指令的智能體報告的數(shù)字更接近0,表明詳細(xì)指令比一般指導(dǎo)更有效。

在多輪游戲中,智能體逐漸調(diào)整策略,報告的數(shù)字逐漸收斂到0,顯示出對游戲的良好理解和理性決策能力。例如,在多輪游戲中,智能體在每輪開始時會被告知上一輪的獲勝數(shù)字,并根據(jù)這些信息調(diào)整策略。實驗結(jié)果顯示,隨著游戲的進(jìn)行,智能體報告的數(shù)字逐漸接近0,表明智能體能夠有效地考慮其他智能體的行為,并做出合理的決策。

阿里巴巴與人民大學(xué)聯(lián)合團(tuán)隊的成果,AgentScope提升多智能體模擬效率-AI.x社區(qū)

圖8:不同的系統(tǒng)提示對不同的LLM的影響。

此外,使用“鏈?zhǔn)剿季S”提示的智能體比使用基本提示的智能體更快收斂到納什均衡。例如,在第五輪游戲中,使用Qwen2-72B和Prompt 2的智能體報告的平均數(shù)字為2.02,而使用Prompt 1的智能體報告的平均數(shù)字為25.16。這表明,詳細(xì)的行為指導(dǎo)能夠加速智能體達(dá)到納什均衡。

智能體多樣性研究

在多智能體系統(tǒng)的研究中,智能體的多樣性是一個關(guān)鍵因素。多樣化的智能體能夠更真實地模擬復(fù)雜系統(tǒng)中的各種行為和交互,從而提高模擬的現(xiàn)實性和代表性。研究團(tuán)隊通過對AgentScope平臺的實驗,深入探討了智能體多樣性的重要性及其實現(xiàn)方法。

異構(gòu)配置

在AgentScope平臺中,研究團(tuán)隊通過配置工具和自動背景生成管道,為智能體設(shè)置了多樣化的背景,包括教育水平和職業(yè)背景。具體來說,智能體被分為多個組,每組包含200個智能體,每個組的智能體具有不同的教育水平或職業(yè)背景。

阿里巴巴與人民大學(xué)聯(lián)合團(tuán)隊的成果,AgentScope提升多智能體模擬效率-AI.x社區(qū)

圖9:具有不同教育水平的代理人報告的數(shù)字分布。

在教育水平方面,智能體被分為五個不同的教育水平:小學(xué)、高中、學(xué)士、碩士和博士。實驗結(jié)果顯示,教育水平越高的智能體在游戲中的表現(xiàn)越理性。例如,使用Qwen2-72B的智能體中,博士教育水平的智能體報告的平均數(shù)字顯著低于小學(xué)教育水平的智能體。這表明,教育水平較高的智能體在游戲中表現(xiàn)出更強(qiáng)的推理能力和決策能力。

在職業(yè)背景方面,智能體被分為六個不同的職業(yè):游戲理論教授、經(jīng)濟(jì)學(xué)家、心理學(xué)家、運動員、藝術(shù)家和作家。實驗結(jié)果顯示,不同職業(yè)背景的智能體在游戲中的表現(xiàn)也存在顯著差異。例如,游戲理論教授和經(jīng)濟(jì)學(xué)家報告的數(shù)字較小,表現(xiàn)出更理性的行為;而藝術(shù)家和作家則可能采用更直接的策略。這些結(jié)果表明,智能體的職業(yè)背景對其行為有重要影響。

阿里巴巴與人民大學(xué)聯(lián)合團(tuán)隊的成果,AgentScope提升多智能體模擬效率-AI.x社區(qū)

圖10:不同職業(yè)的代理人報告的數(shù)字分布。

圖11:涉及具有多種 LLM 的代理的個體級別模擬。

通過對不同背景設(shè)置的智能體行為進(jìn)行分析,研究團(tuán)隊發(fā)現(xiàn),智能體的行為與其背景設(shè)置一致。例如,具有博士教育水平的智能體在游戲中表現(xiàn)出更強(qiáng)的推理能力和決策能力,而小學(xué)教育水平的智能體則可能表現(xiàn)出較為簡單的行為模式。同樣,游戲理論教授和經(jīng)濟(jì)學(xué)家在游戲中表現(xiàn)出更理性的行為,而藝術(shù)家和作家則可能采用更直接的策略。

這些結(jié)果表明,通過提供不同的背景描述,可以顯著增強(qiáng)智能體的多樣性,從而提高模擬的現(xiàn)實性和代表性。AgentScope平臺的配置工具和自動背景生成管道為實現(xiàn)這一目標(biāo)提供了有力支持。

混合LLM的模擬實驗

為了進(jìn)一步探討智能體多樣性,研究團(tuán)隊進(jìn)行了混合LLM的模擬實驗。具體來說,智能體被配置為使用不同的LLM,包括Llama3-70B、MistralAI-8×22B和Qwen2-72B,每個LLM分配500個智能體。實驗包括個體級別和組級別的模擬。

在個體級別模擬中,每個智能體獨立參與游戲。實驗結(jié)果顯示,不同LLM的智能體行為存在顯著差異。例如,Llama3-70B的智能體報告的數(shù)字較為一致,傾向于報告約33的數(shù)字;MistralAI-8×22B的智能體則一致報告0;Qwen2-72B的智能體表現(xiàn)出更大的行為多樣性,報告的數(shù)字范圍較廣,主要集中在0到50之間。

在組級別模擬中,智能體被分為三組,每組使用相同的LLM。每個智能體報告一個數(shù)字,組內(nèi)智能體的平均數(shù)字作為該組的報告數(shù)字。實驗結(jié)果顯示,同組智能體的行為在第二輪后趨于一致。例如,Qwen2-72B和Llama3-70B的智能體表現(xiàn)較為一致,而MistralAI-8×22B的智能體有時會報告較大的數(shù)字。

實驗結(jié)果表明,不同LLM的智能體在行為上存在顯著差異。例如,Llama3-70B的智能體報告的數(shù)字較為一致,而MistralAI-8×22B的智能體則一致報告0,Qwen2-72B的智能體表現(xiàn)出更大的行為多樣性。這些差異可能與LLM的架構(gòu)、訓(xùn)練語料等因素有關(guān)。

阿里巴巴與人民大學(xué)聯(lián)合團(tuán)隊的成果,AgentScope提升多智能體模擬效率-AI.x社區(qū)

圖12:涉及具有混合 LLM 的代理的群體級別模擬。

此外實驗還顯示,智能體在多輪游戲中的策略調(diào)整也存在差異。例如,在多輪游戲中,智能體在每輪開始時會被告知上一輪的獲勝數(shù)字,并根據(jù)這些信息調(diào)整策略。實驗結(jié)果顯示,隨著游戲的進(jìn)行,智能體報告的數(shù)字逐漸接近0,表明智能體能夠有效地考慮其他智能體的行為,并做出合理的決策。

進(jìn)一步討論

在論文的最后部分,我們將進(jìn)一步探討AgentScope在大規(guī)模多智能體模擬中的一些關(guān)鍵問題和實驗結(jié)果。這些討論將涵蓋溫度對生成多樣性的影響、智能體扮演極端角色的表現(xiàn)、先驗知識對智能體行為的影響以及非零納什均衡的模擬實驗。

溫度對生成多樣性的影響

溫度是控制大語言模型(LLM)生成多樣性的一個重要超參數(shù)。在AgentScope的實驗中,研究團(tuán)隊設(shè)置了1000個使用Qwen2-72B和Prompt 2的智能體,并將溫度范圍設(shè)置為{0.05, 0.25, 0.50, 1.00}。實驗結(jié)果顯示,隨著溫度的增加,報告數(shù)字的標(biāo)準(zhǔn)差從6.50上升到8.20,而平均值變化不大。

這些結(jié)果表明,溫度對生成多樣性的影響主要體現(xiàn)在報告數(shù)字的分布上,而對總體平均值的影響較小。當(dāng)溫度較低時,智能體的行為較為一致,報告的數(shù)字集中在一個較小的范圍內(nèi);而當(dāng)溫度較高時,智能體的行為變得更加多樣化,報告的數(shù)字分布范圍更廣。這一發(fā)現(xiàn)對于在大規(guī)模模擬中控制智能體行為的多樣性具有重要意義。

阿里巴巴與人民大學(xué)聯(lián)合團(tuán)隊的成果,AgentScope提升多智能體模擬效率-AI.x社區(qū)

圖13:游戲中設(shè)定不同比例時報出的數(shù)字分布情況。

扮演極端角色的智能體表現(xiàn)

在多樣化背景設(shè)置的模擬中,研究團(tuán)隊嘗試讓智能體扮演極端角色,例如七歲兒童。實驗結(jié)果顯示,盡管智能體被設(shè)定為七歲兒童,但其行為并不符合預(yù)期,表現(xiàn)出計算和多步驟推理能力。這表明,盡管可以為智能體設(shè)置各種背景,但在某些極端情況下,智能體的行為可能與預(yù)期不符。

這一發(fā)現(xiàn)強(qiáng)調(diào)了在模擬前評估模型能力和設(shè)計背景設(shè)置的重要性。用戶需要仔細(xì)設(shè)計背景設(shè)置,并評估模型在特定角色下的表現(xiàn),以確保模擬結(jié)果的現(xiàn)實性和代表性。

先驗知識對智能體行為的影響

“猜平均數(shù)”的游戲是一個經(jīng)典的博弈論問題,LLM可能在其訓(xùn)練語料中已經(jīng)獲得了相關(guān)的先驗知識。為了測量這種先驗知識的影響,研究團(tuán)隊改變了游戲的比例,從2/3改為1/2和51/100,并分別進(jìn)行了模擬實驗。

實驗結(jié)果顯示,當(dāng)比例設(shè)置為1/2和51/100時,智能體的表現(xiàn)存在顯著差異。更多的智能體在比例為1/2時傾向于報告較大的數(shù)字,而在比例為51/100時,智能體的表現(xiàn)則更加多樣化。這表明,LLM的先驗知識對智能體行為有顯著影響。

為了減少這種影響,研究團(tuán)隊在系統(tǒng)提示中加入了一條注釋,指出這是“猜平均數(shù)”游戲的變體。實驗結(jié)果顯示,加入注釋后,智能體的表現(xiàn)更加接近比例為1/2的情況。這一發(fā)現(xiàn)表明,通過在系統(tǒng)提示中明確說明游戲設(shè)置,可以有效減少先驗知識對智能體行為的影響。

非零納什均衡的模擬實驗

為了驗證智能體在理解和推理方面的能力,研究團(tuán)隊設(shè)置了一個變體游戲,使納什均衡變?yōu)?0,而不是經(jīng)典游戲中的0。實驗結(jié)果顯示,部分使用Qwen2-72B和MistralAI-8×22B的智能體能夠在第一輪中推理出新的納什均衡點,并在隨后的游戲中逐漸接近10。

阿里巴巴與人民大學(xué)聯(lián)合團(tuán)隊的成果,AgentScope提升多智能體模擬效率-AI.x社區(qū)

圖14:當(dāng)我們在模擬中將納什均衡改為 10 時報告的數(shù)字分布。

圖15:在 LLM 中使用不同溫度時報告的數(shù)字的分布。

這一發(fā)現(xiàn)表明,智能體在理解和推理方面表現(xiàn)出強(qiáng)大的能力,能夠根據(jù)新的游戲規(guī)則做出合理的決策。此外,實驗還發(fā)現(xiàn),盡管智能體在推理過程中可能會犯一些簡單的計算錯誤,但這些錯誤并不影響整體結(jié)論。

通過這些實驗,研究團(tuán)隊展示了AgentScope在大規(guī)模多智能體模擬中的強(qiáng)大能力和潛力。溫度對生成多樣性的影響、智能體扮演極端角色的表現(xiàn)、先驗知識對智能體行為的影響以及非零納什均衡的模擬實驗,進(jìn)一步驗證了AgentScope在支持復(fù)雜模擬和多樣化智能體行為方面的有效性。

結(jié)論

論文通過對AgentScope平臺的詳細(xì)解讀,展示了其在超大規(guī)模多智能體模擬中的最新改進(jìn)和實驗結(jié)果。AgentScope通過引入基于actor模型的分布式機(jī)制、靈活的環(huán)境支持、易用的配置工具和自動背景生成管道,顯著提升了大規(guī)模多智能體模擬的擴(kuò)展性、效率和多樣性。

實驗結(jié)果表明,AgentScope不僅能夠支持大規(guī)模智能體模擬,還能夠通過詳細(xì)的行為指導(dǎo)和多輪游戲中的策略調(diào)整,促使智能體進(jìn)行更深入的思考和更理性的決策。此外,溫度對生成多樣性的影響、智能體扮演極端角色的表現(xiàn)、先驗知識對智能體行為的影響以及非零納什均衡的模擬實驗,進(jìn)一步驗證了AgentScope在支持復(fù)雜模擬和多樣化智能體行為方面的有效性。

未來,AgentScope有望在更多領(lǐng)域中得到應(yīng)用,如交通管理、金融市場模擬、災(zāi)害應(yīng)急響應(yīng)和社會行為研究等。通過不斷優(yōu)化平臺性能和擴(kuò)展應(yīng)用場景,AgentScope將為研究人員和開發(fā)者提供更強(qiáng)大的工具,支持他們在大規(guī)模多智能體模擬領(lǐng)域進(jìn)行創(chuàng)新和探索。(END)

參考資料:https://arxiv.org/pdf/2407.17789

本文轉(zhuǎn)載自 ??大噬元獸??,作者: FlerkenS

收藏
回復(fù)
舉報
回復(fù)
相關(guān)推薦