清華團(tuán)隊(duì)構(gòu)建大型社會(huì)模擬器 AgentSociety ,可精確模擬社會(huì)輿論傳播、公眾政策響應(yīng)等社會(huì)現(xiàn)象
“凡我無(wú)法創(chuàng)造的,我就無(wú)法真正理解。 ” -- 費(fèi)曼
智能時(shí)代呼嘯而來(lái),正深刻改變著人們生產(chǎn)、生活和學(xué)習(xí)的方式。過(guò)去幾十年里,社會(huì)科學(xué)家和相關(guān)領(lǐng)域的研究者,一直致力于通過(guò)實(shí)證數(shù)據(jù)與模型揭示人類行為和智能社會(huì)運(yùn)行的基本規(guī)律,試圖找出隱藏在各種社會(huì)現(xiàn)象和治理痛點(diǎn)背后的因果機(jī)制,從而回答“是什么?為什么?如何治”等一系列問(wèn)題。然而,在社會(huì)科學(xué)研究從“解釋世界”向“改造世界”演進(jìn)的范式轉(zhuǎn)型中,研究者們始終面臨著一個(gè)根本性挑戰(zhàn)——如何突破傳統(tǒng)實(shí)證主義方法的局限,實(shí)現(xiàn)對(duì)人類行為模式與社會(huì)運(yùn)行規(guī)律的可計(jì)算、可干預(yù)、可預(yù)測(cè)的深度理解。正如物理學(xué)家費(fèi)曼所說(shuō)的那句經(jīng)典名言:“凡我無(wú)法創(chuàng)造的,我就無(wú)法真正理解。”真正的理解,不僅是觀察和解釋,更在于能否通過(guò)“生成式”的方式,自底而上地模擬復(fù)現(xiàn)人類行為的復(fù)雜模式與社會(huì)系統(tǒng)的運(yùn)行規(guī)律,從而模擬、預(yù)測(cè)和研判智能社會(huì)治理演化路徑和潛在社會(huì)風(fēng)險(xiǎn),推動(dòng)基于前瞻性實(shí)驗(yàn)主義智能社會(huì)治理最佳路徑。
正如復(fù)雜性科學(xué)先驅(qū)霍蘭德所指出的:“社會(huì)系統(tǒng)的本質(zhì)在于其構(gòu)成元素間的非線性涌現(xiàn)?!边@一論斷揭示了傳統(tǒng)還原論方法在應(yīng)對(duì)社會(huì)復(fù)雜性時(shí)的固有局限,也催生了“生成式社會(huì)科學(xué)”(Generative Social Science)這一研究范式的迅速崛起,該范式將社會(huì)視為復(fù)雜自適應(yīng)系統(tǒng),從微觀層面出發(fā),通過(guò)模擬個(gè)體的行為和互動(dòng)來(lái)探索復(fù)雜社會(huì)系統(tǒng)的內(nèi)在機(jī)制,強(qiáng)調(diào)通過(guò)自底向上的計(jì)算實(shí)現(xiàn)對(duì)社會(huì)數(shù)字孿生的構(gòu)建。其中,智能體建模(Agent-Based Modeling)是目前廣泛應(yīng)用的一種方法,它通過(guò)構(gòu)建Agent以及多Agents之間的交互關(guān)系,動(dòng)態(tài)再現(xiàn)社會(huì)的運(yùn)行狀態(tài)。這種方法已被廣泛應(yīng)用于社會(huì)科學(xué)、政治學(xué)、經(jīng)濟(jì)學(xué)等領(lǐng)域,幫助研究者更深入地理解人類行為及社會(huì)的復(fù)雜性。
盡管這一領(lǐng)域取得了重要進(jìn)展,仍面臨一個(gè)亟待解決的核心問(wèn)題:這樣的模擬究竟能在多大程度上真實(shí)還原現(xiàn)實(shí)社會(huì)的復(fù)雜性?因此,如何在保證模擬規(guī)模足夠龐大以支持復(fù)雜性研究的同時(shí),提升模擬的真實(shí)性,使其更貼近現(xiàn)實(shí)社會(huì)的運(yùn)行邏輯,仍是亟待突破的重要方向。
近日,清華大學(xué)電子系城市科學(xué)與計(jì)算中心研究團(tuán)隊(duì),聯(lián)合清華大學(xué)智能社會(huì)治理研究院、公共管理學(xué)院、社會(huì)科學(xué)學(xué)院等跨學(xué)科團(tuán)隊(duì)深度協(xié)作,充分發(fā)揮大模型智能體、真實(shí)社會(huì)環(huán)境仿真與大規(guī)模模擬加速框架的技術(shù)優(yōu)勢(shì),結(jié)合智能社會(huì)治理的前沿理論與實(shí)踐探索,成功構(gòu)建了基于大模型的“大規(guī)模社會(huì)模擬器 AgentSociety”1.0 版本,可精確模擬社會(huì)輿論傳播、認(rèn)知觀點(diǎn)極化、公眾政策響應(yīng)等。AgentSociety從社會(huì)學(xué)第一性原理出發(fā),以助力推動(dòng)社會(huì)科學(xué)研究范式變革,推動(dòng)了社會(huì)學(xué)領(lǐng)域從行為模擬到心智建模、從靜態(tài)推演到動(dòng)態(tài)共生、從實(shí)驗(yàn)室工具到社會(huì)基礎(chǔ)設(shè)施的發(fā)展。具體而言,該模擬器包括:
大模型驅(qū)動(dòng)的社會(huì)人智能體:基于社會(huì)學(xué)理論,構(gòu)建具有 “類人心智”的社會(huì)人智能體,賦予其情感、需求、動(dòng)機(jī)與認(rèn)知能力,并在這些心智驅(qū)動(dòng)下進(jìn)行復(fù)雜社會(huì)行為,如移動(dòng)、就業(yè)、消費(fèi)、社交互動(dòng)等。
真實(shí)城市社會(huì)環(huán)境:精準(zhǔn)模擬社會(huì)人賴以生存的城市空間,重現(xiàn)交通、基礎(chǔ)設(shè)施和公共資源,使智能體能在真實(shí)環(huán)境約束下交互,形成逼真的社會(huì)生態(tài)。
大規(guī)模社會(huì)模擬引擎:采用異步模擬架構(gòu)與Ray分布式計(jì)算框架,結(jié)合智能體分組和 MQTT 高并發(fā)通信,實(shí)現(xiàn)高效、可擴(kuò)展的智能體交互與社會(huì)行為模擬。
智能社會(huì)科學(xué)研究與治理工具箱:全面支持實(shí)驗(yàn)、訪談、問(wèn)卷調(diào)查等一系列社會(huì)學(xué)研究方法,提供多種自動(dòng)化數(shù)據(jù)分析工具,從定性研究到定量分析全面助力社會(huì)科學(xué)研究的深入開(kāi)展。
[文章地址:https://arxiv.org/abs/2502.08691,
官方文檔:https://agentsociety.readthedocs.io/en/latest/,
GitHub鏈接:https://github.com/tsinghua-fib-lab/agentsociety/ ]
圖 1 AgentSociety 總覽
(交互案例見(jiàn):https://agentsociety.fiblab.net/exp/1a4c4fa5-04c1-4973-9433-b8b696f2fda0)
大規(guī)模社會(huì)模擬器通過(guò)數(shù)字化和虛擬化的方式,使研究者能夠在無(wú)需進(jìn)行實(shí)際實(shí)驗(yàn)的情況下,模擬并觀察社會(huì)現(xiàn)象的變化過(guò)程,顯著降低了研究的風(fēng)險(xiǎn)與成本。同時(shí),模擬器能夠在不同情境下進(jìn)行多維度的數(shù)據(jù)采集和實(shí)驗(yàn)設(shè)計(jì),克服傳統(tǒng)研究因受限于時(shí)間、空間和資源等因素所帶來(lái)的局限。團(tuán)隊(duì)提供可視化交互工具和智能社會(huì)治理研究工具箱,支持實(shí)時(shí)監(jiān)測(cè)、主動(dòng)干預(yù)和數(shù)據(jù)收集,助力社會(huì)研究和治理實(shí)驗(yàn)。
社會(huì)模擬器的應(yīng)用不僅限于具體的社會(huì)實(shí)驗(yàn),它還可以作為社會(huì)科學(xué)研究的核心方法工具,輔助開(kāi)展前期研究和假設(shè)驗(yàn)證,輔助政策決策者和公共事務(wù)參與主體進(jìn)行智能決策。研究團(tuán)隊(duì)可以利用其進(jìn)行初步的理論構(gòu)建、實(shí)驗(yàn)設(shè)計(jì)和政策效果評(píng)估,為后續(xù)的實(shí)證研究提供依據(jù)。這種工具的靈活性和可擴(kuò)展性使得研究者能夠在不同的社會(huì)情境和變量條件下,快速測(cè)試?yán)碚摷僭O(shè)并驗(yàn)證其可行性,為學(xué)術(shù)研究的精準(zhǔn)性和實(shí)用性提供有力支持。
為了展示大規(guī)模社會(huì)模擬器在社會(huì)科學(xué)研究中的價(jià)值,團(tuán)隊(duì)開(kāi)展了一系列典型社會(huì)實(shí)驗(yàn),涵蓋干預(yù)實(shí)驗(yàn)、訪談和調(diào)查問(wèn)卷等方法。實(shí)驗(yàn)聚焦觀點(diǎn)極化、煽動(dòng)性消息傳播與治理、全民基本收入(Universal Basic Income, UBI)政策和颶風(fēng)沖擊下的社會(huì)動(dòng)態(tài),深入探討個(gè)體與群體行為在不同社會(huì)機(jī)制下的演化規(guī)律?;贏gentSociety的實(shí)驗(yàn),有效模擬了真實(shí)世界中常見(jiàn)的“回音室效應(yīng)”、煽動(dòng)性信息具有更強(qiáng)的傳播性和情緒引導(dǎo)力、UBI政策在個(gè)體消費(fèi)和改善心理健康方面的效果、以及颶風(fēng)沖擊下的人群流動(dòng)的受限與恢復(fù),研究結(jié)果與真實(shí)世界高度一致,證明了AgentSociety作為低成本實(shí)驗(yàn)場(chǎng)地驗(yàn)證政策的有效性。
一、大模型驅(qū)動(dòng)的社會(huì)人智能體
社會(huì)人智能體是AgentSociety的核心。團(tuán)隊(duì)提出的大模型驅(qū)動(dòng)的社會(huì)人智能體,旨在通過(guò)結(jié)合大模型智能體技術(shù)與心理學(xué)、經(jīng)濟(jì)學(xué)和行為科學(xué)理論,模擬具有復(fù)雜社會(huì)行為的智能體,并通過(guò)模擬大規(guī)模智能體間及智能體與環(huán)境的交互,探索社會(huì)現(xiàn)象的演變和集體行為。具體而言,團(tuán)隊(duì)將社會(huì)人智能體設(shè)計(jì)分為三個(gè)層面:心智、心智-行為耦合和行為。
圖 2 社會(huì)人智能體的基本構(gòu)成,分為心智、心智-行為耦合和行為
心智層面:構(gòu)建智能體的心理認(rèn)知系統(tǒng)
在心智層面,為每個(gè)智能體構(gòu)建穩(wěn)定的個(gè)體畫像(如性格、年齡、性別)和動(dòng)態(tài)的個(gè)人狀態(tài)(如情感、經(jīng)濟(jì)狀況和社會(huì)關(guān)系),以確保智能體在不同情境下展現(xiàn)個(gè)性化的行為模式。在此基礎(chǔ)上,團(tuán)隊(duì)引入情感(Emotions)、需求(Needs)和認(rèn)知(Cognition) 三大核心心理過(guò)程,共同決定智能體的決策推理、行為模式和社會(huì)適應(yīng)能力。具體而言,情感反映智能體對(duì)外部刺激的即時(shí)反應(yīng),影響其短期決策和社交互動(dòng),例如在正面反饋下增強(qiáng)合作意愿,或在負(fù)面情境中表現(xiàn)出回避行為;需求是行為的內(nèi)在驅(qū)動(dòng)力,基于馬斯洛需求層次理論,智能體在滿足基本生存需求后,會(huì)逐步追求安全、社交、尊重乃至自我實(shí)現(xiàn),從而塑造其長(zhǎng)期行為軌跡和社交策略;認(rèn)知決定了智能體如何理解外部世界,包括對(duì)社會(huì)事件、政策環(huán)境和群體行為的態(tài)度,這一過(guò)程不僅受其個(gè)性和過(guò)往經(jīng)歷影響,還會(huì)因長(zhǎng)期社會(huì)互動(dòng)不斷演化。
心智-行為耦合:心智如何驅(qū)動(dòng)智能體行為
智能體的行為并非隨機(jī)或被動(dòng)響應(yīng),而是由其情感、需求和認(rèn)知共同驅(qū)動(dòng),并根據(jù)個(gè)人狀態(tài)與外部環(huán)境的交互不斷調(diào)整。團(tuán)隊(duì)基于馬斯洛需求層次理論(Maslow’s Hierarchy of Needs)和計(jì)劃行為理論(Theory of Planned Behavior, TPB),構(gòu)建從心理狀態(tài)到行為執(zhí)行的完整路徑,使智能體的行為更符合人類的動(dòng)機(jī)模式。按照馬斯洛需求層次理論,智能體會(huì)優(yōu)先滿足生存和安全需求,在此基礎(chǔ)上逐步追求社交等更高級(jí)目標(biāo)。與此同時(shí),基于計(jì)劃行為理論,智能體在形成目標(biāo)后,會(huì)結(jié)合自身認(rèn)知和環(huán)境因素主動(dòng)規(guī)劃行動(dòng),使其行為既具適應(yīng)性,又能展現(xiàn)長(zhǎng)期連貫性。
行為層面:智能體如何展現(xiàn)復(fù)雜類人行為
在行為層面,提出的社會(huì)人智能體不僅能夠執(zhí)行簡(jiǎn)單行為,還能夠展現(xiàn)多層次的復(fù)雜社會(huì)行為,包括移動(dòng)、社交和經(jīng)濟(jì)活動(dòng)。簡(jiǎn)單行為主要涵蓋睡眠、飲食、娛樂(lè)和休息等基礎(chǔ)活動(dòng),這些行為雖然不涉及復(fù)雜的決策,但對(duì)智能體的整體狀態(tài)和長(zhǎng)期行為模式至關(guān)重要。例如,睡眠不足可能影響情緒和社交意愿,而良好的飲食和娛樂(lè)體驗(yàn)則可能提升幸福感,進(jìn)一步塑造智能體的社交和工作行為。復(fù)雜社會(huì)行為方面,智能體能夠在移動(dòng)、社交和經(jīng)濟(jì)活動(dòng)中展現(xiàn)高度的自主智能。移動(dòng)行為不僅涉及簡(jiǎn)單的地點(diǎn)切換,還包括出行方式選擇、路徑規(guī)劃以及對(duì)交通環(huán)境的動(dòng)態(tài)調(diào)整,使智能體的移動(dòng)模式更符合現(xiàn)實(shí)社會(huì)的出行習(xí)慣。社交行為不僅限于基本互動(dòng),還涉及社交關(guān)系的建立、維持和演變,智能體會(huì)根據(jù)自身需求、情感狀態(tài)和外部環(huán)境調(diào)整社交策略,從而形成類似人類的社交網(wǎng)絡(luò)。經(jīng)濟(jì)行為方面,智能體不僅理解資源交換的基本概念,還能根據(jù)自身經(jīng)濟(jì)狀況、市場(chǎng)環(huán)境和個(gè)體偏好進(jìn)行工作、消費(fèi)等經(jīng)濟(jì)決策,展現(xiàn)出符合社會(huì)規(guī)則的經(jīng)濟(jì)行為模式。
圖 3 社會(huì)人智能體設(shè)計(jì)架構(gòu)
社會(huì)人智能體模擬:自主生活的一日
為了驗(yàn)證智能體的自主決策能力及其行為模式的合理性,團(tuán)隊(duì)模擬了社會(huì)人智能體的一日生活,觀察其在移動(dòng)、社交和經(jīng)濟(jì)活動(dòng) 方面的決策和適應(yīng)能力(如下表所示)。通過(guò) 24 小時(shí)的仿真,智能體在需求、情感和認(rèn)知 的驅(qū)動(dòng)下自主規(guī)劃日常任務(wù),并動(dòng)態(tài)調(diào)整行為,以符合現(xiàn)實(shí)社會(huì)中的時(shí)間節(jié)奏和互動(dòng)邏輯。
表 1 社會(huì)人智能體自主生活一日示例
二、真實(shí)社會(huì)環(huán)境
為了讓智能體的行為更加貼近現(xiàn)實(shí)世界,團(tuán)隊(duì)構(gòu)建了一個(gè) 高度真實(shí)、可交互的城市社會(huì)環(huán)境,支持 移動(dòng)、社交和經(jīng)濟(jì)活動(dòng) 等核心行為的模擬。與僅依賴大模型推理不同,團(tuán)隊(duì)的環(huán)境 結(jié)合物理約束、社會(huì)規(guī)則和資源限制,確保智能體的行為符合現(xiàn)實(shí)邏輯,避免 大模型生成的“幻覺(jué)”影響。
這一環(huán)境具備三大核心優(yōu)勢(shì):
1. 精準(zhǔn)建?,F(xiàn)實(shí)世界機(jī)制:融合物理約束、成本反饋和社會(huì)運(yùn)行規(guī)則,讓智能體在時(shí)間、資源、經(jīng)濟(jì)等多維度受到真實(shí)限制,使其行為更具合理性和連貫性。
2. 數(shù)據(jù)源自現(xiàn)實(shí),確保行為邏輯一致:環(huán)境數(shù)據(jù)直接來(lái)源于真實(shí)世界,或基于現(xiàn)實(shí)社會(huì)原則構(gòu)建,保證模擬結(jié)果具有現(xiàn)實(shí)參考價(jià)值,避免虛擬環(huán)境脫離社會(huì)規(guī)律。
3. 智能體可交互接口,支持真實(shí)決策:智能體不僅能夠感知環(huán)境,還可直接與其交互,實(shí)現(xiàn)路徑規(guī)劃、社交關(guān)系演變、經(jīng)濟(jì)交易等動(dòng)態(tài)決策,確保行為不僅是文本推理的結(jié)果,而是真實(shí)行動(dòng)的模擬。
此外,團(tuán)隊(duì)將環(huán)境劃分為城市空間、社交空間和經(jīng)濟(jì)空間,共同構(gòu)建完整、動(dòng)態(tài)的社會(huì)系統(tǒng),為智能體行為的模擬提供精準(zhǔn)支撐,使其更符合人類社會(huì)的運(yùn)行模式。
圖 4 真實(shí)城市社會(huì)環(huán)境
為了驗(yàn)證真實(shí)城市社會(huì)環(huán)境在大規(guī)模社會(huì)模擬中的適應(yīng)性和運(yùn)行效率,團(tuán)隊(duì)進(jìn)行了性能測(cè)試,評(píng)估其在不同規(guī)模的智能體數(shù)量和高并發(fā)查詢場(chǎng)景下的表現(xiàn)。實(shí)驗(yàn)?zāi)M了1,000、10,000、100,000 和 1,000,000 個(gè)智能體在城市、社交和經(jīng)濟(jì)空間內(nèi)的交互,并采用典型工作日出行模式,在 8:30 早高峰啟動(dòng)模擬。測(cè)試過(guò)程中,團(tuán)隊(duì)設(shè)定查詢執(zhí)行比為 1:999(即每 999 次數(shù)據(jù)查詢后進(jìn)行 1 次環(huán)境狀態(tài)更新),貼近智能體的真實(shí)交互模式,同時(shí)控制模擬進(jìn)程數(shù)為 2、4、8、16 和 32。每種實(shí)驗(yàn)條件下,團(tuán)隊(duì)重復(fù)測(cè)試五次,每次持續(xù) 10 秒,并記錄查詢速率(QPS) 在 10^2 至 10^5 之間的變化情況。實(shí)驗(yàn)結(jié)果表明,即使智能體數(shù)量和查詢速率顯著增加,系統(tǒng)仍保持穩(wěn)定運(yùn)行,能夠高效處理大規(guī)模智能體交互,為大規(guī)模社會(huì)模擬提供實(shí)時(shí)、可靠的計(jì)算支持。
表 2城市社會(huì)環(huán)境性能評(píng)估
三、大規(guī)模社會(huì)模擬引擎與社會(huì)學(xué)研究工具箱
為了實(shí)現(xiàn)真實(shí)、高效地大規(guī)模社會(huì)模擬,團(tuán)隊(duì)構(gòu)建了一個(gè)高效、可擴(kuò)展、支持大規(guī)模社會(huì)人智能體并行執(zhí)行的社會(huì)模擬引擎。該引擎不僅結(jié)合了LLM驅(qū)動(dòng)的多智能體系統(tǒng)和真實(shí)城市社會(huì)環(huán)境,更在系統(tǒng)架構(gòu)上進(jìn)行了深度優(yōu)化,以確保模擬結(jié)果既具備現(xiàn)實(shí)合理性,又能大規(guī)模、高效運(yùn)行。
圖 5 大規(guī)模社會(huì)模擬引擎
傳統(tǒng)多智能體框架(如CAMEL、AgentScope)通常依賴嚴(yán)格的消息傳遞機(jī)制來(lái)組織智能體間的交互,以保證任務(wù)的執(zhí)行順序。然而,在現(xiàn)實(shí)社會(huì)中,個(gè)體的行為決策并非總是受外部輸入直接驅(qū)動(dòng),而是源自個(gè)體記憶、認(rèn)知狀態(tài)和環(huán)境約束的自主整合。因此,團(tuán)隊(duì)的社會(huì)模擬引擎采用了更接近現(xiàn)實(shí)的異步模擬架構(gòu),讓每個(gè)智能體作為獨(dú)立的模擬單元,不依賴特定的執(zhí)行順序,而是通過(guò)消息系統(tǒng)進(jìn)行信息交換,實(shí)現(xiàn)智能體之間的相互影響。
為了提升大規(guī)模并行模擬的計(jì)算效率,團(tuán)隊(duì)基于Ray分布式計(jì)算框架,結(jié)合Python的asyncio機(jī)制進(jìn)行異步執(zhí)行,使模擬任務(wù)能夠高效利用多核計(jì)算資源,并支持分布式集群擴(kuò)展。同時(shí),為了降低智能體間通信的系統(tǒng)開(kāi)銷,團(tuán)隊(duì)引入了智能體分組(Agent Group)機(jī)制,使多個(gè)智能體可以在單個(gè)進(jìn)程中運(yùn)行,從而減少進(jìn)程間通信開(kāi)銷,提高計(jì)算效率。此外,為了實(shí)現(xiàn)大規(guī)模社會(huì)智能體的高并發(fā)、可靠消息傳輸,團(tuán)隊(duì)引入了MQTT通信協(xié)議,該協(xié)議廣泛應(yīng)用于物聯(lián)網(wǎng)場(chǎng)景,具備高吞吐量和低延遲的特點(diǎn),非常適用于大規(guī)模社會(huì)模擬中智能體間的信息交換。
在系統(tǒng)架構(gòu)上,團(tuán)隊(duì)采用模塊化設(shè)計(jì),包括共享服務(wù)層、模擬任務(wù)管理層和可選的GUI交互層。共享服務(wù)層包括LLM API接口、MQTT消息服務(wù)器、數(shù)據(jù)庫(kù)存儲(chǔ)和指標(biāo)管理系統(tǒng),確保模擬過(guò)程中數(shù)據(jù)傳輸高效、智能體行為可記錄、結(jié)果可視化。模擬任務(wù)管理層則基于Ray框架,提供高效的智能體管理和任務(wù)調(diào)度能力,使得不同實(shí)驗(yàn)?zāi)軌颡?dú)立執(zhí)行,同時(shí)共享計(jì)算資源,提升可擴(kuò)展性和復(fù)用性。
大規(guī)模社會(huì)模擬器通過(guò)數(shù)字化和虛擬化的方式,使研究者能夠在無(wú)需進(jìn)行實(shí)際實(shí)驗(yàn)的情況下,模擬并觀察社會(huì)現(xiàn)象的變化過(guò)程,顯著降低了研究的風(fēng)險(xiǎn)和成本。同時(shí)模擬器能夠在不同情境下進(jìn)行多維度的數(shù)據(jù)采集和實(shí)驗(yàn)設(shè)計(jì),解決傳統(tǒng)研究因受限于時(shí)間、空間和資源等因素所帶來(lái)的局限。團(tuán)隊(duì)提供可視化交互工具與社會(huì)學(xué)研究工具箱,支持實(shí)時(shí)監(jiān)測(cè)、主動(dòng)干預(yù)和數(shù)據(jù)收集,助力社會(huì)實(shí)驗(yàn)研究。
? 實(shí)時(shí)可視化監(jiān)測(cè):直觀展示社交網(wǎng)絡(luò)、經(jīng)濟(jì)活動(dòng)、移動(dòng)軌跡 等核心變量,支持實(shí)驗(yàn)參數(shù)調(diào)整,精準(zhǔn)跟蹤社會(huì)演化過(guò)程。
? 訪談(Interviews):研究者可實(shí)時(shí)向智能體提問(wèn),獲取基于記憶、當(dāng)前狀態(tài)和環(huán)境的回答,不影響其正常行為。
? 調(diào)查問(wèn)卷(Surveys):支持 批量分發(fā)結(jié)構(gòu)化問(wèn)卷,智能體按預(yù)設(shè)規(guī)則作答,確保數(shù)據(jù)一致性,便于趨勢(shì)分析。
? 干預(yù)實(shí)驗(yàn)(Interventions):提供三種行為干預(yù)方式,測(cè)試社會(huì)情境下的個(gè)體與群體響應(yīng),包括:1)智能體配置:預(yù)設(shè)性格、目標(biāo)和關(guān)系,影響初始行為傾向;2)記憶操控:修改情緒和認(rèn)知,觀察對(duì)決策與社交互動(dòng)的影響。3)外部信息干預(yù):發(fā)送特定信息(如災(zāi)害預(yù)警)測(cè)試應(yīng)急響應(yīng)與傳播模式。
社會(huì)模擬器的應(yīng)用不僅限于具體的社會(huì)實(shí)驗(yàn),它還可以作為社會(huì)科學(xué)研究的核心方法工具,輔助開(kāi)展前期研究和假設(shè)驗(yàn)證,輔助政策決策者和公共事務(wù)參與主體進(jìn)行智能決策。研究團(tuán)隊(duì)可以利用其進(jìn)行初步的理論構(gòu)建、實(shí)驗(yàn)設(shè)計(jì)和政策效果評(píng)估,為后續(xù)的實(shí)證研究提供依據(jù)。這種工具的靈活性和可擴(kuò)展性使得研究者能夠在不同的社會(huì)情境和變量條件下,快速測(cè)試?yán)碚摷僭O(shè)并驗(yàn)證其可行性,為學(xué)術(shù)研究的精準(zhǔn)性和實(shí)用性提供有力保障。
為了評(píng)估社會(huì)模擬引擎的擴(kuò)展性和計(jì)算效率,團(tuán)隊(duì)進(jìn)行了大規(guī)模測(cè)試,模擬不同數(shù)量的智能體,并測(cè)量系統(tǒng)在高并發(fā)場(chǎng)景下的表現(xiàn)。在消息通信系統(tǒng)方面,團(tuán)隊(duì)測(cè)試了 MQTT、Redis Pub/Sub 和 RabbitMQ,比較了它們的并行處理能力、吞吐量(msg/s)和輔助工具支持。實(shí)驗(yàn)結(jié)果顯示,MQTT 和 Redis Pub/Sub 滿足高吞吐需求。
表 3 消息系統(tǒng)性能評(píng)估
在大規(guī)模智能體模擬方面,團(tuán)隊(duì)在64 核服務(wù)器上運(yùn)行實(shí)驗(yàn),32 核分配給模擬引擎,32 核用于智能體執(zhí)行,并測(cè)試了1,000和10,000 智能體在不同進(jìn)程數(shù)(8、16、32) 下的運(yùn)行情況。實(shí)驗(yàn)測(cè)量了 總執(zhí)行時(shí)間、LLM API 響應(yīng)時(shí)間、模擬器 API 響應(yīng)時(shí)間和令牌消耗,結(jié)果表明 Ray 分布式計(jì)算框架和智能體分組機(jī)制大幅提高了模擬效率,確保系統(tǒng)在 高并發(fā)負(fù)載下仍能穩(wěn)定運(yùn)行。
表 4 AgentSociety總體性能評(píng)估表
上表展示了隨著智能體數(shù)量增加,系統(tǒng)在分布式計(jì)算下的可擴(kuò)展性及性能表現(xiàn)。實(shí)驗(yàn)表明,令牌使用模式(包括輸入和輸出)保持穩(wěn)定,分布式并行框架能夠有效支持大規(guī)模智能體的執(zhí)行,充分利用多核計(jì)算能力,成功緩解了CPU瓶頸,確保了系統(tǒng)的可擴(kuò)展性。同時(shí),實(shí)驗(yàn)結(jié)果也表明,在完全并行的條件下,執(zhí)行效率主要受限于大模型API調(diào)用的性能。
四、社會(huì)實(shí)驗(yàn)典型案例
為了展示大規(guī)模社會(huì)模擬器在社會(huì)科學(xué)研究中的價(jià)值,團(tuán)隊(duì)開(kāi)展了一系列典型社會(huì)實(shí)驗(yàn),涵蓋干預(yù)實(shí)驗(yàn)、訪談和調(diào)查問(wèn)卷等方法。實(shí)驗(yàn)聚焦 觀點(diǎn)極化、煽動(dòng)性消息傳播與治理、UBI政策和颶風(fēng)沖擊下的社會(huì)動(dòng)態(tài),深入探討個(gè)體與群體行為在不同社會(huì)機(jī)制下的演化規(guī)律。
4.1 觀點(diǎn)極化社會(huì)傳播現(xiàn)象模擬
觀點(diǎn)極化指社會(huì)群體內(nèi)部的觀點(diǎn)逐漸分化,形成難以調(diào)和的對(duì)立陣營(yíng)。本實(shí)驗(yàn)以槍支管控政策為議題,模擬社會(huì)智能體的觀點(diǎn)演化過(guò)程。實(shí)驗(yàn)設(shè)計(jì)包含對(duì)照組和兩個(gè)干預(yù)組:在對(duì)照組中,智能體通過(guò)相互討論更新觀點(diǎn),沒(méi)有外部干預(yù),觀點(diǎn)的演化完全依賴于智能體之間的自主社交交互;在同質(zhì)信息組中,智能體僅接收到與其立場(chǎng)相同的信息,從而模擬信息繭房效應(yīng);在對(duì)立信息組中,智能體僅接收與其立場(chǎng)相反的信息,旨在測(cè)試不同觀點(diǎn)的影響。通過(guò)這種實(shí)驗(yàn)設(shè)計(jì),研究人員僅需要書寫簡(jiǎn)單實(shí)驗(yàn)配置文件,即可在模擬器中開(kāi)展該實(shí)驗(yàn)。
圖 6 觀點(diǎn)極化實(shí)驗(yàn)配置模板
圖 7 接觸不同信息條件下觀點(diǎn)極化程度的對(duì)比
如上圖所示,針對(duì)槍支管控這一政治議題,三種實(shí)驗(yàn)設(shè)置下的觀點(diǎn)變化呈現(xiàn)出明顯的差異。在對(duì)照組中,智能體之間進(jìn)行自由討論,沒(méi)有外部干預(yù),結(jié)果顯示39%的智能體在互動(dòng)后變得更加極化,而33%的智能體則傾向于持更加溫和的觀點(diǎn)。與此相比,在同質(zhì)信息組中,觀點(diǎn)極化現(xiàn)象更加顯著,52%的智能體的觀點(diǎn)變得更加極端。這表明,與志同道合的個(gè)體過(guò)度互動(dòng)可能會(huì)加劇觀點(diǎn)的極化,即真實(shí)世界中常見(jiàn)的“回音室效應(yīng)”。而在對(duì)立信息組中,89%的智能體的觀點(diǎn)變得更加溫和,11%的智能體甚至被說(shuō)服接受了對(duì)立的觀點(diǎn)。這表明,接觸到不同意見(jiàn)的內(nèi)容能夠有效緩解觀點(diǎn)極化,或可成為應(yīng)對(duì)極化現(xiàn)象的一種有效策略。
4.2 煽動(dòng)性消息的傳播模擬與智能治理
煽動(dòng)性消息指包含極端觀點(diǎn)或誤導(dǎo)性信息的內(nèi)容,這類信息在社交網(wǎng)絡(luò)中的快速傳播可能加劇群體沖突,影響公共討論環(huán)境。本實(shí)驗(yàn)?zāi)M 煽動(dòng)性信息在社交網(wǎng)絡(luò)中的傳播,并測(cè)試不同的內(nèi)容治理策略對(duì)其擴(kuò)散模式和群體情緒的影響。實(shí)驗(yàn)包括對(duì)照組和煽動(dòng)性信息組:在對(duì)照組中,智能體僅傳播普通信息,團(tuán)隊(duì)觀察其自然擴(kuò)散過(guò)程及情緒演化。在煽動(dòng)性信息組,團(tuán)隊(duì)引入帶有強(qiáng)烈情緒表達(dá)的煽動(dòng)性內(nèi)容,分析其對(duì)信息傳播速度和群體情緒的影響。針對(duì)煽動(dòng)性信息傳播的治理,團(tuán)隊(duì)設(shè)計(jì)了節(jié)點(diǎn)干預(yù)和邊干預(yù) 兩種策略,其中節(jié)點(diǎn)干預(yù) 通過(guò)檢測(cè)并封禁反復(fù)傳播煽動(dòng)性內(nèi)容的賬戶、以減少信息源頭,邊干預(yù)則在發(fā)現(xiàn)煽動(dòng)性內(nèi)容傳播時(shí)切斷社交連接,以遏制其擴(kuò)散。實(shí)驗(yàn)還通過(guò)與智能體的交互式訪談探究個(gè)體在分享煽動(dòng)性消息時(shí)的心理動(dòng)因。在模擬器中開(kāi)展該實(shí)驗(yàn)的配置如下,
圖 8 煽動(dòng)性消息實(shí)驗(yàn)配置模板
圖 9 煽動(dòng)性消息的傳播與治理策略
實(shí)驗(yàn)結(jié)果顯示,煽動(dòng)性消息在社交網(wǎng)絡(luò)中具有更強(qiáng)的傳播潛力和更高的情緒反應(yīng)。節(jié)點(diǎn)干預(yù),即暫停頻繁傳播煽動(dòng)性內(nèi)容的賬戶,比邊干預(yù)更有效,能夠更好地控制煽動(dòng)性消息的擴(kuò)散。情緒強(qiáng)度分析的結(jié)果表明,煽動(dòng)性消息顯著放大了網(wǎng)絡(luò)中的情緒強(qiáng)度,而節(jié)點(diǎn)干預(yù)在調(diào)節(jié)情緒反應(yīng)方面表現(xiàn)尤為突出。進(jìn)一步,訪談結(jié)果揭示,強(qiáng)烈的情緒反應(yīng)和社會(huì)責(zé)任感是推動(dòng)煽動(dòng)性信息分享的主要驅(qū)動(dòng)因素,用戶常因同情或擔(dān)憂而分享信息,希望引起公眾關(guān)注或推動(dòng)社會(huì)反應(yīng)??傮w來(lái)看,煽動(dòng)性信息具有更強(qiáng)的傳播性和情緒引導(dǎo)力,與真實(shí)人類社會(huì)中的觀測(cè)結(jié)果高度一致。同時(shí),節(jié)點(diǎn)干預(yù)在信息控制和情緒調(diào)節(jié)方面更為有效,為優(yōu)化社交網(wǎng)絡(luò)內(nèi)容管理策略提供了有力支持。
4.3 全民基本收入(Universal Basic Income,UBI)政策推演
UBI 旨在緩解貧困、促進(jìn)經(jīng)濟(jì)穩(wěn)定和提升社會(huì)福祉,盡管其高昂成本和經(jīng)濟(jì)影響存在爭(zhēng)議,但作為 改善收入分配和增強(qiáng)社會(huì)保障的政策工具,已成為研究焦點(diǎn)。本實(shí)驗(yàn)通過(guò)模擬UBI 政策的干預(yù)效果,探討其對(duì)個(gè)體經(jīng)濟(jì)行為和宏觀經(jīng)濟(jì)環(huán)境的影響。實(shí)驗(yàn)包括對(duì)照組和UBI干預(yù)組。對(duì)照組中,智能體在無(wú) UBI 政策的條件下進(jìn)行經(jīng)濟(jì)活動(dòng);干預(yù)組則模擬實(shí)施 UBI,每名智能體每月獲得 $1,000的無(wú)條件收入,以觀察其消費(fèi)、儲(chǔ)蓄、就業(yè)選擇等行為變化。實(shí)驗(yàn)基于 UBI 試點(diǎn)地區(qū)(如美國(guó)德克薩斯州)的人口分布數(shù)據(jù),并通過(guò)對(duì)比兩組模擬的 經(jīng)濟(jì)和社會(huì)指標(biāo),評(píng)估 UBI 對(duì)個(gè)體和整體經(jīng)濟(jì)的影響,分析其是否與現(xiàn)實(shí) UBI 社會(huì)實(shí)驗(yàn)的結(jié)果相符。
圖 10 UBI政策效果與公眾意見(jiàn)
實(shí)驗(yàn)結(jié)果顯示,模擬中的經(jīng)濟(jì)系統(tǒng)隨著時(shí)間推移逐漸穩(wěn)定,實(shí)際GDP和智能體消費(fèi)水平的波動(dòng)逐漸縮小。團(tuán)隊(duì)在第96步引入了UBI政策,并比較了接下來(lái)24步內(nèi)的經(jīng)濟(jì)和社會(huì)指標(biāo),具體包括智能體消費(fèi)水平和抑郁水平(使用CES-D量表進(jìn)行調(diào)查問(wèn)卷評(píng)估)。結(jié)果表明,UBI政策顯著提高了消費(fèi)水平并降低了抑郁水平,這與德州UBI政策的影響相似,驗(yàn)證了模擬的現(xiàn)實(shí)性。此外,通過(guò)對(duì)智能體的訪談,分析了它們對(duì)UBI政策的看法。訪談結(jié)果顯示,UBI政策的影響與利率、長(zhǎng)期福利、儲(chǔ)蓄和生活必需品等關(guān)鍵因素密切相關(guān),反映了現(xiàn)實(shí)中公眾對(duì)UBI政策的普遍認(rèn)知。這些結(jié)果一方面支持了UBI政策在提高消費(fèi)和改善心理健康方面的效果,另一方面也證明了模擬器作為低成本實(shí)驗(yàn)場(chǎng)地驗(yàn)證政策的有效性。
4.4 颶風(fēng)沖擊下的社會(huì)動(dòng)態(tài)模擬推演
颶風(fēng)等極端自然災(zāi)害對(duì)社會(huì)結(jié)構(gòu)和個(gè)體行為產(chǎn)生深遠(yuǎn)影響,理解此類事件對(duì)人口流動(dòng)、基礎(chǔ)設(shè)施和社會(huì)穩(wěn)定的沖擊對(duì)于優(yōu)化應(yīng)急響應(yīng)和降低災(zāi)害風(fēng)險(xiǎn)至關(guān)重要。本實(shí)驗(yàn)?zāi)M颶風(fēng)來(lái)襲期間的社會(huì)動(dòng)態(tài),分析個(gè)體在災(zāi)害環(huán)境下的行為模式。實(shí)驗(yàn)基于 2019 年颶風(fēng)多里安(Hurricane Dorian) 對(duì)美國(guó)東南部的影響,選取南卡羅來(lái)納州哥倫比亞市作為案例研究。數(shù)據(jù)來(lái)源包括 SafeGraph 移動(dòng)數(shù)據(jù)(記錄城市內(nèi)人群流動(dòng)模式)和 Census Block Group(CBG)數(shù)據(jù)(提供人口統(tǒng)計(jì)特征),用于構(gòu)建 1,000 名社會(huì)智能體,模擬其在颶風(fēng)期間的行為變化。
實(shí)驗(yàn)結(jié)果顯示,模擬智能體在颶風(fēng)事件中的移動(dòng)模式與真實(shí)數(shù)據(jù)高度一致,活動(dòng)水平隨颶風(fēng)來(lái)臨大幅下降,并在災(zāi)后逐步恢復(fù),符合實(shí)際人群出行趨勢(shì)。模擬數(shù)據(jù)與真實(shí)人口流動(dòng)的時(shí)間演化相似,驗(yàn)證了模擬器在復(fù)現(xiàn)極端天氣下人類行為的有效性,為優(yōu)化災(zāi)害應(yīng)對(duì)策略提供支持。
圖 11 颶風(fēng)沖擊實(shí)驗(yàn)配置模板
圖 12 颶風(fēng)沖擊下人流移動(dòng)強(qiáng)度變化
五、未來(lái)展望
面向未來(lái)智能社會(huì)治理探索,AgentSociety 將成為人機(jī)共生、治理創(chuàng)新、后稀缺經(jīng)濟(jì)模式的試驗(yàn)場(chǎng),測(cè)試 AI 議員參與立法對(duì)民主決策的影響,模擬UBI與機(jī)器人稅組合政策,甚至在數(shù)字環(huán)境推演 AI 時(shí)代的法律與倫理框架,探討科技與社會(huì)的共存模式。團(tuán)隊(duì)所提出的AgentSociety 是一個(gè)基于大語(yǔ)言智能體的大規(guī)模社會(huì)模擬器,正在從 “預(yù)測(cè)與解釋工具” 逐漸進(jìn)化為 “智能社會(huì)治理實(shí)驗(yàn)室”。其核心價(jià)值不僅在于分析社會(huì)現(xiàn)象,更在于構(gòu)建一個(gè)實(shí)驗(yàn)平臺(tái),用于政策沙盒測(cè)試、危機(jī)預(yù)警和未來(lái)社會(huì)形態(tài)探索,助力社會(huì)治理與文明演化。
圖 13 AgentSociety未來(lái)展望
六、平臺(tái)使用方法
AgentSociety同時(shí)提供在線使用和離線運(yùn)行兩種智能體部署方式,歡迎智能社會(huì)治理同仁和社會(huì)科學(xué)研究人員關(guān)注使用。
1. 在線體驗(yàn)
目前平臺(tái)正處于內(nèi)測(cè)階段(詳見(jiàn)https://agentsociety.readthedocs.io/en/latest/,https://agentsociety.fiblab.net/exp/1a4c4fa5-04c1-4973-9433-b8b696f2fda0)。研發(fā)團(tuán)隊(duì)誠(chéng)摯歡迎來(lái)自社會(huì)科學(xué)、大模型、智能體等各個(gè)領(lǐng)域的學(xué)者嘗試平臺(tái)并提出寶貴建議和意見(jiàn)。平臺(tái)提供易用的在線實(shí)驗(yàn)環(huán)境,包括智能體、城市社會(huì)環(huán)境、社會(huì)科學(xué)研究工具箱、完善的手冊(cè)文檔與實(shí)驗(yàn)案例以及在線指導(dǎo)。后續(xù)內(nèi)部評(píng)測(cè)后,將提供在線使用模式。
用戶可以通過(guò)郵箱agentsociety.fiblab2025@gmail.com提交研究提案。經(jīng)過(guò)團(tuán)隊(duì)審核和討論后,團(tuán)隊(duì)將通過(guò)郵件發(fā)送內(nèi)測(cè)賬號(hào),協(xié)助您順利完成實(shí)驗(yàn)。期待與大家共同探索和推動(dòng)社會(huì)科學(xué)研究的前沿發(fā)展!
2. 離線運(yùn)行
用戶可以在官方網(wǎng)站https://agentsociety.readthedocs.io/en/latest/下載離線版本,在本地部署后進(jìn)行智能體的配置和實(shí)驗(yàn),平臺(tái)提供適用于Linux、MacOS Arm等不同類型操作系統(tǒng)的相應(yīng)版本,方便模擬環(huán)境的快速部署和測(cè)試。