清華EconAgent獲ACL 2024杰出論文:大模型智能體革新計(jì)算經(jīng)濟(jì)學(xué)研究范式
宏觀經(jīng)濟(jì)學(xué)在上個(gè)世紀(jì)經(jīng)歷了多次危機(jī)與發(fā)展。
從18世紀(jì)亞當(dāng)·斯密古典宏觀經(jīng)濟(jì)學(xué)中「看不見的手」到上世紀(jì)20~30年代美國大蕭條時(shí)期的凱恩斯革命,從二戰(zhàn)后薩繆爾森的新古典綜合到70~80年代美國滯漲時(shí)期的貨幣主義,從新古典宏觀經(jīng)濟(jì)學(xué)的理性預(yù)期到行為經(jīng)濟(jì)學(xué),尤其是2008年全球金融危機(jī)后,對(duì)宏觀經(jīng)濟(jì)現(xiàn)象的研究越來越重視對(duì)人的復(fù)雜行為的準(zhǔn)確建模。
20世紀(jì)末到21世紀(jì)初,基于代理的建模(Agent-based Modeling, ABM)在計(jì)算經(jīng)濟(jì)學(xué)中受到一定程度的關(guān)注。
ABM強(qiáng)調(diào)了主流方法動(dòng)態(tài)隨機(jī)一般均衡(DSGE)模型中「完美世界」假設(shè)的缺陷,旨在通過模擬微觀個(gè)體的行為及其交互自下而上地涌現(xiàn)出宏觀層面的典型化事實(shí)(Stylized facts),例如GDP增長與波動(dòng)、通脹與失業(yè)率的權(quán)衡。
然而,由于個(gè)體行為規(guī)則需要專家設(shè)定,并帶來模型校驗(yàn)、可解釋性有限的問題,ABM模擬在宏觀經(jīng)濟(jì)學(xué)領(lǐng)域的發(fā)展一定程度上受限。
如今,大語言模型(LLM)的出現(xiàn)催生了各個(gè)領(lǐng)域的智能體研究并取得了多方面的成功,驗(yàn)證了LLM強(qiáng)大的推理與決策能力,這為模擬更真實(shí)的經(jīng)濟(jì)個(gè)體提供了有效途徑。
論文鏈接:https://arxiv.org/abs/2310.10436v4
清華大學(xué)團(tuán)隊(duì)的這項(xiàng)工作使用LLM構(gòu)造EconAgent,在一個(gè)宏觀經(jīng)濟(jì)系統(tǒng)中模擬了個(gè)體的工作與消費(fèi)行為,并相較于傳統(tǒng)ABM模擬涌現(xiàn)出了更穩(wěn)定、真實(shí)的典型事實(shí)(Stylized fact, 即經(jīng)典的宏觀經(jīng)濟(jì)現(xiàn)象)。
EconAgent與經(jīng)濟(jì)模擬系統(tǒng)
論文第一作者為清華大學(xué)博士生李念,合作者包括清華大學(xué)李勇教授、高宸助理研究員、廖慶敏教授。
經(jīng)濟(jì)模擬系統(tǒng)的構(gòu)建
為盡可能保證經(jīng)濟(jì)模擬的真實(shí)性,經(jīng)濟(jì)系統(tǒng)包括了必要的經(jīng)濟(jì)活動(dòng),包括個(gè)體、公司、政府、銀行等經(jīng)濟(jì)對(duì)象,以及工作、消費(fèi)、定價(jià)等經(jīng)濟(jì)活動(dòng):
- 個(gè)體通過工作取得月收入;
- 政府按照稅收政策對(duì)所有個(gè)體征稅,并將稅收平均返還;
- 個(gè)體決定將稅收收入和儲(chǔ)蓄的一部分用于消費(fèi)生活必需品;
- 個(gè)體的工作帶來必需品的生產(chǎn)供應(yīng),個(gè)體的消費(fèi)帶來必需品的消費(fèi)需求,結(jié)合當(dāng)前的庫存,供需不平衡會(huì)帶來消費(fèi)市場與勞動(dòng)市場的動(dòng)態(tài)變化,即商品價(jià)格與個(gè)體工資的變動(dòng);
- 每年個(gè)體在銀行的儲(chǔ)蓄得到一些利息;銀行通過常用的Taylor Rule進(jìn)行每年的利率調(diào)整。
EconAgent智能體設(shè)計(jì)
為了使EconAgent能根據(jù)自身與外部的經(jīng)濟(jì)狀況作出合理決策,研究者進(jìn)行了如下幾方面設(shè)計(jì)。
首先,在prompt中賦予了個(gè)體差異化的、基于現(xiàn)實(shí)世界的畫像,包括年齡、姓名、職業(yè)等,使得每個(gè)個(gè)體都具有獨(dú)特的特征和背景,從而能夠模擬真實(shí)世界中個(gè)體的多樣性和復(fù)雜性。
其次,prompt中描述了真實(shí)經(jīng)濟(jì)環(huán)境中的生活場景,使得EconAgent夠感知與理解經(jīng)濟(jì)環(huán)境中的信息及其變化趨勢(shì),從而作出正確合理的響應(yīng)。進(jìn)一步地,研究者對(duì)智能體設(shè)計(jì)了記憶模塊,以模擬廣泛的宏觀經(jīng)濟(jì)趨勢(shì)對(duì)個(gè)體決策的影響;
如此一來,EconAgent不僅能夠感知當(dāng)前的經(jīng)濟(jì)環(huán)境,還能夠考慮市場環(huán)境的歷史變化和長期趨勢(shì)。
最后,EconAgent綜合考慮多類經(jīng)濟(jì)因素做出自主決策,不依賴于預(yù)定義的規(guī)則。
反思prompt與結(jié)果:個(gè)體能感知?jiǎng)趧?dòng)市場與消費(fèi)市場的變化
實(shí)驗(yàn)結(jié)果:宏觀經(jīng)濟(jì)現(xiàn)象與規(guī)律的自主涌現(xiàn)
研究者模擬了一個(gè)百人經(jīng)濟(jì)系統(tǒng),每個(gè)模擬步代表一個(gè)月,共進(jìn)行了20年的模擬,從宏觀經(jīng)濟(jì)指標(biāo)與經(jīng)濟(jì)規(guī)律兩個(gè)方面對(duì)模擬結(jié)果進(jìn)行驗(yàn)證,并與基于規(guī)則的ABM模擬[1,2]以及RL方法[3]進(jìn)行對(duì)比。
1. 宏觀經(jīng)濟(jì)指標(biāo):通脹率、失業(yè)率、名義GDP、名義GDP增長率
實(shí)驗(yàn)結(jié)果表明,基于EconAgent的模擬涌現(xiàn)出數(shù)值更合理、波動(dòng)更穩(wěn)定的宏觀經(jīng)濟(jì)指標(biāo)。例如,通脹率不超過10%、在第3年后基本達(dá)到穩(wěn)定。
宏觀經(jīng)濟(jì)指標(biāo)
2. 宏觀經(jīng)濟(jì)規(guī)律:Phillips Curve、Okun’s Law
實(shí)驗(yàn)結(jié)果表明,基于EconAgent的模擬涌現(xiàn)出更合理的經(jīng)濟(jì)規(guī)律,而其它方法的結(jié)果出現(xiàn)了錯(cuò)誤的Phillips Curve:失業(yè)率與工資通脹率并不是負(fù)相關(guān)關(guān)系。
宏觀經(jīng)濟(jì)規(guī)律
EconAgent的決策行為分析
為進(jìn)一步探究EconAgent所做的決策是否符合真實(shí)世界的經(jīng)濟(jì)常識(shí),研究者對(duì)其工作與消費(fèi)決策進(jìn)行多個(gè)經(jīng)濟(jì)因素的回歸分析。
結(jié)果表明,當(dāng)稅收越少、政府返還越多、預(yù)期收入越高時(shí),工作意愿越高;當(dāng)儲(chǔ)蓄越高、上個(gè)月消費(fèi)越少時(shí),消費(fèi)占儲(chǔ)蓄比例越低,意味著EconAgent會(huì)保持穩(wěn)定的消費(fèi)水平;此外,商品價(jià)格也是影響工作與消費(fèi)意愿的重要因素。以上結(jié)論均與現(xiàn)實(shí)世界中的人類行為相吻合。
研究者進(jìn)一步研究EconAgent是否自主地表現(xiàn)出決策機(jī)制中的異質(zhì)性。
上圖(a)展示了消費(fèi)傾向隨年齡增長而逐步增加,這與在傳統(tǒng)宏觀經(jīng)濟(jì)研究中觀察到的經(jīng)驗(yàn)規(guī)律大體一致[4]。
研究者通過與EconAgent的交互,進(jìn)一步解讀了Phillips Curve中出現(xiàn)負(fù)相關(guān)的可能原因。首先,計(jì)算失業(yè)率最高和最低的兩年中所有Agent的平均消費(fèi)傾向。
上圖(b)展示了比較結(jié)果,其中***表示顯著差異(p < 0.001),可以觀察出高失業(yè)率導(dǎo)致消費(fèi)傾向顯著降低。
為了更深入地了解在高失業(yè)率的勞動(dòng)市場中選擇減少消費(fèi)的原因,隨機(jī)選擇一個(gè)Agent,并基于在失業(yè)率最高的那一年的行為決策歷史,結(jié)合每個(gè)季度的經(jīng)濟(jì)動(dòng)態(tài),為所做出的消費(fèi)決策提供理由。以下結(jié)果表明,Agent對(duì)宏觀經(jīng)濟(jì)趨勢(shì)有所感知,在面對(duì)高失業(yè)率下的勞動(dòng)市場通貨緊縮時(shí),會(huì)選擇謹(jǐn)慎消費(fèi)。
研究者進(jìn)一步探究了重要事件對(duì)EconAgent行為的影響以及由此產(chǎn)生的宏觀經(jīng)濟(jì)模擬結(jié)果的變化,這也是許多ABM研究中廣泛討論的一個(gè)話題[5]。
以對(duì)全球經(jīng)濟(jì)產(chǎn)生重大影響的COVID-19為例,研究者通過prompt的方式將其納入模擬中,如下所示:
下圖對(duì)比了失業(yè)率的變化情況,其中「Normal」和「COVID-19」分別表示有無上述提示的模擬結(jié)果。
結(jié)果表明基于EconAgent的模擬成功地復(fù)現(xiàn)了全球失業(yè)率的增長,盡管數(shù)值與真實(shí)數(shù)據(jù)并不完全匹配,但這表明所提出的框架能夠定性模擬重要事件對(duì)宏觀經(jīng)濟(jì)產(chǎn)生的影響。
以下是EconAgent的反思示例。
進(jìn)一步地,研究團(tuán)隊(duì)將EconAgent與研發(fā)的OpenCity智能體平臺(tái)[6]相結(jié)合,基于EconAgent驅(qū)動(dòng)北京真實(shí)街區(qū)中的個(gè)體工作、消費(fèi)行為,與企業(yè)的生產(chǎn)行為等經(jīng)濟(jì)活動(dòng)的模擬仿真。
總結(jié)與展望
總而言之,該論文工作結(jié)合LLM智能體與經(jīng)濟(jì)模擬,為計(jì)算經(jīng)濟(jì)學(xué)的研究范式開辟了一條新的可能道路,未來有望以DSGE等主流模型為目標(biāo),向更精準(zhǔn)、更真實(shí)的模擬邁進(jìn)。
進(jìn)一步地,關(guān)于大語言模型智能體ABM模擬及其在社會(huì)、經(jīng)濟(jì)、物理、網(wǎng)絡(luò)等領(lǐng)域應(yīng)用的相關(guān)工作,團(tuán)隊(duì)還發(fā)布了首篇綜述論文:《Large Language Models Empowered Agent-based Modeling and Simulation: A Survey and Perspectives》,該論文已被Humanities and Social Sciences Communications接收。