Finarena:基于大模型智能體的金融市場分析和預(yù)測人機(jī)協(xié)作框架
金融市場復(fù)雜且動態(tài),受經(jīng)濟(jì)指標(biāo)、地緣政治事件和投資者行為的影響,傳統(tǒng)線性分析方法難以捕捉其非線性特征。傳統(tǒng)統(tǒng)計方法(如CAPM、ARIMA)無法有效利用非結(jié)構(gòu)化數(shù)據(jù)(如新聞、經(jīng)濟(jì)報告)進(jìn)行分析和預(yù)測。
本文提出FinArena框架,結(jié)合人機(jī)協(xié)作以改善股票趨勢預(yù)測和個性化投資決策。人模塊通過交互界面捕捉個體風(fēng)險偏好,制定個性化投資策略。機(jī)器模塊利用基于大型語言模型的多代理系統(tǒng)整合多種金融數(shù)據(jù)源。
FinArena在股票趨勢預(yù)測和交易模擬中優(yōu)于傳統(tǒng)和先進(jìn)基準(zhǔn),顯示出提升投資結(jié)果的潛力。
論文地址:https://arxiv.org/pdf/2503.02692
【 掃描文末二維碼加入星球獲取論文 】
摘要
本文提出FinArena框架,結(jié)合人機(jī)協(xié)作以改善股票趨勢預(yù)測和個性化投資決策。人模塊通過交互界面捕捉個體風(fēng)險偏好,制定個性化投資策略。機(jī)器模塊利用基于大型語言模型的多代理系統(tǒng)整合多種金融數(shù)據(jù)源。采用自適應(yīng)檢索增強(qiáng)生成(RAG)方法處理非結(jié)構(gòu)化新聞數(shù)據(jù),解決LLM的幻覺問題。通用專家代理根據(jù)提取的特征和投資者風(fēng)險偏好做出投資決策。實驗表明,F(xiàn)inArena在股票趨勢預(yù)測和交易模擬中優(yōu)于傳統(tǒng)和先進(jìn)基準(zhǔn),顯示出提升投資結(jié)果的潛力。
簡介
金融市場復(fù)雜且動態(tài),受經(jīng)濟(jì)指標(biāo)、地緣政治事件和投資者行為的影響,傳統(tǒng)線性分析方法難以捕捉其非線性特征。傳統(tǒng)統(tǒng)計方法(如CAPM、ARIMA)無法有效利用非結(jié)構(gòu)化數(shù)據(jù)(如新聞、經(jīng)濟(jì)報告)進(jìn)行分析和預(yù)測。
大型語言模型(LLMs)如GPT系列在金融分析中展現(xiàn)出潛力,能夠處理非結(jié)構(gòu)化數(shù)據(jù),提取情感和趨勢。領(lǐng)域特定模型(如FinBERT、BloombergGPT)在金融情感分析和實體識別等任務(wù)中表現(xiàn)良好。LLMs在多項金融任務(wù)中的初步應(yīng)用顯示其有效性,能夠整合交易數(shù)據(jù)、技術(shù)分析和情感評分進(jìn)行價格趨勢預(yù)測。LLM在金融分析中的應(yīng)用面臨三大挑戰(zhàn):
- 不確定性:LLM對未在訓(xùn)練數(shù)據(jù)中出現(xiàn)的信息處理能力差,可能導(dǎo)致生成不準(zhǔn)確的信息,影響分析和預(yù)測的可靠性。
- 多模態(tài)數(shù)據(jù)整合:金融市場分析需整合時間序列、表格和非結(jié)構(gòu)化數(shù)據(jù),LLM主要處理語言,如何有效利用多種數(shù)據(jù)仍需深入研究。
- 人機(jī)協(xié)作缺乏:現(xiàn)有研究多集中于機(jī)器學(xué)習(xí)方法與人類專家的對抗,缺乏針對普通投資者的協(xié)作框架研究。
本研究提出了一個名為FinArena的人機(jī)協(xié)作框架,用于處理多模態(tài)金融數(shù)據(jù)分析和投資者風(fēng)險偏好輸入。該框架采用混合專家(MoE)方法,分為人類模塊和機(jī)器模塊。人類模塊通過交互界面捕捉個體風(fēng)險偏好,實現(xiàn)個性化投資策略。機(jī)器模塊整合多個專注于不同金融數(shù)據(jù)類型的LLM(大語言模型),如歷史股價、企業(yè)新聞和財務(wù)報表。每個專家組獨立分析特定信息,最終由通用專家模型綜合分析結(jié)果,并考慮投資者的風(fēng)險偏好。在新聞數(shù)據(jù)處理中,采用自反過程過濾無關(guān)信息,并引入自適應(yīng)檢索增強(qiáng)生成(RAG)方法,減少無關(guān)響應(yīng)和幻覺問題。財務(wù)報表分析采用迭代分析過程,使多個LLM逐步推理分析,類似人類思維,輸出公司基本面的洞察和置信度。
本文貢獻(xiàn)主要體現(xiàn)在三個方面:
- 開源小規(guī)模金融數(shù)據(jù)集,包含新聞文章、歷史股價和財務(wù)報表,關(guān)注散戶投資者的信息獲取。
- 提出基于MoE方法的人機(jī)協(xié)作框架,處理多模態(tài)金融數(shù)據(jù),采用自適應(yīng)RAG減少LLM的幻覺現(xiàn)象。
- 對FinArena與多基線模型進(jìn)行全面評估,設(shè)計輸入模塊捕捉投資者風(fēng)險偏好,識別最佳時機(jī),并討論A股與美股的實驗表現(xiàn)差異。
相關(guān)工作
基于歷史股票價格的財務(wù)模型
金融市場的隨機(jī)性和波動性使得確定性模型難以準(zhǔn)確描述,需發(fā)展應(yīng)對不確定性的模型。歷史股價數(shù)據(jù)是時間序列分析的主要來源,ARIMA模型推動了金融分析的統(tǒng)計預(yù)測,但其在非平穩(wěn)性和高階差分方面存在局限。GARCH模型能捕捉波動聚集,但對沖擊和極值的捕捉能力不足,且計算復(fù)雜性高,普通投資者難以使用。
機(jī)器學(xué)習(xí)方法(如CNN和LSTM)在金融時間序列預(yù)測中取得進(jìn)展,但存在滯后效應(yīng)問題。混合模型(如ARIMA-LSTM和WT-ARIMA-LSTM)嘗試結(jié)合傳統(tǒng)與機(jī)器學(xué)習(xí)方法,但仍依賴單一歷史股價數(shù)據(jù),未能突破預(yù)測性能。當(dāng)前金融建模存在依賴單一數(shù)據(jù)特征的顯著缺口,需整合更多金融數(shù)據(jù)特征,解決延遲和可解釋性問題,以滿足市場需求。
LLM代理用于金融市場分析
傳統(tǒng)股票價格預(yù)測模型依賴于歷史價格數(shù)據(jù),但這種方法過于簡化,無法捕捉金融市場的復(fù)雜動態(tài)。金融市場中存在大量非結(jié)構(gòu)化數(shù)據(jù),傳統(tǒng)模型難以處理,而大語言模型(LLMs)在提取非結(jié)構(gòu)化信息方面表現(xiàn)優(yōu)異。LLMs可分為超大模型(如GPT-3、GPT-4)和經(jīng)過微調(diào)的模型(如FinBERT、BloombergGPT、Xuanyuan 2.0、BBT-Fin等),后者專注于金融領(lǐng)域的優(yōu)化。LLMs的進(jìn)步改變了金融市場分析方式,提高了市場動態(tài)理解和預(yù)測準(zhǔn)確性,預(yù)計將成為金融市場分析方法演變的基石。
現(xiàn)有多代理LLM系統(tǒng)的探討
現(xiàn)有的通用LLM在處理多模態(tài)金融數(shù)據(jù)時效果不佳,主要因預(yù)訓(xùn)練數(shù)據(jù)不足,無法捕捉特定信息。研究方向轉(zhuǎn)向使用專門的LLM處理不同類型數(shù)據(jù),如RiskLabs、SEP和FinAgent等系統(tǒng)已展示了多LLM組合的有效性。當(dāng)前研究存在問題:數(shù)據(jù)需求大且成本高,不利于普通投資者;依賴預(yù)訓(xùn)練知識,易產(chǎn)生幻覺;忽視投資者的風(fēng)險偏好,導(dǎo)致決策單一。
本研究提出人機(jī)協(xié)作框架FinArena,解決上述問題:部署多LLM分析多模態(tài)數(shù)據(jù),引入自適應(yīng)RAG方法處理新聞文本幻覺,設(shè)計投資者風(fēng)險偏好輸入模塊,實現(xiàn)AI與人類的協(xié)作投資決策。
整體框架
概覽
FinArena由兩個部分組成:三個專門的代理和一個分析單元。三個代理分別為:
- 時間序列代理:處理股票時間序列數(shù)據(jù),預(yù)測未來股價。
- 新聞代理:總結(jié)新聞文章,提取見解,訪問在線資源。
- 財務(wù)報表代理:分析財務(wù)指標(biāo),具備迭代推理能力。
分析單元綜合三者的結(jié)果,依據(jù)投資者的風(fēng)險偏好提供個性化投資建議(買入或賣出)。
生成時間序列的代理
傳統(tǒng)股票價格預(yù)測方法主要依賴數(shù)學(xué)模型(如ARIMA、GARCH)和機(jī)器學(xué)習(xí)算法(如XGBoost、LSTM),但這些方法需要復(fù)雜模型和特定實施策略,適用性有限。
FinArena采用專門的LLM進(jìn)行時間序列分析,用戶只需輸入股票時間序列數(shù)據(jù),代理即可預(yù)測未來股票價格。
預(yù)測模型通過最大化條件概率P來構(gòu)建,X為歷史價格和協(xié)變量的特征空間,P為未來價格的預(yù)測空間。
預(yù)測空間P的生成基于一個微分方程,表示預(yù)測空間隨時間的變化率。
時間序列代理生成預(yù)測空間P后,通過函數(shù)H將其轉(zhuǎn)化為0-1的趨勢輸出時間序列O。
不確定性驅(qū)動的自適應(yīng)新聞代理
新聞文章分析在金融投資決策中的需求增加,但處理長文本新聞仍具挑戰(zhàn)。LLM在文本處理上強(qiáng)大,但對不熟悉的詞匯可能無能為力。RAG方法提高了準(zhǔn)確性、效率和個性化。
本文設(shè)計了一種自適應(yīng)RAG方法,使LLM能夠進(jìn)行不確定性驅(qū)動的信息檢索。新聞代理結(jié)合LLM的優(yōu)勢,適應(yīng)動態(tài)新聞內(nèi)容。傳統(tǒng)信息檢索依賴靜態(tài)預(yù)訓(xùn)練語料,無法涵蓋現(xiàn)代新聞的動態(tài)詞匯。過度依賴RAG可能降低處理簡單問題的效率,尤其對低成本投資者而言,頻繁調(diào)用搜索引擎API成本高。
新聞代理引入判斷模塊(J),判斷復(fù)雜查詢是否可由預(yù)訓(xùn)練語料直接解決。J為隨機(jī)過程,返回0表示預(yù)訓(xùn)練足夠,返回1表示不足。
S表示新聞代理的總結(jié)、分析和預(yù)測,O為未來股價走勢的預(yù)測。
財務(wù)報表分析的迭代推理代理
FinArena開發(fā)了一個迭代推理代理(Statement Agent),用于分析公司財務(wù)報表,包含三個步驟。
- 第一步:LLM識別公司財務(wù)報表中的季節(jié)性模式,理解公司財務(wù)健康的周期性。
- 第二步:將第一步提取的季節(jié)性模式與原始財務(wù)報表一起提交給第二個LLM,進(jìn)行全面的年度運營分析。
- 第三步:LLM預(yù)測公司股票的潛在漲跌,并根據(jù)前一步的分析賦予信心等級。
輸出O來自第三步,包含公司股票價格變化的長期趨勢和LLM的信心水平。迭代推理代理相較于傳統(tǒng)的思維鏈(CoT)微調(diào),更充分利用財務(wù)報表并整合自身對數(shù)據(jù)的理解,增強(qiáng)可解釋性。
信息聚合系統(tǒng)與人機(jī)協(xié)作
現(xiàn)代金融投資決策復(fù)雜,需團(tuán)隊合作,單一決策者難以完成。有效團(tuán)隊合作對解決超出個人能力的大規(guī)模問題至關(guān)重要。投資決策通常通過小組協(xié)作進(jìn)行,各角色專注不同領(lǐng)域(市場分析、風(fēng)險管理、戰(zhàn)略分析)。多智能體大語言模型(LLMs)可模擬這種協(xié)作,利用不同模型的優(yōu)勢進(jìn)行分析。例如,TimeGPT適合處理時間數(shù)據(jù),而LLaMA和GPT系列適合文本分析。這種聚合系統(tǒng)能像投資團(tuán)隊一樣,完成復(fù)雜的投資決策任務(wù)。
人類專家在投資決策中不可或缺,提供多代理系統(tǒng)無法復(fù)制的細(xì)膩、直覺和適應(yīng)性。FinArena系統(tǒng)促進(jìn)不同LLM代理的協(xié)作,并優(yōu)先整合人類專家的參與。投資者可主動參與決策,監(jiān)控分析結(jié)果、評估響應(yīng)概率,并與AI專家互動。
報告代理為人機(jī)互動提供接口,允許投資者在預(yù)測和投資建議前表達(dá)風(fēng)險偏好。模型功能T將投資者的風(fēng)險偏好R與輸出空間O結(jié)合,生成投資建議A。Kt為狀態(tài)轉(zhuǎn)移修正,調(diào)整LLM代理對人類反饋的理解。
FinArena強(qiáng)調(diào)人機(jī)協(xié)作在復(fù)雜投資問題中的重要性,確保投資者的獨特見解和風(fēng)險偏好被納入決策過程。
數(shù)據(jù)集
本研究選擇構(gòu)建私有數(shù)據(jù)集,以彌補(bǔ)公共數(shù)據(jù)集的不足,如信息相關(guān)性差、過時或內(nèi)容長度不足。公共數(shù)據(jù)集常包含多種新聞主題,可能稀釋金融因素的關(guān)注度,且僅提供標(biāo)題,缺乏上下文。自建數(shù)據(jù)集確保數(shù)據(jù)的時效性和相關(guān)性,全面捕捉金融新聞及其對市場動態(tài)的影響。數(shù)據(jù)集規(guī)模考慮到小型投資者的需求,避免過大或過于昂貴。
實驗在A股和美國股市進(jìn)行,數(shù)據(jù)時間范圍為2023年1月1日至2024年3月30日,以減少對LLM預(yù)訓(xùn)練數(shù)據(jù)的過度估計。選擇公司基于影響力、信息透明度和數(shù)據(jù)可用性,確保所選公司在行業(yè)內(nèi)具有顯著影響力和高信息披露水平。股票價格數(shù)據(jù)關(guān)注開盤價、收盤價和交易量,作為市場表現(xiàn)的基本指標(biāo),便于投資者使用。
財務(wù)新聞對市場情緒和投資決策至關(guān)重要,及時準(zhǔn)確的信息幫助投資者在動態(tài)市場中做出明智選擇。現(xiàn)有公共數(shù)據(jù)集缺乏具體性、時效性和主題聚焦,構(gòu)建定制數(shù)據(jù)集以提高研究相關(guān)性和影響力。對于A股公司,系統(tǒng)爬取《國家商報》網(wǎng)站的相關(guān)新聞;對美國公司,使用《商業(yè)今日》網(wǎng)站,提取包含特定關(guān)鍵詞的文章。新聞數(shù)據(jù)包括“標(biāo)題”、“日期”和“文本”三個字段,經(jīng)過時間格式標(biāo)準(zhǔn)化和無關(guān)文本刪除后,使用k-means聚類選擇同日期范圍內(nèi)的代表性文章。
財務(wù)報表反映公司運營狀況,但完整報告龐大,難以有效提取信息。采用Tsanghi API選擇資產(chǎn)負(fù)債表、現(xiàn)金流量表和利潤表的關(guān)鍵財務(wù)指標(biāo),合并為單一輸入文件,支持已有研究認(rèn)為財務(wù)表格數(shù)據(jù)的增值有限。
實驗
本文評估FinArena框架在股票運動預(yù)測和交易模擬中的表現(xiàn)。
- RQ1:FinArena在股票運動預(yù)測上與傳統(tǒng)基準(zhǔn)的比較。
- RQ2:廣泛使用非結(jié)構(gòu)化數(shù)據(jù)(如新聞數(shù)據(jù))的優(yōu)勢。
- RQ3:個體市場預(yù)期對AI專家決策準(zhǔn)確性的影響。
- RQ4:FinArena的有效利用及個體風(fēng)險偏好對交易模擬效果的影響。
實驗設(shè)置
使用DeepSeek-v2模型創(chuàng)建新聞代理和聲明代理,處理非結(jié)構(gòu)化數(shù)據(jù);TimeGPT用于歷史股價數(shù)據(jù),開發(fā)股票代理;最終AI專家基于gpt-4o-mini模型構(gòu)建。
針對RQ2,使用LLAMA-3-70B和Kimi模型創(chuàng)建非結(jié)構(gòu)化數(shù)據(jù)代理,分別處理英文和中文文本。
股票運動預(yù)測中,AI專家生成二元預(yù)測,評估方法使用準(zhǔn)確率和F1分?jǐn)?shù)。
股票交易模擬中,基于趨勢預(yù)測提供買賣持有建議,考慮四種風(fēng)險配置:保守型、中度保守型、中度激進(jìn)型和激進(jìn)型,分別在交易中分配不同比例的閑置資金。
評估FinArena及基線模型的表現(xiàn),使用年化收益、夏普比率和最大回撤比率等指標(biāo)。
基線
比較FinArena與ARIMA、LSTM和TimeGPT等基準(zhǔn)模型在股票預(yù)測中的表現(xiàn)。ARIMA模型使用AIC和BIC確定差分階數(shù)為2,并通過網(wǎng)格搜索選擇滯后階數(shù)。LSTM模型為4層,訓(xùn)練200個epoch,批量大小為32。TimeGPT模型將開盤價、最高價和最低價作為外生變量預(yù)測收盤價變化。
股票交易模擬中,比較隨機(jī)策略和特定交易方法,如買入上漲連續(xù)和賣出下跌連續(xù)策略(BRSF)。評估基于ARIMA和LSTM模型的策略,并補(bǔ)充僅依賴新聞數(shù)據(jù)的實驗結(jié)果作為基線。
所有方法經(jīng)過嚴(yán)格評估,以確保在數(shù)據(jù)集中的全面性能比較。
結(jié)果
股票走勢預(yù)測
FinArena在八個案例中超越多個基線模型,表明多模態(tài)數(shù)據(jù)分析優(yōu)于單一股票價格分析,回答RQ1和RQ2。Kimi和LLaMA 3相較于DeepSeek-v2表現(xiàn)下降,說明過度關(guān)注新聞?wù)Z言風(fēng)格可能引入人類偏見,影響分析準(zhǔn)確性。在使用DeepSeek-v2時,預(yù)先告知投資者市場態(tài)度會導(dǎo)致性能下降,尤其是“無敏感”態(tài)度影響最小,回答RQ3。RAG的引入顯著提升模型的準(zhǔn)確性和F1-Score,尤其在A股公司中效果更顯著,可能因信息復(fù)雜性更高。
股票交易模擬
對FinArena與基線模型的性能進(jìn)行全面回測,時間范圍為2024年1月1日至3月27日,結(jié)果已年化以便比較。不同策略基于FinArena預(yù)測結(jié)果的收益普遍超過基線,M.Agg在年化收益率和夏普比率表現(xiàn)最佳,但最大回撤表現(xiàn)最差。不同風(fēng)險偏好影響投資回報,F(xiàn)inArena通過整合信息提高了收益的下限,最終回報仍由投資者掌控。
FinArena在多股票投資中表現(xiàn)優(yōu)于平均投資者,驗證了人機(jī)協(xié)作架構(gòu)的有效性。在Nvidia等個別股票上,BRSF“經(jīng)驗法”表現(xiàn)優(yōu)異,AR和SR結(jié)果最高。A股市場中,F(xiàn)inArena的投資方法均導(dǎo)致負(fù)收益,而基準(zhǔn)方法實現(xiàn)正收益??冃Р患褮w因于個體投資者數(shù)據(jù)集的不完整和不足,未來研究方向為如何利用不完整數(shù)據(jù)提高分析和預(yù)測準(zhǔn)確性,以服務(wù)小規(guī)模低成本投資者。
討論
FinArena在美國股市數(shù)據(jù)集上的預(yù)測性能優(yōu)于其他方法,具有最高準(zhǔn)確率和最低方差,表明不同數(shù)據(jù)類型的利潤相關(guān)信息分布良好。在A股市場數(shù)據(jù)集上,F(xiàn)inArena的效果較差,傳統(tǒng)機(jī)器學(xué)習(xí)模型(如LSTM)在某些股票預(yù)測上有優(yōu)勢,但整體表現(xiàn)平平。A股市場的信息不對稱問題嚴(yán)重,許多公司缺乏足夠的新聞覆蓋,且正面新聞?wù)急犬惓8?,可能與監(jiān)管政策和信息披露限制有關(guān)。投資策略偏好在兩市場中顯著影響最終收益,且沒有單一策略明顯占優(yōu),反映出市場結(jié)構(gòu)、信息可及性和投資者行為的復(fù)雜性。
總結(jié)
FinArena是一個創(chuàng)新的人機(jī)協(xié)作框架,利用多個專門的LLM代理進(jìn)行金融數(shù)據(jù)分析和預(yù)測,旨在提高股票走勢預(yù)測的準(zhǔn)確性和可靠性。通過整合多種金融數(shù)據(jù)(如股票價格、新聞文章和財務(wù)報表),F(xiàn)inArena在預(yù)測股票運動方面優(yōu)于傳統(tǒng)和先進(jìn)基準(zhǔn),取得更高的準(zhǔn)確率和F1分?jǐn)?shù)。在股票交易模擬中,F(xiàn)inArena根據(jù)不同風(fēng)險偏好展現(xiàn)出不同的收益,適度激進(jìn)策略獲得最佳年化收益和夏普比率,而保守策略則提供更好的風(fēng)險管理。
FinArena在美國市場表現(xiàn)優(yōu)異,但在A股市場表現(xiàn)不穩(wěn)定,可能與信息披露和數(shù)據(jù)質(zhì)量有關(guān),強(qiáng)調(diào)市場成熟度和透明度對多代理LLM投資模型表現(xiàn)的重要性。FinArena的多模態(tài)方法和自適應(yīng)機(jī)制解決了傳統(tǒng)金融建模中的關(guān)鍵挑戰(zhàn),為個性化投資決策提供了強(qiáng)有力的解決方案。
本文轉(zhuǎn)載自???靈度智能???,作者: 靈度智能
