自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

全市場都下跌了,這套LLM智能體選出的策略累計(jì)收益超50%,重點(diǎn)是代碼開源!

發(fā)布于 2024-9-19 13:18
瀏覽
0收藏

1. 背景

在量化交易領(lǐng)域,Alpha因子挖掘是核心焦點(diǎn)之一:探索和提煉那些能夠預(yù)測資產(chǎn)收益的預(yù)測信號(hào)。

全市場都下跌了,這套LLM智能體選出的策略累計(jì)收益超50%,重點(diǎn)是代碼開源!-AI.x社區(qū)圖片

尤金·法瑪提出了有效市場假說(Efficient Market Hypothesis,EMH),指出股票價(jià)格是所有市場可用信息的反映,股票價(jià)格應(yīng)當(dāng)全面反映市場內(nèi)所有可獲取的信息。

隨著研究的深入,當(dāng)前 Alpha 挖掘過程存在三大主要挑戰(zhàn):

-(1)傳統(tǒng)方法的僵化性:金融領(lǐng)域中識(shí)別 Alpha 因子的傳統(tǒng)方法往往依賴于啟發(fā)式規(guī)則和金融專業(yè)知識(shí)。這些基于規(guī)則的方法通常僅在特定市場條件下表現(xiàn)出色,缺乏適應(yīng)不同市場動(dòng)態(tài)的靈活性。

-(2)數(shù)據(jù)的多樣性與整合:近期研究探索了運(yùn)用機(jī)器學(xué)習(xí)技術(shù)從諸如經(jīng)濟(jì)新聞、社交媒體趨勢和歷史價(jià)格走勢等多樣數(shù)據(jù)源中挖掘 Alpha 因子。

-(3)對(duì)市場變化的適應(yīng)性:市場動(dòng)態(tài)變幻莫測,在一種環(huán)境中表現(xiàn)良好的策略在另一種環(huán)境中可能失效。

近年來,運(yùn)用深度學(xué)習(xí)方法來預(yù)測市場并形成策略逐漸成為主流。在不同市場條件下有效地挖掘和利用 Alpha 因子仍是一項(xiàng)重大議題。

為解決這一問題,作者提出了一個(gè)新框架,借助大型語言模型(LLMs)的能力來進(jìn)行 Alpha 挖掘和策略優(yōu)化。

2. 實(shí)現(xiàn)思路

作者提出的新框架,目前已經(jīng)作為開源代碼發(fā)布在:??https://anonymous.4open.science/r/Automate-Strategy-Finding-with-LLM-in-Quant-investment-ADA2/??

全市場都下跌了,這套LLM智能體選出的策略累計(jì)收益超50%,重點(diǎn)是代碼開源!-AI.x社區(qū)圖片

如上圖所示,新框架由三個(gè)核心組件構(gòu)成:

?種子阿爾法工廠(Seed Alphas Factory):利用大型語言模型(LLMs)來過濾和分類多模態(tài)數(shù)據(jù),從而構(gòu)建出強(qiáng)大的種子Alpha集合。

?多智能體決策流程(Multi-Agent Decision-Making Process):運(yùn)用多模態(tài)多智能體決策流程。多智能體方式能夠納入不同的風(fēng)險(xiǎn)觀點(diǎn),增強(qiáng)策略在不同市場條件下的適應(yīng)性和穩(wěn)健性。此階段產(chǎn)生的成果是生成適合當(dāng)前市場狀態(tài)和風(fēng)險(xiǎn)偏好的Alpha因子列表。

?權(quán)重優(yōu)化方式(Weight Optimization Approach):通過深度神經(jīng)網(wǎng)絡(luò)(DNN)優(yōu)化所選阿爾法的權(quán)重以預(yù)測未來收益,為動(dòng)態(tài)且適應(yīng)性強(qiáng)的投資策略奠定基礎(chǔ)。

2.1 種子阿爾法工廠:LLM 過濾與分類

利用大型語言模型(LLMs)的總結(jié)和分類能力,加速對(duì)近期阿爾法挖掘研究的理解,并為進(jìn)一步發(fā)展構(gòu)種子阿爾法工廠。

使用了名為“Alpha Grail”的 ChatGPT 定制版本來執(zhí)行 LLM 過濾和分類任務(wù)。Alpha Grail 的主要作用是通過處理與阿爾法相關(guān)的研究文檔,協(xié)助量化研究人員構(gòu)建種子阿爾法工廠。

給 Alpha Grail 的具體指令是:

總結(jié)文檔信息,幫助量化研究人員依照傳統(tǒng)金融類別構(gòu)建種子阿爾法工廠,確保每個(gè)類別的種子阿爾法相互獨(dú)立。

全市場都下跌了,這套LLM智能體選出的策略累計(jì)收益超50%,重點(diǎn)是代碼開源!-AI.x社區(qū)圖片

作者提供了 11 份 阿爾法挖掘 研究不同背景的文檔,具體文檔如上圖。通過這些文檔,Alpha Grail 生成了9個(gè)列別 100 個(gè)種子 Alpha 因子(如下圖),如動(dòng)量、均值回歸、波動(dòng)率和基本面分析。

全市場都下跌了,這套LLM智能體選出的策略累計(jì)收益超50%,重點(diǎn)是代碼開源!-AI.x社區(qū)圖片

全市場都下跌了,這套LLM智能體選出的策略累計(jì)收益超50%,重點(diǎn)是代碼開源!-AI.x社區(qū)圖片

全市場都下跌了,這套LLM智能體選出的策略累計(jì)收益超50%,重點(diǎn)是代碼開源!-AI.x社區(qū)圖片

LLM 過濾與分類階段也融合了多模態(tài)處理能力。通過納入研究文檔中的文本、圖像、表格和圖形等多模態(tài)數(shù)據(jù)源,LLM 能夠?qū)ΨN子阿爾法進(jìn)行更全面的分析和分類。多模態(tài)方法增強(qiáng)了 LLM 捕捉研究中復(fù)雜細(xì)節(jié)和關(guān)系的能力,有利于生成更強(qiáng)大和多樣化的種子Alpha因子庫。

2.2 多模態(tài)和多智能體評(píng)估Alpha因子集

通過多模態(tài)和多智能體系統(tǒng)對(duì)阿爾法因子進(jìn)行全面評(píng)估和篩選。通過整合不同的數(shù)據(jù)源并利用多個(gè)分析視角,確保對(duì)種子阿爾法進(jìn)行多元化和深入的評(píng)估。

使用了包含文本、數(shù)字、視覺和多媒體輸入的多模態(tài)數(shù)據(jù),使得整個(gè)評(píng)估過程更為豐富和全面。通過整合這些不同的數(shù)據(jù)類型,能夠全面了解市場狀況和阿爾法因子的表現(xiàn)。

全市場都下跌了,這套LLM智能體選出的策略累計(jì)收益超50%,重點(diǎn)是代碼開源!-AI.x社區(qū)圖片

上表列出了評(píng)估框架中使用的五種數(shù)據(jù)類型。這種整體性方法有助于對(duì)市場動(dòng)態(tài)進(jìn)行細(xì)致的理解,并增強(qiáng)評(píng)估過程的穩(wěn)健性。

多智能體系統(tǒng)由各種智能體組成,每個(gè)智能體都具有不同的風(fēng)險(xiǎn)偏好和投資策略。

智能體主要任務(wù)包括:

? 分析多模態(tài)數(shù)據(jù),并依據(jù)各自的標(biāo)準(zhǔn)評(píng)估種子阿爾法。

? 進(jìn)行風(fēng)險(xiǎn)偏好分析,根據(jù)其預(yù)定義的風(fēng)險(xiǎn)參數(shù)評(píng)估種子阿爾法。

? 選擇符合其風(fēng)險(xiǎn)偏好和市場分析的阿爾法因子,確保在不同市場情形下的相關(guān)性和穩(wěn)健性。

為了提高所選阿爾法因子的可靠性,實(shí)施了置信度評(píng)分機(jī)制。每個(gè)智能體根據(jù)其分析和歷史表現(xiàn)為阿爾法因子分配置信度分?jǐn)?shù),反映智能體對(duì)阿爾法因子預(yù)測能力和穩(wěn)健性的評(píng)估。

所選的阿爾法因子運(yùn)用歷史市場數(shù)據(jù)進(jìn)行嚴(yán)格的回測,以評(píng)估它們?cè)诟鞣N市場條件下的表現(xiàn)。對(duì)于確定最終策略中最具潛力的阿爾法因子至關(guān)重要。

關(guān)鍵評(píng)估指標(biāo)包括信息系數(shù)(IC)和夏普比率等性能指標(biāo)。每個(gè)類別的種子阿爾法因子必須達(dá)到特定的置信度分?jǐn)?shù)閾值才能被納入最終選擇,以確保只選取最可靠和穩(wěn)健的阿爾法因子。

為了實(shí)現(xiàn)選擇過程的自動(dòng)化,設(shè)計(jì)了基于類別的阿爾法選擇算法。該算法依據(jù)置信度分?jǐn)?shù)從不同類別中識(shí)別和挑選阿爾法。輸入包括多個(gè)類別,每個(gè)類別包含一組阿爾法和一個(gè)置信度閾值。算法從一個(gè)空的選定阿爾法集合開始,并遍歷每個(gè)類別,使用 SelectBestAlphas 函數(shù)確定最有前景的候選者。評(píng)估每個(gè)阿爾法的置信度分?jǐn)?shù),超過閾值的被納入最終集合。

這個(gè)過程對(duì)所有類別重復(fù)進(jìn)行,確保從所有類別中嚴(yán)格挑選出符合置信度標(biāo)準(zhǔn)的阿爾法。最終輸出是一組成功通過置信度評(píng)估的選定阿爾法。

2.3 最優(yōu)權(quán)重阿爾法策略

為優(yōu)化所選種子阿爾法的權(quán)重,運(yùn)用深度神經(jīng)網(wǎng)絡(luò)(DNN)將阿爾法值擬合至未來收益。

網(wǎng)絡(luò)架構(gòu)包含三層:輸入層、隱藏層和輸出層。

? 輸入層將從歷史收盤價(jià)得出的每日阿爾法計(jì)算作為輸入特征。

? 隱藏層配備了十個(gè)節(jié)點(diǎn),采用 ReLU 激活函數(shù)引入非線性并增強(qiáng)模型的學(xué)習(xí)能力。

? 輸出層由單個(gè)節(jié)點(diǎn)構(gòu)成,用于預(yù)測未來收益。

為確保模型的泛化能力并防止過擬合,使用了單獨(dú)的驗(yàn)證集。

構(gòu)建了一個(gè)基于歷史阿爾法值預(yù)測未來收益的強(qiáng)大框架,從而形成有效的投資策略。DNN 模型通過隱藏層處理輸入數(shù)據(jù),利用學(xué)習(xí)到的權(quán)重和偏差進(jìn)行轉(zhuǎn)換。最終輸出通過在輸出層應(yīng)用另一組權(quán)重、偏差和激活函數(shù)生成。

3. 效果評(píng)估

RQ1:該框架能否根據(jù)市場條件差異捕獲新的阿爾法?

全市場都下跌了,這套LLM智能體選出的策略累計(jì)收益超50%,重點(diǎn)是代碼開源!-AI.x社區(qū)圖片

作者提出了一種提示架構(gòu)(如上圖),將多模態(tài)市場信息融入大型語言模型(LLM),以達(dá)成多模態(tài)知識(shí)提取,并在不同的市場條件下選取最優(yōu)的種子阿爾法。

通過整合來自金融新聞情緒的文本數(shù)據(jù)、公司財(cái)務(wù)報(bào)表的數(shù)值數(shù)據(jù)和交易圖表的視覺數(shù)據(jù),新框架提供了全面的股票分析。這種數(shù)據(jù)融合確保了全面的市場觀點(diǎn),增強(qiáng)了決策能力。上下文分析依照市場趨勢和行業(yè)表現(xiàn)調(diào)整參數(shù),確保相關(guān)且準(zhǔn)確的阿爾法選擇。實(shí)驗(yàn)證實(shí)了該框架在不同市場條件下進(jìn)行多模態(tài)知識(shí)提取和動(dòng)態(tài)阿爾法選擇的有效性。

全市場都下跌了,這套LLM智能體選出的策略累計(jì)收益超50%,重點(diǎn)是代碼開源!-AI.x社區(qū)圖片

如上圖,在案例 1 中,運(yùn)用 2021 年 12 月 31 日至 2022 年 9 月 30 日的上證 50 公司公告、財(cái)務(wù)報(bào)表、K 線圖和交易圖表,所選的阿爾法包含動(dòng)量和基于成交量的指標(biāo),如價(jià)格動(dòng)量、相對(duì)強(qiáng)弱指標(biāo)(RSI)、平滑異同移動(dòng)平均線(MACD)、移動(dòng)平均線、布林帶、成交量、市值和每股收益調(diào)整。

在案例 2 中,著重于增量更新的上證 50 相關(guān)新聞、股票評(píng)論和中國宏觀經(jīng)濟(jì)指數(shù),所選的阿爾法強(qiáng)調(diào)了波動(dòng)性和經(jīng)濟(jì)因素,包括平均真實(shí)波動(dòng)幅度(ATR)、布林帶比率、帶延遲的基于成交量的指標(biāo)、毛利潤和營業(yè)收入比率以及高低價(jià)格比較。

表明通過整合不同的數(shù)據(jù)源并采用先進(jìn)的分析模型捕捉新的投資機(jī)會(huì)。這種動(dòng)態(tài)方式確保所選的阿爾法與當(dāng)前市場條件相關(guān)并做出響應(yīng),增強(qiáng)了投資策略的穩(wěn)健性和有效性。

RQ2:由LLM驅(qū)動(dòng)的Alpha因子挖掘框架是否優(yōu)于現(xiàn)有框架?

在評(píng)估所選種子阿爾法信號(hào)的性能時(shí),主要指標(biāo)是信息系數(shù)(IC,Information Coefficient)。這些指標(biāo)可以用來衡量阿爾法值對(duì)未來回報(bào)的預(yù)測能力。

信息系數(shù)(IC)衡量預(yù)測的Alpha值與實(shí)際未來回報(bào)之間的相關(guān)性。通過皮爾遜相關(guān)系數(shù)進(jìn)行量化,該系數(shù)評(píng)估兩個(gè)變量之間的線性關(guān)系。較高的 IC 表明更強(qiáng)的預(yù)測關(guān)系,意味著阿爾法值在預(yù)測回報(bào)方面更有效。

評(píng)估了四個(gè)最常見的阿爾法類別:動(dòng)量、均值回歸、波動(dòng)性、基本面和增長。

全市場都下跌了,這套LLM智能體選出的策略累計(jì)收益超50%,重點(diǎn)是代碼開源!-AI.x社區(qū)圖片

上圖展示了每個(gè)類別的平均 IC 值。結(jié)果表明,由大語言模型驅(qū)動(dòng)的框架在所有類別中始終取得了更高的平均 IC 值,特別是在波動(dòng)性和基本面方面,表明與傳統(tǒng)框架相比具有更出色的交易有效性。

RQ3:新框架選出的策略能否持續(xù)跑贏市場?

全市場都下跌了,這套LLM智能體選出的策略累計(jì)收益超50%,重點(diǎn)是代碼開源!-AI.x社區(qū)圖片

上表展示由新框架生成的 12 個(gè)阿爾法的示例組合,在上證 50 成分股進(jìn)行評(píng)估。

權(quán)重組合 IC 值頗高,為-0.0587。盡管部分種子阿爾法單獨(dú)的 IC 值相對(duì)較低,但將其移除會(huì)致使重新訓(xùn)練的組合權(quán)重顯著降低,表明它們?cè)谡w性能中起著關(guān)鍵作用。

例如,如果移除阿爾法#6,權(quán)重組合將降至-0.055;一旦移除阿爾法#11,權(quán)重組合將僅為 0.0491。表明由大型語言模型選取的種子阿爾法集有效地協(xié)同運(yùn)作,提供了強(qiáng)大的預(yù)測能力。

為了回答新框架能否持續(xù)跑遠(yuǎn)市場這個(gè)問題,作者在 2023 年 1 月 1 日至 2023 年 12 月 31 日期間,在上證 50 數(shù)據(jù)集上運(yùn)用了一種簡易的投資方法進(jìn)行了回測。

根據(jù)股票的阿爾法值進(jìn)行排序,挑選表現(xiàn)最優(yōu)的股票進(jìn)行投資。在選定的股票中均勻分配資金,為降低交易成本,每天的交易數(shù)量限制在5只以內(nèi)。

全市場都下跌了,這套LLM智能體選出的策略累計(jì)收益超50%,重點(diǎn)是代碼開源!-AI.x社區(qū)圖片

在實(shí)驗(yàn)中,設(shè)定每日選股上限為13只,交易上限為5只。測試期間各策略凈值的變化如上圖所示。盡管并未專門追求絕對(duì)收益的最大化,但在回測中卻展現(xiàn)出了卓越的表現(xiàn),相較于其他方法,實(shí)現(xiàn)了最高的盈利。

2023年的回測結(jié)果顯示,累計(jì)回報(bào)率達(dá)到了53.17%,與此同時(shí),指數(shù)下跌了11.73%,EFund下跌了9.17%,Boshi Fund下跌了8.81%。還將新框架與其他阿爾法挖掘方法進(jìn)行了對(duì)比,結(jié)果表明,新框架在市場中能夠獲得最大的利潤。

本文轉(zhuǎn)載自??大語言模型論文跟蹤??,作者:HuggingAGI 

標(biāo)簽
已于2024-9-19 13:40:45修改
收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦