MarketSenseAI:GPT4選股,收益率高達72.87%
1. LLM與選股
資本市場是資本配置的高效渠道,價格發(fā)現過程對維持金融系統(tǒng)的健康穩(wěn)定至關重要。
價格發(fā)現過程取決于一系列復雜的相互作用因素,包括公司和行業(yè)要素、宏觀經濟數據、動量效應以及政治和地緣政治影響。市場參與者共同參與這一復雜的價格發(fā)現機制,以確保金融市場的有效運行。
股票選擇本質上是一種價格發(fā)現機制,市場參與者會關注被視為“定價不當”的股票,從而獲得相對于整個市場更具吸引力的回報潛力。這一原則構成了價值投資的核心。不過,“定價不當”這一概念還可以進一步深化,因為它可能還涉及到市場對資產公允價值的感知,這種感知未必與其內在價值完全一致。
這可能涵蓋對公司未來增長的預期,這一策略通常被稱為“成長投資”,有時會忽略當前的基本面。
除了價值投資和成長投資,還有其他因素影響并增加了股票選擇的復雜性。被動投資、資本流動、衍生品相關流動以及宏觀經濟因素等,共同造就了一個本質上具有概率性且常?;靵y的金融系統(tǒng)。
市場參與者通過理解和運用廣泛的信息來做決策。然而,散戶投資者在分析個股時往往面臨困境。這一挑戰(zhàn)源于他們分析信息的能力有限、易受行為偏差影響以及缺乏強大的風險管理技能。
因此,散戶可能錯過有前景的投資機會或使自身面臨不當風險。
像 ChatGPT 這樣的大型語言模型(LLMs)的出現,為財務分析和股票選擇帶來了極大的提升希望。這些復雜的人工智能(AI)系統(tǒng),經過大量且多樣的語料庫訓練,不僅展現出了復制人類認知復雜面的能力,在很多情況下甚至超越了人類。
? LLMs 能夠迅速解析海量財務數據,從收益報告到宏觀經濟研究,處理大量非結構化數據(如新聞文章或專家意見)的效率遠超人類分析師。這種快速且深入的內容分析,使其能夠指出傳統(tǒng)分析中常被忽略的模式。
? 人類可能會受認知偏差影響,而 LLMs 則提供了更客觀的視角。它們在很大程度上不受可能干擾人類判斷的情感和認知偏差影響,不過其訓練過程中仍存在一些偏差。此外,LLMs 突破了個人或團隊分析師的局限,能在產品、市場以及最重要的投資者之間無縫拓展這種能力。
? LLMs 在降低股票選擇中的偏差方面發(fā)揮著關鍵作用。和人類分析師不同,LLMs 不受情感或認知偏差影響,為財務分析提供了更客觀的看法。這種客觀性對于做出無偏差的投資決策至關重要,因為 LLMs 依靠數據驅動的見解而非主觀判斷。雖然其訓練數據中存在一些固有偏差,但 LLMs 顯著減少了人類偏差對投資決策的影響。
本文作者提出了Market Sense AI,利用模塊化架構和大型語言模型從海量的數字和文本數據中生成簡潔總結,提取有關公司發(fā)展和股票潛力的。并結合投資期限等,針對特定股票給出投資建議。
2. Market Sense AI架構
圖片
如上圖所示,Market Sense AI 的架構框架包括5個組件:
? 前四個核心組件負責數據輸入
? 第五個組件負責促進最終推薦(即買入、持有或賣出)
Market Sense AI 效仿專業(yè)投資團隊的決策流程:通過新聞摘要器追蹤公司或其所屬行業(yè)的最新動態(tài),通過基本面摘要器分析公司的最新財務報表,以及在考慮價格行動動態(tài)的情況下對當前環(huán)境進行宏觀經濟分析。
2.1. 新聞摘要組件(Progressive News Summarizer)
與股票有關的新聞,包括公告、報告、分析師觀點和研究成果等,對市場情緒以及后續(xù)的股票價格影響頗大。這類新聞可能產生短期、長期或甚微的影響。所以,在股票分析中,新聞的來源與解讀需要審慎處理。
新聞摘要器負責獲取新聞、進行濃縮,并為某只股票的最具影響力的新聞進行漸進式概要。
圖片
如上圖所示,從新聞 API 中獲取與特定股票對應的每日新聞。
每天的個股新聞會預先處理,剔除與公司無關的內容,比如誘導點擊類的文章,以確保其格式適合輸入提示。通過 GPT4 對股票的每日新聞生成簡潔的每日新聞摘要然后進行統(tǒng)一存儲。
但是股票的新聞不僅僅是單個獨立的新聞重要,股票的新聞往往會綜合過去的舊聞持續(xù)性產生作用。例如,在合并或法律糾紛的情形下,關于公司業(yè)績好于預期的公告在整體決策過程中或許影響力較小。
新聞摘要組件通過將最新的新聞摘要與之前摘要相結合來解決此問題。更確切地說,提示結構指示 GPT-4 模仿金融分析師的角色,通過整合各類信息為特定股票合成更新的摘要。提示包括:
? 當前摘要 :截至特定年月的公司及其股票的最新摘要。
? 每日新聞摘要 :公司在給定月份的新聞,分為事實新聞和分析師的觀點。
? 說明 :整合最相關的信息,區(qū)分事實新聞和分析師的意見。
摘要綜合考量了過去一個月的每日新聞摘要和上個月的新聞摘要。確保摘要器始終反映最新、最相關且最重要的發(fā)展動態(tài),為公司在新聞中的狀況提供全面且最新的概覽。
圖片
如上表,新聞摘要器捕獲了2023 年兩個不同月份圍繞蘋果公司(AAPL.US)的發(fā)展動態(tài)。涵蓋了從公司持續(xù)的財務表現到戰(zhàn)略舉措和市場挑戰(zhàn)等多個話題。
在 10 月,重點在于蘋果在科技行業(yè)的重要地位,表現為 iPhone 15 系列的推出以及對其 Apple Watch 和 AirPods 的更新。這一時期還突顯了智能手機銷售的挑戰(zhàn)、地緣政治問題的影響以及股票表現的波動。本月特有的是關于蘋果對收購一級方程式廣播權的興趣以及首席執(zhí)行官蒂姆·庫克出售公司股票的報道,展現了公司多樣的戰(zhàn)略興趣和高管決策。
到 11 月,盡管許多早期主題延續(xù),但新元素出現。摘要顯示了蘋果的銷售放緩、智能手機市場的競爭壓力以及其合作伙伴關系的戰(zhàn)略轉變,包括與高盛終止信用卡協(xié)議。值得注意的是,公司的可持續(xù)發(fā)展努力和 M3 芯片的推出,以及其在流媒體內容方面的拓展。
下表是一些摘要示例:
圖片
2.2. 基本面總結模塊(Fundamentals Summarizer)
基本面數據在預測性金融分析中極其重要,提供了可量化的指標,能反映公司當下的狀況和未來的走向。
圖片
如上圖所示,借助 EODHD(https://eodhd.com/) 的基本面數據 API 獲取季度信息。
圖片
為方便財務數據的比較,在輸入提示前,進行預處理。預處理涵蓋了特定的數字縮寫技術,通過使用“百萬”“十億”或“千”等前綴,把大數字轉化為更緊湊的格式。使財務數據標準化并且這一預處理步驟對于讓 GPT-4 準確比較和解讀復雜的財務數字至關重要。
不同季度的數據以表格形式并列呈現。通過利用GPT-4對比最新的季度財務報表,深入探究盈利能力、收入趨勢、債務指標和現金流動態(tài)等方面。
對近期數據的關注使 LLM 能夠察覺財務表現的變化,可能將其與漸進式新聞相聯(lián)系。更確切地說,Market Sense AI 利用以下公式對公司的財務狀況進行建模:
通過提示詞引導 GPT-4 充當金融分析師,分析近期走勢:分析指定公司股票的最新季度來評估其財務健康狀況,包括:
? 財務表格:來自資產負債表、損益表和現金流量表的最新季度的關鍵財務數據。
? 分析重點:盈利能力、收入增長、債務水平和現金流生成方面的近期趨勢和發(fā)展。
盡管大型語言模型(LLMs)在不擅長理解復雜數值數據,但預處理方法與 GPT-4 的能力相結合,能夠確保準確的比較與解釋?;久婵偨Y器的目的是呈現公司財務狀況的客觀、真實概覽,不給出任何直接的投資建議。
圖片
上表展示了基本面總結器如何從財務報表(包括收入、資產負債表和現金流量表)中提取關鍵觀點。
2.3. 股票價格動態(tài)總結模塊(Stock Price Dynamics Summarizer)
股票價格動態(tài)總結模塊作為 Market Sense AI 的關鍵部分,對股票的價格變動和財務指標進行分析。
圖片
如上圖所示,該模塊不但會分析目標股票,還會依據公司描述和所屬行業(yè),將其表現與五個最為相似的股票、標準普爾 500 指數進行對比。
識別相似股票的方法:借助 MPNet 語言模型生成嵌入并計算相似性得分。
股票描述由 MPNet 編碼為高維向量,捕捉每家公司的獨特特征和活動。有利于計算標準普爾 500 中上市公司之間的成對相似性得分。這些得分對于識別具有與目標股票相似屬性的股票極為關鍵,從而確保實現將單個股票表現與更廣泛市場趨勢相融合的綜合比較分析。
獲取目標股票、與其類似的股票以及標準普爾 500 指數的市場數據。對關鍵財務指標進行分析,涵蓋 3 個月、6 個月和 12 個月的累計回報和夏普比率,并算出波動率和最大回撤。
尤其是夏普比率和最大回撤,極為關鍵,分別能了解到股票在市場低迷時期的風險調整回報和抗跌能力。這種全面的分析能廣泛了解該股票相對于同行和整個市場的表現。
圖片
上圖展示了股票價格動態(tài)總結模塊的結果,將復雜數據提煉為易懂見解。提供了股票相對于類似公司和整體市場趨勢的市場動態(tài)的多維視角。
2.4. 宏觀經濟環(huán)境綜述(Macroeconomic Environment Summary)
宏觀經濟分析對于做出明智的投資決策和實現有效的資本配置極為關鍵。能夠為整體經濟的健康狀況和表現提供重要洞見,對單個公司的盈利能力與價值以及整個股票市場都有著顯著影響??紤]到諸如新冠疫情或烏克蘭戰(zhàn)爭等塑造投資格局的主要因素,投資者便能做出更明智的抉擇。
圖片
如上圖,該組件每兩周對投資報告和研究文章進行整合,為復雜的經濟數據和趨勢提供簡潔的總結。Market Digest 從包括高盛、摩根士丹利、瑞銀和貝萊德等領先銀行和投資機構的各類公開報告中獲取信息。
首先將這些報告和文章轉化為文本形式。借助 GPT4 對單個報告進行總結,接著在第二步中將這些單個總結凝練為全面的概述。
使 Market Digest 能夠將不同的觀點和分析整合成一個連貫的敘述,就宏觀經濟態(tài)勢、中央銀行政策、優(yōu)先部門或國家以及地緣政治趨勢提供共識性觀點。輸出簡潔且全面,兼顧了市場分析師和專家之間潛在的矛盾或不同看法,包括:
? 初始總結重點:對單個報告進行總結,突出包括中央銀行政策、地緣政治見解和市場展望等關鍵宏觀經濟要素。
? 綜合與情緒分析:對所有報告展開深入剖析,提取共識和分歧觀點,重點關注按資產類別或投資維度劃分的情緒分析。
? 說明:要求一份詳盡且真實的報告,著重于當下的市場情緒以及按資產類別進行的分析分類。
圖片
上圖給出了 Market Digest 總結的示例。
2.5. 信號生成( Signal Generation)
信號生成組件作為 Market Sense AI 管道的最后一環(huán),整合了來自新聞、基本面、價格動態(tài)和宏觀經濟分析等組件的文本輸出,為特定股票給出全面的投資建議和詳細的證據。
實際上,一只股票的投資決策取決于一定程度上能從新聞中獲取的基礎公司最重要的發(fā)展情況、公司的財務狀況、股票相對于競爭對手和市場的表現,以及更廣泛的宏觀經濟環(huán)境。
最先進的 LLM(GPT - 4)具備權衡和推理這些不同類別數據的能力,在復雜金融推理任務中的出色表現就是證明。
實際應用中,GPT - 4 扮演專業(yè)金融分析師的角色。采用了思維鏈策略,通過一個反映專業(yè)金融分析師思維模式的邏輯多步推理過程來引導模型。
圖片
使用語境學習(in Context Leaerning,iCL)根據當前的財務狀況和不斷變化的市場數據動態(tài)調整分析。這種雙重策略使得 MarketSenseAI 能夠提供適應不斷變化的市場條件和投資者偏好的深刻見解。其提示結構如下:
? 新聞分析:模型首先評估關于目標公司的最新新聞摘要,判斷其對股票表現的潛在影響。
? 價格動態(tài)分析:接著,它將股票的價格動態(tài)與相關股票和整體市場進行對比,提供相對表現的視角。
? 宏觀經濟環(huán)境分析:模型隨后評估更廣泛的宏觀經濟形勢及其對目標公司的影響,考慮全球經濟趨勢和事件。
? 基本面分析:最后一步是審查公司的基本財務數據,分析其當前的財務健康狀況和未來前景。
模型的輸出以簡潔的格式呈現,包括一個決策(“買入”、“賣出”或“持有”)以及該選擇背后清晰的逐步解釋?!百I入”和“賣出”在投資組合布局的語境中分別指代多頭和空頭頭寸,而“持有”則意味著在投資組合中不涉及該特定股票。
圖片
上表展示了MarketSenseAI在2023年11月末為蘋果公司提供可解釋投資建議的能力,建議在隨后月份的調整后投資組合中維持“持有”狀態(tài)。
既包括了成功的財務表現和產品發(fā)布等積極因素,也包括了銷售增長放緩、競爭加劇和監(jiān)管審查等挑戰(zhàn)。綜合考慮這些相互矛盾的因素后,“持有”的總體決策展現了一種謹慎的態(tài)度。
圖片
Market Sense AI 中的文本相似性分析揭示了模型的推理如何與輸入數據的動態(tài)相契合,對于生成每月投資信號至關重要。
“新聞”和“價格動態(tài)”摘要中的高相似性得分(分別為平均得分 0.923 和 0.907)表明模型重視這些快速變化的因素,認識到它們對股票價格的直接影響。對于短期、每月的預測尤其重要,因為當前的發(fā)展和價格趨勢會極大地左右市場行為。
相比之下,“基本面”和“宏觀”組件的輸出,平均相似性得分分別為 0.849 和 0.803,對模型的月度決策直接影響較小?;久婷考径雀?,提供了公司財務健康狀況相對穩(wěn)定但變化不頻繁的情況,而宏觀經濟數據更廣泛和通用,對短期投資決策的影響較為適中。
3. 效果對比
3.1 總體情況
作者選取標普100指數中的股票來評估Market Sense AI性能,評估期從 2022 年 12 月 1 日持續(xù)至 2024 年 3 月 31 日。
使用的數據集:
? 新聞:2022 年 12 月 1 日至 2024 年 2 月 29 日期間,共發(fā)布 163,483 篇文章,平均每個股票每天 4.57 篇,標準差為 5.49。每篇文章平均標記數為 867,標準差為 1196。這些數據生成了 35,229 個每日的、特定于公司的新聞摘要以及 1,500 個每月的漸進式摘要。
? 基本面:從 2022 年第二季度起,收集了標準普爾 100 股票的 612 份季度報告中的財務數據。該數據集產生了 608 個獨特的基本面摘要,平均每個股票約 6 個。
? 描述:每只股票及其所在板塊的簡要描述,由算法 1 用于識別相似股票。
? 價格:對 2022 年 1 月 1 日至 2024 年 2 月 29 日的歷史每日股票價格(調整收盤價)進行分析,以計算股票價格動態(tài)。此數據由股票價格動態(tài)組件用于為每個股票每月生成一個摘要,總計 1,500 個摘要。
? 宏觀:市場摘要分析了 2023 年 4 月至 2023 年 2 月期間主要金融機構發(fā)布的 187 份投資報告(每份 20 - 30 頁)。對于 2023 年 1 月至 3 月做出的預測,信號生成組件無法獲取宏觀經濟摘要,因此僅有 11 個宏觀經濟摘要用于信號生成。
總共生成 1,500 個信號(15 個月×100 只股票),對這些信號細分可知,有 338 個“買入”、1150 個“持有”和 12 個“賣出”信號。
3.2. 市場表現評估結果(Bootstrapping)
Bootstrapping 方法能夠在處理復雜或未知數據分布時提供一種有效的統(tǒng)計推斷手段,通過有放回的重采樣數據來估計特定統(tǒng)計量的變化性,包括標準誤差、置信區(qū)間和各種準確度指標。可以幫助作者確定模型生成的投資信號與傳統(tǒng)隨機投資信號相比是否具有顯著差異。
圖片
從上圖可以看出,無論是在累計回報(R)還是命中率(HR)上,MarketSenseAI都展現出了在識別有利投資機會方面的能力遠超隨機猜測。特別是在考慮去趨勢回報后,"買入"信號的高命中率量化值表明,與隨機信號生成方法相比,MarketSenseAI的推薦有更大的概率成功。這一發(fā)現強調了模型在有效識別潛在市場表現優(yōu)異機會方面的能力,從而證明了MarketSenseAI在投資決策中的實用價值和統(tǒng)計顯著性??偟膩碚f,Bootstrapping評估強有力地證明了MarketSenseAI能夠產生遠超偶然機會的投資信號,證明了其在金融分析中的有效性和可靠性。
3.3. 市場效果評估
3.3.1. 普通策略
圖片
作者采用了多種普通策略方法來驗證MarketSenseAI的市場效果,這些策略方法包括:
1.同等加權策略(MS):基于MarketSenseAI生成的“買入”和“賣出”信號,構建一個每月重新平衡的同等加權投資組合。
2.僅買入信號策略(MS-L):僅考慮MarketSenseAI的“買入”信號,忽略“賣出”信號,構建一個每月重新平衡的同等加權投資組合。
3.資本化加權策略(MS-L-Cap):基于MarketSenseAI的“買入”信號,構建一個每月重新平衡的資本化加權投資組合。
4.基于夏普比率的排名策略(MS-Top10-SR):選擇“買入”信號中夏普比率最高的10只股票,構建一個同等加權投資組合。
5.基于GPT-4排名的策略:利用GPT-4對“買入”信號的解釋進行評分和排名,選擇排名最高的股票構建投資組合。
驗證市場效果的過程中,將這些策略的表現與S&P 100指數的同等加權和資本化加權組合以及基于移動平均線的樸素趨勢跟蹤策略(Naive)進行了比較。比較的指標包括總回報、夏普比率、索提諾比率、波動性、勝率和最大回撤等。
圖片
最終效果顯示:
?MS策略:總回報達到了35.48%(考慮交易成本后為32.94%),夏普比率為2.49,索提諾比率為3.87,顯著優(yōu)于S&P 100的同等加權組合。
?MS-L策略:由于“賣出”信號較少,其表現與MS策略相似,總回報為35.79%(考慮交易成本后為34.82%)。
?MS-L-Cap策略:在資本化加權的情況下,總回報達到了66.22%(考慮交易成本后為65.25%),遠超S&P 100 ETF的43.27%。
?基于GPT-4排名的策略:特別是MS-Top10-GPT策略,總回報達到了49.09%(考慮交易成本后為48.07%),夏普比率為2.68,索提諾比率為4.29,勝率為74.1%,最大回撤為7.66%,在所有策略中表現最佳。
綜上所述,MarketSenseAI生成的信號在多種普通策略方法下均顯示出卓越的市場效果,不僅在總回報上超越了基準指數,而且在風險調整后的回報指標上也表現出色,驗證了MarketSenseAI在實際投資決策中的有效性和優(yōu)越性。
3.3.2. 基于排名的策略
圖片
利用基于排名的策略來驗證MarketSenseAI的市場效果,主要是通過以下幾種方式:
1.基于夏普比率的排名策略(MS-Top10-SR):
- 這種策略選擇“買入”信號中夏普比率最高的10只股票,構建同等加權的投資組合。
- 結果顯示,MS-Top10-SR策略的總回報為23.13%(交易成本后為22.12%),夏普比率為1.45,索提諾比率為2.11。
2.基于GPT-4排名的策略:
? 這些策略利用GPT-4對“買入”信號的解釋進行評分和排名,選擇排名最高的股票構建投資組合。
? 具體包括MS-Top5-GPT、MS-Top10-GPT、MS-High-GPT和MS-Low-GPT策略,它們分別選擇GPT-4排名最高的5只股票、10只股票、高于7分的股票和7分及以下的股票。
3.資本化加權的基于GPT-4排名的策略(MS-Top10-Cap-GPT):
? 這種策略對GPT-4排名最高的股票采用資本化加權方法,構建投資組合。
圖片
最終效果如下:
?MS-Top5-GPT和MS-Top10-GPT策略:
MS-Top5-GPT策略的總回報為50.96%(交易成本后為49.67%),夏普比率為2.26,索提諾比率為3.69。
MS-Top10-GPT策略的總回報為49.09%(交易成本后為48.07%),夏普比率為2.68,索提諾比率為4.29,勝率最高,達到74.1%,最大回撤為7.66%。
?MS-High-GPT和MS-Low-GPT策略:
MS-High-GPT策略的總回報為39.47%(交易成本后為38.35%),夏普比率為2.28,索提諾比率為3.44。
MS-Low-GPT策略的總回報為25.66%(交易成本后為24.27%),夏普比率為1.76,索提諾比率為2.64。
?MS-Top10-Cap-GPT策略:
該策略的總回報達到了72.87%(交易成本后為71.64%),是所有策略中表現最好的。
基于排名的策略在驗證MarketSenseAI市場效果時表現出色,尤其是那些利用GPT-4進行排名的策略,它們在總回報、夏普比率、索提諾比率等關鍵指標上均優(yōu)于傳統(tǒng)的基于夏普比率排名的策略。這些結果進一步證實了MarketSenseAI在投資決策中的有效性,以及GPT-4在解釋和排名投資信號方面的強大能力。
本文轉載自??大語言模型論文跟蹤??,作者:HuggingAGI ????
