自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<style id="26eds"></style>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考華為認證廠商認證 IT技術(shù)PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺

51CTO學堂

IT職業(yè)在線教育平臺

當金融遇上 AI 魔法：FinSQL 點燃數(shù)據(jù)智能新引擎精華

AIGC前沿技術(shù)追蹤

發(fā)布于 2024-12-20 10:56

瀏覽

0收藏

一、背景

1.1 研究背景

在當今數(shù)字化時代，金融領(lǐng)域的數(shù)據(jù)量呈爆炸式增長，對數(shù)據(jù)的高效分析和利用成為金融機構(gòu)獲取競爭優(yōu)勢的關(guān)鍵。傳統(tǒng)的數(shù)據(jù)庫操作依賴于專業(yè)的 SQL 編程技能，然而，金融專業(yè)人士雖精通金融業(yè)務(wù)，但在 SQL 編程方面往往技能有限。這一矛盾促使了 Text-to-SQL 技術(shù)的興起，其旨在將自然語言問題轉(zhuǎn)化為可執(zhí)行的 SQL 查詢，為金融分析提供了便捷的數(shù)據(jù)訪問途徑，無需編寫復雜的 SQL 代碼即可獲取所需信息，大大提高了工作效率，減少了對專業(yè)數(shù)據(jù)庫人員的依賴，使金融專業(yè)人士能夠更專注于數(shù)據(jù)分析和決策制定。

然而，盡管 Text-to-SQL 技術(shù)在金融領(lǐng)域具有巨大潛力，但仍面臨諸多挑戰(zhàn)。一方面，缺乏專門針對金融分析的實用基準數(shù)據(jù)集，現(xiàn)有的數(shù)據(jù)集無法準確反映金融數(shù)據(jù)庫的復雜特性，如廣泛存在的寬表結(jié)構(gòu)等。另一方面，現(xiàn)有的 Text-to-SQL 方法未能充分考慮金融應用中數(shù)據(jù)庫的獨特特征，導致模型在處理金融數(shù)據(jù)時性能受限。

1.2 研究成果

當金融遇上 AI 魔法：FinSQL 點燃數(shù)據(jù)智能新引擎-AI.x社區(qū)

為應對這些挑戰(zhàn)，本文作者團隊開展了深入研究，取得了一系列創(chuàng)新性成果。

首先，構(gòu)建了一個名為 BULL 的實用 Text-to-SQL 基準數(shù)據(jù)集。該數(shù)據(jù)集源自恒生電子的智能投資助手產(chǎn)品，涵蓋基金、股票和宏觀經(jīng)濟三個領(lǐng)域的數(shù)據(jù)庫，包含豐富的自然語言問題與 SQL 查詢對，且提供中英文版本，為金融 Text-to-SQL 研究提供了寶貴的數(shù)據(jù)資源，填補了金融領(lǐng)域?qū)Ｓ脭?shù)據(jù)集的空白。

其次，提出了一種基于模型無關(guān)的大語言模型的 Text-to-SQL 框架 FinSQL 。

該框架從提示構(gòu)建、參數(shù)高效微調(diào)及輸出校準三個關(guān)鍵方面，為金融 Text-to-SQL 提供了系統(tǒng)性解決方案，有效提升了模型性能，增強了模型在實際金融應用中的適用性和準確性。

通過在 BULL 數(shù)據(jù)集上的廣泛實驗驗證， FinSQL 框架在金融 Text-to-SQL 任務(wù)中展現(xiàn)出卓越性能，達到了當前最優(yōu)水平，為金融數(shù)據(jù)處理和分析帶來了新的可能，推動了金融領(lǐng)域智能化進程。

二、現(xiàn)狀

2.1 Text-to-SQL 數(shù)據(jù)集

高質(zhì)量數(shù)據(jù)集是 Text-to-SQL 系統(tǒng)發(fā)展和評估的基石。早期的數(shù)據(jù)集如 GeoQuery 和 Scholar，在查詢數(shù)量和場景復雜度上存在局限性，主要聚焦于單數(shù)據(jù)庫場景且 SQL 查詢較為簡單。WikiSQL 和 Spider 等數(shù)據(jù)集的出現(xiàn)，在查詢數(shù)量和跨數(shù)據(jù)庫遷移能力上有所提升，引入了復雜多表查詢，但與實際應用場景仍有較大差距。

實際應用中的數(shù)據(jù)庫往往規(guī)模更大，且可能涉及外部知識以輔助用戶理解模式信息。KaggleDBQA 和 BIRD 等數(shù)據(jù)集在這方面進行了改進，通過引入外部知識和增加查詢樣本數(shù)量，使數(shù)據(jù)集更貼近實際情況，但仍無法完全滿足行業(yè)復雜多變的需求。特別是在金融領(lǐng)域，數(shù)據(jù)庫結(jié)構(gòu)復雜，現(xiàn)有數(shù)據(jù)集在表和列數(shù)量上遠不及實際場景，給 Text-to-SQL 方法在模式信息融合和處理復雜查詢時帶來巨大挑戰(zhàn)。

2.2 Text-to-SQL 模型

早期基于規(guī)則的 Text-to-SQL 模型，依賴手工編寫的模板生成 SQL 查詢，這類模型對特定場景高度依賴，缺乏通用性和擴展性，難以適應復雜多變的自然語言表達。

隨著技術(shù)發(fā)展，基于 Seq2Seq 架構(gòu)的模型如 IRNet、RAT-SQL 和 LGESQL 等應運而生。這些模型利用編碼器表示問題和模式，通過解碼器生成 SQL 查詢，部分模型還引入圖神經(jīng)網(wǎng)絡(luò)來捕捉問題與模式之間的對齊關(guān)系，提高了模型的準確性和泛化能力。

近年來，預訓練大語言模型如 T5、mT5 和 LLaMA 等展現(xiàn)出強大的語言理解和生成能力，基于這些模型的微調(diào)方法在 Text-to-SQL 任務(wù)中取得了較好效果。例如，Graphix 通過使T5具備多跳推理能力提升性能，Picard 利用約束解碼器提高生成 SQL 的質(zhì)量，RESDSQL 采用兩階段方法先檢索相關(guān)模式元素再生成SQL查詢，成為 Spider 排行榜上基于微調(diào)的當前最優(yōu)方法。

然而，當前領(lǐng)先的基于 GPT 模型的方法雖效果顯著，但依賴 OpenAI API，成本高昂且存在信息泄露風險，同時在不同場景下需要重新設(shè)計指令模板，限制了其在實際金融場景中的應用。

三、技術(shù)

3.1 問題定義

本文聚焦于基于大語言模型（LLM）的 Text-to-SQL 系統(tǒng)。Text-to-SQL 的任務(wù)是，給定自然語言查詢 Q 及其對應的數(shù)據(jù)庫模式 S（包括表 T、列 C 和外鍵關(guān)系 R），系統(tǒng)旨在生成與 Q 對應的可執(zhí)行 SQL 查詢 y。傳統(tǒng)方法多采用編碼器或編碼器-解碼器模型，而基于 LLM 的方法則利用 LLM 強大的語言理解和生成能力直接生成 SQL 查詢。

具體而言，基于 LLM 的 Text-to-SQL 系統(tǒng)通過將問題 Q 和數(shù)據(jù)庫模式 S 組合成提示模板來生成指令提示 P(Q, S)，模型M 基于此提示估計 SQL 查詢 y 的概率分布，并逐個生成查詢中的標記（token），生成過程遵循特定公式，通過對每個標記的條件概率進行連乘來確定最終的 SQL 查詢。

3.2 關(guān)鍵技術(shù)與概念

3.2.1 模式鏈接

模式鏈接是 Text-to-SQL 系統(tǒng)的關(guān)鍵組件，其目的是將數(shù)據(jù)庫模式的元數(shù)據(jù)與自然語言查詢進行關(guān)聯(lián)，從而提取與查詢相關(guān)的模式元素子集，減少無關(guān)信息對模型的干擾，提高生成 SQL 查詢的質(zhì)量。

早期方法主要采用基于規(guī)則或字符匹配技術(shù)進行模式鏈接，但在處理語義相似但表達不同的詞匯時存在局限性，且無法有效捕捉自然語言與表結(jié)構(gòu)之間的復雜語義關(guān)系。近年來，部分研究采用圖神經(jīng)網(wǎng)絡(luò)（GNN）來表示模式結(jié)構(gòu)，取得了一定成果，但這些方法與常見的開源大模型兼容性較差。為提高與 LLM 的兼容性，一些方法將模式鏈接作為獨立模塊，利用Cross-Encoder 模型或精心設(shè)計的上下文學習指令來檢索相關(guān)模式元素，在主流基準測試中表現(xiàn)出色。

3.2.2 思維鏈

思維鏈是一種引導大語言模型進行復雜推理任務(wù)的方法，通過讓模型先輸出推理過程再給出最終答案，顯著提升了模型在處理推理任務(wù)時的性能。在算術(shù)推理基準測試 GSM8K 中，思維鏈技術(shù)使谷歌的大型語言模型 Palm-540B 的準確率大幅提升，從 17.9% 提高到 56.5%。這種技術(shù)不僅提高了答案的準確性，還增強了模型輸出的可解釋性，使模型的推理過程更加透明。

3.2.3 參數(shù)高效微調(diào)

參數(shù)高效微調(diào)方法（如Adapter、Prompt Tuning、Prefix-Tuning 和 LoRA 等）通過僅調(diào)整預訓練大語言模型的少量參數(shù)（通常小于1%），使其能夠快速適應下游任務(wù)，有效解決了傳統(tǒng)全參數(shù)微調(diào)方法計算資源消耗大、存儲成本高和跨數(shù)據(jù)庫泛化能力弱的問題。這些方法在保持模型性能的同時，顯著降低了計算成本和時間，為模型在實際應用中的快速部署和迭代提供了可能。

3.2.4 大語言模型的成本與局限性

不同的大語言模型在上下文長度和使用成本上存在差異。例如，GPT-4 提供了 8k 和 32k 兩種上下文長度選項，但使用其API 需要支付相應費用，且模型輸出存在一定的隨機性和不穩(wěn)定性，可能導致生成的 SQL 查詢在語法和語義上存在錯誤或不一致。此外，大語言模型還存在幻覺現(xiàn)象，即生成看似合理但與事實不符的內(nèi)容，這在金融領(lǐng)域的應用中可能帶來嚴重風險。

四、FinSQL 框架

4.1 整體框架概述

針對金融分析領(lǐng)域中基于大語言模型（LLM）的 Text-to-SQL 方法面臨的挑戰(zhàn)，作者提出了 FinSQL 框架。該框架由三個關(guān)鍵組件構(gòu)成，分別是 提示構(gòu)建、參數(shù)高效微調(diào)及輸出校準，每個組件均針對特定挑戰(zhàn)進行設(shè)計，共同實現(xiàn)了金融文本到SQL 的高效轉(zhuǎn)換。

4.2 提示構(gòu)建

4.2.1 混合數(shù)據(jù)增強

當金融遇上 AI 魔法：FinSQL 點燃數(shù)據(jù)智能新引擎-AI.x社區(qū)

圖 4：基于自我檢查的思維鏈生成概述

在金融應用中，數(shù)據(jù)標注的專業(yè)性和高成本導致訓練數(shù)據(jù)的短缺和多樣性不足。為解決這一問題，作者提出了一種混合數(shù)據(jù)增強方法，結(jié)合了思維鏈（CoT）數(shù)據(jù)、同義問題數(shù)據(jù)和 SQL 骨架數(shù)據(jù)三種形式，分別從推理能力、表達多樣性和SQL結(jié)構(gòu)理解三個方面增強數(shù)據(jù)質(zhì)量。

當金融遇上 AI 魔法：FinSQL 點燃數(shù)據(jù)智能新引擎-AI.x社區(qū)

表 3：在中文數(shù)據(jù)集中使用不同方法生成思維鏈（CoT）的成功率。

當金融遇上 AI 魔法：FinSQL 點燃數(shù)據(jù)智能新引擎-AI.x社區(qū)

圖 5：思維鏈（Chain of Thought，CoT）提示模板。紅色的字是輸入變量。在這里，我們需要提供問題、模式信息、正確的 SQL 語句以及一個示例來填充這個模板。

當金融遇上 AI 魔法：FinSQL 點燃數(shù)據(jù)智能新引擎-AI.x社區(qū)

圖 6：同義問題生成概述

當金融遇上 AI 魔法：FinSQL 點燃數(shù)據(jù)智能新引擎-AI.x社區(qū)

圖 8：SQL 骨架增強數(shù)據(jù)的一個例子

對于思維鏈增強，通過設(shè)計特殊的提示模板引導 LLM 生成正確的 CoT 內(nèi)容，并利用執(zhí)行結(jié)果進行自我檢查，確保生成內(nèi)容的準確性，有效提高了模型的推理能力。同義問題增強則借助 ChatGPT 自動生成與原始問題同義的問題，豐富了問題的表達形式，使模型能夠適應不同用戶的語言習慣。規(guī)則增強通過提取 SQL 查詢的骨架，在訓練階段引導模型先生成骨架再生成完整 SQL，加深了模型對 SQL 結(jié)構(gòu)的理解。

4.2.2 并行模式鏈接

當金融遇上 AI 魔法：FinSQL 點燃數(shù)據(jù)智能新引擎-AI.x社區(qū)

圖 9：交叉編碼器模型的推理過程

現(xiàn)有的模式鏈接方法在金融場景中存在局限性，如基于圖神經(jīng)網(wǎng)絡(luò)的方法與開源 LLM 兼容性差，基于 Cross-Encoder的方法受限于上下文長度且在處理多寬表場景時效率低下。為克服這些問題，作者提出了并行 Cross-Encoder 模型，將表格組織成批次并行處理，快速準確地檢索相關(guān)模式元素，有效提升了模式鏈接的效率和準確性，為模型生成高質(zhì)量 SQL 查詢提供了有力支持。

4.3 參數(shù)高效微調(diào)

傳統(tǒng)的全參數(shù)微調(diào)方法在處理下游任務(wù)時面臨計算成本高、存儲成本高和跨數(shù)據(jù)庫泛化能力弱的問題。FinSQL 框架采用基于 LoRA 的參數(shù)高效微調(diào)方法，僅調(diào)整少量低秩矩陣的權(quán)重，顯著降低了計算資源需求。

當金融遇上 AI 魔法：FinSQL 點燃數(shù)據(jù)智能新引擎-AI.x社區(qū)

圖 10：通過低秩適應（LoRA）對大語言模型（LLMs）進行微調(diào)的過程。

具體而言，通過在預訓練權(quán)重矩陣上添加兩個低秩矩陣（A和B），在訓練過程中凍結(jié)原模型權(quán)重，僅更新這兩個低秩矩陣，實現(xiàn)了多任務(wù)參數(shù)高效微調(diào)。同時，引入 LoRA 插件中心，存儲針對不同數(shù)據(jù)庫或任務(wù)訓練的 LoRA 模塊，通過權(quán)重合并方法實現(xiàn)跨數(shù)據(jù)庫的高效遷移學習，在低資源場景下也能快速適應新數(shù)據(jù)庫，有效提升了模型的泛化能力。

當金融遇上 AI 魔法：FinSQL 點燃數(shù)據(jù)智能新引擎-AI.x社區(qū)

圖 11：基于少樣本 LoRA 的微調(diào)過程以及權(quán)重合并

4.4 輸出校準

當金融遇上 AI 魔法：FinSQL 點燃數(shù)據(jù)智能新引擎-AI.x社區(qū)

圖 12：由大型語言模型生成的無效 SQL 查詢示例。第一個 SQL 在連接和條件語句中有語法錯誤。第二個使用了一個無效的列，因為數(shù)據(jù)庫中不存在 “aquirementrium” 這個列。正確的 SQL 中的列是 “acquireramount”。第三個 SQL 在表和列之間建立了錯誤的連接。列 “chinameabbr” 和 “firstindustryname” 分別屬于表 “l(fā)c_sharestru” 和 “l(fā)c_exgindustry”。

由于 LLM 本身的局限性，如幻覺和隨機解碼策略，其生成的 SQL 查詢可能存在語法錯誤、無效列引用或表列關(guān)聯(lián)錯誤等問題。為提高生成 SQL 查詢的正確性和一致性， FinSQL 框架提出了一種輸出校準算法。

該算法無需執(zhí)行 SQL 查詢，通過修復語法錯誤、提取關(guān)鍵詞和值進行非執(zhí)行式自一致性檢查以及表列對齊等操作，有效減少了無效 SQL 查詢的出現(xiàn)，提高了輸出 SQL 查詢的質(zhì)量，確保了模型在實際金融應用中的可靠性。

五、BULL 數(shù)據(jù)集

5.1 數(shù)據(jù)集構(gòu)建

BULL 數(shù)據(jù)集基于恒生電子的智能投資助手產(chǎn)品構(gòu)建，涵蓋了基金、股票和宏觀經(jīng)濟三個與金融分析密切相關(guān)的領(lǐng)域。數(shù)據(jù)集包含了來自真實業(yè)務(wù)場景的豐富數(shù)據(jù)，共計 31、28 和 19 個表，平均每個表具有較多的列，截止到 2022 年 4 月，數(shù)據(jù)全面且時效性強。

為確保數(shù)據(jù)的準確性和專業(yè)性，數(shù)據(jù)集的構(gòu)建過程涉及多方合作。金融專業(yè)人士和數(shù)據(jù)科學家共同編寫了 4966 條多樣化的中文問題，軟件工程師為這些問題編寫對應的 SQL 查詢，隨后由具備數(shù)據(jù)庫和金融知識的實習生進行驗證和糾錯。此外，為滿足不同語言需求，團隊還將數(shù)據(jù)集擴展為英文版本，包括對表和列描述的專業(yè)翻譯，以及問題和 SQL 查詢的準確改寫，確保了數(shù)據(jù)集在中英文環(huán)境下的可用性和一致性。

當金融遇上 AI 魔法：FinSQL 點燃數(shù)據(jù)智能新引擎-AI.x社區(qū)

圖 2：BULL 數(shù)據(jù)庫的介紹。BULL 的英文和中文版本具有相同的數(shù)據(jù)庫結(jié)構(gòu)。“#Tab Num” 代表數(shù)據(jù)庫中的表的數(shù)量。“#Avg Col” 和 “#Max Col” 分別表示數(shù)據(jù)庫中每個表的平均列數(shù)和最大列數(shù)。

5.2 數(shù)據(jù)特點與優(yōu)勢

當金融遇上 AI 魔法：FinSQL 點燃數(shù)據(jù)智能新引擎-AI.x社區(qū)

與其他廣泛使用的 Text-to-SQL 基準數(shù)據(jù)集相比， BULL 數(shù)據(jù)集具有顯著優(yōu)勢。其每個數(shù)據(jù)庫包含的表和列數(shù)量遠超同類數(shù)據(jù)集，如 WikiSQL、Spider 和 BIRD 等，更接近實際金融應用中的復雜數(shù)據(jù)庫結(jié)構(gòu)。這一特點使得在該數(shù)據(jù)集上訓練的模型能夠更好地處理大規(guī)模、多表關(guān)聯(lián)的金融數(shù)據(jù)查詢，增強了模型在實際場景中的實用性和泛化能力。

此外， BULL 數(shù)據(jù)集的表和列名稱常采用縮寫或模糊表示，這要求模型具備更強的上下文理解能力，從而推動了 Text-to-SQL 模型在語義理解和推理能力上的發(fā)展，為金融領(lǐng)域的智能化數(shù)據(jù)分析提供了更具挑戰(zhàn)性和現(xiàn)實意義的數(shù)據(jù)資源。

六、實驗

6.1 實驗設(shè)置

6.1.1 數(shù)據(jù)集與評估指標

當金融遇上 AI 魔法：FinSQL 點燃數(shù)據(jù)智能新引擎-AI.x社區(qū)

表 4：不同先前方法在 BULL-en 上的總體結(jié)果。對于微調(diào)方法，我們使用 T5-large 和 LLaMA2-13B。星號表示我們采用我們的并行交叉編碼器模型進行模式鏈接。

實驗在 BULL 數(shù)據(jù)集上進行，該數(shù)據(jù)集包含基金、股票和宏觀經(jīng)濟三個領(lǐng)域的數(shù)據(jù)庫，提供了豐富的中英文問題-SQL查詢對。評估指標選用執(zhí)行準確率（EX），通過比較預測 SQL 查詢與真實 SQL 查詢在數(shù)據(jù)庫中的執(zhí)行結(jié)果來判斷模型的準確性，這一指標與流行的 Text-to-SQL 排行榜（如Spider）所使用的官方評估指標一致，確保了實驗結(jié)果的可比性和可靠性。

6.1.2 實驗模型與基線方法

當金融遇上 AI 魔法：FinSQL 點燃數(shù)據(jù)智能新引擎-AI.x社區(qū)

表 5：不同先前方法在我們的 BULL-cn 上的總體結(jié)果。對于微調(diào)方法，我們使用 mT5-large 和 Baichuan2-13B。星號表示我們使用我們的并行交叉編碼器模型進行模式鏈接。

實驗采用了多種先進的大語言模型作為基礎(chǔ)模型，包括解碼器架構(gòu)的 LLaMA2 和 Baichuan2，以及編碼器-解碼器架構(gòu)的T5 和 mT5。為了進行對比，作者選擇了多個在 Spider 排行榜上表現(xiàn)優(yōu)異的基線方法，如DAIL-SQL、DIN-SQL、C3、RESDSQL、Token Preprocessing 和 Picard 等，通過在 BULL 數(shù)據(jù)集上比較 FinSQL 框架與這些基線方法的性能，全面評估了 FinSQL 的有效性和先進性。

6.2 實驗結(jié)果分析

6.2.1 整體性能對比

當金融遇上 AI 魔法：FinSQL 點燃數(shù)據(jù)智能新引擎-AI.x社區(qū)

表 6：模式鏈接的性能

在 BULL 數(shù)據(jù)集的中英文版本上， FinSQL 框架均取得了領(lǐng)先的性能表現(xiàn)。與基于 GPT 的方法相比， FinSQL 不僅在執(zhí)行準確率上更優(yōu)，且避免了高昂的 API 使用成本，展現(xiàn)出更高的性價比和實用性。在與基于 T5 的方法對比中， FinSQL 同樣表現(xiàn)出色，盡管在某些情況下略低于 Picard，但整體上在處理金融領(lǐng)域復雜查詢時具有明顯優(yōu)勢，驗證了 FinSQL 框架在實際金融數(shù)據(jù)場景中的強大適應性和高效性。

6.2.2 模式鏈接效果評估

當金融遇上 AI 魔法：FinSQL 點燃數(shù)據(jù)智能新引擎-AI.x社區(qū)

表 7 ：展示了我們的并行交叉編碼器模型中表格和列的召回率 @k 的情況。其中，“recall@k” 指的是在檢索任務(wù)中，在前 k 個結(jié)果中正確結(jié)果的召回比例；

通過采用AUC（Area Under the ROC Curve）作為評估指標，實驗表明 FinSQL 框架中的并行 Cross-Encoder 模型在模式鏈接任務(wù)中表現(xiàn)卓越。無論是在英文還是中文數(shù)據(jù)集上，該模型在識別相關(guān)表和列時均達到了極高的準確率，AUC 值接近 1，這意味著模型能夠精準地篩選出與查詢相關(guān)的模式元素，有效減少了無關(guān)信息的干擾，為后續(xù) SQL 查詢生成提供了堅實基礎(chǔ)，顯著提升了模型在復雜金融數(shù)據(jù)庫環(huán)境中的性能。

6.2.3 數(shù)據(jù)增強效果分析

當金融遇上 AI 魔法：FinSQL 點燃數(shù)據(jù)智能新引擎-AI.x社區(qū)

表 8：不同數(shù)據(jù)增強方法的有效性

通過消融實驗，研究了混合數(shù)據(jù)增強方法中各組成部分的貢獻。結(jié)果顯示，去除任何一種數(shù)據(jù)增強方式都會導致模型性能下降，證明了思維鏈數(shù)據(jù)、同義問題數(shù)據(jù)和SQL骨架數(shù)據(jù)在提升模型推理能力、表達多樣性和SQL結(jié)構(gòu)理解方面的不可或缺性，強調(diào)了混合數(shù)據(jù)增強策略在提高 FinSQL 框架魯棒性和泛化能力方面的關(guān)鍵作用。

6.2.4 權(quán)重合并方法在少樣本跨數(shù)據(jù)庫場景中的效果

當金融遇上 AI 魔法：FinSQL 點燃數(shù)據(jù)智能新引擎-AI.x社區(qū)

圖 13：基于權(quán)重合并的小樣本低秩自適應（LoRA）在四個模型上的執(zhí)行準確率

在少樣本跨數(shù)據(jù)庫場景下，實驗對比了 LoRA 權(quán)重合并方法與普通 LoRA 方法的性能。結(jié)果表明，權(quán)重合并方法在低樣本情況下表現(xiàn)優(yōu)異，尤其在零樣本和少量樣本學習設(shè)置中，能夠顯著提升模型的執(zhí)行準確率。隨著樣本數(shù)量增加，兩者差距逐漸縮小，但合并權(quán)重方法仍具有明顯優(yōu)勢，有效解決了新數(shù)據(jù)庫構(gòu)建時訓練數(shù)據(jù)不足的問題，提高了模型在不同數(shù)據(jù)庫間的遷移能力和適應性。

6.2.5 輸出校準效果評估

當金融遇上 AI 魔法：FinSQL 點燃數(shù)據(jù)智能新引擎-AI.x社區(qū)

表 9：輸出校準的效果

對輸出校準算法的研究表明，該算法中的自一致性檢查和表列對齊等操作對提高模型生成 SQL 查詢的質(zhì)量至關(guān)重要。去除輸出校準步驟會導致執(zhí)行準確率下降，證明了該算法在減少 LLM 幻覺和隨機解碼策略影響方面的有效性，確保了生成 SQL查詢在語法和語義上的正確性，提高了模型在實際金融應用中的可靠性和穩(wěn)定性。

七、結(jié)論

7.1 研究成果總結(jié)

本研究成功構(gòu)建了 BULL 數(shù)據(jù)集，為金融領(lǐng)域的 Text-to-SQL 研究提供了重要的數(shù)據(jù)基礎(chǔ)。該數(shù)據(jù)集基于真實金融業(yè)務(wù)場景，具有豐富的表結(jié)構(gòu)和數(shù)據(jù)多樣性，填補了金融分析專用數(shù)據(jù)集的空白。

提出的 FinSQL 框架為金融 Text-to-SQL 任務(wù)提供了一種創(chuàng)新性的解決方案。通過獨特的提示構(gòu)建、參數(shù)高效微調(diào)和輸出校準策略，有效提升了模型在處理金融數(shù)據(jù)時的性能，達到了當前最優(yōu)水平。實驗結(jié)果充分證明了 FinSQL 框架在實際金融應用中的有效性和優(yōu)越性，為金融數(shù)據(jù)處理和分析帶來了新的思路和方法。

7.2 未來研究方向

盡管 FinSQL 框架取得了顯著成果，但仍有進一步提升的空間。未來研究可考慮進一步優(yōu)化混合數(shù)據(jù)增強策略，探索更多有效的數(shù)據(jù)生成方式，以提高模型對復雜金融語義的理解能力。在模型訓練和推理過程中，如何更好地結(jié)合領(lǐng)域知識和上下文信息，也是一個值得深入研究的方向。

隨著金融數(shù)據(jù)規(guī)模的不斷增長和業(yè)務(wù)需求的日益復雜，如何提升模型的可擴展性和適應性，以應對大規(guī)模、多模態(tài)金融數(shù)據(jù)的挑戰(zhàn)，將是未來研究的重點之一。此外，探索更加高效的模型壓縮和加速技術(shù)，降低模型計算成本，提高推理效率，也將有助于推動 FinSQL 框架在實際金融場景中的廣泛應用。

7.3 對金融領(lǐng)域智能化發(fā)展的意義

本研究成果對金融領(lǐng)域的智能化發(fā)展具有重要意義。FinSQL 框架的應用將大大降低金融專業(yè)人士操作數(shù)據(jù)庫的門檻，提高數(shù)據(jù)獲取和分析的效率，使他們能夠更快速、準確地獲取有價值的信息，為投資決策、風險管理等核心業(yè)務(wù)提供有力支持。

隨著 Text-to-SQL 技術(shù)在金融領(lǐng)域的普及，有望推動金融機構(gòu)內(nèi)部數(shù)據(jù)流程的優(yōu)化和創(chuàng)新，促進不同業(yè)務(wù)系統(tǒng)之間的數(shù)據(jù)融合與協(xié)同工作。例如，在投資分析中，分析師可以通過自然語言直接查詢海量金融數(shù)據(jù)，快速獲取公司財務(wù)報表、市場趨勢等信息，結(jié)合專業(yè)知識進行深度分析，及時發(fā)現(xiàn)潛在投資機會，優(yōu)化投資組合。在風險管理方面，能夠?qū)崟r監(jiān)測市場動態(tài)數(shù)據(jù)，利用模型預測風險指標，提前制定風險應對策略，有效降低金融風險。

從行業(yè)層面來看， FinSQL 框架的推廣有助于提升整個金融行業(yè)的數(shù)據(jù)利用效率和智能化水平，推動金融創(chuàng)新發(fā)展。它可以激發(fā)更多基于數(shù)據(jù)驅(qū)動的金融產(chǎn)品和服務(wù)創(chuàng)新，如智能投顧、個性化金融推薦等，為投資者提供更加精準、個性化的金融服務(wù)體驗，滿足不同客戶群體的多樣化需求。同時，也為監(jiān)管機構(gòu)提供了更高效的數(shù)據(jù)監(jiān)測和分析工具，有助于加強金融市場監(jiān)管，維護市場穩(wěn)定。

在金融科技發(fā)展的大趨勢下， FinSQL 框架為金融領(lǐng)域與人工智能技術(shù)的深度融合提供了實踐范例，引領(lǐng)著金融數(shù)據(jù)處理向更加智能化、自動化的方向邁進。未來，隨著技術(shù)的不斷進步和完善，其在金融領(lǐng)域的應用前景將更加廣闊，有望成為推動金融行業(yè)數(shù)字化轉(zhuǎn)型和高質(zhì)量發(fā)展的重要力量。

綜上所述，本研究不僅在學術(shù)上為金融 Text-to-SQL 領(lǐng)域提供了新的數(shù)據(jù)集和框架，在實際應用中也為金融行業(yè)的智能化變革帶來了積極影響和廣闊發(fā)展空間，助力金融機構(gòu)在激烈的市場競爭中搶占先機，實現(xiàn)可持續(xù)發(fā)展。同時，也為后續(xù)相關(guān)研究和技術(shù)發(fā)展奠定了堅實基礎(chǔ)，激發(fā)更多研究者和從業(yè)者探索金融與人工智能融合的創(chuàng)新之路。

本文轉(zhuǎn)載自 ??AIGC前沿技術(shù)追蹤??，作者： ??AIGC前沿技術(shù)追蹤??

標簽

贊

收藏

回復

舉報

回復

相關(guān)推薦

大模型微調(diào)新范式：當LoRA遇見MoE

zhangyannni ? 3348瀏覽 ? 0回復
四款AI神器點燃你的創(chuàng)意火花

echo_ning ? 2218瀏覽 ? 0回復
當AI遇上架構(gòu)師：誰將主導未來？

玄姐聊AGI ? 2257瀏覽 ? 0回復
開源的金融分析工具，Llama3-70B-Instruct模型編織開放的金融智能網(wǎng)

xuxiangda ? 3040瀏覽 ? 0回復
用 Dify 和 Notion 打造輕量級金融數(shù)據(jù)庫

開發(fā)者阿橙 ? 3927瀏覽 ? 0回復
搜索引擎+GraphRAG+智能體，打造AI智能搜索

小虎哦哦 ? 2927瀏覽 ? 0回復
數(shù)據(jù)分析自動化：LIDA智能可視化的魔法！

Halo咯咯 ? 2087瀏覽 ? 0回復
《深度學習 “魔法”：數(shù)據(jù)增強策略深度剖析》

智能交互引擎 ? 2131瀏覽 ? 0回復
最新綜述帶你解鎖AI的個性化服務(wù) | 綜述！擴散模型：AI藝術(shù)創(chuàng)作背后的"魔法引擎"

arnoldzhw ? 3351瀏覽 ? 0回復
微軟研究院推出的MarS：生成基礎(chǔ)模型時代的統(tǒng)一金融市場模擬引擎

Halo咯咯 ? 3637瀏覽 ? 0回復
人工智能智能體(AI Agent)發(fā)展趨勢2024年總結(jié)與2025年展望

十一月雨_55 ? 8315瀏覽 ? 0回復
當愛情遇上算法，人工智能將永遠愛你嗎？研究浪漫AI伴侶的隱性偏見

xuxiangda ? 1842瀏覽 ? 0回復
當 AI 學會 25 種語言：達摩院 Babel 如何讓全球 90% 人口共享智能紅利？

Halo咯咯 ? 1523瀏覽 ? 0回復
多智能體的魔法就得這么玩

AIGC前沿技術(shù)追蹤 ? 1314瀏覽 ? 0回復
當敏捷團隊遇見AI，新的實踐由此誕生

51CTO內(nèi)容精選 ? 1192瀏覽 ? 0回復
一文讀懂AI智能體融合與數(shù)據(jù)隱私安全問題

數(shù)字化助推器 ? 1084瀏覽 ? 0回復
AI智能體融合時代 數(shù)據(jù)隱私安全的“守護之道”

數(shù)字化助推器 ? 1016瀏覽 ? 0回復
英偉達押注Agent新基建！AI專屬搜索引擎問世

探索AGI ? 1146瀏覽 ? 0回復
金融大佬 Mike Conover 親授：構(gòu)建高保真知識智能體的實戰(zhàn)秘笈

凝固的雨_1 ? 1894瀏覽 ? 0回復

AIGC前沿技術(shù)追蹤

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

綜述：基于LLM的數(shù)據(jù)查詢與可視化 5天前發(fā)布
大語言模型增強的文本到 SQL 生成：綜述 2025-04-14 01:14:57發(fā)布

熱門推薦

大半精銳盡出！o1下線！滿血o3之后，模型本身就是Manus，最大賣點：替代人干真活！ 1回復

王炸！MCP 架構(gòu)設(shè)計深度剖析 & 使用 Spring AI + MCP 四步教你實現(xiàn) Agent 智能體開發(fā) 0回復

Dify從入門到高階系列二：手把手教學！超詳細的Dify知識庫配置全攻略 0回復

Crawl4AI：GitHub榜首40K星標！LLM專屬極速開源爬蟲神器 0回復

只需5分鐘，教你用Python搭建MCP Server 0回復

上一篇：最新開源Auto-RAG：最低成本解決多跳問題

下一篇： MIT：LLM的思考方式竟然和大腦相似

社區(qū)精華內(nèi)容

目錄