自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<p id="lsqfl"><li id="lsqfl"></li></p>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項目管理免費題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺

51CTO學(xué)堂

IT職業(yè)在線教育平臺

低資源場景下Text2SQL方法原創(chuàng)

大模型自然語言處理

發(fā)布于 2024-12-4 10:13

瀏覽

0收藏

低資源場景下Text2SQL方法-AI.x社區(qū)

SFT的text2sql方法

SFT使模型能夠遵循輸入指令并根據(jù)預(yù)定義模板進(jìn)行思考和響應(yīng)。如上圖，、和是用于通知模型在推理過程中響應(yīng)角色的角色標(biāo)簽。后面的內(nèi)容表示模型需要遵循的指令，而后面的內(nèi)容傳達(dá)了當(dāng)前用戶對模型的需求。后面的內(nèi)容代表模型的預(yù)期輸出，也可以定義為模型預(yù)測的標(biāo)簽。在監(jiān)督微調(diào)期間，模型根據(jù)和中的內(nèi)容預(yù)測后面的內(nèi)容，然后將其與標(biāo)簽進(jìn)行比較以計算損失函數(shù)。標(biāo)記作為結(jié)束標(biāo)記，以防止模型在后續(xù)推理階段偏離思路，從而減少推理時間。通過定義監(jiān)督微調(diào)模板，模型可以在推理時根據(jù)模板喚起微調(diào)知識，用戶可以從預(yù)先建立的響應(yīng)模板中提取答案。

text2sql一些研究涵蓋兩個基本任務(wù)：schema_linking和SQL生成。

Schema Linking: 主要目的是識別和提取與問題相關(guān)的表，并通過分步推理和鏈?zhǔn)剿季S方法在有限內(nèi)存下處理大規(guī)模數(shù)據(jù)庫。
SQL 生成: 主要目的是根據(jù)模式鏈接任務(wù)的結(jié)果生成準(zhǔn)確的SQL查詢語句，同時通過減少輸入表的數(shù)量來降低內(nèi)存消耗。

方法

低資源場景下Text2SQL方法-AI.x社區(qū)

LR-SQL方法框架

提出了LR-SQL方法，解決低資源場景下的Text2SQL任務(wù)，具體如下：

1.schema_link模型：首先，LR-SQL方法包含兩個監(jiān)督微調(diào)模型：schema_link模型和SQL生成模型。schema_link模型的主要作用是簡化整個流程，通過將完整的數(shù)據(jù)庫分解為靈活的表組合，使模型能夠從這些分散的切片中學(xué)習(xí)數(shù)據(jù)庫內(nèi)關(guān)系。

2.數(shù)據(jù)分解：在schema_link模型的微調(diào)過程中，LR-SQL將數(shù)據(jù)庫分解為多個切片，每個切片具有可調(diào)節(jié)的表數(shù)量。這種方法允許模型根據(jù)GPU內(nèi)存限制靈活地覆蓋不同數(shù)量的表。

低資源場景下Text2SQL方法-AI.x社區(qū)

LR-SQL的監(jiān)督模板構(gòu)建

低資源場景下Text2SQL方法-AI.x社區(qū)

低資源場景下Text2SQL方法-AI.x社區(qū)

將數(shù)據(jù)庫中的表分解成多個片段，每個片段包含一定數(shù)量的表和其列的描述。

3.思維鏈：為了增強模型在推理過程中感知各個離散切片之間關(guān)系的能力，LR-SQL訓(xùn)練了模型的鏈?zhǔn)剿季S能力。COT能力使模型能夠逐步引導(dǎo)自己生成最終結(jié)果。

低資源場景下Text2SQL方法-AI.x社區(qū)

LR-SQL訓(xùn)練

4.SQL生成模型：在schema_link模型微調(diào)完成后，預(yù)測的目標(biāo)表和問題被發(fā)送到SQL生成模型以生成最終的SQL查詢。該模型僅使用包含目標(biāo)表的少量表進(jìn)行微調(diào)，從而顯著減少了所需的內(nèi)存。

低資源場景下Text2SQL方法-AI.x社區(qū)

在推理階段，與訓(xùn)練相比，模型處理長文本所需的內(nèi)存需求大幅減少。

實驗

低資源場景下Text2SQL方法-AI.x社區(qū)

schema_link模型評估：LR-SQL方法在兩個數(shù)據(jù)集上的總準(zhǔn)確率分別為91.38和94.38，過濾準(zhǔn)確率分別為94.26和97.19，平均精度分別為95.50和96.91，平均召回率分別為95.76和97.85。與現(xiàn)有方法相比，LR-SQL在保持較高準(zhǔn)確率的同時，顯著減少了GPU內(nèi)存使用。

低資源場景下Text2SQL方法-AI.x社區(qū)

切片大小對性能的影響：實驗還探討了不同切片大小對模型性能和GPU內(nèi)存使用的影響。結(jié)果表明，當(dāng)切片大小適中時，模型的性能最佳。

參考文獻(xiàn)

LR-SQL: A Supervised Fine-Tuning Method for Text2SQL Tasks under Low-Resource Scenarios，https://arxiv.org/pdf/2410.11457

本文轉(zhuǎn)載自公眾號大模型自然語言處理作者：余俊暉

原文鏈接：??https://mp.weixin.qq.com/s/VZNcukQp5C_ngNei1iB2jg??

?著作權(quán)歸作者所有，如需轉(zhuǎn)載，請注明出處，否則將追究法律責(zé)任

標(biāo)簽

贊

收藏

回復(fù)

舉報

回復(fù)

相關(guān)推薦

不平衡場景下的多模態(tài)知識圖譜補全

mb5f8eba9bdb0af ? 2807瀏覽 ? 0回復(fù)
大模型與數(shù)據(jù)分析：探索Text-to-SQL

pangguiyu ? 7727瀏覽 ? 0回復(fù)
ECCV2024｜LightenDiffusion 超越現(xiàn)有無監(jiān)督方法，引領(lǐng)低光圖像增強新紀(jì)元！

angel ? 3811瀏覽 ? 0回復(fù)
馬斯克突發(fā)新版大模型，犧牲特斯拉資源叫板OpenAI，Grok-2一手實測來了

Crystalcxt ? 1808瀏覽 ? 0回復(fù)
高維多變量下的Transformer時序預(yù)測建模方法

海因斯DK ? 3175瀏覽 ? 0回復(fù)
一篇大模型NL2SQL全棧技術(shù)最新綜述

PaperAgent ? 5774瀏覽 ? 0回復(fù)
NL2SQL：基于LLM的解決方案是最好的嗎？

大語言模型論文跟蹤 ? 5179瀏覽 ? 0回復(fù)
Text2SQL 新一代解決方案Tool-SQL，基于LLM和Agent智能體實現(xiàn)，效果提升顯著

AI博物院 ? 4528瀏覽 ? 0回復(fù)
DB-GPT-Hub:text2sql的微調(diào)框架及基準(zhǔn)測試套件

大模型自然語言處理 ? 2292瀏覽 ? 0回復(fù)
阿里巴巴研究院推出 XiYan-SQL：用于Text-to-SQL的多生成器集成人工智能框架

Halo咯咯 ? 6090瀏覽 ? 0回復(fù)
淺看大模型用于Text2SQL的綜述

大模型自然語言處理 ? 2829瀏覽 ? 0回復(fù)
復(fù)旦大學(xué) METASQL：NL2SQL終于有候選排序了

AIGC前沿技術(shù)追蹤 ? 1877瀏覽 ? 0回復(fù)
Text2SQL 已過時？TAG 如何一統(tǒng) AI 與數(shù)據(jù)庫江湖！

AIGC前沿技術(shù)追蹤 ? 2899瀏覽 ? 0回復(fù)
GoRA: 基于梯度驅(qū)動的自適應(yīng)低秩微調(diào)方法

頓數(shù)AI ? 1847瀏覽 ? 0回復(fù)
從GraphRAG到PIKE-RAG，微軟發(fā)布復(fù)雜企業(yè)場景下的私域知識提取與推理新突破

AI博物院 ? 3178瀏覽 ? 0回復(fù)
算力租賃新趨勢揭秘：如何高效利用云計算資源賦能未來

AI算力補給站 ? 2036瀏覽 ? 0回復(fù)
小模型借 FEATHER-SQL，在 NL2SQL 領(lǐng)域掀翻天

AIGC前沿技術(shù)追蹤 ? 1121瀏覽 ? 0回復(fù)
NL2SQL新突破：SQL-R1用強化學(xué)習(xí)打破傳統(tǒng)局限

Halo咯咯 ? 671瀏覽 ? 0回復(fù)
技術(shù)前沿：CHASE-SQL與XiYan-SQL，解鎖自然語言與數(shù)據(jù)庫對話的奧秘！

Halo咯咯 ? 663瀏覽 ? 0回復(fù)

大模型自然語言處理

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

Kimi-VL開源多模態(tài)大模型結(jié)構(gòu)、訓(xùn)練方法、訓(xùn)練數(shù)據(jù)淺析 2025-04-16 07:08:19發(fā)布
十大PDF解析工具在不同文檔類別中的比較研究 2025-04-07 06:31:37發(fā)布

熱門推薦

大半精銳盡出！o1下線！滿血o3之后，模型本身就是Manus，最大賣點：替代人干真活！ 1回復(fù)

王炸！MCP 架構(gòu)設(shè)計深度剖析 & 使用 Spring AI + MCP 四步教你實現(xiàn) Agent 智能體開發(fā) 0回復(fù)

Dify從入門到高階系列二：手把手教學(xué)！超詳細(xì)的Dify知識庫配置全攻略 0回復(fù)

Crawl4AI：GitHub榜首40K星標(biāo)！LLM專屬極速開源爬蟲神器 0回復(fù)

只需5分鐘，教你用Python搭建MCP Server 0回復(fù)

上一篇： DB-GPT-Hub:text2sql的微調(diào)框架及基準(zhǔn)測試套件

下一篇： aiops第一名方案-EasyRAG：自動網(wǎng)絡(luò)運營的高效檢索增強生成框架

社區(qū)精華內(nèi)容

目錄