自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

淺看大模型用于Text2SQL的綜述 原創(chuàng)

發(fā)布于 2024-12-5 14:34
瀏覽
0收藏

前言

我們來看看大模型在text2sql上的一篇綜述,大模型的發(fā)展,出現(xiàn)了一系列新方法,主要集中在提示工程(prompt engineering)和微調(fine-tuning)上。這篇綜述提供了LLMs在Text-to-SQL任務中的全面概述,討論了基準數(shù)據(jù)集、提示工程、微調方法和未來的研究方向。

Text2SQL

淺看大模型用于Text2SQL的綜述-AI.x社區(qū)

利用大型語言模型(LLMs)解決文本到SQL任務的方法,主要包括提示工程和微調兩大類。

1.提示工程

淺看大模型用于Text2SQL的綜述-AI.x社區(qū)

淺看大模型用于Text2SQL的綜述-AI.x社區(qū)

提示工程通過設計結構化的提示,使LLMs能夠理解任務需求并生成相應的SQL查詢。提示工程分為三個階段:預處理、推理和后處理。

  • 預處理:包括問題描述和數(shù)據(jù)庫模式的格式化和布局,以及引入額外的SQL知識或外部知識。問題描述可以采用Openai模板或"Create Table"布局,樣本數(shù)據(jù)可以幫助LLM更好地理解數(shù)據(jù)庫內容。


淺看大模型用于Text2SQL的綜述-AI.x社區(qū)


淺看大模型用于Text2SQL的綜述-AI.x社區(qū)


    • 推理:在接收到用戶問題和數(shù)據(jù)庫模式后,生成相應的SQL查詢。推理過程可以設計特定的工作流,如Chain-of-Thought和Least-to-Most方法,也可以使用Demonstrations來增強SQL生成能力。
    • 后處理:對生成的SQL進行優(yōu)化,提高其性能和穩(wěn)定性。常見的后處理方法包括自校正(Self-Correction)和一致性方法(Self-Consistency和Cross-Consistency)。

    2.微調

    淺看大模型用于Text2SQL的綜述-AI.x社區(qū)

    微調通過在特定任務數(shù)據(jù)上訓練LLMs來提升其性能。微調過程包括數(shù)據(jù)準備、預訓練模型選擇、模型微調和模型評估。

    • 數(shù)據(jù):可以通過整合現(xiàn)有數(shù)據(jù)集或構建新數(shù)據(jù)集來獲取訓練數(shù)據(jù)。新數(shù)據(jù)集可以通過半自動或全自動的方法生成。
    • 預訓練模型選擇:選擇適合的預訓練模型進行微調,考慮模型參數(shù)規(guī)模、預訓練語料庫和計算能力等因素。
    • 模型微調:采用全量微調和參數(shù)高效微調等方法。參數(shù)高效微調通過僅微調少量模型參數(shù)來提高訓練效率。
    • 模型評估:通過綜合指標分析、分類分析和基于LLM的分析評估來衡量模型性能。常用的評估指標包括精確集匹配準確率(EM)、執(zhí)行準確率(EX)、測試集準確率(TS)和有效效率得分(VES)。

    參考文獻

    A Survey on Employing Large Language Models for Text-to-SQL Tasks,https://arxiv.org/pdf/2407.15186v3


    本文轉載自公眾號大模型自然語言處理  作者:余俊暉

    原文鏈接:??https://mp.weixin.qq.com/s/UxDDIF63j8R2yozJ8XtDQw??

    ?著作權歸作者所有,如需轉載,請注明出處,否則將追究法律責任
    已于2024-12-6 09:54:51修改
    收藏
    回復
    舉報
    回復
    相關推薦