從RAG到RAG+:讓大模型更懂業(yè)務的權(quán)威指南
原文: Retrieval Augmented Generation (RAG) and Beyond: A Comprehensive Survey on How to Make your LLMs use External Data More Wisely
每當我向非技術(shù)背景的朋友解釋大語言模型時,我常常用"博學但缺乏實踐經(jīng)驗的應屆生"作比喻。這些模型確實掌握了海量的知識,但在特定領(lǐng)域的實際應用中,常常會暴露出"經(jīng)驗不足"的問題。就像一位剛畢業(yè)的法學生,雖然能流暢地背誦法條,但面對真實的案件時可能會覺得無從下手。
微軟亞洲研究院的研究團隊近期發(fā)布的這篇綜述,正是致力于解決這個"經(jīng)驗不足"的問題。這篇論文不僅系統(tǒng)地梳理了檢索增強生成(RAG)技術(shù)的發(fā)展脈絡,更重要的是提供了一個全新的視角,幫助我們理解和解決大模型在實際應用中遇到的各種挑戰(zhàn)。
為什么簡單的RAG還不夠用?
讓我們先看一個真實的場景。某金融機構(gòu)嘗試用ChatGPT來回答客戶的投資咨詢問題。為了確保答案的準確性,他們實施了一個基礎(chǔ)的RAG方案:把投資產(chǎn)品說明書、市場分析報告等文檔接入模型。但實際效果卻不盡如人意。
當客戶問"這個基金適合我嗎?"時,模型往往會直接從產(chǎn)品說明書中摘錄風險收益特征。但一個專業(yè)的投資顧問會怎么做?
他會先了解客戶的投資目標、風險承受能力、投資期限等信息,然后結(jié)合市場環(huán)境和產(chǎn)品特點給出建議。這種專業(yè)的咨詢過程涉及到復雜的推理和判斷,遠非簡單的文檔檢索所能支持。
理解四個層次的知識需求
論文首次系統(tǒng)地定義了RAG應用中的四個層次需求。這個分層框架源于對大量實際應用案例的觀察和總結(jié),讓我們通過具體例子來理解每個層次:
**第一層是顯式事實查詢。**比如"公司的退休金政策是什么?"這類問題只需要從員工手冊中找到相關(guān)段落即可。這是最基礎(chǔ)的RAG應用場景。
**第二層是隱式事實查詢,需要綜合多個信息源。**例如"我現(xiàn)在的工資和工齡,五年后能拿到多少退休金?"這就需要檢索并關(guān)聯(lián)多個政策條款,還要進行簡單的計算。
**第三層是可解釋推理查詢,要求理解和運用專業(yè)的決策流程。**以醫(yī)療診斷為例,醫(yī)生會遵循"望聞問切"的次序,逐步收集信息,形成診斷。模型需要理解并模仿這種專業(yè)的思維過程。
**第四層是隱性推理查詢,這可能是最接近人類專家直覺的層次。**比如經(jīng)驗豐富的醫(yī)生看到某些癥狀組合,就能聯(lián)想到可能的罕見病因,這種判斷往往基于大量病例經(jīng)驗,而非明確的診斷規(guī)則。
走向更智能的RAG解決方案
理解了不同層次的需求,我們就能更有針對性地設(shè)計解決方案。
對于第一層的顯式事實查詢,傳統(tǒng)的RAG方案其實已經(jīng)夠用,但在工程實現(xiàn)上還有優(yōu)化空間。比如文檔切分的策略就很關(guān)鍵。如果切分得太細,可能會丟失上下文信息;切分得太粗,又會引入無關(guān)信息。一個實用的做法是根據(jù)文檔的邏輯結(jié)構(gòu)來切分,比如保持完整的段落或章節(jié),而不是機械地按字數(shù)切分。
對于第二層的隱式事實查詢,核心挑戰(zhàn)是如何讓模型"主動"獲取必要信息。迭代式RAG是一個有效的解決方案:模型先基于初始問題檢索一部分信息,發(fā)現(xiàn)信息不足時,自動形成新的檢索請求,直到收集足夠的信息才給出最終答案。
在處理第三層的可解釋推理查詢時,"提示調(diào)優(yōu)"顯示出獨特優(yōu)勢。以醫(yī)療問診為例,我們可以設(shè)計這樣的提示模板:
1. 請先詳細了解患者的主訴和癥狀;
2. 根據(jù)癥狀有針對性地詢問病史;
3. 建議必要的檢查;
4. 結(jié)合所有信息作出初步診斷;
5. 制定治療方案。
這種結(jié)構(gòu)化的提示能有效引導模型遵循專業(yè)的診療規(guī)范。
第四層的隱性推理查詢最具挑戰(zhàn)性,因為我們要讓模型學習專家的"直覺"。一個可行的方案是構(gòu)建特定領(lǐng)域的案例庫,并通過精心設(shè)計的標注來捕捉專家的判斷依據(jù)。
比如在醫(yī)療領(lǐng)域,除了記錄最終診斷,還要讓專家解釋為什么會想到這個診斷,看到了哪些關(guān)鍵線索。這些解釋可以幫助模型學習專家的思維模式。
總結(jié)
這篇綜述不僅梳理了當前RAG技術(shù)的現(xiàn)狀,也為未來發(fā)展指明了方向。一個明顯的趨勢是,RAG正在從單純的知識檢索,向知識的結(jié)構(gòu)化表達和專業(yè)化推理演進。
未來的RAG系統(tǒng)可能會更像一個"數(shù)字學徒",不斷從與人類專家的互動中學習和改進。它不僅要會查資料,還要學會專家思考問題的方式。
本文轉(zhuǎn)載自 ??芝士AI吃魚??,作者: 芝士AI吃魚
