自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<pre id="n1c1x"></pre>

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開(kāi)發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問(wèn)答課堂專欄直播

51CTO

鴻蒙開(kāi)發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開(kāi)發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開(kāi)發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

AI.x社區(qū)

登錄/注冊(cè)
51CTO

中國(guó)優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺(tái)

51CTO學(xué)堂

IT職業(yè)在線教育平臺(tái)

提升RAG性能的全攻略：優(yōu)化檢索增強(qiáng)生成系統(tǒng)的策略大揭秘原創(chuàng) 精華

發(fā)布于 2024-11-25 09:07

瀏覽

0收藏

01、概述

近年來(lái)，隨著檢索增強(qiáng)生成（Retrieval Augmented Generation，RAG）應(yīng)用的快速普及，其性能優(yōu)化成為開(kāi)發(fā)者們關(guān)注的熱點(diǎn)。盡管基礎(chǔ)RAG管道設(shè)計(jì)較為簡(jiǎn)單，但要滿足實(shí)際業(yè)務(wù)需求，往往需要更高級(jí)的優(yōu)化策略。本文將全面解讀RAG優(yōu)化的各類方法，幫助大家快速掌握主流策略并在實(shí)踐中應(yīng)用。

02、RAG管道基礎(chǔ)：從零開(kāi)始理解工作原理

一個(gè)標(biāo)準(zhǔn)的RAG管道一般包含以下幾個(gè)基本步驟：

文檔加載與分塊：將文檔內(nèi)容拆分為多個(gè)小塊（chunk），并將這些塊存儲(chǔ)到向量數(shù)據(jù)庫(kù)（如Milvus或Zilliz Cloud）。
檢索相關(guān)內(nèi)容：根據(jù)查詢，向量數(shù)據(jù)庫(kù)找到與查詢最相關(guān)的Top-K文檔塊。
注入上下文：將檢索到的文檔塊作為上下文注入大語(yǔ)言模型（LLM）的提示中。
生成回答：LLM結(jié)合上下文生成最終的答案。

提升RAG性能的全攻略：優(yōu)化檢索增強(qiáng)生成系統(tǒng)的策略大揭秘-AI.x社區(qū)

這種直觀的流程雖然高效，但在復(fù)雜場(chǎng)景中可能出現(xiàn)性能瓶頸，比如信息丟失或回答不準(zhǔn)確。因此，針對(duì)RAG各環(huán)節(jié)的優(yōu)化策略便應(yīng)運(yùn)而生。

03、RAG優(yōu)化策略分類：全面覆蓋五大方向

可以將RAG優(yōu)化策略劃分為以下五大類：

查詢優(yōu)化（Query Enhancement）：通過(guò)修改用戶查詢表達(dá)方式，使意圖更清晰，提升查詢準(zhǔn)確性。
索引優(yōu)化（Indexing Enhancement）：通過(guò)改進(jìn)索引方式，增強(qiáng)文檔塊的檢索效率。
檢索器優(yōu)化（Retriever Enhancement）：提升檢索階段的準(zhǔn)確性與上下文覆蓋范圍。
生成器優(yōu)化（Generator Enhancement）：改善提示設(shè)計(jì)，確保生成更優(yōu)質(zhì)的答案。
管道優(yōu)化（Pipeline Enhancement）：優(yōu)化整體RAG管道流程，動(dòng)態(tài)調(diào)整系統(tǒng)執(zhí)行方式。

接下來(lái)，我們將逐一探討每一類優(yōu)化方法及其應(yīng)用場(chǎng)景。

一、查詢優(yōu)化：為系統(tǒng)注入“清晰思路”

在RAG系統(tǒng)中，查詢的準(zhǔn)確性至關(guān)重要。以下幾種方法能夠幫助優(yōu)化查詢階段：

1. 假設(shè)性問(wèn)題生成（Hypothetical Questions）

通過(guò)大語(yǔ)言模型（LLM）生成一組假設(shè)性問(wèn)題，模擬用戶可能的提問(wèn)方式。

流程：先根據(jù)文檔塊生成假設(shè)性問(wèn)題，將其存儲(chǔ)于向量數(shù)據(jù)庫(kù)中。當(dāng)用戶提交實(shí)際查詢時(shí)，系統(tǒng)先檢索假設(shè)性問(wèn)題，再返回相關(guān)文檔塊供LLM生成答案。
優(yōu)點(diǎn)：緩解跨領(lǐng)域查詢的對(duì)稱性問(wèn)題，提高檢索精度。
缺點(diǎn)：生成假設(shè)性問(wèn)題可能增加計(jì)算開(kāi)銷，且存在不確定性。

提升RAG性能的全攻略：優(yōu)化檢索增強(qiáng)生成系統(tǒng)的策略大揭秘-AI.x社區(qū)

2. 假設(shè)性文檔嵌入（HyDE）

HyDE方法會(huì)根據(jù)用戶查詢生成一個(gè)“假設(shè)性回答”，將其轉(zhuǎn)化為向量嵌入后用于檢索文檔塊。

優(yōu)勢(shì)：類似于假設(shè)性問(wèn)題生成，但通過(guò)直接生成答案有效處理復(fù)雜查詢。
不足：生成“假設(shè)性回答”需要額外的計(jì)算資源。

提升RAG性能的全攻略：優(yōu)化檢索增強(qiáng)生成系統(tǒng)的策略大揭秘-AI.x社區(qū)

3. 子查詢拆分（Sub-Queries）

對(duì)于復(fù)雜查詢，可以先將其拆分為多個(gè)子查詢，分別檢索并合并答案。例如：

原始查詢：Milvus和Zilliz Cloud的功能有什么不同？
拆分后：

子查詢1：Milvus的功能有哪些？
子查詢2：Zilliz Cloud的功能有哪些？

通過(guò)簡(jiǎn)化復(fù)雜查詢，系統(tǒng)可以更準(zhǔn)確地檢索相關(guān)內(nèi)容。

提升RAG性能的全攻略：優(yōu)化檢索增強(qiáng)生成系統(tǒng)的策略大揭秘-AI.x社區(qū)

4. 退一步提問(wèn)（Stepback Prompts）

將復(fù)雜的查詢轉(zhuǎn)化為“退一步”問(wèn)題。例如：

用戶問(wèn)題：Milvus是否可以存儲(chǔ)10億條記錄的數(shù)據(jù)集？
退一步問(wèn)題：Milvus能處理的數(shù)據(jù)集規(guī)模上限是多少？

這種方法能夠簡(jiǎn)化原始問(wèn)題，使檢索更具針對(duì)性。

提升RAG性能的全攻略：優(yōu)化檢索增強(qiáng)生成系統(tǒng)的策略大揭秘-AI.x社區(qū)

二、索引優(yōu)化：打造高效的文檔檢索方式

索引階段的優(yōu)化方法可以幫助系統(tǒng)更快速、更精準(zhǔn)地定位相關(guān)文檔塊。

1. 自動(dòng)合并文檔塊

在索引過(guò)程中，建立“父子層級(jí)”：

初始檢索時(shí)聚焦細(xì)粒度子文檔塊。
如果多個(gè)子塊來(lái)自同一父文檔，則將父文檔提供給LLM作為上下文。

此方法已在LlamaIndex中實(shí)現(xiàn)，對(duì)提升檢索覆蓋率非常有效。

提升RAG性能的全攻略：優(yōu)化檢索增強(qiáng)生成系統(tǒng)的策略大揭秘-AI.x社區(qū)

2. 構(gòu)建分層索引

采用兩級(jí)索引結(jié)構(gòu)：

第一級(jí)存儲(chǔ)文檔摘要，用于快速篩選相關(guān)文檔。
第二級(jí)存儲(chǔ)文檔塊，僅檢索篩選出的相關(guān)文檔內(nèi)的內(nèi)容。

這種方式在處理大規(guī)模數(shù)據(jù)或分層結(jié)構(gòu)數(shù)據(jù)（如圖書(shū)館藏）時(shí)尤為適用。

提升RAG性能的全攻略：優(yōu)化檢索增強(qiáng)生成系統(tǒng)的策略大揭秘-AI.x社區(qū)

3. 混合檢索與重排序（Hybrid Retrieval & Reranking）

結(jié)合詞頻算法（如BM25）或稀疏嵌入方法（如Splade）與向量檢索。檢索完成后，通過(guò)重排序算法（如Cross-Encoder）對(duì)結(jié)果進(jìn)行相關(guān)性排序。

優(yōu)點(diǎn)：提升了檢索覆蓋率，減少向量召回不足的問(wèn)題。

提升RAG性能的全攻略：優(yōu)化檢索增強(qiáng)生成系統(tǒng)的策略大揭秘-AI.x社區(qū)

三、檢索器優(yōu)化：讓信息“更近一步”

1. 句子窗口檢索（Sentence Window Retrieval）

提升RAG性能的全攻略：優(yōu)化檢索增強(qiáng)生成系統(tǒng)的策略大揭秘-AI.x社區(qū)

在向量數(shù)據(jù)庫(kù)中檢索細(xì)粒度文檔塊，但將更大范圍的上下文信息提供給LLM，以減少信息遺漏。

注意：窗口大小需要根據(jù)業(yè)務(wù)需求動(dòng)態(tài)調(diào)整，避免過(guò)多無(wú)關(guān)信息干擾。

2. 元數(shù)據(jù)篩選（Meta-data Filtering）

通過(guò)時(shí)間、類別等元數(shù)據(jù)過(guò)濾檢索結(jié)果。例如，對(duì)于財(cái)報(bào)查詢，僅保留用戶指定年份的相關(guān)文檔。此方法在數(shù)據(jù)量龐大且元數(shù)據(jù)豐富的場(chǎng)景中非常有效。

提升RAG性能的全攻略：優(yōu)化檢索增強(qiáng)生成系統(tǒng)的策略大揭秘-AI.x社區(qū)

四、生成器優(yōu)化：從提示設(shè)計(jì)到內(nèi)容生成

1. 壓縮提示信息

提升RAG性能的全攻略：優(yōu)化檢索增強(qiáng)生成系統(tǒng)的策略大揭秘-AI.x社區(qū)

對(duì)檢索到的文檔塊進(jìn)行信息壓縮，減少無(wú)關(guān)細(xì)節(jié)并強(qiáng)調(diào)重點(diǎn)。

優(yōu)點(diǎn)：優(yōu)化有限提示窗口內(nèi)的信息利用率，提高生成答案的準(zhǔn)確性。

2. 調(diào)整提示塊順序

提升RAG性能的全攻略：優(yōu)化檢索增強(qiáng)生成系統(tǒng)的策略大揭秘-AI.x社區(qū)

研究發(fā)現(xiàn)，LLM更傾向于使用提示開(kāi)頭和結(jié)尾的信息。因此，可以將高置信度文檔塊放置在提示的首尾，以提升回答質(zhì)量。

五、管道優(yōu)化：全面提升RAG系統(tǒng)效率

1. 自我反思（Self-reflection）

對(duì)于模糊或不確定的文檔塊，系統(tǒng)可進(jìn)行“二次反思”，利用自然語(yǔ)言推理（NLI）或額外工具進(jìn)行驗(yàn)證，從而確?；卮鸬臏?zhǔn)確性。

提升RAG性能的全攻略：優(yōu)化檢索增強(qiáng)生成系統(tǒng)的策略大揭秘-AI.x社區(qū)

2. 查詢路由（Query Routing）

設(shè)計(jì)一個(gè)路由代理，判斷查詢是否需要經(jīng)過(guò)RAG管道。簡(jiǎn)單問(wèn)題可直接由LLM回答，復(fù)雜問(wèn)題則進(jìn)入RAG系統(tǒng)處理。

優(yōu)勢(shì)：提升響應(yīng)速度，避免不必要的管道資源消耗。

提升RAG性能的全攻略：優(yōu)化檢索增強(qiáng)生成系統(tǒng)的策略大揭秘-AI.x社區(qū)

03、總結(jié)：實(shí)現(xiàn)RAG應(yīng)用的性能飛躍

盡管標(biāo)準(zhǔn)RAG管道設(shè)計(jì)較為簡(jiǎn)潔，但為了達(dá)到實(shí)際業(yè)務(wù)的性能要求，采用多種優(yōu)化策略是必要的。本文從查詢優(yōu)化、索引優(yōu)化、檢索器優(yōu)化、生成器優(yōu)化及管道優(yōu)化五大方向，詳細(xì)解析了多種方法及其實(shí)際應(yīng)用場(chǎng)景。

在實(shí)際應(yīng)用中，開(kāi)發(fā)者可以根據(jù)需求靈活組合這些策略，為RAG系統(tǒng)注入更多智慧，推動(dòng)其在多領(lǐng)域的廣泛應(yīng)用。希望本文的總結(jié)能幫助大家快速掌握RAG優(yōu)化技巧，為您的AI項(xiàng)目提供新思路！

參考：

??https://docs.llamaindex.ai/en/stable/examples/retrievers/recursive_retriever_nodes/??
??https://arxiv.org/abs/2307.03172??

本文轉(zhuǎn)載自公眾號(hào)Halo咯咯作者：基咯咯

原文鏈接：??https://mp.weixin.qq.com/s/touyEJAkGpMUAL5x9oGvvg??

?著作權(quán)歸作者所有，如需轉(zhuǎn)載，請(qǐng)注明出處，否則將追究法律責(zé)任

標(biāo)簽

已于2024-11-25 09:32:00修改

贊

收藏

回復(fù)

舉報(bào)

回復(fù)

相關(guān)推薦

通過(guò)檢索增強(qiáng)生成(RAG) 增強(qiáng)LLM的實(shí)戰(zhàn)演練

51CTO內(nèi)容精選 ? 3232瀏覽 ? 0回復(fù)
提升RAG系統(tǒng)性能10條策略建議

AIGC觀察者 ? 2520瀏覽 ? 0回復(fù)
GraphRAG + Ollama 本地部署全攻略：避坑實(shí)戰(zhàn)指南

玄姐聊AGI ? 9646瀏覽 ? 0回復(fù)
Easy-RAG 一個(gè)適合學(xué)習(xí)、使用、自主擴(kuò)展的檢索增強(qiáng)生成系統(tǒng)

AIGC觀察者 ? 3323瀏覽 ? 0回復(fù)
15種先進(jìn)的檢索增強(qiáng)生成（RAG）技術(shù)

玄姐聊AGI ? 2425瀏覽 ? 0回復(fù)
RAG高級(jí)優(yōu)化：基于問(wèn)題生成的文檔檢索增強(qiáng)

恰似驚鴻 ? 2723瀏覽 ? 0回復(fù)
15種先進(jìn)的檢索增強(qiáng)生成（RAG）技術(shù)

Halo咯咯 ? 1856瀏覽 ? 0回復(fù)
再談大模型檢索增強(qiáng)生成——RAG

AI探索時(shí)代 ? 1845瀏覽 ? 0回復(fù)
RAG 應(yīng)用效果不太理想？試試以下RAG優(yōu)化策略大幅提升問(wèn)答效果

AI博物院 ? 7296瀏覽 ? 0回復(fù)
LightRAG：提升檢索增強(qiáng)生成的效率與準(zhǔn)確性

Halo咯咯 ? 3542瀏覽 ? 0回復(fù)
RAG檢索增強(qiáng)生成和大模型微調(diào)的抉擇

AI探索時(shí)代 ? 1979瀏覽 ? 0回復(fù)
九種不同類型的檢索增強(qiáng)生成 (RAG)

Halo咯咯 ? 2388瀏覽 ? 0回復(fù)
DeepSeek R1與Qwen大模型，構(gòu)建Agentic RAG全攻略

小虎哦哦 ? 4410瀏覽 ? 0回復(fù)
繞過(guò) RAG 實(shí)時(shí)檢索瓶頸，緩存增強(qiáng)生成（CAG）如何助力性能突破？

Baihai_IDP ? 1691瀏覽 ? 0回復(fù)
什么是檢索增強(qiáng)生成 (RAG)？

Halo咯咯 ? 1614瀏覽 ? 0回復(fù)
AI 代理開(kāi)發(fā)全攻略：從構(gòu)思到落地的實(shí)戰(zhàn)指南

Halo咯咯 ? 1271瀏覽 ? 0回復(fù)
MCP Server 實(shí)戰(zhàn)全攻略，原來(lái)這么簡(jiǎn)單

玄姐聊AGI ? 4787瀏覽 ? 0回復(fù)
AI 大模型應(yīng)用開(kāi)發(fā)全攻略

玄姐聊AGI ? 1274瀏覽 ? 0回復(fù)
生成式AI時(shí)代下的數(shù)據(jù)、模型與用戶保護(hù)全攻略

51CTO內(nèi)容精選 ? 669瀏覽 ? 0回復(fù)

這個(gè)用戶很懶，還沒(méi)有個(gè)人簡(jiǎn)介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

數(shù)學(xué)推理的 AI 新突破：NVIDIA 的 OpenMath-Nemotron 系列震撼登場(chǎng)！ 6h前發(fā)布
從簡(jiǎn)單計(jì)數(shù)到多模態(tài)：嵌入技術(shù)的演變與應(yīng)用 6h前發(fā)布

熱門(mén)推薦

2025年最值得關(guān)注的十大多模態(tài)大語(yǔ)言模型！ 0回復(fù)

GPT-4.1系列深度解析：從代碼到動(dòng)畫(huà)，從理論到實(shí)戰(zhàn)，AI的多面手來(lái)了！ 0回復(fù)

清華發(fā)布GLM 4！32B參數(shù)模型硬剛GPT-4o，性能驚艷 0回復(fù)

Google介紹了Agent2Agent（A2A）：一種新的開(kāi)放協(xié)議，允許AI代理在生態(tài)系統(tǒng)中安全地合作 0回復(fù)

大半精銳盡出！o1下線！滿血o3之后，模型本身就是Manus，最大賣(mài)點(diǎn)：替代人干真活！ 1回復(fù)

上一篇： LLaVA-o1：第一個(gè)能夠進(jìn)行自發(fā)、系統(tǒng)推理的視覺(jué)語(yǔ)言模型，類似于 GPT-o1

下一篇： ChatGPT Search：AI搜索引擎如何挑戰(zhàn)Google霸主地位？

社區(qū)精華內(nèi)容

目錄

<style id="wygeb"></style>