自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<s id="2wyyw"><nav id="2wyyw"></nav></s>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓

鴻蒙開發(fā)者社區(qū)

WOT技術大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術網(wǎng)站

51CTO博客

專業(yè)IT技術創(chuàng)作平臺

51CTO學堂

IT職業(yè)在線教育平臺

大模型面經(jīng)—RAG工程實踐經(jīng)驗總結(jié) 原創(chuàng)

發(fā)布于 2024-10-24 13:29

瀏覽

0收藏

?RAG工程經(jīng)驗面經(jīng)總結(jié)。

雖然RAG工程整體有很多論文、算法和方法論，但在實際使用過程中，當數(shù)據(jù)量大了RAG很容易出現(xiàn)不可控的問題，本篇就針對實踐過程中遇到的問題總結(jié)面經(jīng)進行分享，看看能不能給大家提供一些幫助。下面是一個快捷目錄。

一. RAG如何去優(yōu)化索引結(jié)構(gòu)？

二. 當混合檢索以及基于不同大小的chunk去檢索效果都不太好的時候，如何優(yōu)化？

三. 如何通過rerank去提升RAG效果的，有哪些方案？

下面是答案。

一. RAG如何去優(yōu)化索引結(jié)構(gòu)？

1. 優(yōu)化被檢索的embedding

1）微調(diào)被檢索的embedding

目的：讓被檢索的內(nèi)容與query之間的相關性更加緊密

特別是術語更新較快且比較罕見的領域，可以針對性地進行微調(diào)。

2）動態(tài)embedding

目的：基于上下文動態(tài)調(diào)整embedding

當然這只是個發(fā)論文的思路，工程落地的時候這塊還是有待驗證的。

3）檢索后處理流程優(yōu)化

目的：直接把所有檢索結(jié)果給大模型可能會超出上下文窗口限制，內(nèi)容過多噪聲也可能比較多。

優(yōu)化方法：

ReRank
Prompt 壓縮
RAG 管道優(yōu)化
混合搜索
遞歸檢索與查詢引擎
StepBack-prompt 方法
子查詢
HyDE 方法

2. 優(yōu)化query的chunk大小

chunk大小非常關鍵，決定了從向量存儲中檢索的文檔的長度。小塊可能導致文檔缺失一些關鍵信息，而大塊可能引入無關的噪音。找到最佳塊大小是要找到正確的平衡。

目前來說一般是按不同塊大小劃分驗證集做實驗，直接用驗證集效果說話。

3. 結(jié)合不同粒度信息進行混合檢索

雖然向量搜索有助于檢索與給定查詢相關的語義相關塊，但有時在匹配特定關鍵詞方面缺乏精度。根據(jù)用例，有時可能需要精確匹配。

混合檢索就是結(jié)合embedding搜索和關鍵詞搜索。

二. 當混合檢索以及基于不同大小的chunk去檢索效果都不太好的時候，如何優(yōu)化？

這種情況就要針對具體的case關注知識庫里是否有答案了。

如果有答案但是沒檢索出來，那么大概率可能答案被錯誤分割開了，那么可以結(jié)合一些小模型（BERT等）拿來做上下句預測；

另外也可以分析 query 和 doc 的特點：字相關還是語義相關，一般建議是先用推薦系統(tǒng)經(jīng)典的ES做召回，然后才用模型做精排

三. 如何通過rerank去提升RAG效果的，有哪些方案？

背景：當檢索時，前K個結(jié)果不一定按最相關的方式排序。它們都是相關的，但在這些相關內(nèi)容中，最相關的可能并不是第1或第2個，而是排名靠后的。rerank就是將最相關的信息重新定位到排名靠后的檢索結(jié)果。

這里推薦一些思路：

Diversity Ranker 根據(jù)文檔的多樣性進行重新排序；

LostInTheMiddleRanker 中提出LLM 會著重把注意力放在文本開頭和結(jié)尾的位置，那就把最需要讓 LLM 關注的 documents 放在開頭和結(jié)尾的位置。

另外還有一些經(jīng)典的框架LlamaIndex、LangChain 和 HayStack都可以參考和直接用。

其實主要的思路都大同小異，實際工作中還是主要會結(jié)合具體的case來優(yōu)化，大家有更多的問題和經(jīng)驗也可以一起分享討論。

參考文獻

[1] Retrieval-Augmented Generation for Large Language Models: A Survey(arxiv.org/pdf/2312.10997)

[2] 論文分享|RAG理論-第一篇-概述 - 知乎(https://zhuanlan.zhihu.com/p/678616587)

[3] 提升RAG性能的關鍵技術：從數(shù)據(jù)清理到混合檢索的全方位討論 - 知乎(https://zhuanlan.zhihu.com/p/676463769)

?

文轉(zhuǎn)載自公眾號瓦力算法學研所，作者：喜歡瓦力的卷卷

原文鏈接：??https://mp.weixin.qq.com/s/xcGvL2WhgV2tKT3JdiF6GA???

?著作權(quán)歸作者所有，如需轉(zhuǎn)載，請注明出處，否則將追究法律責任

標簽

贊

收藏

回復

舉報

回復

相關推薦

生成式AI大模型之提示詞工程實踐

數(shù)字化助推器 ? 3079瀏覽 ? 0回復
AIGC 和低代碼結(jié)合應用全棧研發(fā)實踐總結(jié)

卓勝微wjp ? 3481瀏覽 ? 0回復
解構(gòu)復合人工智能系統(tǒng)（Compound AI Systems）：關鍵術語、理論、思路、實踐經(jīng)驗

Baihai_IDP ? 3563瀏覽 ? 0回復
實踐出真知：Agents 領域“一年打怪升級”的經(jīng)驗分享

Baihai_IDP ? 3289瀏覽 ? 0回復
RAG工程如何評測？

shizhi02 ? 2507瀏覽 ? 0回復
大模型面經(jīng)——以醫(yī)療領域為例，整理RAG基礎與實際應用中的痛點

shizhi02 ? 2619瀏覽 ? 0回復
大模型面經(jīng)——LoRA最全總結(jié)

shizhi02 ? 2434瀏覽 ? 0回復
大模型面經(jīng)——Langchain總結(jié)

shizhi02 ? 2004瀏覽 ? 0回復
大模型面經(jīng)——MoE混合專家模型總結(jié)

shizhi02 ? 2430瀏覽 ? 0回復
大模型面經(jīng)—分布式訓練指南

shizhi02 ? 1934瀏覽 ? 0回復
大模型面經(jīng)—如何評估顯卡利用率及顯卡運用優(yōu)化方法

shizhi02 ? 2466瀏覽 ? 0回復
【多模態(tài)&RAG】多模態(tài)RAG ColPali實踐

大模型自然語言處理 ? 2005瀏覽 ? 0回復
關于學習大模型技術的方法論——個人經(jīng)驗漫談

AI探索時代 ? 1679瀏覽 ? 0回復
RAG范式演進及Agentic-RAG總結(jié)綜述

大模型自然語言處理 ? 2806瀏覽 ? 0回復
大模型面經(jīng)：SFT和RL如何影響模型的泛化或記憶能力？

shizhi02 ? 1890瀏覽 ? 0回復
大模型面經(jīng)：目前不同階段的scaling law之間的區(qū)別和聯(lián)系是什么？

shizhi02 ? 2209瀏覽 ? 0回復
【模型測試】大模型評測工具OpenCompass使用方法總結(jié)

一起AI技術 ? 2085瀏覽 ? 0回復
大模型面經(jīng)：RAG與Long context“相愛相殺”背景下，如何設計最優(yōu)解決方案？

shizhi02 ? 1099瀏覽 ? 0回復
12張圖清晰總結(jié) MCP、RAG、Agent 架構(gòu)設計間的關系

玄姐聊AGI ? 1526瀏覽 ? 0回復

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關注

最近發(fā)布

大模型面經(jīng)：RAG與Long context“相愛相殺”背景下，如何設計最優(yōu)解決方案？ 2025-04-09 12:17:30發(fā)布
ZeroHSI-一種零樣本的四維人類-場景交互合成方法 2025-03-24 13:12:04發(fā)布

熱門推薦

大半精銳盡出！o1下線！滿血o3之后，模型本身就是Manus，最大賣點：替代人干真活！ 1回復

王炸！MCP 架構(gòu)設計深度剖析 & 使用 Spring AI + MCP 四步教你實現(xiàn) Agent 智能體開發(fā) 0回復

Dify從入門到高階系列二：手把手教學！超詳細的Dify知識庫配置全攻略 0回復

Crawl4AI：GitHub榜首40K星標！LLM專屬極速開源爬蟲神器 0回復

只需5分鐘，教你用Python搭建MCP Server 0回復

上一篇： Ultralytics新作-YOLOv11

下一篇：大模型思維鏈升級之DoT框架

社區(qū)精華內(nèi)容

目錄

<legend id="r14rg"><abbr id="r14rg"></abbr></legend>

<cite id="r14rg"><track id="r14rg"></track></cite>