自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開(kāi)發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問(wèn)答課堂專欄直播

51CTO

鴻蒙開(kāi)發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開(kāi)發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開(kāi)發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

AI.x社區(qū)

登錄/注冊(cè)
51CTO

中國(guó)優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺(tái)

51CTO學(xué)堂

IT職業(yè)在線教育平臺(tái)

DyPRAG：即插即用動(dòng)態(tài)將上下文轉(zhuǎn)化為參數(shù)知識(shí)，有效緩解RAG幻覺(jué) 原創(chuàng)

大模型自然語(yǔ)言處理

發(fā)布于 2025-4-3 07:34

瀏覽

0收藏

來(lái)自fans投稿，提出動(dòng)態(tài)參數(shù)化RAG，即插即用無(wú)縫和RAG結(jié)合，減少RAG幻覺(jué)的發(fā)生，來(lái)看看具體思路。

檢索增強(qiáng)生成（RAG）通過(guò)從外部源檢索相關(guān)文檔并將其合并到上下文中來(lái)增強(qiáng)大語(yǔ)言模型（LLMs）。雖然它通過(guò)提供事實(shí)文本提高了可靠性，但隨著上下文長(zhǎng)度的增長(zhǎng)，顯著增加了推理成本，并引入了具有挑戰(zhàn)性的RAG幻覺(jué)問(wèn)題，這主要是由于LLM中缺乏相應(yīng)的參數(shù)知識(shí)造成的。

參數(shù)化RAG （PRAG）通過(guò)離線訓(xùn)練將文檔嵌入大模型參數(shù)有效地降低推理成本。然而其高昂的訓(xùn)練和存儲(chǔ)成本以及有限的泛化能力，極大地限制了其實(shí)際應(yīng)用。

我們提出動(dòng)態(tài)參數(shù)化RAG，在推理時(shí)將文檔知識(shí)動(dòng)態(tài)轉(zhuǎn)化為模型參數(shù)知識(shí)，能有效補(bǔ)充相應(yīng)知識(shí)。并且能即插即用無(wú)縫和RAG結(jié)合，提升模型知識(shí)內(nèi)化水平同時(shí)減少RAG幻覺(jué)的發(fā)生。

DyPRAG：即插即用動(dòng)態(tài)將上下文轉(zhuǎn)化為參數(shù)知識(shí)，有效緩解RAG幻覺(jué)-AI.x社區(qū)

論文：Better wit than wealth: Dynamic Parametric Retrieval Augmented Generation for Test-time Knowledge Enhancement
鏈接：https://arxiv.org/pdf/2503.23895
項(xiàng)目：https://github.com/Trae1ounG/DyPRAG

方法

檢索增強(qiáng)生成（RAG）

DyPRAG：即插即用動(dòng)態(tài)將上下文轉(zhuǎn)化為參數(shù)知識(shí)，有效緩解RAG幻覺(jué)-AI.x社區(qū)

參數(shù)化RAG（PRAG）

DyPRAG：即插即用動(dòng)態(tài)將上下文轉(zhuǎn)化為參數(shù)知識(shí)，有效緩解RAG幻覺(jué)-AI.x社區(qū)

然而，PRAG的訓(xùn)練成本較高，且難以適應(yīng)新文檔。因此，我們提出動(dòng)態(tài)參數(shù)化RAG（DyPRAG），實(shí)現(xiàn)更高效的參數(shù)注入。

動(dòng)態(tài)參數(shù)化RAG（DyPRAG）

DyPRAG的核心思路在于訓(xùn)練一個(gè)輕量的參數(shù)轉(zhuǎn)換器來(lái)建模從文檔->參數(shù)的潛在映射，僅需要少量的訓(xùn)練數(shù)據(jù)就能有效學(xué)習(xí)到泛化性極強(qiáng)的轉(zhuǎn)換器，在推理時(shí)幾乎不會(huì)引入額外的計(jì)算開(kāi)銷且能提升模型性能，最少只需要2MB存儲(chǔ)開(kāi)銷。

DyPRAG：即插即用動(dòng)態(tài)將上下文轉(zhuǎn)化為參數(shù)知識(shí)，有效緩解RAG幻覺(jué)-AI.x社區(qū)

DyPRAG對(duì)比RAG和PRAG

1. 文檔-參數(shù)對(duì)收集（離線）

DyPRAG：即插即用動(dòng)態(tài)將上下文轉(zhuǎn)化為參數(shù)知識(shí)，有效緩解RAG幻覺(jué)-AI.x社區(qū)

2. 訓(xùn)練動(dòng)態(tài)參數(shù)翻譯器（離線）

DyPRAG：即插即用動(dòng)態(tài)將上下文轉(zhuǎn)化為參數(shù)知識(shí)，有效緩解RAG幻覺(jué)-AI.x社區(qū)

DyPRAG：即插即用動(dòng)態(tài)將上下文轉(zhuǎn)化為參數(shù)知識(shí)，有效緩解RAG幻覺(jué)-AI.x社區(qū)

DyPRAG：即插即用動(dòng)態(tài)將上下文轉(zhuǎn)化為參數(shù)知識(shí)，有效緩解RAG幻覺(jué)-AI.x社區(qū)

MLP超網(wǎng)絡(luò)工作流程

DyPRAG：即插即用動(dòng)態(tài)將上下文轉(zhuǎn)化為參數(shù)知識(shí)，有效緩解RAG幻覺(jué)-AI.x社區(qū)

3. 高效推理（在線）

DyPRAG：即插即用動(dòng)態(tài)將上下文轉(zhuǎn)化為參數(shù)知識(shí)，有效緩解RAG幻覺(jué)-AI.x社區(qū)

DyPRAG：即插即用動(dòng)態(tài)將上下文轉(zhuǎn)化為參數(shù)知識(shí)，有效緩解RAG幻覺(jué)-AI.x社區(qū)

DyPRAG整體框架圖

實(shí)驗(yàn)

分布內(nèi)QA實(shí)驗(yàn)

在多個(gè)問(wèn)答數(shù)據(jù)集上訓(xùn)練參數(shù)轉(zhuǎn)換器并進(jìn)行實(shí)驗(yàn)，DyPRAG表現(xiàn)出極優(yōu)的性能：

DyPRAG能有效注入?yún)?shù)知識(shí)：對(duì)比RAG，在沒(méi)有提供任何文檔拼接到上下文的情況下，DyPRAG表現(xiàn)出明顯優(yōu)于RAG的性能同時(shí)減少了推理開(kāi)銷。
上下文知識(shí)+動(dòng)態(tài)生成參數(shù)知識(shí)有效促進(jìn)知識(shí)融合：DyPRAG-Combine將文檔加入上下文結(jié)合動(dòng)態(tài)生成參數(shù)知識(shí)，在所有情況下取得最好效果，有效促進(jìn)了模型知識(shí)和上下文知識(shí)的融合。

DyPRAG：即插即用動(dòng)態(tài)將上下文轉(zhuǎn)化為參數(shù)知識(shí)，有效緩解RAG幻覺(jué)-AI.x社區(qū)

分布內(nèi)主實(shí)驗(yàn)

分布外QA實(shí)驗(yàn)

DyPRAG能有效轉(zhuǎn)換分布外的文檔到參數(shù)知識(shí)，在補(bǔ)充參數(shù)知識(shí)后始終可以作為相比RAG更強(qiáng)更魯棒的基線。

DyPRAG：即插即用動(dòng)態(tài)將上下文轉(zhuǎn)化為參數(shù)知識(shí)，有效緩解RAG幻覺(jué)-AI.x社區(qū)

分布外數(shù)據(jù)集實(shí)現(xiàn)

為什么DyPRAG能減少RAG幻覺(jué)？

RAG幻覺(jué)（或叫知識(shí)沖突）經(jīng)常由于模型內(nèi)部知識(shí)和外部提供上下文知識(shí)發(fā)生沖突導(dǎo)致發(fā)生?？赡?strong>模型包含正確的參數(shù)知識(shí)但結(jié)合上下文知識(shí)報(bào)錯(cuò)，也可能上下文知識(shí)正確但模型包含錯(cuò)誤參數(shù)知識(shí)導(dǎo)致模型回答錯(cuò)誤。
DyPRAG首先動(dòng)態(tài)將檢索文檔轉(zhuǎn)換為模型參數(shù)知識(shí)，提前讓模型“做足了功課”，在遇到相對(duì)應(yīng)的上下文內(nèi)容時(shí)就能極大程度避免知識(shí)沖突發(fā)生，這也是DyPRAG-Combine性能提升的直接來(lái)源，極低的開(kāi)銷使得DyPRAG有希望成為RAG幻覺(jué)的有效解決方式。

DyPRAG：即插即用動(dòng)態(tài)將上下文轉(zhuǎn)化為參數(shù)知識(shí)，有效緩解RAG幻覺(jué)-AI.x社區(qū)

RAG幻覺(jué)示例分析

知識(shí)內(nèi)化實(shí)驗(yàn)

基于RAGTruth幻覺(jué)數(shù)據(jù)集衡量DyPRAG-Combine對(duì)知識(shí)的內(nèi)化程度（使用GPT-4o打分）。

RAGTruth中的文檔來(lái)源和訓(xùn)練時(shí)完全不同并且大模型訓(xùn)練時(shí)完全沒(méi)有見(jiàn)過(guò)——DyPRAG能有效將沒(méi)有見(jiàn)過(guò)知識(shí)進(jìn)行內(nèi)化，內(nèi)化程度顯著優(yōu)于RAG方法。

DyPRAG：即插即用動(dòng)態(tài)將上下文轉(zhuǎn)化為參數(shù)知識(shí)，有效緩解RAG幻覺(jué)-AI.x社區(qū)

RAGTruth數(shù)據(jù)集驗(yàn)證

計(jì)算/存儲(chǔ)開(kāi)銷

通過(guò)詳細(xì)的時(shí)間復(fù)雜度計(jì)算和實(shí)際運(yùn)行時(shí)間對(duì)比，我們提出的DyPRAG能有效提升模型性能，同時(shí)減少RAG帶來(lái)的高推理開(kāi)銷以及PRAG帶來(lái)的極高訓(xùn)練和存儲(chǔ)開(kāi)銷（僅1%），更證明方法即插即用提升性能的高可用性！

DyPRAG：即插即用動(dòng)態(tài)將上下文轉(zhuǎn)化為參數(shù)知識(shí)，有效緩解RAG幻覺(jué)-AI.x社區(qū)

實(shí)際存儲(chǔ)和訓(xùn)練開(kāi)銷

DyPRAG：即插即用動(dòng)態(tài)將上下文轉(zhuǎn)化為參數(shù)知識(shí)，有效緩解RAG幻覺(jué)-AI.x社區(qū)

理論分析推理、存儲(chǔ)、訓(xùn)練開(kāi)銷

結(jié)論

我們提出動(dòng)態(tài)參數(shù)化RAG (Dynamic Parametric RAG)，一個(gè)輕量級(jí)框架可以以即插即用的方式以最小的成本有效地將文檔轉(zhuǎn)換為參數(shù)。
我們提出了一個(gè)強(qiáng)大而實(shí)用的RAG范式：有效地將上下文知識(shí)與測(cè)試時(shí)動(dòng)態(tài)生成的參數(shù)知識(shí)結(jié)合起來(lái)，實(shí)現(xiàn)更強(qiáng)大的知識(shí)融合。
實(shí)驗(yàn)結(jié)果表明，DyPRAG具有極優(yōu)的泛化能力，能夠有效地注入?yún)?shù)并無(wú)縫地融合上下文知識(shí)，在減少RAG幻覺(jué)的同時(shí)提高了模型性能。

公眾號(hào)大模型自然語(yǔ)言處理作者：余俊暉

原文鏈接：??https://mp.weixin.qq.com/s/d_WS0S3KT4XjbJHBoOFYFA??

?著作權(quán)歸作者所有，如需轉(zhuǎn)載，請(qǐng)注明出處，否則將追究法律責(zé)任

標(biāo)簽

已于2025-4-3 07:34:15修改

贊

收藏

回復(fù)

舉報(bào)

社區(qū)頭條

熱門內(nèi)容榜 ? 最近上榜

回復(fù)

相關(guān)推薦

80M參數(shù)打平GPT-4！蘋果發(fā)超強(qiáng)上下文理解模型，聰明版Siri馬上就來(lái)

duhorse ? 2416瀏覽 ? 0回復(fù)
「有效上下文」提升20倍！DeepMind發(fā)布ReadAgent框架

duhorse ? 2789瀏覽 ? 0回復(fù)
LLM超長(zhǎng)上下文查詢-性能評(píng)估實(shí)戰(zhàn)

ermulong ? 2709瀏覽 ? 0回復(fù)
Next-Level Agents：釋放動(dòng)態(tài)上下文（Dynamic Context）的巨大潛力

Baihai_IDP ? 3209瀏覽 ? 0回復(fù)
百萬(wàn)上下文RAG，Agent還能這么玩

ermulong ? 3204瀏覽 ? 0回復(fù)
LLM超長(zhǎng)上下文查詢-性能評(píng)估實(shí)戰(zhàn)

ermulong ? 2528瀏覽 ? 0回復(fù)
為消除幻覺(jué)，Amazon Bedrock開(kāi)大招！推出上下文基礎(chǔ)和 RAG 連接器！

51CTO技術(shù)棧 ? 2917瀏覽 ? 1回復(fù)
提升5.69倍，高效RAG上下文壓縮方法COCOM

Aceryt ? 2086瀏覽 ? 0回復(fù)
長(zhǎng)上下文 還是 RAG？ Google:我全都要！

探索AGI ? 2127瀏覽 ? 0回復(fù)
在長(zhǎng)上下文LLM的時(shí)代，RAG是否仍然必要？

sbf_2000 ? 2264瀏覽 ? 0回復(fù)
#AIGC創(chuàng)新先鋒者征文大賽# RAG vs 長(zhǎng)上下文 LLMs：誰(shuí)主沉?。?/a>

Baihai_IDP ? 2035瀏覽 ? 0回復(fù)
智能決策進(jìn)化之路：從長(zhǎng)上下文LLM到自主RAG系統(tǒng)

Halo咯咯 ? 2982瀏覽 ? 0回復(fù)
基于Agent的金融問(wèn)答系統(tǒng)：RAG的檢索增強(qiáng)之上下文重排和壓縮

一起AI技術(shù) ? 1860瀏覽 ? 0回復(fù)
HiQA：一種用于多文檔問(wèn)答的層次化上下文增強(qiáng)RAG

大模型自然語(yǔ)言處理 ? 1880瀏覽 ? 0回復(fù)
長(zhǎng)上下文語(yǔ)言模型評(píng)估體系探析

Baihai_IDP ? 2366瀏覽 ? 0回復(fù)
大模型超長(zhǎng)窗口上下文與檢索增強(qiáng)生成——RAG

AI探索時(shí)代 ? 2276瀏覽 ? 0回復(fù)
Claude的MCP（模型上下文協(xié)議）簡(jiǎn)介

Halo咯咯 ? 4498瀏覽 ? 0回復(fù)
RAG系統(tǒng)中的困境：上下文不是想加就能加的

芝士AI吃魚 ? 1819瀏覽 ? 0回復(fù)
谷歌提出Titans：突破算力限制，擴(kuò)展上下文

Aceryt ? 1589瀏覽 ? 0回復(fù)

大模型自然語(yǔ)言處理

這個(gè)用戶很懶，還沒(méi)有個(gè)人簡(jiǎn)介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

Kimi-VL開(kāi)源多模態(tài)大模型結(jié)構(gòu)、訓(xùn)練方法、訓(xùn)練數(shù)據(jù)淺析 2025-04-16 07:08:19發(fā)布
十大PDF解析工具在不同文檔類別中的比較研究 2025-04-07 06:31:37發(fā)布

熱門推薦

大半精銳盡出！o1下線！滿血o3之后，模型本身就是Manus，最大賣點(diǎn)：替代人干真活！ 1回復(fù)

王炸！MCP 架構(gòu)設(shè)計(jì)深度剖析 & 使用 Spring AI + MCP 四步教你實(shí)現(xiàn) Agent 智能體開(kāi)發(fā) 0回復(fù)

Dify從入門到高階系列二：手把手教學(xué)！超詳細(xì)的Dify知識(shí)庫(kù)配置全攻略 0回復(fù)

Crawl4AI：GitHub榜首40K星標(biāo)！LLM專屬極速開(kāi)源爬蟲神器 0回復(fù)

只需5分鐘，教你用Python搭建MCP Server 0回復(fù)

上一篇： RAG分塊優(yōu)化之語(yǔ)義分塊方法CrossFormer模型技術(shù)思路

下一篇：十大PDF解析工具在不同文檔類別中的比較研究

社區(qū)精華內(nèi)容

目錄

<meter id="donye"><strike id="donye"></strike></meter>