自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<pre id="xg6v7"><fieldset id="xg6v7"></fieldset></pre>

<sub id="xg6v7"><p id="xg6v7"></p></sub>

<sub id="xg6v7"></sub>

<sub id="xg6v7"></sub>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓

鴻蒙開發(fā)者社區(qū)

WOT技術大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術網(wǎng)站

51CTO博客

專業(yè)IT技術創(chuàng)作平臺

51CTO學堂

IT職業(yè)在線教育平臺

圖RAG統(tǒng)一框架來了，12種RAG方法一網(wǎng)打盡！

發(fā)布于 2025-3-18 07:49

瀏覽

0收藏

基于圖的 RAG 統(tǒng)一框架 in-depth 分析

作者：港中深與華為的研究人員

圖RAG統(tǒng)一框架來了，12種RAG方法一網(wǎng)打盡！-AI.x社區(qū)

核心速覽

研究背景

研究問題：這篇文章要解決的問題是如何在統(tǒng)一框架下對基于圖的檢索增強生成 (RAG) 方法進行系統(tǒng)的比較和分析。現(xiàn)有的基于圖的 RAG 方法沒有在同一實驗設置下進行系統(tǒng)的比較。

研究難點：包括缺乏統(tǒng)一的框架來抽象和比較各種基于圖的 RAG 方法；現(xiàn)有工作主要關注整體性能評估而非單個組件的性能；以及缺乏對各種方法在準確性和效率方面的全面比較。

相關工作：涉及 RAG 技術在醫(yī)療、金融、教育等領域的廣泛應用，以及已有的基于圖的 RAG 方法（如 RAPTOR、KGP、HippoRAG 等），但這些方法缺乏系統(tǒng)比較和分析。

研究方法

圖構建：將大規(guī)模語料庫分割成多個塊，并使用 LLM 或其他工具從中提取節(jié)點和邊構建圖（如 passage graph、tree、knowledge graph、textual knowledge graph 和 rich knowledge graph）。
索引構建：為高效在線查詢，構建存儲圖中實體或關系的索引，并計算社區(qū)報告實現(xiàn)高效檢索。索引類型包括節(jié)點索引、關系索引和社區(qū)索引。
操作符配置：在統(tǒng)一框架下，任何現(xiàn)有的基于圖的 RAG 方法均可通過選擇特定操作符（節(jié)點、關系、塊、子圖、社區(qū)）并組合實現(xiàn)。
檢索與生成：將用戶輸入的問題轉(zhuǎn)換為檢索原語，利用選定操作符檢索信息，再與問題一起輸入 LLM 生成答案。答案生成包括直接生成和 Map-Reduce 兩種范式。

實驗設計

數(shù)據(jù)集：使用了 11 個真實世界數(shù)據(jù)集，如 MultihopQA、Quality、PopQA、MusiqueQA、HotpotQA、ALCE、Mix、MultihopSum、Agriculture、CS 和 Legal。
評估指標：對特定問題任務采用準確率和召回率；對抽象問題任務采用全面性、多樣性、賦能和總體質(zhì)量等指標。
實現(xiàn)：所有算法均在 Python 中實現(xiàn)，并使用提出的統(tǒng)一框架，實驗覆蓋 350 集數(shù)據(jù)集。
超參數(shù)設置：對于需要 top-k 選擇的方法（如塊或?qū)嶓w），設置 ( k=4 ) 以適應令牌長度限制，并采用 BGE-M3 模型生成節(jié)點和關系的嵌入向量。

結(jié)果與分析

特定問題任務的性能：RAG 技術顯著提高了 LLM 的性能。比如，在 Quality 數(shù)據(jù)集上，RAPTOR 相較于 ZeroShot 提高了 53.80% 的準確性，但若檢索到的元素不相關則可能降低性能。

圖RAG統(tǒng)一框架來了，12種RAG方法一網(wǎng)打盡！-AI.x社區(qū)

圖構建和索引構建的成本：構建樹的令牌成本最低，而 TKG 和 RKG 的成本最高。對于大型數(shù)據(jù)集，GraphRAG 的離線階段成本較高。

圖RAG統(tǒng)一框架來了，12種RAG方法一網(wǎng)打盡！-AI.x社區(qū)

生成成本：ZeroShot 和 Vanilla RAG 在時間和令牌消耗方面較為經(jīng)濟，而 KGP 和 ToG 由于依賴 LLM 檢索信息成本較高。

圖RAG統(tǒng)一框架來了，12種RAG方法一網(wǎng)打盡！-AI.x社區(qū)

復雜問題任務的新 SOTA 算法：提出了 VGraphRAG，通過結(jié)合實體、關系、社區(qū)和塊四種元素有效指導 LLM 生成準確答案，在 ALCE 數(shù)據(jù)集上分別在 STRREC、STREM 和 STRHIT 上提高了 8.47%、13.18% 和 4.93%。

圖RAG統(tǒng)一框架來了，12種RAG方法一網(wǎng)打盡！-AI.x社區(qū)

抽象問題任務的性能：基于圖的 RAG 方法通常優(yōu)于 Vanilla RAG，GGraphRAG 和 RAPTOR 因在提示中加入高層次總結(jié)文本表現(xiàn)更佳。

圖RAG統(tǒng)一框架來了，12種RAG方法一網(wǎng)打盡！-AI.x社區(qū)

新 SOTA 算法的成本效益：設計了成本效益更高的 CheapRAG，通過選擇最有用的社區(qū)和塊顯著減少令牌成本，在 MultihopSum 數(shù)據(jù)集上相比 GGraphRAG 降低了 100 倍令牌成本，同時提升了答案質(zhì)量。

圖RAG統(tǒng)一框架來了，12種RAG方法一網(wǎng)打盡！-AI.x社區(qū)

總體結(jié)論

本文對現(xiàn)有基于圖的 RAG 方法進行了深入實驗評估和比較，提出了一個新的統(tǒng)一框架覆蓋所有現(xiàn)有方法，并識別出關鍵性能影響因素和未來研究機會。

論文評價

優(yōu)點與創(chuàng)新

統(tǒng)一框架：提出了一個新穎的統(tǒng)一框架，涵蓋所有現(xiàn)有基于圖的檢索增強生成 (RAG) 方法，并抽象出關鍵操作。
全面比較：在統(tǒng)一框架下系統(tǒng)比較了 12 種代表性方法，提供了深入分析。
新變體識別：結(jié)合現(xiàn)有技術識別出新的 RAG 方法變體，在部分任務上優(yōu)于最先進方法。
實驗設計：在多個常用 QA 數(shù)據(jù)集上進行了全面實驗，評估不同查詢類型下的方法性能。
模塊化設計：模塊化設計允許各階段（圖構建、檢索、生成）獨立優(yōu)化和組合，提升靈活性。
操作符設計：通過調(diào)整檢索階段或交換組件，便于快速測試和實施新策略，加速模型開發(fā)。
標準化評估：提供了標準化評估方法，確保結(jié)果可重復，促進公平基準測試，為未來創(chuàng)新提供支持。

論文詳情與開源代碼

論文詳情：https://arxiv.org/abs/2503.04338
代碼開源地址：https://github.com/JayLZhou/GraphRAG

本文轉(zhuǎn)載自??NLP前沿??，作者：NLP前沿

標簽

贊

收藏

回復

舉報

社區(qū)頭條

回復

相關推薦

除了RAG，還有這五種方法消除大模型幻覺

51CTO技術棧 ? 4747瀏覽 ? 0回復
FlashRAG：5大組件、12種RAG技術、32個數(shù)據(jù)集的開源框架，比LangChain輕量！

PaperAgent ? 8278瀏覽 ? 0回復
微軟重磅開源 GraphRAG：新一代 RAG 技術來了！

玄姐聊AGI ? 5452瀏覽 ? 0回復
介紹一種實用的RAG技術：父文檔檢索（PDR）

51CTO內(nèi)容精選 ? 2344瀏覽 ? 0回復
RAG高級優(yōu)化：一文看盡Query的轉(zhuǎn)換之路

恰似驚鴻 ? 2504瀏覽 ? 0回復
一種支持4種多模態(tài)RAG技術的引擎：VARAG

PaperAgent ? 3113瀏覽 ? 0回復
一種將RAG、KG、VS、TF結(jié)合增強領域LLM性能的框架

PaperAgent ? 2685瀏覽 ? 0回復
改進RAG管道檢索文檔質(zhì)量的五種方法

51CTO內(nèi)容精選 ? 2359瀏覽 ? 0回復
15種典型RAG框架：卡內(nèi)基梅隆大學最新RAG綜述

大語言模型論文跟蹤 ? 5002瀏覽 ? 0回復
表格場景RAG怎么做？TableRAG：一種增強大規(guī)模表格理解框架

大模型自然語言處理 ? 2434瀏覽 ? 0回復
文檔截圖嵌入統(tǒng)一多模態(tài)檢索方法原理

大模型自然語言處理 ? 1861瀏覽 ? 0回復
一篇綜述：RAG復雜Query的4種優(yōu)化方案

CourseAI ? 2101瀏覽 ? 0回復
深度剖析25種RAG變體：全網(wǎng)最全~沒有之一

柏企閱文 ? 2241瀏覽 ? 0回復
Phi-4-multimodal：圖、文、音頻統(tǒng)一的多模態(tài)大模型架構、訓練方法、數(shù)據(jù)細節(jié)

大模型自然語言處理 ? 1791瀏覽 ? 0回復
RAG常見13種分塊策略大總結(jié)（一覽表）

大模型自然語言處理 ? 1621瀏覽 ? 0回復
PathRAG：通過圖剪枝的方法優(yōu)化Graph-based RAG的性能方法淺析

大模型自然語言處理 ? 1680瀏覽 ? 0回復
12張圖清晰總結(jié) MCP、RAG、Agent 架構設計間的關系

玄姐聊AGI ? 1717瀏覽 ? 0回復
RAG進階技術！這十種方法你一定要知道

Halo咯咯 ? 1195瀏覽 ? 0回復
12張圖清晰總結(jié) MCP、RAG、Agent 架構設計間的關系

玄姐聊AGI ? 1526瀏覽 ? 0回復

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關注

最近發(fā)布

推理大模型并非一定要推理 7天前發(fā)布
llama 4，開源！ 2025-04-10 07:06:26發(fā)布

熱門推薦

大半精銳盡出！o1下線！滿血o3之后，模型本身就是Manus，最大賣點：替代人干真活！ 1回復

王炸！MCP 架構設計深度剖析 & 使用 Spring AI + MCP 四步教你實現(xiàn) Agent 智能體開發(fā) 0回復

Dify從入門到高階系列二：手把手教學！超詳細的Dify知識庫配置全攻略 0回復

Crawl4AI：GitHub榜首40K星標！LLM專屬極速開源爬蟲神器 0回復

只需5分鐘，教你用Python搭建MCP Server 0回復

上一篇：微軟LongRoPE v2：幾乎無損的上下文擴展！

下一篇： Qwen原生多模態(tài)開源，淺析一下！

社區(qū)精華內(nèi)容

目錄