自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<style id="1lfxi"></style>

<style id="1lfxi"></style>

<style id="1lfxi"></style>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認證廠商認證 IT技術(shù)PMP項目管理免費題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺

51CTO學(xué)堂

IT職業(yè)在線教育平臺

長上下文還是 RAG？ Google:我全都要！

發(fā)布于 2024-8-27 11:30

瀏覽

0收藏

嘿，大家好！這里是一個專注于AI智能體的頻道！

最近，深度學(xué)習(xí)和人工智能領(lǐng)域的大牛們在arXiv上發(fā)表了一篇有趣的研究，標(biāo)題挺長的：《檢索增強生成或長上下文大型語言模型？全面研究和混合方法》。

今天分享一篇由Google DeepMind和密歇根大學(xué)的研究人員發(fā)布的一個長上下文和RAG混合的方法。

Retrieval Augmented Generation or Long-Context LLMs? AComprehensive Study and Hybrid Approach

檢索增強生成（RAG）一直是大型語言模型（LLMs）高效處理超長文本的強大工具。然而，像Gemini-1.5和GPT-4這樣的最新LLM展現(xiàn)了直接理解長文本的卓越能力。我們對RAG和長文本（LC）LLM進行了全面的比較，旨在利用兩者的優(yōu)點。我們使用三種最新的LLM，在各種公開數(shù)據(jù)集上對RAG和LC進行基準(zhǔn)測試。結(jié)果顯示，當(dāng)資源充足時，LC在平均性能上始終優(yōu)于RAG。然而，RAG顯著較低的成本仍然是一個明顯的優(yōu)勢?；谶@一觀察，我們提出了Self-Route，這是一種簡單但有效的方法，根據(jù)模型的自我反思將查詢路由到RAG或LC。Self-Route顯著降低了計算成本，同時保持了與LC相當(dāng)?shù)男阅?/strong>。我們的研究為使用RAG和LC的長文本應(yīng)用提供了指導(dǎo)。

首先，讓我們聊聊RAG。這種方法讓LLM通過檢索相關(guān)信息來生成回答，就像是給模型加了個外掛，讓它能夠訪問海量信息，而且成本很低。但是，隨著LLM的發(fā)展，像Gemini1.5和GPT-4這樣的模型已經(jīng)能夠直接理解超長文本了。這就引出了一個問題：我們是否還需要RAG？

研究人員決定做個全面的比較。他們用最新的三個LLM在不同的公共數(shù)據(jù)集上進行了基準(zhǔn)測試。結(jié)果發(fā)現(xiàn)，只要資源足夠，LC在幾乎所有情況下都比RAG表現(xiàn)得更好。但是，RAG的成本優(yōu)勢依然明顯。這就是說，雖然LC在理解長文本上更勝一籌，但RAG在成本上更具吸引力。

基于這個問題，研究人員提出了一種新方法，叫做SELF-ROUTE。這種方法根據(jù)模型的自我評估來決定是使用RAG還是LC。SELF-ROUTE在保持與LC相當(dāng)?shù)男阅艿耐瑫r，顯著降低了計算成本。例如，在Gemini-1.5-Pro上，成本降低了65%，在GPT-4上降低了39%。

研究人員通過深入分析了RAG與LC的預(yù)測差異，發(fā)現(xiàn)RAG和LC在很多情況下會給出相同的預(yù)測，無論是正確的還是錯誤的。事實上，對于 63% 的查詢，模型預(yù)測是完全相同的；對于 70% 的查詢，分數(shù)差異小于 10（絕對值）。有趣的是，相同的預(yù)測不一定正確，如代表平均分數(shù)的不同顏色所示，即(S_RAG + S_LC) / 2。這一觀察結(jié)果表明，RAG 和 LC 不僅傾向于做出相同的正確預(yù)測，而且傾向于做出類似的錯誤。

因此，我們可以在大多數(shù)查詢中利用 RAG，為一小部分真正擅長的查詢保留計算成本更高的 LC。通過這樣做，RAG 可以在不犧牲整體性能的情況下顯著降低計算成本。

SELF-ROUTE也比較簡單，其實就倆步驟：先是RAG加Route這一步，然后是長上下文預(yù)測那一步。前一步里，我們把查詢和檢索到的內(nèi)容塊兒給LLM，然后讓它預(yù)測這查詢能不能回答，如果能，就生成答案。這跟咱們平時用的RAG差不多，但有個關(guān)鍵的不同點：LLM現(xiàn)在有個選擇權(quán)，如果覺得根據(jù)提供的內(nèi)容回答不了問題，它可以選擇不回答，提示詞是“Write unanswerable if the query can not be answered based on the provided text”。

對于那些LLM覺得能回答的查詢，我們就直接接受RAG的預(yù)測作為最終答案。對于那些LLM覺得回答不了的，咱們就進入第二步，把完整的上下文信息給長上下文LLM，讓它來得出最終預(yù)測，也就是LC。評測發(fā)現(xiàn)，雖然RAG得分穩(wěn)定低于LC，但是SELF-ROUTE可以用更少的tokens，獲得接近甚至更好的效果

本文轉(zhuǎn)載自??探索AGI??，作者：獼猴桃 ????

標(biāo)簽
RAG
Google
智能體

贊

收藏

回復(fù)

分享

微博

QQ

微信

舉報
舉報

微信掃碼分享

刪除帖子
刪除取消

回復(fù)

相關(guān)推薦

港中文提出CLongEval中文基準(zhǔn)測試集，準(zhǔn)確評估大模型長上下文能力

zhangyannni ? 4892瀏覽 ? 0回復(fù)
LLM超長上下文查詢-性能評估實戰(zhàn)

ermulong ? 2709瀏覽 ? 0回復(fù)
百萬上下文RAG，Agent還能這么玩

ermulong ? 3204瀏覽 ? 0回復(fù)
LLM超長上下文查詢-性能評估實戰(zhàn)

ermulong ? 2529瀏覽 ? 0回復(fù)
提升5.69倍，高效RAG上下文壓縮方法COCOM

Aceryt ? 2086瀏覽 ? 0回復(fù)
長上下文能力只是吹牛？最強GPT-4o正確率僅55.8%，開源模型不如瞎蒙

duhorse ? 2740瀏覽 ? 0回復(fù)
在長上下文LLM的時代，RAG是否仍然必要？

sbf_2000 ? 2264瀏覽 ? 0回復(fù)
#AIGC創(chuàng)新先鋒者征文大賽# RAG vs 長上下文 LLMs：誰主沉浮？

Baihai_IDP ? 2035瀏覽 ? 0回復(fù)
智能決策進化之路：從長上下文LLM到自主RAG系統(tǒng)

Halo咯咯 ? 2984瀏覽 ? 0回復(fù)
基于Agent的金融問答系統(tǒng)：RAG的檢索增強之上下文重排和壓縮

一起AI技術(shù) ? 1860瀏覽 ? 0回復(fù)
HiQA：一種用于多文檔問答的層次化上下文增強RAG

大模型自然語言處理 ? 1882瀏覽 ? 0回復(fù)
長上下文語言模型評估體系探析

Baihai_IDP ? 2367瀏覽 ? 0回復(fù)
大模型超長窗口上下文與檢索增強生成——RAG

AI探索時代 ? 2280瀏覽 ? 0回復(fù)
Claude的MCP（模型上下文協(xié)議）簡介

Halo咯咯 ? 4499瀏覽 ? 0回復(fù)
RAG系統(tǒng)中的困境：上下文不是想加就能加的

芝士AI吃魚 ? 1819瀏覽 ? 0回復(fù)
為什么大語言模型難以處理長上下文？從 Transformer 到 Mamba

Baihai_IDP ? 2569瀏覽 ? 0回復(fù)
高效注意力機制與硬件優(yōu)化：硬件優(yōu)化的稀疏注意力，長上下文建模

AI研究前瞻 ? 1737瀏覽 ? 0回復(fù)
DyPRAG：即插即用動態(tài)將上下文轉(zhuǎn)化為參數(shù)知識，有效緩解RAG幻覺

大模型自然語言處理 ? 1562瀏覽 ? 0回復(fù)
SWAN-GPT：突破長上下文瓶頸的革命性架構(gòu)設(shè)計

頓數(shù)AI ? 669瀏覽 ? 0回復(fù)

探索AGI

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

Anthropic開源Agentic Coding最佳實踐！ 8天前發(fā)布
英偉達押注Agent新基建！AI專屬搜索引擎問世 2025-04-10 06:40:23發(fā)布

熱門推薦

大半精銳盡出！o1下線！滿血o3之后，模型本身就是Manus，最大賣點：替代人干真活！ 1回復(fù)
王炸！MCP 架構(gòu)設(shè)計深度剖析 & 使用 Spring AI + MCP 四步教你實現(xiàn) Agent 智能體開發(fā) 0回復(fù)
Dify從入門到高階系列二：手把手教學(xué)！超詳細的Dify知識庫配置全攻略 0回復(fù)
Crawl4AI：GitHub榜首40K星標(biāo)！LLM專屬極速開源爬蟲神器 0回復(fù)
只需5分鐘，教你用Python搭建MCP Server 0回復(fù)

上一篇：披上Agent盔甲的RAG，從此不再只是召回生成！

下一篇：解密GCN，手把手教你用PyTorch實現(xiàn)圖卷積網(wǎng)絡(luò)

社區(qū)精華內(nèi)容

目錄

Copyright ? 2005-2025 51CTO.COM 京ICP證060544版權(quán)所有未經(jīng)許可請勿轉(zhuǎn)載

客服

感谢您访问我们的网站，您可能还对以下资源感兴趣：
自拍偷在线精品自拍偷