自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開(kāi)發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問(wèn)答課堂專欄直播

51CTO

鴻蒙開(kāi)發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開(kāi)發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開(kāi)發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

AI.x社區(qū)

登錄/注冊(cè)
51CTO

中國(guó)優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺(tái)

51CTO學(xué)堂

IT職業(yè)在線教育平臺(tái)

向o1看齊，Google開(kāi)源RAG推理擴(kuò)展，提升近60%

發(fā)布于 2024-11-5 14:39

瀏覽

0收藏

論文筆記分享，標(biāo)題Inference Scaling for Long-Context Retrieval Augmented Generation，來(lái)自google deepmind

openai o1通過(guò)讓擴(kuò)展推理，讓模型在推理方面達(dá)到非常優(yōu)異的性能。google這篇內(nèi)容，核心想驗(yàn)證2個(gè)點(diǎn)

RAG系統(tǒng)的性能，如何從推理計(jì)算擴(kuò)展中受益
通過(guò)建立RAG性能和推理參數(shù)之間的關(guān)系模型來(lái)預(yù)測(cè)給定預(yù)算下的最佳測(cè)試時(shí)計(jì)算分配

文中應(yīng)用了2種擴(kuò)展方式，DRAG，IterRAG均有效的提高了RAG系統(tǒng)的性能。并且，當(dāng)最優(yōu)分配時(shí)，增加推理計(jì)算幾乎可以線性提升RAG性能，這種關(guān)系表示為RAG的推理擴(kuò)展法則。

向o1看齊，Google開(kāi)源RAG推理擴(kuò)展，提升近60%-AI.x社區(qū)

在RAG中，與O1不同的是，用有效上下文長(zhǎng)度來(lái)衡量推理計(jì)算。有效上下文長(zhǎng)度為在LLM輸出最終答案之前，所有迭代中總的輸入token數(shù)量。

對(duì)于大多數(shù)只調(diào)用一次LLM的方法，有效上下文長(zhǎng)度相當(dāng)于prompt中的token數(shù)量，并受限于LLM的上下文窗口限制。

這里排除輸出成本和檢索成本，因?yàn)長(zhǎng)LMs通常在知識(shí)密集型任務(wù)中通常答案比較短，可能是精確的實(shí)體或數(shù)字。

2種擴(kuò)展上下文的方式

向o1看齊，Google開(kāi)源RAG推理擴(kuò)展，提升近60%-AI.x社區(qū)

DRAG

D是Demo的意思，就是通過(guò)提供多個(gè)RAG的示例作為few-shot，提高LLMs的上下文能力。
輸入構(gòu)成有3部分，檢索到的文檔、輸入query以及相應(yīng)的問(wèn)題和答案示例。所以可以擴(kuò)展的有2部分，就是檢索的文檔數(shù)量，以及示例的數(shù)量。

IterRAG

Iter就是迭代的意思，通過(guò)將復(fù)雜查詢分解為多個(gè)子查詢來(lái)解決多跳的問(wèn)題
在每次迭代中，模型可能會(huì)生成一個(gè)子查詢、一個(gè)中間答案或最終答案。這個(gè)過(guò)程會(huì)重復(fù)迭代，直到生成最終答案或達(dá)到最大迭代次數(shù)。

總體的呈現(xiàn)線性的擴(kuò)展規(guī)律，性能跟上下文長(zhǎng)度之間。DRAG受限于1M窗口的限制，IterRAG可以通過(guò)迭代在更長(zhǎng)上下文的時(shí)候表現(xiàn)出良好的擴(kuò)展。

向o1看齊，Google開(kāi)源RAG推理擴(kuò)展，提升近60%-AI.x社區(qū)

參數(shù)特定的縮放，總體而言，，擴(kuò)大檢索范圍、增加例子數(shù)量、增加生成步驟的數(shù)量都會(huì)提高性能，但是收益會(huì)因有效上下文長(zhǎng)度和方法的不同而不同。看下圖斜率，增加文檔數(shù)量可以得到更大的提升。并且DRAG和IterRAG的飽和程度不同。

向o1看齊，Google開(kāi)源RAG推理擴(kuò)展，提升近60%-AI.x社區(qū)

最后給定上下文長(zhǎng)度的最大預(yù)算，一個(gè)公式如下，其中中考慮了文檔數(shù)量，示例，迭代次數(shù)等參數(shù)。但是這些參數(shù)跟特定模型相關(guān)。需要對(duì)進(jìn)行實(shí)驗(yàn)，然后MSE算出a、b、c的最優(yōu)值。

向o1看齊，Google開(kāi)源RAG推理擴(kuò)展，提升近60%-AI.x社區(qū)

向o1看齊，Google開(kāi)源RAG推理擴(kuò)展，提升近60%-AI.x社區(qū)

本文轉(zhuǎn)載自 ??NLP前沿??，作者： ??NLP前沿??

標(biāo)簽

贊

收藏

回復(fù)

舉報(bào)

回復(fù)

相關(guān)推薦

剛剛，OpenAI發(fā)布史上最強(qiáng)模型-o1，推理能力超人類博士！

Aceryt ? 2280瀏覽 ? 0回復(fù)
OpenAI發(fā)布突破性AI模型o1系列，推理能力大幅躍升重塑行業(yè)格局

芝士AI吃魚(yú) ? 2427瀏覽 ? 0回復(fù)
OpenAI o1模型推理能力大幅提升的背后：重復(fù)采樣如何提升AI推理能力

Syrupup ? 3341瀏覽 ? 0回復(fù)
OpenAI o1推理模型基礎(chǔ)入門

51CTO內(nèi)容精選 ? 2148瀏覽 ? 0回復(fù)
開(kāi)源社區(qū)離Openai o1越來(lái)越近~

NLP前沿1 ? 2236瀏覽 ? 0回復(fù)
o1推理擴(kuò)展的風(fēng)吹到了RAG，性能飆升58.9%！

PaperAgent ? 2330瀏覽 ? 0回復(fù)
OpenAI o1：用內(nèi)部思維鏈進(jìn)行復(fù)雜推理

shizhi02 ? 2287瀏覽 ? 0回復(fù)
擊敗GPT-4o、僅次于o1！英偉達(dá)重磅開(kāi)源超強(qiáng)大模型--Nemotron

Aceryt ? 2989瀏覽 ? 0回復(fù)
VLM版o1超越一眾開(kāi)源和閉源模型！LLaVA-o1：多階段自主推理（北大&清華&阿里等）

angel ? 2297瀏覽 ? 0回復(fù)
解密o1推理過(guò)程！DeepSeek-R1-Lite預(yù)覽版上線

kede96 ? 2731瀏覽 ? 0回復(fù)
解讀 Marco - o1：邁向開(kāi)放式推理模型的探索與實(shí)踐

AI論文解讀 ? 2466瀏覽 ? 0回復(fù)
阿里重磅開(kāi)源QwQ-32B：自我思考、糾正，數(shù)學(xué)能力擊敗o1模型

Aceryt ? 7255瀏覽 ? 0回復(fù)
阿里發(fā)布類o1模型QWQ，可自我反思糾錯(cuò)，實(shí)測(cè)數(shù)學(xué)推理遠(yuǎn)超o1、DS-R1，人人免費(fèi)

51CTO技術(shù)棧 ? 2469瀏覽 ? 0回復(fù)
大語(yǔ)言模型o1慢思考推理系統(tǒng)的破局之路：模仿、探索與自我提升的深度揭秘！

十一月雨_55 ? 3459瀏覽 ? 0回復(fù)
開(kāi)源版o1！中國(guó)大模型讓國(guó)外陷入瘋狂，成本猛降90%

Aceryt ? 2792瀏覽 ? 0回復(fù)
Kimi深夜炸場(chǎng)：滿血版多模態(tài)o1級(jí)推理模型！OpenAI外全球首次！Jim Fan：同天兩款國(guó)產(chǎn)o1絕對(duì)不是巧合！

51CTO技術(shù)棧 ? 1674瀏覽 ? 0回復(fù)
最簡(jiǎn)單的推理擴(kuò)展方案，效果媲美o1！

NLP前沿1 ? 1449瀏覽 ? 0回復(fù)
DeepSeek R1 Vs OpenAI o1！全球頂級(jí)推理模型訓(xùn)練技術(shù)對(duì)比大解密！

51CTO技術(shù)棧 ? 4693瀏覽 ? 0回復(fù)
o1模型醫(yī)學(xué)推理驚人，超過(guò)人類醫(yī)生

Aceryt ? 1522瀏覽 ? 0回復(fù)

這個(gè)用戶很懶，還沒(méi)有個(gè)人簡(jiǎn)介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

推理大模型并非一定要推理 7天前發(fā)布
llama 4，開(kāi)源！ 2025-04-10 07:06:26發(fā)布

熱門推薦

大半精銳盡出！o1下線！滿血o3之后，模型本身就是Manus，最大賣點(diǎn)：替代人干真活！ 1回復(fù)

王炸！MCP 架構(gòu)設(shè)計(jì)深度剖析 & 使用 Spring AI + MCP 四步教你實(shí)現(xiàn) Agent 智能體開(kāi)發(fā) 0回復(fù)

Dify從入門到高階系列二：手把手教學(xué)！超詳細(xì)的Dify知識(shí)庫(kù)配置全攻略 0回復(fù)

Crawl4AI：GitHub榜首40K星標(biāo)！LLM專屬極速開(kāi)源爬蟲(chóng)神器 0回復(fù)

只需5分鐘，教你用Python搭建MCP Server 0回復(fù)

上一篇：傳統(tǒng)RAG涼涼？多模態(tài)RAG帶來(lái)工業(yè)級(jí)革命

下一篇：一篇大模型RAG最新綜述

社區(qū)精華內(nèi)容

目錄

^{<blockquote id="blmol"><i id="blmol"></i></blockquote>}

<kbd id="blmol"></kbd>