自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<strike id="p1esu"></strike>

<cite id="p1esu"><track id="p1esu"></track></cite>

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問(wèn)答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

AI.x社區(qū)

登錄/注冊(cè)
51CTO

中國(guó)優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺(tái)

51CTO學(xué)堂

IT職業(yè)在線教育平臺(tái)

RAG 的盡頭是 Agent？原創(chuàng)

發(fā)布于 2024-8-2 12:49

瀏覽

0收藏

1、大模型的痛點(diǎn)

大模型技術(shù)席卷全球，為日常工作和生活帶來(lái)便利，但也面臨時(shí)效性、準(zhǔn)確性等問(wèn)題。如何提升大模型的性能？解決其挑戰(zhàn)？構(gòu)建高級(jí)應(yīng)用？成為重要待解決問(wèn)題。

RAG 的盡頭是 Agent？ -AI.x社區(qū)

RAG（檢索增強(qiáng)生成）技術(shù)通過(guò)信息檢索和文本生成，顯著提升了大模型的性能。但 RAG 也存在局限性，比如：數(shù)據(jù)依賴、檢索效率等。如何解決這些痛點(diǎn)？如何進(jìn)一步提升 RAG 性能？是本文剖析的重點(diǎn)。

2、RAG 的痛點(diǎn)

Naive RAG 通過(guò)檢索和生成，提升大模型在問(wèn)答、智能助手等任務(wù)上的性能。但 Naive RAG 難以處理復(fù)雜問(wèn)題或大型文檔集，舉例如下：

RAG 的盡頭是 Agent？ -AI.x社區(qū)

簡(jiǎn)單問(wèn)題："特斯拉的主要風(fēng)險(xiǎn)因素是什么？" 和 "作者在 YC 期間做了什么？" 等問(wèn)題，Naive RAG 可以給出準(zhǔn)確答案。

復(fù)雜問(wèn)題："總結(jié) XXX 公司年度報(bào)告"、"比較開發(fā)者 A 和 B 貢獻(xiàn)" 或 "分析滴滴公司風(fēng)險(xiǎn)" 等問(wèn)題，Naive RAG 可能無(wú)法提供滿意結(jié)果。

針對(duì)復(fù)雜問(wèn)題，我們需要探索更高級(jí) RAG 解決方案。

RAG 的盡頭是 Agent？ -AI.x社區(qū)

3、From RAG to Agent

Naive RAG（基于檢索的增強(qiáng)生成）應(yīng)用主要是在整合自身知識(shí)庫(kù)的基礎(chǔ)上，提升大型模型的性能，以產(chǎn)出更精準(zhǔn)、即時(shí)和豐富的行業(yè)內(nèi)容或定制化信息。然而，這種應(yīng)用仍限于內(nèi)容生成的領(lǐng)域。若要人工智能像一位“目標(biāo)導(dǎo)向”的高效工作者一樣，自主選擇多種工具，與不同系統(tǒng)互動(dòng)合作，直至完成最終任務(wù)，那么我們就需要從 RAG 升級(jí)至 Agent 模式。

以下是 RAG 向 Agent 轉(zhuǎn)變的描述：

RAG 的盡頭是 Agent？ -AI.x社區(qū)

從 RAG 到 Agent 的演進(jìn)，并非完全摒棄 RAG，而是在其基礎(chǔ)上拓展以下幾層功能：

多輪對(duì)話能力：與用戶進(jìn)行更深層次的交流，準(zhǔn)確把握用戶需求。
查詢/任務(wù)規(guī)劃層：理解和規(guī)劃復(fù)雜的查詢與任務(wù)流程。
外部工具接口：利用外部工具來(lái)完成特定任務(wù)。
反思機(jī)制：對(duì)執(zhí)行結(jié)果進(jìn)行反思、總結(jié)和評(píng)估。
記憶功能：記錄用戶交互歷史，以提供更加個(gè)性化的服務(wù)。

通過(guò)這些功能的增強(qiáng)，Agent 不僅能應(yīng)對(duì)復(fù)雜任務(wù)，還能在多變的環(huán)境中靈活應(yīng)對(duì)。與 RAG 相比，Agent更專注于完成特定任務(wù)，并更注重與現(xiàn)有系統(tǒng)的融合。它不僅理解語(yǔ)言，還能在現(xiàn)實(shí)世界或數(shù)字系統(tǒng)中采取行動(dòng)。Agent 不僅能執(zhí)行復(fù)雜的多步驟任務(wù)，比如；信息檢索、數(shù)據(jù)處理，還能無(wú)縫接入各種系統(tǒng)和 API 接口，訪問(wèn)用戶數(shù)據(jù)，與數(shù)據(jù)庫(kù)互動(dòng)。

人類之所以獨(dú)特，很大程度上是因?yàn)槲覀儠?huì)使用工具。同樣，作為智能體的Agent 也能借助外部工具，處理更為復(fù)雜的任務(wù)。比如：Agent 能夠利用圖表生成工具制作在線圖表，使用天氣查詢工具獲取天氣信息。因此，Agent 是真正釋放大模型潛能的關(guān)鍵。

因此，我們的大模型應(yīng)用也將從 RAG 邁向 Agent，可以說(shuō)，Agent 是 RAG 發(fā)展的必然歸宿。

4、案例剖析

最近，阿里巴巴千問(wèn)團(tuán)隊(duì)成功開發(fā)了一款新型 Agent（智能體），該智能體整合了 RAG 技術(shù)，旨在解析包含數(shù)百萬(wàn)字詞的文檔。盡管它僅利用了 Qwen2 大模型的 8k 上下文窗口，但其性能表現(xiàn)卻超越了傳統(tǒng)的 RAG 模型和長(zhǎng)序列原生模型。

Agent 構(gòu)建流程如下：

該智能體的構(gòu)建涉及三個(gè)級(jí)別，每一級(jí)都是基于前一級(jí)的構(gòu)建：

級(jí)別一：檢索

這一級(jí)別關(guān)注的是如何識(shí)別并提取與關(guān)鍵詞最相關(guān)的文檔片段，主要分為以下三個(gè)步驟：

步驟1：區(qū)分指令信息與非指令信息

用戶輸入示例：“請(qǐng)用2000字的篇幅詳細(xì)說(shuō)明，我的問(wèn)題是，自行車是什么時(shí)候發(fā)明的？請(qǐng)用英文回答?！?/p>

信息分解：{“問(wèn)題內(nèi)容”: [“自行車是什么時(shí)候發(fā)明的”], “指令要求”: [“2000字詳細(xì)說(shuō)明”, “用英文回答”]}。

步驟2：多語(yǔ)言關(guān)鍵詞推導(dǎo)

輸入問(wèn)題：“自行車是什么時(shí)候發(fā)明的”

信息轉(zhuǎn)換：{“英文關(guān)鍵詞”: [“bicycles”, “invention”, “timing”], “中文關(guān)鍵詞”: [“自行車”, “發(fā)明”, “時(shí)間”]}。

步驟3：應(yīng)用 BM25 關(guān)鍵詞檢索算法

通過(guò) BM25 算法，對(duì)關(guān)鍵詞進(jìn)行高效的檢索，以定位相關(guān)文檔片段。

RAG 的盡頭是 Agent？ -AI.x社區(qū)

級(jí)別二：分塊閱讀

當(dāng)相關(guān)文檔片段與用戶查詢關(guān)鍵詞的重疊度不足，可能導(dǎo)致這些片段在檢索過(guò)程中被忽略，未能傳遞給大模型。為了解決這個(gè)問(wèn)題，我們采用了以下策略：

步驟1：相關(guān)性評(píng)估

使用聊天模型對(duì)每個(gè)512字節(jié)的文檔片段進(jìn)行評(píng)估，判斷其與用戶查詢的相關(guān)性。如果模型判斷為不相關(guān)，則輸出“無(wú)”；若判斷為相關(guān)，則輸出相關(guān)的句子。

步驟2：基于相關(guān)句子的檢索

從步驟1中提取出的相關(guān)句子，將它們作為搜索查詢?cè)~，利用BM25算法檢索出與用戶查詢最相關(guān)的文檔塊。

步驟3：生成答案

根據(jù)檢索到的上下文信息，生成最終的答案。

RAG 的盡頭是 Agent？ -AI.x社區(qū)

級(jí)別三：遞進(jìn)推理

面對(duì)多跳推理問(wèn)題，比如：用戶提問(wèn)：“與貝多芬的第五交響曲創(chuàng)作于同一世紀(jì)的交通工具是什么？”大模型需要將問(wèn)題分解為多個(gè)子問(wèn)題來(lái)逐一解答：“貝多芬的第五交響曲是在哪個(gè)世紀(jì)創(chuàng)作的？”以及“自行車是在哪個(gè)世紀(jì)發(fā)明的？”

這一挑戰(zhàn)可以通過(guò)以下步驟，利用工具調(diào)用（又稱函數(shù)調(diào)用）智能體或 ReAct智能體來(lái)解決：

1. 向三級(jí)智能體（Lv3-Agent）提出原始問(wèn)題。

2. 當(dāng)三級(jí)智能體無(wú)法根據(jù)其現(xiàn)有記憶回答問(wèn)題時(shí)，執(zhí)行以下步驟：

a. 三級(jí)智能體生成一個(gè)新的子問(wèn)題。

b. 三級(jí)智能體將這個(gè)子問(wèn)題提交給二級(jí)智能體（Lv2-Agent）。

c. 將二級(jí)智能體的回答整合到三級(jí)智能體的記憶庫(kù)中。

3. 重復(fù)上述過(guò)程，直到三級(jí)智能體能夠回答原始問(wèn)題。

4. 最終，三級(jí)智能體提供原始問(wèn)題的解答。

RAG 的盡頭是 Agent？ -AI.x社區(qū)

參考：https://mp.weixin.qq.com/s/nwPaNEJzY55GQmhe8Bgakw

本文轉(zhuǎn)載自公眾號(hào)玄姐聊AGI 作者：玄姐

原文鏈接：??https://mp.weixin.qq.com/s/ooRVobsyt9slhhbIpWltYg??

?著作權(quán)歸作者所有，如需轉(zhuǎn)載，請(qǐng)注明出處，否則將追究法律責(zé)任

標(biāo)簽

贊

收藏

回復(fù)

舉報(bào)

回復(fù)

相關(guān)推薦

大模型不是AI的盡頭，聯(lián)想楊元慶稱真正意義的AI PC應(yīng)該具備5大特征

liutao988 ? 2502瀏覽 ? 0回復(fù)
什么是AI Agent？

zhcs333 ? 4465瀏覽 ? 0回復(fù)
披上Agent盔甲的RAG，從此不再只是召回生成！

探索AGI ? 2150瀏覽 ? 0回復(fù)
一文講清什么是 AI Agent（智能體）？

wsp_ping ? 4826瀏覽 ? 0回復(fù)
用于復(fù)雜RAG任務(wù)的先進(jìn)可控Agent

PaperAgent ? 2336瀏覽 ? 0回復(fù)
【智匯金秋創(chuàng)造季】智匯成海，致敬開發(fā)者的“超級(jí)碼力”！

AI.x社區(qū)官方賬號(hào) ? 33.0w瀏覽 ? 148回復(fù)
基于Agent的金融問(wèn)答系統(tǒng)：RAG檢索模塊初建成

一起AI技術(shù) ? 2051瀏覽 ? 0回復(fù)
基于Agent的金融問(wèn)答系統(tǒng)：RAG的檢索增強(qiáng)之ElasticSearch

一起AI技術(shù) ? 2429瀏覽 ? 0回復(fù)
什么是AI Agent，以及怎么實(shí)現(xiàn)AI Agent?

AI探索時(shí)代 ? 2448瀏覽 ? 0回復(fù)
人工智能智能體(AI Agent)發(fā)展趨勢(shì)2024年總結(jié)與2025年展望

十一月雨_55 ? 8315瀏覽 ? 0回復(fù)
黃仁勛：AI Agent是個(gè)價(jià)值數(shù)萬(wàn)億美元的機(jī)會(huì)

云原生AI百寶箱 ? 1981瀏覽 ? 0回復(fù)
LLM之后，Agent的未來(lái)是RL！

探索AGI ? 2548瀏覽 ? 0回復(fù)
什么是檢索增強(qiáng)生成 (RAG)？

Halo咯咯 ? 1611瀏覽 ? 0回復(fù)
【萬(wàn)字長(zhǎng)文】深度剖析：RAG、AI Agent與Agentic RAG的融合發(fā)展|值得收藏

Halo咯咯 ? 3711瀏覽 ? 0回復(fù)
知識(shí)Agent檢索：讓RAG迸發(fā)智慧的五個(gè)架構(gòu)躍遷點(diǎn)

ermulong ? 1360瀏覽 ? 0回復(fù)
理解什么是AI Agent，看懂這篇就夠了

AIGC新知 ? 1782瀏覽 ? 0回復(fù)
MCP 全解析，手把手教你基于 MCP 開發(fā) Agent

玄姐聊AGI ? 8363瀏覽 ? 0回復(fù)
12張圖清晰總結(jié) MCP、RAG、Agent 架構(gòu)設(shè)計(jì)間的關(guān)系

玄姐聊AGI ? 1526瀏覽 ? 0回復(fù)
Hybrid-RRF：動(dòng)態(tài)權(quán)重混合檢索RAG方案

大語(yǔ)言模型論文跟蹤 ? 1849瀏覽 ? 0回復(fù)

這個(gè)用戶很懶，還沒有個(gè)人簡(jiǎn)介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

從 Local MCP Server 到 Remote MCP Server 架構(gòu)設(shè)計(jì)演進(jìn) 17h前發(fā)布
Spring AI 1.0.0 發(fā)布！支持 MCP 很炸裂！! 17h前發(fā)布

熱門推薦

王炸！MCP 架構(gòu)設(shè)計(jì)深度剖析 & 使用 Spring AI + MCP 四步教你實(shí)現(xiàn) Agent 智能體開發(fā) 0回復(fù)

暴論：2025年，程序員必學(xué)技能就是 MCP 0回復(fù)

Java 開發(fā)必看！MCP Server 實(shí)戰(zhàn)全攻略，原來(lái)這么簡(jiǎn)單 0回復(fù)

11張圖全面總結(jié) MCP、A2A、Function Calling 架構(gòu)設(shè)計(jì)間關(guān)系 0回復(fù)

MCP 架構(gòu)設(shè)計(jì)演進(jìn)：從 Local MCP Server 到 Remote MCP Server 開源架構(gòu)設(shè)計(jì)實(shí)現(xiàn) 0回復(fù)

上一篇： RAG 開發(fā)四大痛點(diǎn)及解決方案

下一篇：一文徹底理解大模型 Agent 智能體原理和案例

社區(qū)精華內(nèi)容

目錄

<blockquote id="qokbb"><i id="qokbb"><video id="qokbb"></video></i></blockquote>