自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<p id="ctnef"></p>

<cite id="ctnef"><track id="ctnef"></track></cite>

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問(wèn)答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

AI.x社區(qū)

登錄/注冊(cè)
51CTO

中國(guó)優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺(tái)

51CTO學(xué)堂

IT職業(yè)在線教育平臺(tái)

披上Agent盔甲的RAG，從此不再只是召回生成！精華

發(fā)布于 2024-8-22 13:19

瀏覽

0收藏

嘿，大家好！這里是一個(gè)專注于AI智能體的頻道！

今天我要和大家聊聊一些實(shí)戰(zhàn)相關(guān)的內(nèi)容。大模型在實(shí)際的工業(yè)場(chǎng)景下最常見(jiàn)的2個(gè)場(chǎng)景分別為應(yīng)用助手（copilot）, 文檔/知識(shí)庫(kù)問(wèn)答（RAG）。事實(shí)上后者也逐漸在往更復(fù)雜的Agentic方向發(fā)展了，今天我們來(lái)看以下如何搭建一個(gè)可控的RAG Agent。

RAG Agent核心是它的“大腦”，一個(gè)復(fù)雜的確定性圖，它能讓AI進(jìn)行復(fù)雜的推理。而且，這個(gè)系統(tǒng)一般還能防止“幻覺(jué)”。確保所有答案都基于提供的數(shù)據(jù)，而不是憑空想象。

那我們要完成的這個(gè)系統(tǒng)需要具備哪些方面的能力呢？

可控自主，能夠回答自定義數(shù)據(jù)集中的重要問(wèn)題。
充當(dāng)系統(tǒng)的“大腦”agent ，能實(shí)現(xiàn)復(fù)雜的推理。
幻覺(jué)低，確保答案僅基于提供的數(shù)據(jù)，避免人工智能幻覺(jué)。
多步驟推理，將復(fù)雜的用戶查詢分解為可管理的子任務(wù)。
適應(yīng)性規(guī)劃，根據(jù)新信息不斷更新其計(jì)劃。

大體的框架圖如下：

披上Agent盔甲的RAG，從此不再只是召回生成！-AI.x社區(qū)

它是怎么工作的呢？簡(jiǎn)單來(lái)說(shuō)，就是先把PDF文檔加載進(jìn)來(lái)，然后進(jìn)行文本預(yù)處理，生成每個(gè)章節(jié)的摘要，再把這些內(nèi)容編碼到向量庫(kù)中。當(dāng)有人問(wèn)問(wèn)題時(shí)，AI會(huì)先對(duì)問(wèn)題脫敏，生成一個(gè)規(guī)劃，然后再根據(jù)這個(gè)規(guī)劃進(jìn)行細(xì)化出執(zhí)行任務(wù)，最后生成最終答案。詳細(xì)步驟如下：

S1：構(gòu)建adavanced RAG

數(shù)據(jù)準(zhǔn)備，召回的retriever，可以理解為給文檔建立出索引，用戶后續(xù)的召回。當(dāng)然在S1的搭建高級(jí)RAG中，我們只需要分段的即可。

披上Agent盔甲的RAG，從此不再只是召回生成！-AI.x社區(qū)

接下來(lái)，可以構(gòu)建標(biāo)準(zhǔn)的adavanced RAG的流程，召回塊 -> 保留與query相關(guān)的塊 -> 根據(jù)是否相關(guān)來(lái)決定是否需要改寫 -> 答案如果可用則結(jié)束了（這里的很多函數(shù)都可以在langgraph的官方examples中找到）

披上Agent盔甲的RAG，從此不再只是召回生成！-AI.x社區(qū)

披上Agent盔甲的RAG，從此不再只是召回生成！-AI.x社區(qū)

S2：從adavanced RAG 到 Agent

對(duì)于更復(fù)雜的任務(wù)，僅通過(guò)基于語(yǔ)義相似性檢索信息無(wú)法回答問(wèn)題，需要更復(fù)雜的pipeline。為了實(shí)現(xiàn)這一目標(biāo)，我們先忘記adavanced rag的流程。我們需要定義出Agent的工具，一般RAG的tool就是S1中的retriever（召回）。（為了更復(fù)雜一些，我們?cè)赟1數(shù)據(jù)準(zhǔn)備中，準(zhǔn)備了3個(gè)retriever（文檔塊、摘要、引用）單獨(dú)作為不同的tool）

披上Agent盔甲的RAG，從此不再只是召回生成！-AI.x社區(qū)

可以得到3個(gè)子圖：

披上Agent盔甲的RAG，從此不再只是召回生成！-AI.x社區(qū)

有了工具，那接下來(lái)就是Agent的核心，planning部分了。

計(jì)劃制定

首先需要制定計(jì)劃->計(jì)劃細(xì)化到工具上。

制定計(jì)劃

計(jì)劃細(xì)化

示例：

question = {"question": "主人公是如何打敗反派的？"}
my_plan = planner.invoke(question) # Generate a plan to answer the question
print(my_plan)
refined_plan = break_down_plan_chain.invoke(my_plan.steps) # Refine the plan
print(refined_plan)

#### output
steps1 = [
    '識(shí)別故事中的主人公和反派。',
    '找到主人公和反派之間的高潮或最終對(duì)決。',
    '分析主人公在這次對(duì)決中采取的行動(dòng)。',
    '確定導(dǎo)致反派失敗的具體行動(dòng)或策略。',
    '總結(jié)發(fā)現(xiàn)，回答主人公是如何打敗反派的。'
]

steps2 = [
    '通過(guò)從書籍塊的向量存儲(chǔ)、章節(jié)摘要或書籍引用中檢索相關(guān)信息來(lái)識(shí)別故事中的主人公和反派。',
    '通過(guò)從書籍塊的向量存儲(chǔ)、章節(jié)摘要或書籍引用中檢索相關(guān)信息來(lái)定位主人公和反派之間的高潮或最終對(duì)決。',
    '通過(guò)從書籍塊的向量存儲(chǔ)、章節(jié)摘要或書籍引用中檢索相關(guān)信息來(lái)分析主人公在這次對(duì)決中采取的行動(dòng)。',
    '通過(guò)從書籍塊的向量存儲(chǔ)、章節(jié)摘要或書籍引用中檢索相關(guān)信息來(lái)確定導(dǎo)致反派失敗的具體行動(dòng)或策略。',
    '通過(guò)根據(jù)給定上下文回答問(wèn)題來(lái)總結(jié)發(fā)現(xiàn)，回答主人公是如何打敗反派的。'
]

計(jì)劃更新

給定原始問(wèn)題、當(dāng)前計(jì)劃、過(guò)去的步驟以及迄今為止匯總的信息，更新計(jì)劃（這個(gè)類似于一個(gè)迭代用到的，一次計(jì)劃無(wú)法完成任務(wù)，通過(guò)多次收集信息迭代）

披上Agent盔甲的RAG，從此不再只是召回生成！-AI.x社區(qū)

任務(wù)處理

定義任務(wù)處理程序 - 決定是使用哪個(gè)工具來(lái)處理計(jì)劃中的每個(gè)任務(wù)

披上Agent盔甲的RAG，從此不再只是召回生成！-AI.x社區(qū)

問(wèn)題脫敏

脫敏

為了生成一個(gè)總體計(jì)劃，不帶任何基于任何先驗(yàn)知識(shí)的偏見(jiàn)LLM，我們首先對(duì)輸入問(wèn)題進(jìn)行匿名化，并將名稱實(shí)體映射到變量中

披上Agent盔甲的RAG，從此不再只是召回生成！-AI.x社區(qū)

還原

披上Agent盔甲的RAG，從此不再只是召回生成！-AI.x社區(qū)

上面的串聯(lián)起來(lái)：

# 用戶問(wèn)題
state1 = {'question': "how did the harry beat quirrell? \n"} 
print(f'question: {state1["question"]}')

# 脫敏
anonymized_question_output = anonymize_question_chain.invoke(state1) 

## 脫敏后的問(wèn)題和脫敏字段
anonymized_question = anonymized_question_output["anonymized_question"]
mapping = anonymized_question_output["mapping"] 


print(f'anonimized_querry: {anonymized_question} \n')
print(f'mapping: {mapping} \n')

# 制定計(jì)劃
plan = planner.invoke({"question": anonymized_question})
print(text_wrap(f'plan: {plan.steps}'))
print("")

# 計(jì)劃的脫敏信息還原
deanonimzed_plan = de_anonymize_plan_chain.invoke({"plan": plan.steps, "mapping": mapping})

## 還原后的計(jì)劃
print(text_wrap(f'deanonimized_plan: {deanonimzed_plan.plan}'))


# output
question：harry是如何打敗Quirrell的？

anonimized_querry：X是如何打敗Y的？

mapping：{'X': 'harry', 'Y': 'Quirrell'}

plan：[
    '確定查詢的上下文或領(lǐng)域（例如，體育、競(jìng)賽、游戲等）。',
    '收集X和Y參加的事件或競(jìng)賽的信息。',
    '找到X與Y競(jìng)爭(zhēng)的特定實(shí)例或比賽。',
    '查找那個(gè)特定實(shí)例或比賽的結(jié)果。',
    '分析比賽的細(xì)節(jié)，以了解X是如何設(shè)法打敗Y的。',
    '總結(jié)解釋X如何打敗Y的關(guān)鍵點(diǎn)。'
]

deanonimized_plan：[
    '確定查詢的上下文或領(lǐng)域（例如，體育、競(jìng)賽、游戲等）。',
    '收集harry和Quirrell參加的事件或競(jìng)賽的信息。',
    '找到harry與Quirrell競(jìng)爭(zhēng)的特定實(shí)例或比賽。',
    '查找那個(gè)特定實(shí)例或比賽的結(jié)果。',
    '分析比賽的細(xì)節(jié)，以了解harry是如何設(shè)法打敗Quirrell的。',
    '總結(jié)解釋harry如何打敗Quirrell的關(guān)鍵點(diǎn)。'
]

最后在加一個(gè)判斷，確定是否能根據(jù)信息推出答案。

披上Agent盔甲的RAG，從此不再只是召回生成！-AI.x社區(qū)

整體的流程圖如下：

披上Agent盔甲的RAG，從此不再只是召回生成！-AI.x社區(qū)

披上Agent盔甲的RAG，從此不再只是召回生成！-AI.x社區(qū)

本文轉(zhuǎn)載自 ??探索AGI??，作者：獼猴桃

標(biāo)簽

贊

收藏

回復(fù)

舉報(bào)

回復(fù)

相關(guān)推薦

北大字節(jié)開辟圖像生成新范式！超越Sora核心組件DiT，不再預(yù)測(cè)下一個(gè)token

Crystalcxt ? 2426瀏覽 ? 0回復(fù)
RAG 的盡頭是 Agent？

玄姐聊AGI ? 2248瀏覽 ? 0回復(fù)
用于復(fù)雜RAG任務(wù)的先進(jìn)可控Agent

PaperAgent ? 2333瀏覽 ? 0回復(fù)
【智匯金秋創(chuàng)造季】智匯成海，致敬開發(fā)者的“超級(jí)碼力”！

AI.x社區(qū)官方賬號(hào) ? 33.0w瀏覽 ? 148回復(fù)
基于Agent的金融問(wèn)答系統(tǒng)：RAG的檢索增強(qiáng)之ElasticSearch

一起AI技術(shù) ? 2424瀏覽 ? 0回復(fù)
怎么提升向量數(shù)據(jù)庫(kù)的召回準(zhǔn)確率

AI探索時(shí)代 ? 2253瀏覽 ? 0回復(fù)
編程不再是專業(yè)技能！Replit「Agent」引爆編程革命，零基礎(chǔ)也能輕松上手

duhorse ? 1500瀏覽 ? 0回復(fù)
DeepSeek 在微信上的 4 個(gè)入口，快來(lái)試試，從此遠(yuǎn)離“系統(tǒng)繁忙”！

wsp_ping ? 1868瀏覽 ? 0回復(fù)
Agent只是手段，工作流才是內(nèi)容！

51CTO技術(shù)棧 ? 1678瀏覽 ? 0回復(fù)
不再混淆了！一文揭秘MCP Server、Function Call與Agent的核心區(qū)別

九歌AI大模型 ? 5750瀏覽 ? 0回復(fù)
【萬(wàn)字長(zhǎng)文】深度剖析：RAG、AI Agent與Agentic RAG的融合發(fā)展|值得收藏

Halo咯咯 ? 3711瀏覽 ? 0回復(fù)
知識(shí)Agent檢索：讓RAG迸發(fā)智慧的五個(gè)架構(gòu)躍遷點(diǎn)

ermulong ? 1360瀏覽 ? 0回復(fù)
基于LangGraph的智能文章生成Agent架構(gòu)設(shè)計(jì)思路

九歌AI大模型 ? 1615瀏覽 ? 0回復(fù)
PromptPro：AI提示詞管理神器，從此告別雜亂無(wú)章！

Halo咯咯 ? 2238瀏覽 ? 0回復(fù)
不再只是建議：Augment Agent 想成為真正幫你干活的 AI 開發(fā)伙伴！

墨風(fēng)如雪小站 ? 1905瀏覽 ? 0回復(fù)
12張圖清晰總結(jié) MCP、RAG、Agent 架構(gòu)設(shè)計(jì)間的關(guān)系

玄姐聊AGI ? 1526瀏覽 ? 0回復(fù)
AI 從此能“看圖思考”？

AI博物院 ? 626瀏覽 ? 0回復(fù)
Hybrid-RRF：動(dòng)態(tài)權(quán)重混合檢索RAG方案

大語(yǔ)言模型論文跟蹤 ? 1841瀏覽 ? 0回復(fù)
關(guān)于RAG應(yīng)用中怎么高質(zhì)量的進(jìn)行數(shù)據(jù)召回——召回策略的研究

AI探索時(shí)代 ? 156瀏覽 ? 0回復(fù)

這個(gè)用戶很懶，還沒(méi)有個(gè)人簡(jiǎn)介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

Anthropic開源Agentic Coding最佳實(shí)踐！ 8天前發(fā)布
英偉達(dá)押注Agent新基建！AI專屬搜索引擎問(wèn)世 2025-04-10 06:40:23發(fā)布

熱門推薦

大半精銳盡出！o1下線！滿血o3之后，模型本身就是Manus，最大賣點(diǎn)：替代人干真活！ 1回復(fù)

王炸！MCP 架構(gòu)設(shè)計(jì)深度剖析 & 使用 Spring AI + MCP 四步教你實(shí)現(xiàn) Agent 智能體開發(fā) 0回復(fù)

Dify從入門到高階系列二：手把手教學(xué)！超詳細(xì)的Dify知識(shí)庫(kù)配置全攻略 0回復(fù)

Crawl4AI：GitHub榜首40K星標(biāo)！LLM專屬極速開源爬蟲神器 0回復(fù)

只需5分鐘，教你用Python搭建MCP Server 0回復(fù)

上一篇： Multi-Meta-RAG：langchain點(diǎn)名，評(píng)論爆吹的新研究

下一篇：長(zhǎng)上下文還是 RAG？ Google:我全都要！

社區(qū)精華內(nèi)容

目錄

<thead id="shkgb"></thead>

<p id="shkgb"></p>

^{<sub id="shkgb"></sub>}<sub id="shkgb"><i id="shkgb"></i></sub>

<style id="shkgb"></style>