自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認證廠商認證 IT技術(shù)PMP項目管理免費題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺

51CTO學(xué)堂

IT職業(yè)在線教育平臺

Agent planning大揭秘：記憶增強規(guī)劃能力！

發(fā)布于 2024-8-7 14:37

瀏覽

0收藏

如何讓LLM在規(guī)劃能力上變得更聰明，想象一下，如果我們的AI助手能夠記住過去的經(jīng)歷，并且在需要的時候能夠回憶起來，那會是多么方便的事情啊！

首先，我們要明白，對于AI來說，記憶是提升規(guī)劃能力的關(guān)鍵。目前，有兩種主要的方法可以通過記憶來增強LLM-Agents的規(guī)劃能力：基于RAG的記憶和參數(shù)記憶。

Agent planning大揭秘：記憶增強規(guī)劃能力！-AI.x社區(qū)

RAG，也就是檢索增強生成，它能夠用檢索到的信息來增強LLM的最新知識。想象一下，如果AI能夠把過去的經(jīng)驗存儲在記憶中，并在需要的時候檢索出來，那會是多么棒的事情！這些記憶通常以文本、表格形式或知識圖譜等形式存儲。例如，有的系統(tǒng)會把每天的人類行為經(jīng)驗以文本形式存儲起來，然后基于當(dāng)前情況的相關(guān)性和新鮮度來檢索記憶。還有的系統(tǒng)會使用向量編碼模型將每個記憶編碼成向量，并建立索引結(jié)構(gòu)，以便在檢索時快速找到相關(guān)信息。下面這些工作都歸屬于這個范疇，后面我們可能會詳細去分享具體內(nèi)容。

Generative Agents：這項工作存儲了類似于人類的日常經(jīng)驗，并根據(jù)當(dāng)前情況的相關(guān)性和新鮮度來檢索記憶。這些記憶以文本形式存儲，并且可以根據(jù)與當(dāng)前任務(wù)的相關(guān)性進行檢索。
MemoryBank、TiM 和 RecMind：這些方法將每個記憶編碼成向量，并使用索引結(jié)構(gòu)（如FAISS庫）來組織這些向量。在檢索時，使用當(dāng)前狀態(tài)的描述作為查詢來檢索記憶池中的記憶。這些方法的區(qū)別在于它們更新記憶的方式不同。
MemGPT：這項工作借鑒了計算機架構(gòu)中的多級存儲概念，將LLM的上下文視為RAM，并將額外的存儲結(jié)構(gòu)視為磁盤。LLM可以自主決定是檢索歷史記憶還是將當(dāng)前上下文保存到存儲中。
REMEMBER：這個方法將歷史記憶以Q值表的形式存儲，每個記錄是一個包含環(huán)境、任務(wù)、動作和Q值的元組。在檢索時，會同時檢索正面和負面記憶，以便LLM根據(jù)環(huán)境和任務(wù)的相似性生成計劃。

Agent planning大揭秘：記憶增強規(guī)劃能力！-AI.x社區(qū)

另一方面，參數(shù)記憶可以通過微調(diào)LLM，將Agent的歷史經(jīng)驗樣本嵌入到模型參數(shù)中。這些經(jīng)驗樣本通常來自Agent與環(huán)境的交互，可能包括關(guān)于環(huán)境的常識知識、與任務(wù)相關(guān)的先驗知識，以及成功或失敗的經(jīng)驗。雖然微調(diào)一個大參數(shù)的模型成本很高，但通過PEFT，可以通過只訓(xùn)練一小部分參數(shù)來降低成本并加快速度。

Agent planning大揭秘：記憶增強規(guī)劃能力！-AI.x社區(qū)

但是，這兩種方法都有各自的優(yōu)勢和局限性?；赗AG的方法提供了實時、低成本的外部記憶更新，主要在自然語言文本中，但依賴于檢索算法的準確性。而微調(diào)則通過參數(shù)修改提供了更大的記憶容量，但記憶更新成本高，并且在保留細節(jié)方面存在挑戰(zhàn)。

最后，我們還需要考慮如何生成記憶。記憶增強的LLM-Agents在規(guī)劃中表現(xiàn)出更強的生長潛力和容錯能力，但記憶的生成嚴重依賴于LLM的生成能力。如何通過自生成的記憶來提升較弱的LLM-Agents，仍然是一個值得探索的挑戰(zhàn)領(lǐng)域。

本文轉(zhuǎn)載自 ??探索AGI??，作者：獼猴桃

標簽

贊

收藏

回復(fù)

舉報

回復(fù)

相關(guān)推薦

騰訊揭秘：Agent數(shù)量越多，大語言模型效果越好

laokugonggao ? 2172瀏覽 ? 0回復(fù)
簡單卻有效的Agent推理框架：通過預(yù)測未來大幅提升智能體的規(guī)劃能力

zhangyannni ? 3905瀏覽 ? 0回復(fù)
ODA：通過全局觀察增強大模型集成知識圖譜推理能力的新型Agent框架

PaperAgent ? 3108瀏覽 ? 0回復(fù)
如何使用HippoRAG增強LLM的記憶

51CTO內(nèi)容精選 ? 3517瀏覽 ? 0回復(fù)
AI Agent的未來在哪里？LangChain CEO探討記憶、工具與自主規(guī)劃的完美融合

探索AGI ? 1989瀏覽 ? 0回復(fù)
Agent Planning大揭秘：輕松拿捏多計劃選擇！

探索AGI ? 2715瀏覽 ? 0回復(fù)
Agent planning終篇：打造更聰明的智能體！

探索AGI ? 2807瀏覽 ? 0回復(fù)
LLM+P：賦予大語言模型最佳機器人規(guī)劃能力

AIRoobt ? 2664瀏覽 ? 0回復(fù)
揭秘MemoRAG：AI記憶模塊如何提升生成質(zhì)量

Syrupup ? 2732瀏覽 ? 0回復(fù)
MemLong：用于長文本建模的記憶增強檢索

sbf_2000 ? 2308瀏覽 ? 0回復(fù)
被神化的o1模型，規(guī)劃能力到底如何？

大語言模型論文跟蹤 ? 2631瀏覽 ? 0回復(fù)
草莓OpenAI o1的規(guī)劃能力怎么樣？泰斗Subbarao Kambhampati給你答案！

AIGC最前線 ? 2372瀏覽 ? 0回復(fù)
Agent memory大揭秘：記憶從哪兒來？

探索AGI ? 3191瀏覽 ? 0回復(fù)
o1的規(guī)劃能力如何？LRM是未來嗎？

探索AGI ? 1758瀏覽 ? 0回復(fù)
大模型是能力強還是記憶強？一項發(fā)人深省的研究

芝士AI吃魚 ? 2381瀏覽 ? 0回復(fù)
大模型面經(jīng)：SFT和RL如何影響模型的泛化或記憶能力？

shizhi02 ? 1897瀏覽 ? 0回復(fù)
大語言模型：表面的推理能力背后是出色的規(guī)劃技巧

51CTO內(nèi)容精選 ? 1916瀏覽 ? 0回復(fù)
使AI Agent具有動態(tài)記憶，LangMem快速入門

小虎哦哦 ? 1742瀏覽 ? 0回復(fù)
Mem0 讓 AI 擁有超強記憶能力

丟翅膀的魚 ? 1062瀏覽 ? 0回復(fù)

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

Anthropic開源Agentic Coding最佳實踐！ 8天前發(fā)布
英偉達押注Agent新基建！AI專屬搜索引擎問世 2025-04-10 06:40:23發(fā)布

熱門推薦

大半精銳盡出！o1下線！滿血o3之后，模型本身就是Manus，最大賣點：替代人干真活！ 1回復(fù)

王炸！MCP 架構(gòu)設(shè)計深度剖析 & 使用 Spring AI + MCP 四步教你實現(xiàn) Agent 智能體開發(fā) 0回復(fù)

Dify從入門到高階系列二：手把手教學(xué)！超詳細的Dify知識庫配置全攻略 0回復(fù)

Crawl4AI：GitHub榜首40K星標！LLM專屬極速開源爬蟲神器 0回復(fù)

只需5分鐘，教你用Python搭建MCP Server 0回復(fù)

上一篇： Agent Planning大揭秘：輕松拿捏多計劃選擇！

下一篇： Agent planning終篇：打造更聰明的智能體！

社區(qū)精華內(nèi)容

目錄

<nobr id="7jc8t"><listing id="7jc8t"></listing></nobr>

<cite id="7jc8t"></cite>

<sub id="7jc8t"></sub>