自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

一篇大模型Agent最新綜述

發(fā)布于 2024-9-24 14:54
瀏覽
0收藏

嘿,大家好!這里是一個專注于AI智能體的頻道~

最近這2篇綜述有點撞車了,不是純正的Agent綜述,可以了解一下最新的應(yīng)用測的Agent發(fā)展情況!

一篇大模型Agent最新綜述-AI.x社區(qū)

現(xiàn)實中的Agent系統(tǒng)會面臨很多的挑戰(zhàn),常見的有以下幾點:

  • 感知模塊的探索不足:當(dāng)前研究中對LLM-based Agent的感知模塊探索不夠,尤其是在處理代碼這類特殊文本輸入時,缺乏對樹/圖結(jié)構(gòu)等高級輸入模式的研究。
  • 角色扮演能力的需求:Agent常常需要在不同任務(wù)中扮演多種角色,如代碼生成器、測試員等,這對Agent的多角色處理能力提出了挑戰(zhàn)。
  • 知識檢索基礎(chǔ)的缺乏:很多場景,缺乏一個權(quán)威且公認(rèn)的、包含豐富相關(guān)知識的外部檢索庫
  • 幻覺問題:如生成不存在的API或錯誤的代碼,這影響了Agent的整體性能。
  • 效率問題:在多Agent協(xié)作中,計算資源的需求和通信開銷可能會影響協(xié)作的效率和實時性。

一個Agent應(yīng)用框架主要由三個主要的部分:感知、記憶和行動。

一篇大模型Agent最新綜述-AI.x社區(qū)

  • 感知部分就像是機器人的眼睛和耳朵。它用來接收來自外部世界的各種信息,比如文字、圖片或者聲音,然后把這些信息轉(zhuǎn)換成機器人能理解的形式。
  • 行動部分就像是機器人的手腳和大腦。它根據(jù)接收到的信息做出決策,就像是我們根據(jù)看到和聽到的東西來決定怎么做一樣。同時,機器人還可以根據(jù)和外部世界互動得到的反饋來調(diào)整和改進自己的決策。
  • 記憶部分則像是機器人的記憶庫,它保存了各種各樣的知識和經(jīng)驗。這些記憶幫助機器人更好地理解信息和做出決策。記憶部分還可以通過學(xué)習(xí)來更新,讓機器人在未來能做得更好。
  • 最后,多Agent協(xié)作。像是一群機器人一起工作,每個機器人都有自己的任務(wù),但它們通過合作來完成更復(fù)雜的工作。

一篇大模型Agent最新綜述-AI.x社區(qū)

感知可以處理多種模態(tài)的輸入,包括文本、視覺(如圖像)和聽覺(如聲音)輸入。

其中文本輸入可以進一步細(xì)分為基于token的輸入、基于tree/graph的輸入和混合輸入。這些不同的輸入形式分別關(guān)注代碼的不同特征,例如語義、結(jié)構(gòu)等。

當(dāng)然無論是文本、視覺還是聽覺輸入,感知模塊最終都要將接收到的信息轉(zhuǎn)換成適合LLM處理的嵌入格式,為后續(xù)的推理和決策制定奠定基礎(chǔ)。

記憶模塊負(fù)責(zé)存儲能夠幫助LLM進行有效推理決策的信息。它包括語義記憶、情景記憶和程序記憶三種類型。

  • 語義記憶通常存在于外部知識庫中,如文檔、庫、API信息等;
  • 情景記憶記錄了與當(dāng)前任務(wù)相關(guān)的特定情景或經(jīng)驗信息。例如,它可以包括歷史消息、代碼庫中檢索到的相關(guān)代碼;
  • 程序記憶包含了存儲在LLM權(quán)重中的隱性知識和在Agent代碼中明確寫出的顯性知識。

記憶模塊是Agent的大腦,它保存了所有重要的信息和經(jīng)驗,幫助Agent更好地理解問題和做出決策。

一篇大模型Agent最新綜述-AI.x社區(qū)

重頭戲,Action。行動模塊包括內(nèi)部行動和外部行動,它們根據(jù)LLM的輸入做出推理決策,并根據(jù)與外部環(huán)境互動獲得的反饋來優(yōu)化這些決策。

內(nèi)部行動,涉及Agent的思考過程,包括推理、檢索和學(xué)習(xí)。

其中推理部分,可以概括為3種形式

一篇大模型Agent最新綜述-AI.x社區(qū)

  • 基于思維鏈推理(Chain-of-Thought, CoT):通過逐步展開思考過程,幫助LLM深入理解問題,分解復(fù)雜任務(wù),并生成高質(zhì)量的答案。
  • 結(jié)構(gòu)化推理(Structured CoT):將推理過程以類似偽代碼的形式呈現(xiàn),涉及循環(huán)、分支等結(jié)構(gòu)。這種方式特別適合于代碼生成,因為它可以利用源代碼的豐富結(jié)構(gòu)信息。
  • 其他推理形式:包括頭腦風(fēng)暴和樹形推理等,這些方法通過生成相關(guān)關(guān)鍵詞或動態(tài)探索和更新推理過程來輔助問題解決。

其中檢索部分,為了輔助推理和決策過程,從內(nèi)部或外部的知識庫中檢索相關(guān)信息。這包括查找文檔、代碼片段、API信息等,以支持當(dāng)前的任務(wù)。根據(jù)召回內(nèi)容不同,可以概括為以下幾個類別:

一篇大模型Agent最新綜述-AI.x社區(qū)

召回分為密集Dense的語義搜索,稀疏Sparse的關(guān)鍵詞搜索:

一篇大模型Agent最新綜述-AI.x社區(qū)

learning Action部分,是LLM-based Agent持續(xù)進步和適應(yīng)新挑戰(zhàn)的關(guān)鍵。通過有效的學(xué)習(xí)機制,系統(tǒng)能夠不斷進化。一般包括從經(jīng)驗中學(xué)習(xí)、優(yōu)化內(nèi)部模型和調(diào)整策略,以更好地完成未來的任務(wù)。

  • 更新語義記憶:這可能包括新的API知識、編程語言的語法變化或新的算法。
  • 更新程序記憶:通常涉及到模型的微調(diào)或持續(xù)學(xué)習(xí)。
  • 優(yōu)化Agent代碼:可能會根據(jù)學(xué)習(xí)到的知識來優(yōu)化其執(zhí)行代碼,以提高效率和性能。

最后是External Action部分,它使得Agent能夠主動地與外部世界進行交互,完成任務(wù),并根據(jù)外部反饋進行自我優(yōu)化。如:通過與人或其他Agent交互,以獲取任務(wù)需求、澄清問題或報告結(jié)果;與各種數(shù)字工具和平臺(如API服務(wù))進行交互,以執(zhí)行任務(wù)或驗證結(jié)果。

本文轉(zhuǎn)載自?? 探索AGI??,作者: 獼猴桃

標(biāo)簽
收藏
回復(fù)
舉報
回復(fù)
相關(guān)推薦