自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

一種模塊化大模型Agent框架全棧技術(shù)綜述 精華

發(fā)布于 2024-9-23 11:08
瀏覽
0收藏

現(xiàn)有基于LLM的智能體雖然在功能上取得了進展,但缺乏模塊化,導(dǎo)致在研究和開發(fā)中存在術(shù)語和架構(gòu)上的混淆,在軟件架構(gòu)上缺乏統(tǒng)一。

“A survey on LLM based autonomous agents”提出的框架,它并沒有明確指出大型語言模型(LLM)、工具、數(shù)據(jù)源和記憶是否是Agent的一部分。這種對每個模塊功能的模糊區(qū)分促進了軟件開發(fā)者之間的分裂,并導(dǎo)致不兼容和阻礙了可重用性

一種模塊化大模型Agent框架全棧技術(shù)綜述-AI.x社區(qū)

LLM-Agent-UMF框架通過明確區(qū)分智能體的不同組件,包括LLM、工具和新引入的核心智能體(core-agent),來解決這些問題。核心智能體是智能體的中央?yún)f(xié)調(diào)器,包含規(guī)劃、記憶、檔案、行動和安全五個模塊,其中安全模塊在以往的研究中常被忽視。

核心智能體作為基于大型語言模型(LLM)智能體的中心組成部分

一種模塊化大模型Agent框架全棧技術(shù)綜述-AI.x社區(qū)

核心智能體(core-agent)的內(nèi)部結(jié)構(gòu)

核心智能體(core-agent)是LLM-Agent-UMF框架的關(guān)鍵組成部分。核心智能體被設(shè)計為智能體的中央?yún)f(xié)調(diào)器,負責管理和協(xié)調(diào)智能體的各種功能和組件。內(nèi)部結(jié)構(gòu)被劃分為五個主要模塊,每個模塊都有其特定的功能和責任:

核心智能體的內(nèi)部結(jié)構(gòu)

一種模塊化大模型Agent框架全棧技術(shù)綜述-AI.x社區(qū)

  1. 規(guī)劃模塊(Planning Module):
  • 規(guī)劃模塊是核心智能體的關(guān)鍵組成部分,負責將復(fù)雜的任務(wù)分解成可執(zhí)行的步驟,并生成有效的行動計劃:
  • 規(guī)劃過程(Planning Process):
  • 任務(wù)分解(Task Decomposition):將復(fù)雜任務(wù)分解為更簡單的子任務(wù),建立中間目標的層次結(jié)構(gòu)。
  • 計劃生成(Plan Generation):為每個子任務(wù)制定具體計劃,包括所需工具和參與方。
  • 規(guī)劃策略(Planning Strategies):
  • 單路徑策略(Single-path Strategy):生成單一路徑或程序序列來實現(xiàn)目標,不探索替代方案。
  • 多路徑策略(Multi-path Strategy):生成多個計劃,評估并選擇最合適的路徑。
  • 規(guī)劃技術(shù)(Planning Techniques):
  • 基于規(guī)則的技術(shù)(Rule-based Technique):使用符號規(guī)劃器和PDDL等正式推理方法。
  • 語言模型驅(qū)動的技術(shù)(Language Model Powered Technique):利用LLM的知識和推理能力來制定規(guī)劃策略。
  • 反饋源(Feedback Sources):
  • 人類反饋(Human Feedback):來自核心智能體與人類的直接互動,用于調(diào)整規(guī)劃以符合人類價值觀和偏好。
  • 工具反饋(Tool Feedback):來自核心智能體使用的內(nèi)部或外部工具的反饋,用于優(yōu)化工具選擇和使用策略。
  • 同級核心智能體反饋(Sibling Core-Agent Feedback):來自同一系統(tǒng)內(nèi)不同核心智能體之間的互動和信息交換。
  1. 記憶模塊(Memory Module):
  • 負責存儲和檢索與核心智能體活動相關(guān)的信息,以提高決策效率和任務(wù)執(zhí)行能力。
  • 記憶結(jié)構(gòu)分為短期記憶和長期記憶,分別對應(yīng)不同的信息存儲和檢索需求。
  • 記憶位置包括嵌入式記憶(核心智能體內(nèi))和記憶擴展(核心智能體外,但在智能體系統(tǒng)內(nèi))。
  • 記憶格式可以是自然語言、嵌入向量、SQL數(shù)據(jù)庫或結(jié)構(gòu)化列表。
  1. 檔案模塊(Profile Module):
  • 定義LLM的角色和行為,以適應(yīng)特定的用例和策略。
  • 包含多種方法,如手工制作上下文學(xué)習方法、LLM生成方法、數(shù)據(jù)集對齊方法和新引入的微調(diào)可插拔模塊方法。
  1. 行動模塊(Action Module):
  • 將智能體的決策轉(zhuǎn)化為具體行動,通過行動目標、行動產(chǎn)生、行動空間和行動影響四個視角來定義。
  • 行動產(chǎn)生方法包括通過記憶回憶、計劃遵循和API調(diào)用請求來執(zhí)行行動。
  1. 安全模塊(Security Module):
  • 監(jiān)控行動模塊,特別是在生產(chǎn)環(huán)境中,以確保LLM的安全和負責任的使用。
  • 遵循機密性、完整性、可用性(CIA)原則,確保信息和資源的安全。
  • 安全措施包括提示保護、響應(yīng)保護和數(shù)據(jù)隱私保護。

核心智能體(core-agent)的分類

對核心智能體進行了分類,區(qū)分為主動核心智能體(Active Core-Agents)被動核心智能體(Passive Core-Agents),以闡明它們在結(jié)構(gòu)和功能上的差異。

主動和被動核心智能體的內(nèi)部結(jié)構(gòu)

一種模塊化大模型Agent框架全棧技術(shù)綜述-AI.x社區(qū)

一種模塊化大模型Agent框架全棧技術(shù)綜述-AI.x社區(qū)


主動核心智能體(Active Core-Agents):

  • 包含規(guī)劃、記憶、檔案、行動和安全五個模塊。
  • 負責協(xié)調(diào)和管理智能體的其他組件,需要規(guī)劃模塊來分解任務(wù)、提供上下文、分析信息和做決策。
  • 具有狀態(tài)性(stateful),能夠維護關(guān)于其過去交互和狀態(tài)的信息。
  • 能夠控制LLM的行為和檔案,具有動態(tài)適應(yīng)不同任務(wù)的能力。
  • 在多核心智能體系統(tǒng)中,可能需要復(fù)雜的同步機制。

多主動核心智能體架構(gòu)

一種模塊化大模型Agent框架全棧技術(shù)綜述-AI.x社區(qū)


被動核心智能體(Passive Core-Agents):

  • 主要負責執(zhí)行特定程序,通常不包含規(guī)劃和記憶模塊。
  • 通常是無狀態(tài)的(stateless),只處理當前任務(wù)的狀態(tài)。
  • 行動模塊是其核心,根據(jù)外部指令(如LLM或主動核心智能體的指令)執(zhí)行操作。
  • 與人類的互動通常是單向的,只能由被動核心智能體發(fā)起。
  • 在多核心智能體系統(tǒng)中,集成新的核心智能體相對簡單,因為它們主要執(zhí)行特定的、有限的任務(wù)。

包括被動核心智能體的基于大型語言模型(LLM)的智能體架構(gòu)

一種模塊化大模型Agent框架全棧技術(shù)綜述-AI.x社區(qū)

多被動核心智能體架構(gòu)


一種模塊化大模型Agent框架全棧技術(shù)綜述-AI.x社區(qū)

混合多核心智能體(Hybrid Multi-Core Agent)架構(gòu),

  • 這是一種結(jié)合了主動核心智能體(Active Core-Agents)和被動核心智能體(Passive Core-Agents)的智能體設(shè)計。
  • 利用主動核心智能體的管理和協(xié)調(diào)能力,以及被動核心智能體的執(zhí)行特定任務(wù)的能力。
  • 在保持系統(tǒng)靈活性和可擴展性的同時,處理更廣泛的任務(wù)。

一主動多被動核心智能體混合架構(gòu)

一種模塊化大模型Agent框架全棧技術(shù)綜述-AI.x社區(qū)

多主動多被動核心智能體混合架構(gòu)

一種模塊化大模型Agent框架全棧技術(shù)綜述-AI.x社區(qū)

核心智能體(core-agent)的有效性


  • 驗證LLM-Agent-UMF框架在設(shè)計和改進多核心智能體系統(tǒng)中的應(yīng)用價值。
  • 展示如何通過合并不同智能體的特性來創(chuàng)建具有增強功能的新型智能體。
  • 通過將LLM-Agent-UMF框架應(yīng)用于現(xiàn)有的智能體,如Toolformer、Confucius、ToolLLM和ChatDB,來識別和分類這些智能體中的核心智能體及其模塊。

使用LLM-Agent-UMF對最新智能體進行分類。

一種模塊化大模型Agent框架全棧技術(shù)綜述-AI.x社區(qū)

Toolformer和Confucius的多被動核心智能體系統(tǒng):結(jié)合了Toolformer和Confucius的被動核心智能體,以處理特定的工具調(diào)用和任務(wù)執(zhí)行。

基于大型語言模型的智能體1(LA1):Toolformer和Confucius - 多被動核心智能體架構(gòu)。

一種模塊化大模型Agent框架全棧技術(shù)綜述-AI.x社區(qū)

ToolLLM和ChatDB的多主動核心智能體系統(tǒng):將ToolLLM的API檢索能力和ChatDB的復(fù)雜推理能力結(jié)合起來,創(chuàng)建了一個能夠執(zhí)行高級任務(wù)規(guī)劃和執(zhí)行的智能體。


基于大型語言模型的智能體2-A(LA2-A):ToolLLM和ChatDB - 多主動核心智能體架構(gòu)。

一種模塊化大模型Agent框架全棧技術(shù)綜述-AI.x社區(qū)


https://arxiv.org/pdf/2409.11393
LLM-AGENT-UMF: LLM-BASED AGENT UNIFIED MODELING FRAMEWORK FOR SEAMLESS INTEGRATION OF M

本文轉(zhuǎn)載自??PaperAgent??

收藏
回復(fù)
舉報
回復(fù)
相關(guān)推薦