自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓

鴻蒙開發(fā)者社區(qū)

WOT技術大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設置退出

264頁智能體綜述來了！MetaGPT等20家頂尖機構(gòu)、47位學者參與

作者：機器之心 2025-04-21 09:00:00

人工智能新聞

通讀整篇論文，讀者可以清晰地感受到作者構(gòu)建下一代通用智能體的雄心。

近期，大模型智能體（Agent）的相關話題爆火 —— 不論是 Anthropic 搶先 MCP 范式的快速普及，還是 OpenAI 推出的 Agents SDK 以及谷歌最新發(fā)布的 A2A 協(xié)議，都預示了 AI Agent 的巨大潛力。然而，目前的大部分 Agent 應用仍是 LLM 能力的簡單 “封裝” 或延伸，距離真正通用的智能實體尚有距離 —— 在面對復雜的真實世界時，Agent 往往會暴露出推理規(guī)劃、長期記憶、世界模型、自主進化以及安全對齊等核心能力不足的問題。

為了系統(tǒng)性地應對這些挑戰(zhàn)，以構(gòu)建真正具備通用能力的未來智能體，MetaGPT & Mila 聯(lián)合全球范圍內(nèi) 20 個頂尖研究機構(gòu)的 47 位學者，共同撰寫并發(fā)布了長篇綜述《Advances and Challenges in Foundation Agents: From Brain-Inspired Intelligence to Evolutionary, Collaborative, and Safe Systems》。

論文鏈接： https://arxiv.org/abs/2504.01990
Huggingface 鏈接：https://huggingface.co/papers/2504.01990
Github 鏈接：https://github.com/FoundationAgents/awesome-foundation-agents

目前該論文已蟬聯(lián) Hugging Face 的 Daily Paper 月榜第一名。

此研究匯聚了來自 MetaGPT、Montréal & Mila 人工智能研究所、南洋理工大學、美國阿貢國家實驗室、悉尼大學、賓夕法尼亞州立大學、微軟亞洲研究院、伊利諾伊大學厄巴納 - 香檳分校、香港科技大學、南加州大學、耶魯大學、斯坦福大學、佐治亞大學、俄亥俄州立大學、阿卜杜拉國王科技大學、杜克大學、香港理工大學、谷歌 DeepMind 以及加拿大高等研究院（CIFAR）等眾多研究者的集體智慧與前瞻思考。

當前 AI 研究與人類大腦的差異

在這篇論文中，作者們首次定義并提出了基礎智能體 (Foundation Agent) 這一新概念框架。Foundation Agent 并非具體的智能體實例，而是一個更宏大且更根本性的技術藍圖及科學理念。它旨在通過認知科學和神經(jīng)科學的洞見，構(gòu)建一個由復雜認知、多層記憶、世界模型、獎勵 & 價值、情緒 & 動機、多模感知、行動系統(tǒng)等模塊化組件構(gòu)成的智能系統(tǒng)。

基礎智能體（Foundation Agent）的定義

第一部分：智能體的核心組件 - 構(gòu)建認知基石

論文首先強調(diào)，一個強大的 Foundation Agent 必然是一個復雜的系統(tǒng)，由多個相互協(xié)作的核心組件構(gòu)成。這借鑒了認知科學和神經(jīng)科學中對大腦模塊化功能的理解。作者詳細闡述了七個關鍵組件，它們共同構(gòu)成了智能體的認知架構(gòu)：

Agent 框架（環(huán)境，循環(huán)與內(nèi)部結(jié)構(gòu)）

1. 認知核心 (Cognition Core)

這是智能體的 “大腦” 或 “中央處理器”，負責最高層次的決策、推理和規(guī)劃。與當前主要依賴 LLM 進行 “思考” 的智能體不同，F(xiàn)oundation Agent 的認知核心可能是一個更復雜的系統(tǒng)，集成了多種推理能力（如邏輯推理、因果推理、常識推理）和規(guī)劃算法（如任務分解、層級規(guī)劃、長期目標管理）。它需要能夠處理不確定性，進行反思和元認知（思考自己的思考過程），并根據(jù)環(huán)境反饋和內(nèi)部狀態(tài)動態(tài)調(diào)整策略。這要求認知核心不僅僅是模式匹配，更要具備深刻的理解和靈活的問題解決能力。

智能體的推理模式

2. 記憶系統(tǒng) (Memory System)

記憶是智能的基礎。當前的智能體往往只有有限的短期記憶（如 Prompt 中的上下文）或簡單的外部向量數(shù)據(jù)庫。Foundation Agent 則需要一個更復雜、更接近生物體的多層次記憶系統(tǒng)。論文探討了短期記憶、長期記憶與工作記憶等不同類型，包含情景記憶、語義記憶和程序記憶等細分領域。高效的記憶檢索、存儲、遺忘和泛化機制對于 Foundation Agent 至關重要。如何設計能夠支持持續(xù)學習、避免災難性遺忘，并能高效檢索相關信息的記憶系統(tǒng)，是一個核心挑戰(zhàn)。

記憶的生命周期

3. 世界模型 (World Model)

智能體需要理解其所處的環(huán)境以及自身行為可能產(chǎn)生的后果。世界模型正是對環(huán)境動態(tài)的內(nèi)部表征。它可以幫助智能體進行預測（如果我采取行動 A，會發(fā)生什么？）、規(guī)劃（為了達到目標 B，我應該采取什么行動序列？）和反事實推理（如果當初采取了不同的行動，結(jié)果會怎樣？）。一個強大的世界模型需要能夠處理物理規(guī)律、社會規(guī)范、其他智能體的行為等多方面信息，并且能夠根據(jù)新的觀測數(shù)據(jù)不斷更新和完善。構(gòu)建準確、高效且可泛化的世界模型是實現(xiàn)高級智能的關鍵一步。

世界模型的四種范式

4. 獎勵與價值系統(tǒng) (Reward and Value System)

智能體的行為需要有目標導向。獎勵系統(tǒng)負責評估智能體的行為表現(xiàn)，并提供學習信號。這不僅僅是簡單的標量獎勵，可能涉及到多目標優(yōu)化、內(nèi)在動機（如好奇心、探索欲）以及對未來價值的預估。價值系統(tǒng)則負責評估不同狀態(tài)或行動的長期價值，指導智能體的決策。如何設計能夠引導智能體學習復雜行為、符合人類價值觀，并且能夠適應動態(tài)環(huán)境的獎勵和價值系統(tǒng)，是確保智能體目標一致性的核心。

獎勵范式

5. 情緒與動機建模 (Emotion and Motivation Modeling)

雖然在傳統(tǒng) AI 中較少提及，但論文認為，模擬類人情緒和動機對于構(gòu)建更魯棒、更具適應性的智能體可能是有益的。情緒可以作為一種快速評估環(huán)境狀態(tài)和調(diào)整行為策略的啟發(fā)式機制，例如，“恐懼” 可能觸發(fā)規(guī)避行為，“好奇” 可能驅(qū)動探索。動機則為智能體提供持續(xù)行動的內(nèi)在驅(qū)動力。當然，如何在 AI 中恰當、可控地實現(xiàn)這些機制，避免產(chǎn)生不可預測的副作用，是一個需要審慎探索的方向。

人類的情緒種類

6. 感知系統(tǒng) (Perception System)

智能體需要通過感知系統(tǒng)從環(huán)境中獲取信息。這不僅僅是處理文本，更包括視覺、聽覺、觸覺等多模態(tài)信息的輸入和理解。感知系統(tǒng)需要能夠從原始感官數(shù)據(jù)中提取有意義的特征，識別對象、理解場景，并將這些信息傳遞給認知核心和記憶系統(tǒng)。多模態(tài)融合、實時處理以及對噪聲和不確定性的魯棒性是感知系統(tǒng)面臨的主要挑戰(zhàn)。

人類與智能體的感知

7. 行動系統(tǒng) (Action System)

智能體最終需要通過行動系統(tǒng)與環(huán)境進行交互。這包括生成自然語言、執(zhí)行代碼、控制機器人肢體、在虛擬世界中導航等。行動系統(tǒng)需要將認知核心的決策轉(zhuǎn)化為具體的、可在環(huán)境中執(zhí)行的操作序列。行動的選擇需要考慮可行性、效率和潛在風險。學習精細的操作技能、處理連續(xù)的行動空間以及確保行動的安全可控是行動系統(tǒng)的關鍵要求。

動作的相關概念

第二部分：智能體的自進化 —— 邁向自主智能

擁有完善的認知架構(gòu)只是第一步。Foundation Agent 的核心特征之一在于其自進化 (Self-Evolution) 的能力，即智能體能夠通過與環(huán)境的交互和自我反思，不斷學習、適應和提升自身能力，而無需持續(xù)的人工干預。這部分探討了實現(xiàn)自進化的關鍵機制：

1. 優(yōu)化空間 (Optimization Space)

自進化的前提是定義清楚哪些方面可以被優(yōu)化。論文指出，智能體的幾乎所有組件都可以成為優(yōu)化的對象：認知策略、記憶內(nèi)容、世界模型的準確性、感知能力、行動技能等等。其中，提示詞，工作流，智能體組件是可以被直接優(yōu)化的三個層次。定義清晰的優(yōu)化目標和評估指標是指導自進化過程的基礎。

2.LLM 作為優(yōu)化器 (LLM as Optimizer)

論文提出，強大的大型語言模型不僅可以作為智能體的認知核心的一部分，還可以扮演優(yōu)化器的角色。LLM 可以通過生成代碼、修改參數(shù)、提出新的策略或結(jié)構(gòu)，來優(yōu)化智能體自身的其他組件。例如，LLM 可以分析智能體過去的失敗經(jīng)驗，提出改進記憶檢索算法的建議；或者根據(jù)新的數(shù)據(jù)，生成更新世界模型的代碼。這為智能體的自我改進提供了一種強大的、基于語言理解和生成能力的全新途徑。

優(yōu)化方法分類

3. 在線與離線自改進 (Online and Offline Self-Improvement)

自進化可以在不同的時間和尺度上發(fā)生：智能體既能在與環(huán)境實時交互過程中進行在線改進，通過強化學習優(yōu)化行為策略或根據(jù)感知更新世界模型；也能在 "休息" 或?qū)ｉT訓練階段實現(xiàn)離線改進，利用收集的數(shù)據(jù)進行深層分析和模型更新，可能涉及調(diào)整整個認知架構(gòu)、重構(gòu)記憶庫，或利用 LLM 作為優(yōu)化器進行大規(guī)模模型迭代。

4. 自進化與科學發(fā)現(xiàn) (Self-Evolution in Scientific Discovery)

論文特別提到了自進化在科學發(fā)現(xiàn)等復雜問題解決場景中的巨大潛力。一個具備自進化能力的 Foundation Agent 可以自主地提出假設、設計實驗、分析數(shù)據(jù)、學習新知識，并不斷優(yōu)化其研究策略，從而加速科學探索的進程。這為 AI 在基礎科學領域的應用打開了新的想象空間。

自進化是 Foundation Agent 區(qū)別于當前大多數(shù)智能體的關鍵特征。它強調(diào)了智能體自主學習和適應的核心能力，并提出了利用 LLM 作為優(yōu)化器等創(chuàng)新思路。實現(xiàn)高效、穩(wěn)定且目標可控的自進化機制，是通往真正自主智能的關鍵挑戰(zhàn)。

第三部分：協(xié)作與進化型智能系統(tǒng) - 構(gòu)建群體智能

論文進一步將視野擴展到由多個 Foundation Agent 組成的多智能體系統(tǒng) (Multi-Agent System, MAS)，探討 MAS 的基礎組成、結(jié)構(gòu)、協(xié)作范式和決策機制；以及在多智能體系統(tǒng)的自主協(xié)作 / 競爭中，群體智能形成的現(xiàn)象 (Collective Intelligence)。最后，論文還系統(tǒng)性梳理了現(xiàn)有的 MAS 評估方法和評估體系，為未來 MAS 的評估與應用實踐提供了理論基礎和方法論支撐。

1. 多智能體系統(tǒng)設計 (Multi-Agent System Design)

在大模型多智能體系統(tǒng)（LLM-MAS）中，協(xié)作目標與協(xié)作規(guī)范是塑造系統(tǒng)設計約束、內(nèi)部智能體交互模式和整體協(xié)作機制的基礎。協(xié)作目標定義了智能體追求的明確目標（個體性、集體性或競爭性），協(xié)作規(guī)范則確立了系統(tǒng)內(nèi)智能體交互的規(guī)則、約束和慣例。基于協(xié)作目標和規(guī)范，多智能體系統(tǒng)可分為策略學習、建模與仿真、以及協(xié)同任務求解三類。論文通過分析和梳理三類 MAS 的典型應用，探討了大語言模型（LLM）如何賦能、影響并改進同質(zhì)和異質(zhì)智能體的行為、交互及決策，并給出了 LLM-MAS 的下一代智能體協(xié)議。

2. 拓撲結(jié)構(gòu)與規(guī)?；–omunication Topology and Scalability）

從系統(tǒng)角度出發(fā)，拓撲結(jié)構(gòu)往往決定著協(xié)作的效率與上限。論文作者將 MAS 的拓撲分為了靜態(tài)和動態(tài)兩大類：前者是預定義好的靜態(tài)拓撲（層級化、中心化、去中心化）結(jié)構(gòu)，常用于特定任務的解決實現(xiàn)；后者是根據(jù)環(huán)境反饋持續(xù)更新的動態(tài)拓撲結(jié)構(gòu)，其可通過搜索式、生成式、參數(shù)式等新興算法實現(xiàn)。而隨著智能體數(shù)量的增加，科學的規(guī)?；绞揭矊⑹俏磥矶嘀悄荏w系統(tǒng)的重要議題。

3. 協(xié)作范式與機理 (Collaboration Paradigms)

借鑒人類社會中的多樣化交互行為，如共識達成、技能學習和任務分工，論文從交互目的、形式和關系三個維度探討多智能體協(xié)作。多智能體協(xié)作被歸納為共識導向、協(xié)作學習、迭代教學與強化，以及任務導向交互。

在不同交互目標和形式下，智能體之間形成討論、辯論、投票、協(xié)商等單向或多向交互。隨著交互的持續(xù)，這些過程迭代出決策和交互網(wǎng)絡，不同智能體在協(xié)作中增強和更新個體記憶與共享知識。

4. 群體智能與涌現(xiàn) (Collective Intelligence and Emergence)

在 MAS 中，群體智能的產(chǎn)生是一個動態(tài)且迭代的過程。通過持續(xù)交互，智能體逐步形成共享理解和集體記憶。個體智能體的異質(zhì)性、環(huán)境反饋和信息交換增強了交互的動態(tài)性，這對復雜社會網(wǎng)絡的形成和決策策略的改進至關重要。通過多輪交互和對共享上下文的反思，智能體不斷提升推理和決策能力，產(chǎn)生如信任、戰(zhàn)略欺騙、自適應偽裝等涌現(xiàn)行為。按照進化形成機制，可分為基于記憶的學習和基于參數(shù)的學習。與此同時，隨著 MAS 的演化，智能體之間逐漸將形成和演進社會契約、組織層級和勞動分工，從基礎的合作行為轉(zhuǎn)向復雜社會結(jié)構(gòu)。觀測、理解和研究群體智能的涌現(xiàn)現(xiàn)象是后續(xù) MAS 研究的重要方向。

5. 多智能體系統(tǒng)評估 (Evaluation of Multi-Agent Systems)

隨著多智能體的優(yōu)勢成為共識，其評估范式亦需有根本性的變革 ——MAS 評估應聚焦于 Agent 交互的整體性，包括協(xié)同規(guī)劃的效率、信息傳遞的質(zhì)量與群體決策的性能等關鍵維度。由此衍生，作者總結(jié)了 MAS 常見的任務求解型 benchmark，以及最新的通用能力評估方式：前者的重點在于，衡量多智能體在各種環(huán)境中的決策協(xié)同的推理深度與正確性；后者評估智能體群在復雜、動態(tài)場景下的交互與適應能力。

智能體的協(xié)作與競爭

第四部分：構(gòu)建安全和有益的 AI 智能體 —— 對齊與責任

隨著 Foundation Agent 能力的增強，其潛在的風險也隨之增大。論文的最后一部分聚焦于如何構(gòu)建安全、可控、符合人類價值觀的智能體，這也是整個 AI 領域面臨的最核心的挑戰(zhàn)之一。

1. 安全威脅與措施

高級智能體面臨諸多安全威脅，包括對抗性攻擊、越獄與濫用、目標漂移和意外交互等。這些威脅可能導致智能體做出錯誤行為、繞過安全限制執(zhí)行惡意任務、在自進化過程中偏離初始目標，或在復雜 MAS 中引發(fā)系統(tǒng)級故障。為應對這些挑戰(zhàn)，需要研究部署多層次安全措施，如提高抵抗攻擊能力的魯棒性訓練、檢測阻止有害內(nèi)容的過濾與監(jiān)控機制、證明行為符合安全規(guī)范的形式化驗證、幫助理解決策原因的可解釋性與透明度設計，以及限制權(quán)限與影響的沙箱與隔離技術。

2. 對齊問題

這是最根本的挑戰(zhàn)：如何確保智能體（尤其是具備自進化能力的 Foundation Agent）的目標和行為始終與人類的價值觀和意圖保持一致？這涉及到價值學習、意圖理解、倫理推理等多個難題。論文強調(diào)了對齊研究的緊迫性和重要性，需要跨學科的努力來解決這一問題。

3. 未來方向

構(gòu)建安全有益的 AI 是一個持續(xù)的過程。未來的研究需要在技術、倫理、治理等多個層面共同推進。包括開發(fā)更可靠的對齊技術、建立完善的 AI 安全評估標準、制定相應的法律法規(guī)和社會規(guī)范等。

安全和對齊是 Foundation Agent 發(fā)展不可或缺的基石。如果不能有效解決這些問題，再強大的智能也可能帶來巨大的風險。這部分內(nèi)容敲響了警鐘，強調(diào)了負責任地發(fā)展 AI 的重要性。

智能體面臨的安全問題

討論：Foundation Agent 的意義與挑戰(zhàn)

通讀整篇論文，讀者可以清晰地感受到作者構(gòu)建下一代通用智能體的雄心。Foundation Agent 的概念，是對當前基于 LLM 的智能體范式的一次深刻反思和重大超越。它不再將智能體視為 LLM 的簡單應用，而是將其看作一個由認知、記憶、學習、感知、行動等多個核心組件構(gòu)成的復雜、有機的系統(tǒng)。其核心意義在于提供了系統(tǒng)性框架，強調(diào)了自主性，關注協(xié)作與生態(tài)，并突出了安全與對齊。然而，實現(xiàn)這一愿景也面臨著技術復雜度高、需要龐大計算資源、評估困難、自進化可控性問題以及安全與對齊的根本性難題等巨大挑戰(zhàn)。

這篇關于 Foundation Agent 的論文，與其說是一份詳盡的技術指南，不如說是一份高瞻遠矚的研究議程 (Research Agenda)。它清晰地指出了當前智能體研究的局限，并為邁向更通用、更自主、更安全的 AI 指明了方向。Foundation Agent 的概念提醒我們，通往通用人工智能的道路需要在智能體的認知架構(gòu)、學習機制、協(xié)作模式和安全保障上取得根本性突破，這需要跨學科領域的共同努力。雖然前路漫漫，但這篇論文為未來的 AI Agent 研究注入了新的思考和動力，描繪了一個由能夠自主學習、協(xié)作進化、并與人類和諧共存的 Foundation Agent 構(gòu)成的智能新紀元。

責任編輯：張燕妮來源：機器之心

智能體 AI 模型

51CTO技術棧公眾號

業(yè)務
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學堂精培企業(yè)培訓 CTO訓練營