Manus 架構(gòu)設計揭秘:解構(gòu)下一代 AI Agent 多智能體架構(gòu) 原創(chuàng)
Manus 是一款通用型 AI 助手,能將想法轉(zhuǎn)化為行動:不止于思考,更注重成果。Manus 擅長處理工作與生活中的各類任務,在你安心休息的同時,一切都能妥善完成。
Manus 的名字源自拉丁語中“手”的含義,寓意其具備將思維轉(zhuǎn)化為行動的強大能力。不同于常規(guī)的 AI 助手,Manus 不僅限于提供咨詢或答復,它還能直接完成任務的交付。
作為一款“全能 AI 代理”,Manus 能夠獨立完成從簡單查詢到復雜項目的各種任務,無需用戶持續(xù)介入。用戶只需給出簡單的指令,無需具備 AI 專業(yè)知識,便能獲得優(yōu)質(zhì)的結(jié)果。
“一觸即解決所有問題”的設計理念,讓 Manus 在傳統(tǒng) AI 操作流程中脫穎而出,極大地降低了普通用戶的操作門檻。
1、Manus 核心架構(gòu)剖析
Manus 的架構(gòu)設計充分展現(xiàn)了多智能體系統(tǒng)(Multi-Agent System)的標志性特點,其核心由以下三個主要模塊組成:
第一、規(guī)劃模塊(Planning)
作為 Manus 的"智慧核心",規(guī)劃模塊負責解析用戶指令,將復雜任務拆分為可操作的步驟,并策劃實施計劃。該模塊使得 Manus 能夠應對抽象的任務描述,并將其轉(zhuǎn)化為具體的行動指令。
該決策中心的主要功能包括:
- 任務的理解與分析
- 任務拆分與優(yōu)先級排序
- 執(zhí)行計劃的制定
- 資源分配與工具選擇
- 語義理解與意圖識別(自然語言理解,NLU)
- 將復雜任務轉(zhuǎn)化為有向無環(huán)圖(DAG)結(jié)構(gòu)
- 異常處理與流程優(yōu)化
第二、記憶模塊(Memory)
記憶模塊賦予了 Manus 存儲和利用歷史數(shù)據(jù)的能力,增強了任務執(zhí)行的連續(xù)性和定制化水平。該模塊負責管理以下三種關(guān)鍵信息:
- 用戶偏好:記錄用戶的習慣和偏好,以實現(xiàn)更個性化的交互
- 歷史交互:存儲過去的對話和任務執(zhí)行歷史,確保上下文的連貫性
- 中間結(jié)果:保留任務執(zhí)行過程中的臨時數(shù)據(jù),支持復雜任務的逐步完成
以下是構(gòu)建長期記憶體系的示例代碼:
class MemorySystem:
def __init__(self):
self.user_profile = UserVector() # 用戶偏好向量
self.history_db = ChromaDB() # 交互歷史數(shù)據(jù)庫
self.cache = LRUCache() # 短期記憶緩存
第三、工具使用模塊(Tool Use)
工具使用模塊充當 Manus 的"執(zhí)行臂",負責實施各種操作。該模塊能夠整合并運用多種工具來完成使命,包括但不限于:
- 網(wǎng)絡搜索與信息檢索
- 數(shù)據(jù)分析與處理
- 編寫并執(zhí)行代碼
- 文檔的生成
- 數(shù)據(jù)的可視化
這種集成多種工具的能力確保了 Manus 能夠應對各式復雜任務,從信息搜集到內(nèi)容創(chuàng)作,再到數(shù)據(jù)分析處理。
第四、技術(shù)架構(gòu)依賴
Manus 強大能力得益于多層次的模型協(xié)作:
- 輕量級模型:負責意圖識別,提供快速響應
- Deepseek-R1:專注于任務規(guī)劃,把控全局策略
- Claude-3.7-sonnet:處理復雜的多模態(tài)任務,提供深度理解能力
2、Manus 運轉(zhuǎn)邏輯與工作流程
Manus 采用多智能體架構(gòu),在獨立的虛擬環(huán)境中運作。其工作流程可總結(jié)如下:
完整執(zhí)行流程如下所示:
第一、任務接收
用戶提交的任務請求,無論是簡單的查詢還是復雜的項目需求,Manus 都會接收并開始處理。
第二、任務理解
Manus 解析用戶輸入,把握任務的核心和目標。在此階段,記憶模塊提供用戶偏好和交互歷史,以更精確地解讀用戶意圖。
- 利用先進的自然語言處理技術(shù)進行意圖識別和關(guān)鍵詞提取。
- 當需求不明確時,通過對話引導用戶明確目標。
- 支持文本、圖片、文檔等多種輸入方式,增強交互體驗。
第三、任務分解
規(guī)劃模塊自動將復雜任務拆分為多個可執(zhí)行的子任務,并建立任務間的依賴關(guān)系和執(zhí)行順序。
第四、任務初始化與環(huán)境準備
系統(tǒng)為任務執(zhí)行創(chuàng)建獨立的執(zhí)行環(huán)境,確保隔離性和安全性。
第五、執(zhí)行計劃制定
為每個子任務制定執(zhí)行計劃,包括所需的工具和資源。歷史交互記錄用于優(yōu)化執(zhí)行計劃。
第六、自主執(zhí)行
工具使用模塊在虛擬環(huán)境中獨立執(zhí)行子任務,包括信息搜索、數(shù)據(jù)檢索、代碼編寫、文檔生成和數(shù)據(jù)分析可視化等。中間結(jié)果由記憶模塊保存,供后續(xù)使用。
系統(tǒng)協(xié)同:多個專業(yè)化的智能體協(xié)作,各自負責不同的任務。
每個智能體的執(zhí)行結(jié)果都保存在任務目錄中,確保可追溯性。
class SearchAgent:
def execute(self, task):
# 調(diào)用搜索 API
results = search_api.query(task.keywords)
# 模擬瀏覽器行為
browser = HeadlessBrowser()
for result in results:
content = browser.visit(result.url)
if self.validate_content(content):
self.save_result(content)
- Search Agent 負責網(wǎng)絡信息搜索
- Code Agent 代碼智能體處理代碼生成和執(zhí)行
- Data Analysis Agent 進行數(shù)據(jù)分析
第七、動態(tài)質(zhì)量檢測
質(zhì)量檢查函數(shù)確保結(jié)果可靠性:
def quality_check(result):
if result.confidence < 0.7:
trigger_self_correction()
return generate_validation_report()
第八、結(jié)果整合
將子任務的結(jié)果合并為最終輸出,確保內(nèi)容的連貫性和完整性。
- 智能合并所有智能體的執(zhí)行結(jié)果,消除冗余和矛盾。
- 生成易于用戶理解的多模態(tài)輸出,確保內(nèi)容的可理解性和實用性。
第九、結(jié)果交付
向用戶提供完整的任務成果,可能包括報告、分析、代碼、圖表等格式。
第十、用戶反饋與學習
用戶對結(jié)果進行反饋,記憶模塊記錄這些反饋,用于提升未來任務的執(zhí)行效果。通過模型微調(diào),系統(tǒng)性能得到持續(xù)增強。
Multi-Agent 系統(tǒng)代表了 AI 發(fā)展的前沿方向,Manus 等產(chǎn)品的出現(xiàn)正是這一趨勢的生動體現(xiàn)。雖然這類系統(tǒng)仍面臨計算成本和任務準確性的挑戰(zhàn),但其協(xié)同智能的潛力不可估量。
未來,隨著模型效率的優(yōu)化和任務執(zhí)行可靠性的提升,我們將看到更多"Leave it to Agent"的應用場景,真正實現(xiàn) AI 從思考到行動的無縫銜接。
本文轉(zhuǎn)載自公眾號玄姐聊AGI 作者:玄姐
原文鏈接:??https://mp.weixin.qq.com/s/MklpGHijaADRS-MaICToZw??
