微軟五大Agent聯(lián)手,這下厲害了!
近期,微軟推出了一款創(chuàng)新性的通用Multi-Agent框架——Magentic-One。這個(gè)開源項(xiàng)目致力于處理各類復(fù)雜的開放性任務(wù),涵蓋范圍包括網(wǎng)絡(luò)瀏覽操作、本地文件管理、Python代碼編寫與執(zhí)行、市場(chǎng)研究分析以及學(xué)術(shù)論文撰寫等多個(gè)方面。
該框架由五個(gè)核心智能體構(gòu)成:總體協(xié)調(diào)的Orchestrator、負(fù)責(zé)網(wǎng)絡(luò)任務(wù)的WebSurfer、管理文件系統(tǒng)的FileSurfer、專注編程的Coder,以及處理終端操作的ComputerTerminal。在這個(gè)體系中,Orchestrator作為核心智能體,承擔(dān)著任務(wù)規(guī)劃、進(jìn)度監(jiān)控和錯(cuò)誤修正等重要職責(zé)。
從運(yùn)作機(jī)制來看,Magentic-One采用了雙循環(huán)結(jié)構(gòu):外循環(huán)負(fù)責(zé)管理任務(wù)賬本,記錄事實(shí)、推測(cè)和計(jì)劃;內(nèi)循環(huán)則專注于進(jìn)度賬本的維護(hù),包括當(dāng)前進(jìn)度狀態(tài)和任務(wù)分配情況。
各智能體的具體職能如下:
- Orchestrator擔(dān)任總指揮角色,負(fù)責(zé)任務(wù)拆解、規(guī)劃和協(xié)調(diào)其他智能體
- WebSurfer專門處理基于Chromium的瀏覽器操作,能夠執(zhí)行網(wǎng)頁(yè)導(dǎo)航、交互和內(nèi)容解析
- FileSurfer主要負(fù)責(zé)Markdown格式的文件處理和目錄管理
- Coder著重于代碼編寫和信息分析
- ComputerTerminal提供控制臺(tái)訪問權(quán)限,支持程序執(zhí)行和庫(kù)安裝
在性能評(píng)測(cè)方面,Magentic-One在GAIA和AssistantBench等測(cè)試平臺(tái)上展現(xiàn)出與現(xiàn)有頂級(jí)方案相當(dāng)?shù)谋憩F(xiàn),并在WebArena測(cè)試中取得了具有競(jìng)爭(zhēng)力的成績(jī)。
- 官方博客:https://www.microsoft.com/en-us/research/articles/magentic-one-a-generalist-multi-agent-system-for-solving-complex-tasks/
- 項(xiàng)目地址:https://github.com/microsoft/autogen/tree/main/python/packages/autogen-magentic-one
本文轉(zhuǎn)載自 ??探索AGI??,作者: 獼猴桃
