作者 | 王瑞平
如今,伴隨著大語言模型技術(shù)的不斷成熟,專業(yè)人員開始致力于用它構(gòu)建智能體,但卻始終停留在執(zhí)行簡單任務(wù)的層面,缺少深入挖掘復(fù)雜任務(wù)的功能。這也是由于之前的大語言模型會產(chǎn)生相應(yīng)“幻覺”問題,從而阻礙了發(fā)展。
但是,Meta卻打破了這個“魔咒”,開源了名為“MetaGPT”的框架,上線短短幾周就已火爆全網(wǎng),截至目前,已在Github上狂飆16.9k星,成為了Meta在人工智能界投下的又一枚重磅炸彈!
圖片
從Github上的開源列表中不難看出,MetaGPT能抽象出不同角色,是一個集產(chǎn)品經(jīng)理、架構(gòu)師、項(xiàng)目經(jīng)理、程序員于一體的AI工具。神奇的是,它能在代碼生成時(shí)進(jìn)行內(nèi)部監(jiān)督,從而提升最終輸出的代碼質(zhì)量。
有了它,軟件公司的研發(fā)工作流程將會被徹底改變;它不僅能幫助公司提升研發(fā)效率,還能降低研發(fā)成本。
因此,開發(fā)者普遍表示:“該模型在‘模擬現(xiàn)實(shí)軟件開發(fā)過程’中能提供更多的變量、監(jiān)督效果更佳,相較于競品生成的輸出結(jié)果也更具有優(yōu)勢?!?/p>
1、多智能體元編程框架
簡單來說,MetaGPT構(gòu)建的多智能體元編程框架旨在將有效的人類工作流程作為元編程方法注入到由LLM驅(qū)動的多智能體協(xié)作中。模型的編程框架正是基于ChatGPT和軟件外包公司的SOP訓(xùn)練的!其中,Code=SOP(Team)是核心哲學(xué)。
軟件公司多角色示意圖(正在逐步實(shí)現(xiàn))
如框架圖所示,它能根據(jù)老板的“一句話”需求輸出產(chǎn)品文檔、架構(gòu)設(shè)計(jì)、任務(wù)列表和代碼等,可被看作是由大語言模型構(gòu)成的虛擬團(tuán)隊(duì)。
圖片
圖片
官方文檔中還展示出它的具體安裝方法,在其中輸入“python startup.py”,寫個類似“今日頭條”的推薦系統(tǒng),將會獲得一系列輸出,包括:數(shù)據(jù)結(jié)構(gòu)和API設(shè)計(jì)等。
至于費(fèi)用方面,生成一個包含分析和設(shè)計(jì)的示例大約需要0.2美元(GPT-4 API的費(fèi)用),而完成一個完整的項(xiàng)目大約需要2.0美元。
圖:MetaGPT框架
ITBEAR上發(fā)布的科技信息也顯示,MetaGPT模型可應(yīng)用于各種開發(fā)任務(wù)。假如你需要構(gòu)建一個算法推薦系統(tǒng),模型可以分析系統(tǒng)的適用人群、列出適用人群特征并提出相應(yīng)的功能需求,最后生成代碼并驗(yàn)證。與傳統(tǒng)的手動開發(fā)相比,它可以在短時(shí)間內(nèi)更迅速地完成這些任務(wù),從而降低開發(fā)成本。
這種結(jié)構(gòu)化過程、代理協(xié)作和高級模型驅(qū)動技術(shù)的融合正在改變軟件開發(fā)的前景。在此過程中,研究者做出的貢獻(xiàn)主要包括:引入元編程框架、整合人工SOP流程設(shè)計(jì)、實(shí)現(xiàn)最先進(jìn)的性能。
結(jié)果表明,MetaGPT有潛力解決LLM中的幻覺問題,從而指導(dǎo)LLM系統(tǒng)協(xié)同完成更有效的設(shè)計(jì)。
雖然這聽上去效果不錯,但卻不能完全替代手工開發(fā)。開發(fā)者對于通用模型的輸出結(jié)果還是要有心理預(yù)期,畢竟此類場景還是需要用專業(yè)的垂直領(lǐng)域知識訓(xùn)練效果才會更好!
2、全能:產(chǎn)品經(jīng)理+架構(gòu)師+項(xiàng)目經(jīng)理+工程師
MetaGPT作為全能的AI工具,直接充當(dāng)了產(chǎn)品經(jīng)理、架構(gòu)師、項(xiàng)目經(jīng)理和工程師的角色,包攬了與開發(fā)相關(guān)的所有工作!主要功能是智能化生成代碼,即,輸入需求后“寫出”完整代碼。
具體來講,無論是產(chǎn)品的PRD文檔,還是項(xiàng)目架構(gòu)分析,它都能完整的寫出,還能提示你用的是哪種語言、哪個框架,最后自動生成相關(guān)流程圖表,還真是有模有樣!
而之前提及的GPT-Engineer只“扮演”了單一工程師的角色;MetaGPT卻能扮演多個角色,這是最大的優(yōu)勢,就連服務(wù)器接口規(guī)范它都能完整列出,還能自動對代碼邏輯進(jìn)行分析,并提示你每個文件能用來做什么。
圖片
有的網(wǎng)友好奇,便用它書寫了命令行版的貪食蛇游戲,代碼生成效果相當(dāng)不錯!蛇真的可以跑起來、吃豆子長尾巴、撞自己或撞墻后重置!
圖片
此外,MetaGPT還可以在大約10分鐘內(nèi)構(gòu)建出二十一點(diǎn)游戲,包括:代碼、圖表、評論和文檔,所有這些都只需2美元,這近一步為AGI鋪平了道路。
3、工程師:一行需求完成端到端開發(fā)過程
MetaGPT框架前途無量!當(dāng)我們仔細(xì)審視模型內(nèi)部時(shí),會發(fā)現(xiàn)內(nèi)部實(shí)際上就是一個完整的軟件公司,由多個智能體協(xié)作完成復(fù)雜的軟件問題。
具體來說,為了將Sop編碼為提示符,MetaGPT通過角色定義、任務(wù)分解、過程標(biāo)準(zhǔn)化和其它技術(shù)設(shè)計(jì),只用一行需求就能完成端到端開發(fā)過程。相關(guān)論文也已發(fā)表。
圖片
實(shí)驗(yàn)結(jié)果也表明,MetaGPT可以產(chǎn)生更高級的綜合解決方案。與現(xiàn)有會話和基于聊天的多代理系統(tǒng)相比,它的一致性更強(qiáng)。
最后,為證實(shí)設(shè)計(jì)的有效性,研究者展示出軟件協(xié)同開發(fā)的工作流程,并進(jìn)行了相關(guān)實(shí)驗(yàn)來驗(yàn)證相關(guān)代碼的可行性。
在代碼生成基準(zhǔn)測試中,MetaGPT達(dá)到81.7%和82.3%的新高度。這意味著,與其它基于LLM的編程框架(如,AutoGPT、LangChain和AgentVerse)相比,MetaGPT可以處理更高級別的軟件、解決復(fù)雜問題,也憑借其廣泛的功能脫穎而出。
值得注意的是,在相關(guān)的實(shí)驗(yàn)評估中,MetaGPT達(dá)到了100%的任務(wù)完成率,進(jìn)一步證實(shí)了MetaGPT框架的高效性。
總之,這項(xiàng)研究通過集成標(biāo)準(zhǔn)操作程序?yàn)榛贚LM的多智能體系統(tǒng)概述了一個變革的范例。這將會為多智能體交互和相關(guān)合作開辟出新道路,不僅重新定義了人工智能,還指出通往AGI的道路。
4、局限性:無法處理復(fù)雜信息
然而,需要注意的是,MetaGPT有一些局限性:例如,它只能創(chuàng)建單頁的應(yīng)用程序,而不能處理復(fù)雜的信息,如,多頁或數(shù)據(jù)庫。因此,如果你的想法非常復(fù)雜,MetaGPT可能無法正確生成應(yīng)用程序。
盡管有這些限制,MetaGPT仍有望成為創(chuàng)建簡單應(yīng)用程序的有效工具。此外,它的易用性可能對軟件開發(fā)市場產(chǎn)生重大影響,從而減少對經(jīng)驗(yàn)豐富程序員的需求。
參考資料:https://arxiv.org/pdf/2308.00352.pdf