AutoGPT、AgentGPT、BabyAGI、HuggingGPT、CAMEL:各種基于GPT-4自治系統(tǒng)總結(jié)
ChatGPT和LLM技術(shù)的出現(xiàn)使得這些最先進(jìn)的語(yǔ)言模型席卷了世界,不僅是AI的開發(fā)人員,愛好者和一些組織也在研究探索集成和構(gòu)建這些模型的創(chuàng)新方法。各種平臺(tái)如雨后春筍般涌現(xiàn),集成并促進(jìn)新應(yīng)用程序的開發(fā)。
AutoGPT的火爆讓我們看到越來越多的自主任務(wù)和代理利用了GPT-4的API。這些發(fā)展不僅增強(qiáng)了處理集成不同系統(tǒng)的復(fù)雜任務(wù)的能力,而且還推動(dòng)了我們通過自主人工智能所能實(shí)現(xiàn)的界限。
我們這里將整理一些開源的類似AutoGPT的工具系統(tǒng),這些工具和應(yīng)用程序可以大致分為命令行接口(CLI)和基于瀏覽器的解決方案,HuggingGPT可以同時(shí)支持這兩種解決方案。
命令行:AutoGPT, BabyAGI
瀏覽器:AgentGPT, CAMEL, Web LLM
Auto-GPT
盡管Auto-GPT是一個(gè)實(shí)驗(yàn)性的開源應(yīng)用程序,但是它的增長(zhǎng)是迅速的。該程序由GPT-4驅(qū)動(dòng),可以自主實(shí)現(xiàn)設(shè)定的任何目標(biāo)。
GitHub: https://github.com/Significant-Gravitas/Auto-GPT
看看它的Github Star的增長(zhǎng)幅度可以看到最近的火爆
AgentGPT
AgentGPT是一種基于web的解決方案。它允許配置和部署自治AI代理,并讓它完成任何目標(biāo)。它將嘗試通過思考要做的任務(wù)、執(zhí)行任務(wù)并從結(jié)果中學(xué)習(xí)來達(dá)到目標(biāo)。
該平臺(tái)目前處于測(cè)試階段,正在開發(fā)以下功能:
- 通過矢量DB進(jìn)行長(zhǎng)期的記憶
- 通過LangChain(LangChain是一個(gè)用于構(gòu)建基于大型語(yǔ)言模型LLM的應(yīng)用程序的庫(kù))進(jìn)行web瀏覽
- 與網(wǎng)站和人的互動(dòng)
- 用戶和身份驗(yàn)證
Git?Hub: https://github.com/reworkd/AgentGPT
網(wǎng)站: https://agentgpt.reworkd.ai/
BabyAGI
BabyAGI任務(wù)驅(qū)動(dòng)自治代理的精簡(jiǎn)版本
它的主要思想是基于先前任務(wù)的結(jié)果和預(yù)定義的目標(biāo)來創(chuàng)建任務(wù)。然后,腳本使用OpenAI的語(yǔ)言模型功能來創(chuàng)建基于目標(biāo)的新任務(wù),Pinecone來存儲(chǔ)和檢索上下文的任務(wù)結(jié)果,這可以說是最精簡(jiǎn)的自治AI架構(gòu)了,如果你對(duì)這個(gè)方向有興趣,可以看看他的代碼。
?GitHub: https://github.com/yoheinakajima/babyagi
網(wǎng)站: http://babyagi.org/
HuggingGPT
微軟的HuggingGPT,又名JARVIS,它包括一個(gè)LLM作為控制器和許多專家模型作為協(xié)作執(zhí)行者(來自HuggingFace Hub)。它工作流程包括四個(gè)階段:
- 任務(wù)規(guī)劃:使用ChatGPT分析請(qǐng)求以了解意圖,并將其分解為可能的可解決任務(wù)。
- 模型選擇:使用ChatGPT根據(jù)描述選擇專家模型。
- 任務(wù)執(zhí)行:調(diào)用并執(zhí)行每個(gè)選定的模型,并將結(jié)果返回給ChatGPT。
- 響應(yīng)生成:最后,使用ChatGPT集成所有模型的預(yù)測(cè)并生成響應(yīng)。
?GitHub: https://github.com/microsoft/JARVIS
HF: https://huggingface.co/spaces/microsoft/HuggingGPT
Web LLM
Web LLM是一個(gè)基于LLM和基于LLM的聊天機(jī)器人,在沒有服務(wù)器支持的情況下在瀏覽器內(nèi)運(yùn)行,并通過WebGPU加速。從技術(shù)上講,Web LLM不是人工智能的自治解決方案,而是輕量級(jí)的網(wǎng)絡(luò)聊天機(jī)器人。
GitHub: https://github.com/mlc-ai/web-llm
CAMEL
CAMEL 是 ”Communicative Agents for ‘Mind’ Exploration of Large Scale Language Models“的縮寫,它提出了一種新穎的代理框架,即角色扮演,作為 AutoGPT 和 AgentGPT 的替代方案。
?GitHub: https://github.com/lightaime/camel
網(wǎng)站: http://agents.camel-ai.org/
GPTRPG
這個(gè)系統(tǒng)將游戲和大語(yǔ)言模型結(jié)合,主要包含2個(gè)部分
一個(gè)支持llm的AI代理的簡(jiǎn)單的類似rpg的環(huán)境
通過OpenAI API將AI代理植入到游戲環(huán)境的角色中
這是基于最近發(fā)布的一篇論文,其中部署了多個(gè)代理來自主參與在線游戲。
?GitHub: https://github.com/dzoba/gptrpg
Arxiv:https://arxiv.org/abs/2304.03442
總結(jié)
集成ChatGPT和LLM到各種應(yīng)用程序中只是使用語(yǔ)言模型的潛力的一部分。這些模型是為了處理自然語(yǔ)言任務(wù)而設(shè)計(jì)的,包括文本生成、翻譯、摘要、問答等等。未來的語(yǔ)言模型將更加先進(jìn)和智能,能夠在更廣泛的應(yīng)用領(lǐng)域中提供幫助。
例如,未來的語(yǔ)言模型可以用于更準(zhǔn)確的機(jī)器翻譯,使人類之間的跨文化交流更加便利。他們也可以用于自動(dòng)摘要和內(nèi)容生成,以幫助作者和媒體機(jī)構(gòu)更快地創(chuàng)建和發(fā)布內(nèi)容。此外,語(yǔ)言模型也可以用于語(yǔ)音識(shí)別和自然語(yǔ)言處理,以便人們能夠更好地與計(jì)算機(jī)交互。
總之,隨著語(yǔ)言模型技術(shù)的不斷進(jìn)步,我們可以期待看到更多的創(chuàng)新和進(jìn)步。這些模型將成為人工智能領(lǐng)域的核心技術(shù),為我們提供更好的解決方案和更廣泛的應(yīng)用場(chǎng)景。