自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

一文深入了解AI Agent -- 組成、方法、案例及展望

發(fā)布于 2024-4-10 11:49
瀏覽
0收藏

前一段時(shí)間,比爾.蓋茨在他的博客上發(fā)表了:《AI is about to completely change how you use computers》比爾·蓋茨在這篇文章中探討了AI Agent對我們未來生活的巨大影響。他談到了AI Agent在醫(yī)療保健、教育、生產(chǎn)力、娛樂和購物等領(lǐng)域的作用。這些Agent將為人們提供更個(gè)性化的服務(wù),幫助解決各種問題并提供支持,從輔助醫(yī)生和教師工作到處理日常任務(wù),甚至影響我們與朋友和家人的互動方式。AI Agent正在以各種方式迅速進(jìn)入我們的生活,將在未來幾年內(nèi)徹底改變我們的生活方式。

什么是AI Agent (LLM Agent)

AI Agent 的定義

AI Agent是一種超越簡單文本生成的人工智能系統(tǒng)。它使用大型語言模型(LLM)作為其核心計(jì)算引擎,使其能夠進(jìn)行對話、執(zhí)行任務(wù)、推理并展現(xiàn)一定程度的自主性。簡而言之,Agent是一個(gè)具有復(fù)雜推理能力、記憶和執(zhí)行任務(wù)手段的系統(tǒng)。

一文深入了解AI Agent -- 組成、方法、案例及展望-AI.x社區(qū)

AI Agent 的主要組成部分

在LLM賦能的自主agent系統(tǒng)中(LLM Agent),LLM充當(dāng)agent大腦的角色,并與若干關(guān)鍵組件協(xié)作。

一文深入了解AI Agent -- 組成、方法、案例及展望-AI.x社區(qū)

規(guī)劃(planning)

  • 子目標(biāo)分解:agent將大任務(wù)拆分為更小的可管理的子目標(biāo),使得可以有效處理復(fù)雜任務(wù)。
  • 反思與完善:agent對歷史動作可以自我批評和自我反思,從錯(cuò)誤中學(xué)習(xí)并在后續(xù)步驟里完善,從而改善最終結(jié)果的質(zhì)量。

記憶(Memory)

  • 短期記憶:上下文學(xué)習(xí)即是利用模型的短期記憶學(xué)習(xí)
  • 長期記憶:為agent提供保留和召回長期信息的能力,通常利用外部向量存儲和檢索實(shí)現(xiàn)

工具使用(tool use)

  • 對模型權(quán)重丟失的信息,agent學(xué)習(xí)調(diào)用外部API獲取額外信息,包括當(dāng)前信息、代碼執(zhí)行能力、專有信息源的訪問等等

行動(Action)

  • 行動模塊是智能體實(shí)際執(zhí)行決定或響應(yīng)的部分。面對不同的任務(wù),智能體系統(tǒng)有一個(gè)完整的行動策略集,在決策時(shí)可以選擇需要執(zhí)行的行動,比如廣為熟知的記憶檢索、推理、學(xué)習(xí)、編程等。

AI Agent的意義

人機(jī)協(xié)同模式

基于大模型的Agent不僅可以讓每個(gè)人都有增強(qiáng)能力的專屬智能助理,還將改變?nèi)藱C(jī)協(xié)同的模式,帶來更為廣泛的人機(jī)融合。生成式AI的智能革命演化至今,從人機(jī)協(xié)同呈現(xiàn)了三種模式:


(1)嵌入(embedding)模式。用戶通過與AI進(jìn)行語言交流,使用提示詞來設(shè)定目標(biāo),然后AI協(xié)助用戶完成這些目標(biāo),比如普通用戶向生成式AI輸入提示詞創(chuàng)作小說、音樂作品、3D內(nèi)容等。在這種模式下,AI的作用相當(dāng)于執(zhí)行命令的工具,而人類擔(dān)任決策者和指揮者的角色。


(2)副駕駛(Copilot)模式。在這種模式下,人類和AI更像是合作伙伴,共同參與到工作流程中,各自發(fā)揮作用。AI介入到工作流程中,從提供建議到協(xié)助完成流程的各個(gè)階段。例如,在軟件開發(fā)中,AI可以為程序員編寫代碼、檢測錯(cuò)誤或優(yōu)化性能提供幫助。人類和AI在這個(gè)過程中共同工作,互補(bǔ)彼此的能力。AI更像是一個(gè)知識豐富的合作伙伴,而非單純的工具。


實(shí)際上,2021年微軟在GitHub首次引入了Copilot(副駕駛)的概念。GitHub Copilot是一個(gè)輔助開發(fā)人員編寫代碼的AI服務(wù)。2023年5月,微軟在大模型的加持下,Copilot迎來全面升級,推出Dynamics 365 Copilot、Microsoft 365 Copilot和Power Platform Copilot等,并提出“Copilot是一種全新的工作方式”的理念。工作如此,生活也同樣需要“Copilot”,“出門問問”創(chuàng)始人李志飛認(rèn)為大模型的最好工作,是做人類的“Copilot”。


(3)智能體(Agent)模式。人類設(shè)定目標(biāo)和提供必要的資源(例如計(jì)算能力),然后AI獨(dú)立地承擔(dān)大部分工作,最后人類監(jiān)督進(jìn)程以及評估最終結(jié)果。這種模式下,AI充分體現(xiàn)了智能體的互動性、自主性和適應(yīng)性特征,接近于獨(dú)立的行動者,而人類則更多地扮演監(jiān)督者和評估者的角色。

一文深入了解AI Agent -- 組成、方法、案例及展望-AI.x社區(qū)

從前文對智能體記憶、規(guī)劃、行動和使用工具四個(gè)主要模塊的功能分析來看,智能體模式相較于嵌入模式、副駕駛模式無疑更為高效,或?qū)⒊蔀槲磥砣藱C(jī)協(xié)同的主要模式。



基于Agent的人機(jī)協(xié)同模式,每個(gè)普通個(gè)體都有可能成為超級個(gè)體。超級個(gè)體是擁有自己的AI團(tuán)隊(duì)與自動化任務(wù)工作流,基于Agent與其他超級個(gè)體建立更為智能化與自動化的協(xié)作關(guān)系?,F(xiàn)在業(yè)內(nèi)不乏一人公司、超級個(gè)體的積極探索。

AI Agent與軟件開發(fā)

AI Agent將使軟件架構(gòu)的范式從面向過程遷移到面向目標(biāo)?,F(xiàn)有的軟件(包括APP)通過一系列預(yù)定義的指令、邏輯、規(guī)則和啟發(fā)式算法將流程固定下來,以滿足軟件運(yùn)行結(jié)果符合用戶的預(yù)期,即用戶按照指令邏輯一步一步操作達(dá)成目標(biāo)。這樣一種面向過程的軟件架構(gòu)具有高可靠性、確定性。但是,這種面向目標(biāo)的架構(gòu)只能應(yīng)用于垂直領(lǐng)域,而無法普遍應(yīng)用到所有領(lǐng)域,因此標(biāo)準(zhǔn)化和定制化之間如何平衡也成為SaaS行業(yè)面對的難題之一。

一文深入了解AI Agent -- 組成、方法、案例及展望-AI.x社區(qū)

AI Agent范式將原本由人類主導(dǎo)的功能開發(fā),逐漸遷移為以AI為主要驅(qū)動力。以大模型為技術(shù)基礎(chǔ)設(shè)施,Agent為核心產(chǎn)品形態(tài),把傳統(tǒng)軟件預(yù)定義的指令、邏輯、規(guī)則和啟發(fā)式算法的任務(wù)層級演變成目標(biāo)導(dǎo)向的智能體自主生成。這樣一來,原本的架構(gòu)只能解決有限范圍的任務(wù),未來的架構(gòu)則可以解決無限域的任務(wù)。未來的軟件生態(tài),不僅是最上層與所有人交互的媒介是Agent,整個(gè)產(chǎn)業(yè)的發(fā)展,無論是底層技術(shù),商業(yè)模式,中間組件,甚至是人們的生活習(xí)慣和行為都會圍繞Agent來改變,這就是Agent-Centric時(shí)代的開啟。

一文深入了解AI Agent -- 組成、方法、案例及展望-AI.x社區(qū)

常見LLM Agent框架或者應(yīng)用

AutoGPT

可以說是LLM Agent的鼻祖了。Auto-GPT是一個(gè)實(shí)驗(yàn)性的開源應(yīng)用程序,展示了GPT-4語言模型的能力。這個(gè)程序由GPT-4驅(qū)動,將LLM“思想”連接在一起,以自主地實(shí)現(xiàn)您設(shè)置的任何目標(biāo)。作為GPT-4完全自主運(yùn)行的最早示例之一,Auto-GPT突破了人工智能的極限,將AI進(jìn)程推向了新高度 -- 自主人工智能。

??https://link.zhihu.com/?target=https%3A//github.com/Significant-Gravitas/AutoGPT??

一文深入了解AI Agent -- 組成、方法、案例及展望-AI.x社區(qū)

一文深入了解AI Agent -- 組成、方法、案例及展望-AI.x社區(qū)

一文深入了解AI Agent -- 組成、方法、案例及展望-AI.x社區(qū)

AutoGen

微軟發(fā)布的AutoGen agent是可定制的、可對話的,并能以各種模式運(yùn)行,這些模式采用 LLM、人類輸入和工具的組合。使用 AutoGen,開發(fā)人員還可以靈活定義agent交互行為。自然語言和計(jì)算機(jī)代碼都可用于為不同的應(yīng)用編程靈活的對話模式。AutoGen 可作為一個(gè)通用框架,構(gòu)建具有不同復(fù)雜性和 LLM 能力的各種應(yīng)用。實(shí)證研究證明了該框架在許多樣本應(yīng)用中的有效性,應(yīng)用領(lǐng)域包括數(shù)學(xué)、編碼、問答、運(yùn)籌學(xué)、在線決策、娛樂等。

??https://github.com/microsoft/autogen??

一文深入了解AI Agent -- 組成、方法、案例及展望-AI.x社區(qū)

ChatDev

清華大學(xué) NLP 實(shí)驗(yàn)室聯(lián)合面壁智能等科研機(jī)構(gòu)研發(fā)的一個(gè)大模型驅(qū)動的全流程自動化軟件開發(fā)框架。ChatDev (Chat-powered Software Development)。ChatDev 擬作一個(gè)由多智能體協(xié)作運(yùn)營的虛擬軟件公司,在人類“用戶”指定一個(gè)具體的任務(wù)需求后,不同角色的智能體將進(jìn)行交互式協(xié)同,以生產(chǎn)一個(gè)完整軟件(包括源代碼、環(huán)境依賴說明書、用戶手冊等)。這一技術(shù)為軟件開發(fā)自動化提供了新的可能性,支持快捷高效且經(jīng)濟(jì)實(shí)惠的軟件制作,未來將有效地將部分人力從傳統(tǒng)軟件開發(fā)的繁重勞動中解放出來。

??https://github.com/OpenBMB/ChatDev??

一文深入了解AI Agent -- 組成、方法、案例及展望-AI.x社區(qū)

一文深入了解AI Agent -- 組成、方法、案例及展望-AI.x社區(qū)

一文深入了解AI Agent -- 組成、方法、案例及展望-AI.x社區(qū)

XAgent

??https://github.com/OpenBMB/XAgent??

一文深入了解AI Agent -- 組成、方法、案例及展望-AI.x社區(qū)

XAgent是面壁智能聯(lián)合清華大學(xué) NLP 實(shí)驗(yàn)室共同研發(fā)開源的基于LLM的自主智能體,可以自動解決各種任務(wù)。它被設(shè)計(jì)為一個(gè)通用的智能體,可以應(yīng)用于各種任務(wù),終極目標(biāo)是創(chuàng)建一個(gè)可以解決任何給定任務(wù)的超級智能體。換句話說,打造的是超級無敵的多邊形戰(zhàn)士,不是單獨(dú)為某個(gè)任務(wù)設(shè)計(jì)的特定智能體。

一文深入了解AI Agent -- 組成、方法、案例及展望-AI.x社區(qū)

GPT-engineer

??https://github.com/gpt-engineer-org/gpt-engineer??

一文深入了解AI Agent -- 組成、方法、案例及展望-AI.x社區(qū)

HuggingGPT

HuggingGPT也是一個(gè)老牌的AI Agent項(xiàng)目了,主要思路為利用LLM的框架(例如。ChatGPT)來連接機(jī)器學(xué)習(xí)社區(qū)中的各種AI模型(例如huggingface)來解決人工智能任務(wù)。

??https://huggingface.co/spaces/microsoft/HuggingGPT??

一文深入了解AI Agent -- 組成、方法、案例及展望-AI.x社區(qū)

論文: HuggingGPT: Solving AI Tasks with ChatGPT and its Friends in Hugging Face, https://arxiv.org/pdf/2303.17580.pdf

一文深入了解AI Agent -- 組成、方法、案例及展望-AI.x社區(qū)

AI Agent的展望與挑戰(zhàn)

展望

AI Agent是人工智能成為基礎(chǔ)設(shè)施的重要推動力。回顧技術(shù)發(fā)展史,技術(shù)的盡頭是成為基礎(chǔ)設(shè)施,比如電力成為像空氣一樣不易被人們察覺,但是又必不可少的基礎(chǔ)設(shè)施,還如云計(jì)算等。當(dāng)然這個(gè)要經(jīng)歷以下三個(gè)階段:創(chuàng)新與發(fā)展階段–新技術(shù)被發(fā)明并開始應(yīng)用;普及與應(yīng)用階段–隨著技術(shù)成熟,它開始被廣泛應(yīng)用于各個(gè)領(lǐng)域,對社會和經(jīng)濟(jì)產(chǎn)生深遠(yuǎn)影響;基礎(chǔ)設(shè)施階段–當(dāng)技術(shù)變得普及到幾乎無處不在,它就轉(zhuǎn)變成了一種基礎(chǔ)設(shè)施,已經(jīng)成為人們?nèi)粘I钪胁豢苫蛉钡囊徊糠?。幾乎所有的人都認(rèn)同,人工智能會成為未來社會的基礎(chǔ)設(shè)施。而智能體正在促使人工智能基礎(chǔ)設(shè)施化。這不僅得益于低成本的Agent軟件生產(chǎn)優(yōu)勢,而且因?yàn)锳gent能夠適應(yīng)不同的任務(wù)和環(huán)境,并能夠?qū)W習(xí)和優(yōu)化其性能,使得它可以被應(yīng)用于廣泛的領(lǐng)域,進(jìn)而成為各個(gè)行業(yè)和社會活動的基礎(chǔ)支撐。

一文深入了解AI Agent -- 組成、方法、案例及展望-AI.x社區(qū)

Agent下一步可能會朝著兩個(gè)方向同時(shí)迭代。一是與人協(xié)助的智能體,通過執(zhí)行各種任務(wù)來協(xié)助人類,側(cè)重工具屬性;二是擬人化方向的迭代,能夠自主決策,具有長期記憶,具備一定的類人格特征,側(cè)重于類人或超人屬性。

挑戰(zhàn)

從技術(shù)優(yōu)化迭代和實(shí)現(xiàn)上來看,AI Agent的發(fā)展也面臨一些瓶頸。

技術(shù)方面,LLM模型仍然不夠強(qiáng)大,即使是最強(qiáng)大的GPT4在AI Agent應(yīng)用時(shí),仍然面臨以下一些問題:

  • 上下文長度有限:上下文容量有限,限制了歷史信息、詳細(xì)說明、API 調(diào)用上下文和響應(yīng)的包含。系統(tǒng)的設(shè)計(jì)必須適應(yīng)這種有限的通信帶寬,而從過去的錯(cuò)誤中學(xué)習(xí)的自我反思等機(jī)制將從長或無限的上下文窗口中受益匪淺。盡管向量存儲和檢索可以提供對更大知識庫的訪問,但它們的表示能力不如充分關(guān)注那么強(qiáng)大。
  • 長期規(guī)劃和任務(wù)分解的挑戰(zhàn):長期規(guī)劃和有效探索解決方案空間仍然具有挑戰(zhàn)性。LLM在遇到意外錯(cuò)誤時(shí)很難調(diào)整計(jì)劃,這使得它們與人類相比(從試錯(cuò)中學(xué)習(xí))不太穩(wěn)健。
  • 自然語言接口的可靠性:當(dāng)前的Agent系統(tǒng)依賴自然語言作為LLM與外部組件(例如內(nèi)存和工具)之間的接口。然而,模型輸出的可靠性值得懷疑,因?yàn)長LM可能會出現(xiàn)格式錯(cuò)誤,并且偶爾會表現(xiàn)出叛逆行為(例如拒絕遵循指示)。因此,大部分Agent演示代碼都專注于解析模型輸出。


其次,太燒錢了,尤其是多智能體。斯坦福的虛擬小鎮(zhèn)一個(gè)Agent一天需要消耗20美金價(jià)格的token數(shù),因?yàn)槠湫枰洃浐托袆拥乃伎剂糠浅4?。這一價(jià)格是比很多人類工作者更高的,需要后續(xù)Agent框架和LLM推理側(cè)的雙重優(yōu)化。


還有就是現(xiàn)階段在很多場景,使用AI Agent對比Copilot模式的最終效果,還看不到非常大的提升,或者說能覆蓋增加成本的提升。大部分AI Agent技術(shù)還都是研究階段。


最后,這些發(fā)展趨勢預(yù)示著AI Agent可能面臨諸如安全性與隱私性、倫理與責(zé)任、經(jīng)濟(jì)和社會就業(yè)影響等多方面的挑戰(zhàn)。別的不說,對很多人的個(gè)人職業(yè)生涯的長期影響。

一文深入了解AI Agent -- 組成、方法、案例及展望-AI.x社區(qū)

本文轉(zhuǎn)自 AI生成未來 ,作者:北方的郎


原文鏈接:??https://mp.weixin.qq.com/s/pEpYl35IDINGaVDBK76-LA??

標(biāo)簽
收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦