吳恩達(dá)深度剖析:AI Agent 工作流的演進(jìn)與前景 精華
AI Agent 作為具備感知環(huán)境、做出決策和執(zhí)行動(dòng)作能力的智能實(shí)體,正在成為人工智能領(lǐng)域的關(guān)鍵發(fā)展動(dòng)向。
隨著大型語言模型(LLM)技術(shù)的持續(xù)進(jìn)步,AI Agent 的潛力正被逐步揭示,它們不僅能夠完成基于指令的任務(wù),還能表現(xiàn)出更高水平的自主性和主動(dòng)性。
在最近的紅杉 AI Ascent 2024 活動(dòng)中,人工智能領(lǐng)域的杰出人物吳恩達(dá)教授發(fā)表了一場(chǎng)關(guān)于 AI Agent 的富有洞見的演講。他深入探討了 AI Agent 的最新發(fā)展趨勢(shì)和設(shè)計(jì)模式,為參與者提供了關(guān)于人工智能未來方向的深入理解。
AI Agent 工作流的效果
吳恩達(dá)教授在演講中著重指出,AI Agent 正在引領(lǐng)工作流程的革新。與傳統(tǒng)的工作流程不同,AI Agent 通過迭代和對(duì)話式的模式工作,不再是簡(jiǎn)單的指令執(zhí)行者,而是能夠進(jìn)行自我反思、規(guī)劃和修正的參與者。
在傳統(tǒng)的工作流程中,用戶向 AI Agent 模型輸入指令,模型生成回答,這種方式類似于要求人類專家連續(xù)不斷地完成任務(wù),沒有提供反思和修正的空間。
相對(duì)而言,AI Agent 的代理工作流是一個(gè)動(dòng)態(tài)的、迭代的過程。AI Agent 首先接收一個(gè)大致的任務(wù),然后制定工作計(jì)劃,執(zhí)行任務(wù),并在每一步中進(jìn)行自我評(píng)估和修正。
這種工作流程類似于人類在寫作、編程或其他創(chuàng)造性任務(wù)中的思考過程,允許 AI Agent 通過不斷的迭代來提升工作成果的質(zhì)量。例如,AI Agent 可能會(huì)先創(chuàng)建一個(gè)草稿,然后審查和修改,這個(gè)過程可能會(huì)重復(fù)多次,直到達(dá)到滿意的結(jié)果。
吳恩達(dá)教授通過案例研究展示了 AI Agent 代理工作流在編程任務(wù)中的實(shí)際效果。使用代理工作流的 AI Agent 能夠生成更高質(zhì)量的代碼,并在遇到錯(cuò)誤時(shí)自我修正,這種工作流不僅提升了代碼的準(zhǔn)確性,還減少了人為干預(yù)的需求。
吳恩達(dá)教授團(tuán)隊(duì)分析了一個(gè)叫做"人工評(píng)估基準(zhǔn)測(cè)試"的編碼基準(zhǔn)數(shù)據(jù),它包含諸如"給定一個(gè)非空整數(shù)列表,返回所有偶數(shù)位置元素的和"之類的編碼問題?,F(xiàn)有的做法是使用零樣本提示,即直接讓人工智能編寫代碼并運(yùn)行,但沒有人是這樣編碼的。
研究發(fā)現(xiàn),GPT-3.5 使用零樣本提示時(shí)只有 48% 的正確率,GPT-4 提高到了 67%。但如果在 GPT-3.5 上使用一個(gè)代理工作流程,它的表現(xiàn)實(shí)際上比 GPT-4 還要好。如果在 GPT-4 上使用代理工作流程,它的表現(xiàn)也非常出色。這意味著采用代理工作流程對(duì)于構(gòu)建應(yīng)用程序至關(guān)重要。
四種 AI Agent 設(shè)計(jì)模式
吳恩達(dá)教授還提到了 AI Agent 的四種關(guān)鍵設(shè)計(jì)模式,它們是實(shí)現(xiàn)其高效執(zhí)行復(fù)雜任務(wù)的基礎(chǔ)。這些模式包括反思(Reflection)、工具使用(Tool Use)、規(guī)劃(Planning)和多智能體協(xié)作(Multiagent Collaboration),共同構(gòu)成了 AI Agent 的能力框架。
1. 反思
反思(Reflection)允許 AI Agent 在完成任務(wù)后,能夠?qū)ψ陨淼妮敵鲞M(jìn)行再次審視和評(píng)估。在這種模式下,AI Agent 不僅僅是執(zhí)行任務(wù),而是能夠像人類專家一樣,對(duì)自己的工作進(jìn)行批判性思考。
例如,AI Agent 可能會(huì)生成一段代碼,然后根據(jù)預(yù)設(shè)的標(biāo)準(zhǔn)或反饋,自我檢查代碼的正確性、效率和結(jié)構(gòu),并提出可能的改進(jìn)措施。這種自我監(jiān)督和修正的能力,使得AI Agent在執(zhí)行任務(wù)時(shí)能夠不斷提高準(zhǔn)確性和效率。
2. 工具使用
工具使用(Tool Use)賦予 AI Agent 使用外部工具和資源的能力,以此來擴(kuò)展其功能和提高生產(chǎn)效率。
這種模式下,AI Agent 可以搜索網(wǎng)頁、生成和運(yùn)行代碼、分析數(shù)據(jù)等,利用各種工具來收集信息、執(zhí)行操作。
例如,AI Agent 可能會(huì)使用圖像處理工具來分析和處理圖像數(shù)據(jù),或者調(diào)用 API 來獲取和整合外部信息。這樣的能力使得 AI Agent 不再局限于其內(nèi)置的知識(shí)庫(kù),而是能夠與外部系統(tǒng)交互,從而更好地適應(yīng)多變的任務(wù)需求。
3. 規(guī)劃
規(guī)劃(Planning)強(qiáng)調(diào) AI Agent 在面對(duì)復(fù)雜任務(wù)時(shí),能夠進(jìn)行系統(tǒng)性的規(guī)劃和步驟分解。AI Agent 不僅能夠理解任務(wù)的整體目標(biāo),還能夠制定出詳細(xì)的行動(dòng)計(jì)劃,并按照計(jì)劃逐步推進(jìn)任務(wù)的完成。
這種模式下,AI Agent 能夠展現(xiàn)出類似于人類的前瞻性和策略性思維。例如,AI Agent 可能會(huì)在進(jìn)行項(xiàng)目管理時(shí),先確定項(xiàng)目的主要里程碑,然后為每個(gè)里程碑制定具體的執(zhí)行步驟和時(shí)間表,確保項(xiàng)目能夠有序進(jìn)行。
4. 多智能體協(xié)作
多智能體協(xié)作(Multiagent Collaboration)突出了多個(gè) AI Agent 之間的合作和協(xié)調(diào)。在這種模式下,每個(gè) AI Agent 都可以扮演特定的角色,并與其他 AI Agent 共同協(xié)作以完成復(fù)雜的任務(wù)。
這種合作可以模擬真實(shí)世界中的團(tuán)隊(duì)工作流程,通過代理間的互補(bǔ)和協(xié)同作用,提高整體的執(zhí)行效率和創(chuàng)新能力。
例如,在一個(gè)開源軟件開發(fā)項(xiàng)目中,一個(gè) AI Agent 可能負(fù)責(zé)編寫代碼,而另一個(gè) AI Agent 則負(fù)責(zé)代碼審查和測(cè)試,通過這樣的分工合作,共同推動(dòng)項(xiàng)目的成功完成。
總結(jié)
這些模式的結(jié)合使用,不僅提升了 AI Agent 在單個(gè)任務(wù)中的執(zhí)行能力,還為其在更廣泛的應(yīng)用場(chǎng)景中進(jìn)行協(xié)作和創(chuàng)新提供了可能。隨著這些模式的進(jìn)一步發(fā)展和完善,AI Agent 將在未來的工作流程中發(fā)揮更加關(guān)鍵的作用,推動(dòng)各行各業(yè)向智能化轉(zhuǎn)型。
AI Agent 的代理工作流在多個(gè)行業(yè)中展現(xiàn)出其實(shí)際應(yīng)用的巨大潛力。吳恩達(dá)教授提到了這些智能體在編程、研究和多模態(tài)任務(wù)處理等領(lǐng)域的應(yīng)用。
在演講中,吳恩達(dá)教授采用了 "Agentic Reasoning" 作為主題,這一概念可以翻譯為“代理性推理”。它指的是 AI Agent 在執(zhí)行任務(wù)時(shí)所采用的一種推理方式,涉及自主性、目標(biāo)導(dǎo)向和問題解決的能力。
代理性推理強(qiáng)調(diào) AI Agent 不僅僅是對(duì)輸入做出反應(yīng),而是能夠主動(dòng)地進(jìn)行思考、規(guī)劃和決策,以實(shí)現(xiàn)特定的目標(biāo)或應(yīng)對(duì)復(fù)雜的問題。這種推理方式使得 AI Agent 更加類似于一個(gè)自主行動(dòng)的智能體,能夠在多變的環(huán)境中靈活地執(zhí)行任務(wù)。由此可見,AI Agent 的下一步發(fā)展或許才是真正意義上的智能體。
本文轉(zhuǎn)載自??AI探索者知白??,作者:知白
