AI Agent智能體產(chǎn)品的五個級別 原創(chuàng) 精華
OpenAI發(fā)布了其根據(jù)自身技術(shù)研發(fā)與產(chǎn)品開發(fā)的通往AGI的五級量表。OpenAI 將 AI 開發(fā)分為五個階段,每個階段代表更高級的能力水平:
- 第 1 級:聊天機器人—具有對話語言技能AI
- 第 2 級:推理者能夠在人類層面解決問題的AI
- 第 3 級:Agents可以代表用戶執(zhí)行操作的AI
- 第 4 級:創(chuàng)新者 — 可以協(xié)助發(fā)明的AI
- 第 5 級:組織者 — 可以管理組織任務的AI
彼時OpenAI剛發(fā)布o1模型不久,并且正在籌建多智能體團隊,因此處于第二階段與第三階段之間?,F(xiàn)在的OpenAI已經(jīng)開源了多智能體框架Swarm,當然它仍然處于2.5這個level。后續(xù)的進展,還要看明年初將要發(fā)布的能夠操作PC的智能體。
目前OpenAI向多Agent系統(tǒng)邁進與第三階段的目標一致,其中 AI Agent應代表用戶執(zhí)行操作,從而提高他們的能力和效率。
這里,也貼上這個五級量化表的中文版。
可以看到,OpenAI定義的第五級是能夠幫助組織完成復雜業(yè)務流程的AI。按照現(xiàn)在AI的發(fā)展速度,GUI-Agent將能夠快速接管一定的企業(yè)流程自動化,加上RAG技術(shù)的快速迭代翻新,5年之后差不多能夠?qū)崿F(xiàn)。但實現(xiàn)這個目標,卻不一定能夠?qū)崿F(xiàn)AGI的目標。畢竟LLM是存在一定的技術(shù)缺陷的,這也是抱有“AI泡沫論”看法之人的主要論據(jù)之一。
有人把OpenAI的五級量表看作通往AGI之路,也有人并不這么認為。比如在近日的一次采訪中,微軟人工智能首席穆斯塔法?蘇曼(Mustafa Suleyman)與 OpenAI 首席執(zhí)行官山姆?阿爾特曼 Sam Altman)之間就人工通用智能(AGI)的實現(xiàn)時間產(chǎn)生了明顯分歧。盡管 AGI 的實現(xiàn)是 “有可能的”,但這一目標可能需要十年的時間才能達到。
當然,還要看大語言模型的發(fā)展進程,畢竟LLM Based Agent的重點在于LLM。
AI Agent的5個級別
Autonomous Agents(自主智能體)是能夠獨立執(zhí)行一系列復雜任務以實現(xiàn)目標的AI系統(tǒng)。它是AI Agent發(fā)展的終極目標,各種類型的智能體都將奔著這個目標而努力。而現(xiàn)在我們常說的Agent其實也是泛指自主智能體,確切的說是自主智能體發(fā)展的初期階段。隨著人們的進一步探索,更加詳細的AI Agents 5級量化呼之欲出。
下面這張圖來自于 Kore.ai首席宣傳官COBUS GREYLING,完整而詳細的描繪了不同級別的AI Agent的技術(shù)、性能、能力、關(guān)鍵特征和用例。
通過具體技術(shù)描述的五級AI Agent,如下:
1. L0級別(無AI):這個級別的AI Agent不具備人工智能,僅有具備感知能力的工具加上行動功能。它們僅依賴于基礎(chǔ)規(guī)則和手動操作,無法展現(xiàn)智能化的行為。
2. L1級別(基于規(guī)則的AI):這個級別的AI Agent采用基于規(guī)則的人工智能系統(tǒng)。它們能夠根據(jù)預設的規(guī)則來執(zhí)行任務,但缺乏自我學習和適應新情況的能力。
3. L2級別(基于模仿學習/強化學習的AI):這個級別的AI Agent使用模仿學習(IL)或強化學習(RL)的人工智能,取代基于規(guī)則的系統(tǒng),并增強推理與決策功能。它們能夠通過學習來改進行為,以更好地適應環(huán)境。
4. L3級別(基于大型語言模型的AI):這個級別的AI Agent采用大型語言模型(LLM)的人工智能,替代IL/RL系統(tǒng),并增設記憶與反思模塊。它們能夠處理更復雜的任務,并且具有一定的記憶和自我反思能力。
5. L4級別(自主學習和泛化):在L3級別的基礎(chǔ)上,L4級別的AI Agent提升了自主學習和泛化能力,能夠更廣泛地應用學到的知識,并在不同情境下進行泛化。
6. L5級別(個性和協(xié)作行為):在L4級別的基礎(chǔ)上,L5級別的AI Agent融入了個性(情感與性格)和協(xié)作行為(多智能體交互),它們不僅能夠獨立學習,還能與其他智能體協(xié)作,展現(xiàn)出更接近人類的行為特征。
需要說明的是,這張圖表也是一個矩陣圖。X軸(性能)從下到上展示隨著智能體級別的增長性能逐步提升,Y軸(一般性)從左到右展示了不同級別智能體的各項屬性。
這張圖最具價值的地方在于,它不僅展示出了智能體的技術(shù)路徑,還通過特征與案例讓大家更容易理解各級智能體,并用具象化數(shù)字表述出了它們的能力,對于企業(yè)應用智能體和技術(shù)企業(yè)開發(fā)智能體都有一定的指導作用。
從這張圖表來看,目前市面上以及大家在用的AI Agent主要為第三級,且正在向第四級發(fā)展。整張圖片描繪了一個非常有“錢景”的AI Agent未來畫卷。
- AI Agent應用程序利用一個或多個語言模型作為其核心基礎(chǔ)或主干,動態(tài)生成響應和操作。
- 這些應用程序管理狀態(tài)和轉(zhuǎn)換,同時實時構(gòu)建事件鏈以解決特定的用戶查詢,從而提供自適應解決方案。
- AI Agent擅長處理模棱兩可或隱含的問題,將它們分解為連續(xù)的子步驟,并通過行動、觀察和反思的循環(huán)迭代處理,直到達到最終解決方案。
- 延遲和成本管理對于對話式實施至關(guān)重要,可以平衡響應能力與資源效率。Agentic 實現(xiàn)的延遲可能是個問題。
- 可檢查性和可觀察性對于生產(chǎn)實施至關(guān)重要,開發(fā)了強大的機制來揭示AI Agent所經(jīng)過的狀態(tài)和路徑,從而確保透明度。
- 為了完成任務,AI Agent可以使用各種工具,每個工具都有明確的目的——無論是進行 API 調(diào)用、執(zhí)行計算還是搜索 Web。
- 人機協(xié)同 (HITL) 可以用作輔助工具,使AI Agent能夠在需要時尋求人工輸入,從而擴展其操作能力。
- 可以無縫集成新的AI Agent工具以擴展功能,從而允許持續(xù)適應和增強自主AI Agent功能。
- AI Agent擁有真正的自主權(quán),獨立做出決策和執(zhí)行行動,需要最少的人工監(jiān)督。自主性級別由 AI Agent 可以循環(huán)的迭代次數(shù)設置,以得出結(jié)論;以及可供使用的工具數(shù)量。
- 憑借先進的靈活性,AI Agent可以根據(jù)情境需求動態(tài)選擇和排序工具,采用推理和自適應策略來解決出現(xiàn)的復雜任務。
智能體自動化的五個級別
在五級AI Agent的基礎(chǔ)上,自動化領(lǐng)域開始探索智能體自動化(Agentic Automation,也稱作代理自動化)。而一旦Agent成為元宇宙一樣的流行詞匯,也意味著更多人并不了真正解它。所以為了消除這些噪音并幫助更多公司設定他們的目標,Semae.ai引入了一種根據(jù)AI Agent功能和結(jié)果對AI Agent進行分類的方法。這也是一個智能體分類方法,不過角度換到了自動化。如下:
下面,是對于每一級智能體自動化的具體解讀。
0 級:固定自動化
在基層,固定自動化不代表真正的Agent行為。它相當于傳統(tǒng)的機器人流程自動化 (RPA),具有一組固定的規(guī)則和完全確定的結(jié)果。沒有計劃或執(zhí)行控制,因為一切都是在編程過程中預先確定的。人工交互僅限于處理異常,并且任務范圍僅限于基于規(guī)則的邏輯。
示例:表單、網(wǎng)站和業(yè)務應用程序的數(shù)據(jù)輸入。數(shù)據(jù)收集和抓取。
第 1 級:AI 增強自動化
首先,第一級在個人決策層面介紹基本的Agent行為。它本質(zhì)上是固定的自動化,其中一些步驟由大型語言模型 (LLM) 增強。雖然與傳統(tǒng)自動化相比,它提供的好處有限,但它代表了通過約束決策邁向更高級Agent的第一步。
示例:對客戶支持電子郵件進行分類并將其轉(zhuǎn)發(fā)給合適的團隊。
第 2 級:Agent助理
隨著我們上升一個級別,我們看到能夠使用工具調(diào)用的特定任務Agent自動化助理。這些系統(tǒng)可以解釋用戶意圖,確定所需的結(jié)果,并采取適當?shù)男袆印缈偨Y(jié)文本、生成內(nèi)容或使用特定工具。但是,它們僅限于靜態(tài)的短期計劃。
示例:用于搜索、匯總和起草電子郵件的對話式 co-pilot。
第 3 級:計劃和反思
今天,這個級別通常被稱為 AI Agent,它是第一個表現(xiàn)出受限自主性的級別。這些Agent系統(tǒng)可以根據(jù)給定的意圖創(chuàng)建計劃,執(zhí)行它們,反思它們的成功,并在必要時在執(zhí)行過程中修改計劃。當今許多高級 AI Agent都在此級別運行,能夠進行多個推理循環(huán)和規(guī)劃以實現(xiàn)預期結(jié)果。
示例:根據(jù)一組人工級別的規(guī)則和準則,根據(jù)內(nèi)部系統(tǒng)對賬一張100頁的發(fā)票。處理流程流和數(shù)據(jù)中的復雜性、模糊性和可變性。
第4 級:自我完善
4 級Agent自動化將能夠在有或沒有人工協(xié)作的情況下進行有意義的自我提升。它可以檢查和修改其指令和學習數(shù)據(jù),創(chuàng)建新工具,并連接到新的數(shù)據(jù)源。這種級別的自動化使Agent能夠跟上不斷變化的任務和環(huán)境。雖然目前是理論上的,但我們知道 4 級系統(tǒng)是可能的。然而,今天的 AI 模型缺乏在實際業(yè)務應用程序中支持它們的推理能力。
示例:復雜發(fā)票對賬的Agent,可以通過最少的人工協(xié)調(diào)添加新供應商,并隨著時間的推移提高準確性。
第 5 級:自主性
最高級別的Agent自動化代表了許多人認為的通用人工智能 (AGI)。這些假設的Agent表現(xiàn)出原創(chuàng)思維,并將綜合解決以前看不見的任務。利用先進的邏輯推理和創(chuàng)造力,5 級特工將能夠解決初始訓練之外的復雜問題。
示例:數(shù)字知識工作者能夠在沒有監(jiān)督的情況下端到端處理復雜任務。
對于分類和了解智能體自動化和AI Agent的功能,這個框架提供了一種有用的方法。通過明確定義這些級別,可以更好地溝通AI系統(tǒng),設定切合實際的期望,并規(guī)劃智能體自動化開發(fā)的前進道路。
需要注意的是,目前我們主要在前三個級別內(nèi)運營。超出此水平代表未來的可能性,這些可能性將改善我們的工作方式。隨著技術(shù)迭代和應用發(fā)展,按照作者的意思,這個框架應該也會會不斷發(fā)展以適應 AI 功能的新突破和見解。
從自動化角度來看市場的話,目前更多企業(yè)尚處于L0-L1,從L0、L1到L3,是廣大技術(shù)供應商的機會。
自主工作的六個層次
AI Agent不只影響了企業(yè)數(shù)字化技術(shù)的應用,更影響了廣大組織的業(yè)務架構(gòu)與作業(yè)方式。Agent的終極發(fā)展目標是Autonomous Agent能夠?qū)崿F(xiàn)主動響應和自主運行,所以在Agentic AI影響下的工作最終也將發(fā)展成為自主工作(autonomous work)。
未來十年不斷改進的AI資源將對企業(yè)和人類勞動力產(chǎn)生雙重影響。AI將產(chǎn)生廣泛的增強效應,接管低價值的任務,并使人類能夠?qū)⒕性诟邞?zhàn)略性和創(chuàng)造性的工作上。
在這個不完整但仍然相對堅實的基礎(chǔ)上,受到汽車工程師協(xié)會創(chuàng)建的“駕駛自動化的6個級別”的啟發(fā)(PS:駛自動化已經(jīng)啟發(fā)了很多行業(yè)),Salesforce首席數(shù)字宣傳官Vala Afshar等人開發(fā)了一個認知框架-自主工作的六個層次,用于反映AI 能力的演變以及它們將如何在未來十年左右對公司產(chǎn)生影響。
下面是對這個框架各維度的簡單解釋。
級別(Level)
每個自動化工作級別都由數(shù)字(0-6)和標題標識。標題指的是AI在該級別可以完成的工作量和復雜性。它本質(zhì)上是一個通用的工作分解,從最小和最簡單的工作單元開始,即一個任務(1級)。
比任務高一級的是子流程(2級),指的是通常按順序執(zhí)行以完成業(yè)務流程的一個離散部分的一組任務,例如確保所有相關(guān)信息已準確無誤地收集完整以開啟客戶案例。
在3級,AI有能力完成一個業(yè)務流程,如接收客戶訂單、從開放到關(guān)閉管理客戶案例,以及篩選潛在客戶。
在4級,AI可以完成從開始到結(jié)束的幾個流程,執(zhí)行通常按角色分配的大部分工作,如銷售代表、營銷專家或服務Agent。我們在這里關(guān)注的是典型的商業(yè)運營,但在制造業(yè)和其他類型的運營中也同樣適用。
階段(Phase)
六個自動化工作級別并不代表AI的線性發(fā)展軌跡。AI不會以傳統(tǒng)的職業(yè)晉升方式在組織中發(fā)展到更高級別的角色。相反,在其發(fā)展過程中將有兩個非常不同的階段。
第一個是1-3級,我們可以將其描述為增強階段,在這個階段數(shù)字助手將使人類員工能夠發(fā)揮最大的工作能力,并為他們創(chuàng)造新的機會。
第二個是4-6級,這是替代階段,在這個階段數(shù)字Agent將從人類那里承擔越來越多的責任,并隨著時間的推移開始取代他們。
AI角色(Al Role)
在這里,我們從非技術(shù)的角度描述了AI的主要能力以及它與人類同事的關(guān)系。如果有興趣,我們將在后續(xù)提供每個級別的更深入的技術(shù)視角,但現(xiàn)在我們希望突出人與AI之間的關(guān)系。
人類角色(Human Role)
這是AI角色的另一面,同樣關(guān)注人類與AI之間的關(guān)系以及他們的相對責任和能力。
采納(Adoption)
預計主流采納者(廣泛包括早期和晚期大多數(shù)采納者類別)開始在每個級別應用AI的日期。創(chuàng)新者和早期采納者會更早,而落后者可能會更晚,除非危機改變了他們的發(fā)展軌跡。
采納率將因行業(yè)而異,甚至因部門而異。即使在員工層面,采納過程也不太可能是平滑的。有些人會欣然接受AI,盡管他們更可能接受的是讓他們從單調(diào)乏味的工作部分中解放出來的AI,而不是承諾(或威脅)執(zhí)行更有創(chuàng)造性和/或戰(zhàn)略性部分的AI。
其他人,特別是那些擔心自己的工作將被AI完全取代的人,可能會抵制整個過程。總的來說,我們已經(jīng)看到預測性和生成性AI在大多數(shù)行業(yè)中的應用實例,我們知道更復雜和有能力的機器人和Agent即將到來。
自主工作對商業(yè)的影響包括三個重要方面:
首先,AI的發(fā)展將分為增強(1-3級)和替代(4級以上)兩個階段。增強階段中,AI將提升工作效率,釋放人類從事戰(zhàn)略和創(chuàng)造性工作。替代階段中,AI將快速取代人類工作。
其次,AI將加速公司的運營周期,通過SUDA模型(感知、理解、決策、行動)提升公司的反應速度和決策優(yōu)勢。
第三,AI將超越人類能力,處理復雜、準確和快速的任務,其能力將不再以人力單位衡量,而是以機器能力來衡量。
從整個認知框架來看,在某個階段可能在五年左右的時間里,AI將開始接管整個工作角色,從最“程序化”或基于規(guī)則的工作開始。最終,它將獲得足夠的決策和編排能力來接管整個團隊甚至業(yè)務線。
本文轉(zhuǎn)載自公眾號數(shù)字化助推器 作者:天涯咫尺TGH
原文鏈接:??https://mp.weixin.qq.com/s/mU94UlVrRFwzj5V6IVToxw??
