大模型應(yīng)用的能力分級(jí)
原創(chuàng)對(duì)大模型應(yīng)用的能力分級(jí)就像給學(xué)生打分一樣,能讓我們更清楚它的本事有多大。能力分級(jí)能幫我們?cè)O(shè)定目標(biāo),知道AI現(xiàn)在能干什么,未來(lái)還要學(xué)什么。有了統(tǒng)一的分級(jí)方式,大家就能公平比較不同AI的水平,推動(dòng)技術(shù)進(jìn)步。同時(shí),不同分級(jí)的AI適合干不同的活兒,能幫我們找到最合適的幫手。另外,能力分級(jí)讓普通人更容易理解AI的能力,避免過度期待或擔(dān)心。
大模型的應(yīng)用主要有兩種常見模式:RAG 和 Agent。選哪種 RAG 架構(gòu),得看具體要解決什么問題,確保它適合任務(wù)需求。現(xiàn)在,帶有智能體(Agent)功能的 RAG 越來(lái)越重要,它和“智能體 x”的概念很像。這個(gè)“x”就像是一個(gè)萬(wàn)能工具箱,可以根據(jù)不同場(chǎng)景靈活調(diào)整,幫我們自動(dòng)完成任務(wù)并做出明智決策,從而提升效率。另外,要想處理復(fù)雜的多部分問題,整合不同來(lái)源的文檔信息非常關(guān)鍵。簡(jiǎn)單來(lái)說,這些技術(shù)都是為了讓人工智能更聰明、更靈活地幫我們解決問題。
1. RAG 回顧
實(shí)現(xiàn)一個(gè)高效的 RAG(檢索增強(qiáng)生成)系統(tǒng)面臨幾個(gè)關(guān)鍵挑戰(zhàn):首先,系統(tǒng)需要能夠準(zhǔn)確地找到與用戶問題相關(guān)的信息;其次,它必須正確理解用戶的真實(shí)意圖;最后,還要能夠利用大型語(yǔ)言模型(LLM)的推理能力來(lái)處理復(fù)雜的任務(wù)。為了提升推理能力,可以采用一種叫做“Agentic”的方法,比如 ReAct,這種方法通過構(gòu)建一系列的邏輯推理和操作步驟來(lái)解決問題。需要注意的是,不同的 LLM 應(yīng)用場(chǎng)景可能需要不同的解決方案,沒有一種方法能適用于所有情況。
1.1 上下文
上下文指的是對(duì)話過程中積累的相關(guān)信息,它幫助 AI 更好地理解用戶的需求,并作出恰當(dāng)、連貫的回應(yīng)。這些信息包括用戶之前說過的話、當(dāng)前的任務(wù)背景、環(huán)境因素,以及其他可能影響對(duì)話的外部數(shù)據(jù)。通過有效地處理上下文,AI 能夠保持對(duì)話的一致性和個(gè)性化,根據(jù)對(duì)話的進(jìn)展調(diào)整回答,使整個(gè)交流過程更加自然和有意義。
1.2 用戶意圖檢測(cè)
很多時(shí)候,系統(tǒng)表現(xiàn)不佳是因?yàn)闆]有抓住用戶問題的核心,或者面對(duì)需要多種技能結(jié)合的任務(wù)時(shí),未能準(zhǔn)確區(qū)分和應(yīng)用這些技能。用戶意圖指的是用戶提問背后的真正目的或目標(biāo),即他們希望通過問題得到什么或表達(dá)什么。準(zhǔn)確識(shí)別用戶意圖是 AI 系統(tǒng)提供合適回應(yīng)的關(guān)鍵。
2. RAG 的能力分級(jí)
根據(jù)微軟的研究成果,RAG的能力可以從搜索的復(fù)雜程度上分為4個(gè)層級(jí)。
圖片
2.1 Level 1: 顯式事實(shí)查詢
這種查詢是最簡(jiǎn)單的形式,用戶直接詢問某個(gè)具體的事實(shí),而這個(gè)事實(shí)在數(shù)據(jù)中是明確存在的,不需要額外的推理。比如,用戶問“地球的直徑是多少?”這種問題只需要從數(shù)據(jù)中找到對(duì)應(yīng)的數(shù)字即可。RAG 系統(tǒng)的任務(wù)就是定位并提取這些直接存在的信息,就像在一本書中快速找到某個(gè)特定的句子一樣。
2.2 Level 2: 隱式事實(shí)查詢
這種查詢稍微復(fù)雜一些,用戶的問題并不是直接指向某個(gè)明確的事實(shí),而是需要結(jié)合一些背景知識(shí)或邏輯推理才能得出答案。比如,用戶問“堪培拉所在國(guó)的多數(shù)黨是什么?”要回答這個(gè)問題,系統(tǒng)需要知道堪培拉是澳大利亞的首都,然后再結(jié)合澳大利亞當(dāng)前的政黨情況來(lái)推斷答案。這種查詢可能需要從多個(gè)地方提取信息,并進(jìn)行簡(jiǎn)單的邏輯連接。
在這個(gè)層次上,RAG 系統(tǒng)開始展現(xiàn)出一定的“智能體”特性,因?yàn)樗粌H需要檢索信息,還需要進(jìn)行一些推理和邏輯判斷。
2.3 Level 3: 可解釋的推理查詢
這種查詢不僅要求知道事實(shí),還需要理解事實(shí)背后的邏輯和原理,并且能夠提供清晰的解釋?;卮疬@類問題需要結(jié)合事實(shí)知識(shí)和特定領(lǐng)域的規(guī)則或準(zhǔn)則,而這些規(guī)則通常不會(huì)在普通的語(yǔ)言模型預(yù)訓(xùn)練中出現(xiàn)。
舉個(gè)例子,在財(cái)務(wù)審計(jì)中,一個(gè)法律專家可能需要根據(jù)合規(guī)準(zhǔn)則來(lái)判斷一家公司的財(cái)務(wù)報(bào)表是否符合標(biāo)準(zhǔn)。這不僅僅是簡(jiǎn)單地查找數(shù)據(jù),還需要應(yīng)用專業(yè)的規(guī)則來(lái)分析和解釋。
同樣,在技術(shù)支持場(chǎng)景中,系統(tǒng)可能需要按照故障排除的流程來(lái)幫助用戶解決問題,確保每一步都符合既定的操作規(guī)范,從而提供準(zhǔn)確且一致的響應(yīng)。這種查詢要求系統(tǒng)不僅要有知識(shí),還要有能力應(yīng)用這些知識(shí)來(lái)解決實(shí)際問題。
2.4 Level 4: 隱式的推理查詢
這種查詢要求 AI 不僅要看到表面的信息,還要深入挖掘數(shù)據(jù)背后的潛在規(guī)律和邏輯。它需要根據(jù)上下文和觀察到的模式,推斷出那些沒有直接寫出來(lái)的復(fù)雜原理。這些隱藏的原理往往涉及深層次的推理和邏輯聯(lián)系,很難直接找到或提取。
例如,在 IT 運(yùn)維中,AI 可以通過分析過去解決類似問題的成功案例,總結(jié)出有效的策略。它需要從大量數(shù)據(jù)中發(fā)現(xiàn)規(guī)律,而不是簡(jiǎn)單地照搬已有的解決方案。
另外,在軟件開發(fā)中,AI 可以通過研究過去的調(diào)試案例,推斷出高效的問題解決方法。通過整合這些隱含的洞察,AI 能夠提供更精細(xì)、更貼近實(shí)際經(jīng)驗(yàn)的建議,幫助做出更明智的決策。這種查詢體現(xiàn)了 AI 從數(shù)據(jù)中學(xué)習(xí)并提煉智慧的能力。
圖片
可解釋和隱藏的基本原理將重點(diǎn)放在了 RAG 系統(tǒng)理解和運(yùn)用數(shù)據(jù)背后邏輯的能力上。這些更高層次的任務(wù)需要更深入的思考過程,通常需要結(jié)合專家知識(shí)或從大量非結(jié)構(gòu)化歷史數(shù)據(jù)中提煉出有價(jià)值的見解。
通過前面的例子可以看出,直接查詢明確事實(shí)的任務(wù)(比如查詢簽證資格需要參考領(lǐng)事館的官方指南,屬于 L3)與需要依賴隱含推理的任務(wù)(比如分析公司未來(lái)發(fā)展的經(jīng)濟(jì)影響,需要結(jié)合財(cái)務(wù)報(bào)告和經(jīng)濟(jì)趨勢(shì),屬于 L4)是有明顯區(qū)別的。
無(wú)論是哪種情況,數(shù)據(jù)的外部來(lái)源都至關(guān)重要——可能是官方文件,也可能是專家的分析報(bào)告。在這些場(chǎng)景中,提供基本原理不僅能讓回答更加準(zhǔn)確,還能將答案與上下文聯(lián)系起來(lái),讓用戶不僅知道“是什么”,還能理解“為什么”。這種能力讓 智能體化 RAG 系統(tǒng)的回答更加全面和可信。
3.AI Agent
AI Agent 是一種智能自動(dòng)化系統(tǒng),能夠理解和應(yīng)對(duì)復(fù)雜問題,解決多方面的挑戰(zhàn),并完成需要推理、適應(yīng)和決策的任務(wù)。與傳統(tǒng)的自動(dòng)化工具不同(它們通常依賴固定的規(guī)則和預(yù)設(shè)的腳本),AI Agent 利用機(jī)器學(xué)習(xí)(ML)和自然語(yǔ)言處理(NLP)技術(shù),能夠不斷學(xué)習(xí)和提升自己。這種能力讓 AI Agent 變得非常靈活,可以應(yīng)對(duì)動(dòng)態(tài)且不可預(yù)測(cè)的環(huán)境,并隨著新信息的出現(xiàn)快速調(diào)整策略。
例如,如果一個(gè) AI Agent 的任務(wù)是提供客戶支持,它可以從過去的對(duì)話中學(xué)習(xí),改進(jìn)自己的回答方式,并自動(dòng)適應(yīng)每個(gè)客戶的獨(dú)特需求。這種既能自主學(xué)習(xí)又能獨(dú)立運(yùn)作的能力,使 AI Agent 成為復(fù)雜環(huán)境中的理想選擇,尤其是在需要高度適應(yīng)性和對(duì)上下文深度理解的場(chǎng)景中。
3.1 AI Agents的主要特征
AI Agent對(duì)企業(yè)來(lái)說是個(gè)“好幫手”,能簡(jiǎn)化工作、提升客服水平、提高團(tuán)隊(duì)效率。它的優(yōu)勢(shì)主要體現(xiàn)在以下幾個(gè)方面:
- 靈活應(yīng)變:AI Agent能根據(jù)最新數(shù)據(jù)調(diào)整策略,輕松應(yīng)對(duì)各種復(fù)雜多變的場(chǎng)景。
- 任務(wù)拆分:將大任務(wù)拆成小步驟,一步步解決,還能不斷優(yōu)化,直到找到最佳方案。
- 理解上下文:AI Agent能“聽懂”對(duì)話或任務(wù)的背景,即使問題復(fù)雜或模糊,也能給出準(zhǔn)確回應(yīng)。
- 人機(jī)協(xié)作:遇到難題或需要高精度時(shí),AI Agent可以請(qǐng)人類專家?guī)兔ΓY(jié)合AI的高效和人類的智慧。
- 工具整合:它能連接各種外部工具、數(shù)據(jù)庫(kù)和系統(tǒng),執(zhí)行計(jì)算或獲取實(shí)時(shí)數(shù)據(jù),功能更強(qiáng)大。
不過,使用AI Agent也需要仔細(xì)規(guī)劃,比如控制響應(yīng)時(shí)間、確保透明性,以及保證數(shù)據(jù)質(zhì)量。只有這樣,才能讓它真正發(fā)揮作用。
3.2 AI Agents的演化: 從簡(jiǎn)單自動(dòng)化到復(fù)雜自主系統(tǒng)
AI Agent 的發(fā)展離不開機(jī)器學(xué)習(xí)和自然語(yǔ)言處理技術(shù)的進(jìn)步,同時(shí)也得益于對(duì)現(xiàn)實(shí)世界復(fù)雜場(chǎng)景的適應(yīng)需求。早期的自動(dòng)化工具,比如 RPA(機(jī)器人流程自動(dòng)化)和鏈?zhǔn)较到y(tǒng),雖然能夠處理結(jié)構(gòu)化的任務(wù)流程,但缺乏應(yīng)對(duì)不可預(yù)測(cè)情況的靈活性。而隨著 AI Agent 的出現(xiàn),我們現(xiàn)在擁有了能夠處理模糊輸入、進(jìn)行多步推理,并根據(jù)動(dòng)態(tài)變化的上下文做出決策的智能系統(tǒng)。
傳統(tǒng)的自動(dòng)化工具依賴于預(yù)先設(shè)定好的任務(wù)步驟,每一步都嚴(yán)格按照固定的規(guī)則執(zhí)行。例如,RPA 通過模擬人類與軟件的交互(比如登錄系統(tǒng)、將數(shù)據(jù)從一個(gè)應(yīng)用復(fù)制到另一個(gè)應(yīng)用)來(lái)自動(dòng)化重復(fù)性任務(wù)。然而,RPA 的局限性在于它的僵化性——一旦工作流程或條件發(fā)生變化,就需要重新編程,這使得它在面對(duì)動(dòng)態(tài)環(huán)境時(shí)顯得力不從心。
與傳統(tǒng)的 RPA 和鏈?zhǔn)较到y(tǒng)相比,AI Agent 具備完全不同的能力。接下來(lái),從多個(gè)維度詳細(xì)探討它們之間的區(qū)別:
指標(biāo) | AI Agent | 傳統(tǒng)自動(dòng)化系統(tǒng)(RPA) |
靈活性和推理能力 | 高度的靈活性和復(fù)雜的推理能力,能夠根據(jù)實(shí)時(shí)條件調(diào)整動(dòng)作 | 剛性的,遵循預(yù)先設(shè)定的規(guī)則,沒有偏差 |
粒度狀態(tài)感知 | 保持對(duì)其環(huán)境的粒度理解,允許它們調(diào)整以適應(yīng)不斷變化的條件 | 局限于固定的工作流 |
自動(dòng)化方法 | 使用機(jī)器學(xué)習(xí)和自然語(yǔ)言處理動(dòng)態(tài)決策 | 依賴于基于規(guī)則的腳本 |
人機(jī)互動(dòng)(HITL) | 在不確定的情況下,人的監(jiān)督可以指導(dǎo)智能體,提高準(zhǔn)確性 | 依靠手動(dòng)干預(yù)異常 |
成本管理 | 有較高的初始成本,但由于其適應(yīng)性,可提供可伸縮性和長(zhǎng)期節(jié)省。 | 具有較低的前期成本,但隨著頻繁的更新而變得昂貴。 |
延遲優(yōu)化 | 通過預(yù)取和并行處理最小化延遲 | 順序操作,導(dǎo)致較高的延遲 |
動(dòng)作序列生成 | 動(dòng)態(tài)地生成動(dòng)作序列,根據(jù)上下文的變化進(jìn)行調(diào)整 | 遵循嚴(yán)格的序列 |
工具集成 | 與外部工具無(wú)縫集成,根據(jù)需要擴(kuò)展它們的能力 | 需要手動(dòng)配置才能添加新工具 |
透明度 | 允許洞察他們的決策過程,這對(duì)于信任和合規(guī)必不可少 | 靜態(tài)特性,通常不太透明 |
工作流程設(shè)計(jì) | 專注于基于編碼的配置 | 經(jīng)常使用視覺設(shè)計(jì)畫布,允許輕松的拖放調(diào)整 |
會(huì)話能力 | 擅長(zhǎng)自然語(yǔ)言會(huì)話,處理復(fù)雜的,類似人類的互動(dòng) | 僅限于簡(jiǎn)單的文本命令 |
學(xué)習(xí)能力 | 自主地從經(jīng)驗(yàn)中學(xué)習(xí) | 沒有任何學(xué)習(xí)能力 |
上下文感知 | 基于交互的上下文做出響應(yīng) | 在靜態(tài)框架內(nèi)運(yùn)行 |
任務(wù)分解 | 將任務(wù)分解成更小的步驟,并根據(jù)反饋進(jìn)行調(diào)整 | 遵循線性的固定路徑 |
實(shí)時(shí)決策 | 根據(jù)實(shí)時(shí)數(shù)據(jù)做出決策 | 使用預(yù)定義的決策樹 |
處理非結(jié)構(gòu)化數(shù)據(jù) | 可以解釋自然語(yǔ)言、圖像和音頻等非結(jié)構(gòu)化數(shù)據(jù) | 難以處理非結(jié)構(gòu)化數(shù)據(jù) |
目標(biāo)導(dǎo)向行為 | 追求高層次的目標(biāo),調(diào)整方法以達(dá)到目標(biāo) | 以任務(wù)為中心的,缺乏總體目的導(dǎo)向 |
可伸縮性 | 具有高度的可伸縮性,可以在不同的環(huán)境中運(yùn)行 | 需要定制才能在不同的系統(tǒng)中運(yùn)行 |
主動(dòng)能力 | 可以根據(jù)用戶行為啟動(dòng)操作 | 只對(duì)特定的觸發(fā)器做出反應(yīng) |
工具互操作性 | 靈活地與各種工具和 api 集成 | 僅限于特定的工具 |
開發(fā)環(huán)境 | 需要基于代碼的環(huán)境 | 無(wú)代碼 / 低代碼友好 |
適應(yīng)性 | 利用機(jī)器學(xué)習(xí)來(lái)處理新的、不可預(yù)見的情況,使它們能夠適應(yīng)變化 | 在計(jì)劃外的情況下會(huì)失敗 |
關(guān)于Agent 的更多內(nèi)容,可以參考《AI 驅(qū)動(dòng)的數(shù)據(jù)分析:Data Agent》、《Agent 應(yīng)用于提示工程》、《基于大模型(LLM)的Agent 應(yīng)用開發(fā)》和《當(dāng)你問代理機(jī)制的時(shí)候?指的是Agent,Proxy,Broker還是Delegate呢?》等文。
4. AI Agent的 5 個(gè)自主性能力層級(jí)
AI Agent可以分為五個(gè)等級(jí)的自主性,每一個(gè)等級(jí)代表獨(dú)立行動(dòng)和處理復(fù)雜任務(wù)的能力。
圖片
4.1 Level 1: 反應(yīng)性智能體
反應(yīng)性智能體是最基礎(chǔ)的 AI Agent 類型。它們的工作原理很簡(jiǎn)單:根據(jù)“如果發(fā)生 X,那么就執(zhí)行 Y”的規(guī)則來(lái)響應(yīng)特定的輸入。這些智能體沒有記憶功能,也無(wú)法理解上下文,因此只能處理非常簡(jiǎn)單的任務(wù)。雖然它們?cè)诨卮鹨恍┏R妴栴}時(shí)表現(xiàn)不錯(cuò),但面對(duì)更復(fù)雜或需要靈活應(yīng)對(duì)的請(qǐng)求時(shí),就顯得力不從心了。
主要特點(diǎn):
- 基于規(guī)則運(yùn)行:只能按照預(yù)設(shè)的規(guī)則做出反應(yīng)。
- 沒有記憶:無(wú)法記住過去的交互或?qū)W習(xí)新的信息。
- 適用場(chǎng)景:適合處理簡(jiǎn)單的客戶服務(wù)任務(wù)或日常查詢。
舉個(gè)例子:一個(gè)簡(jiǎn)單的客服機(jī)器人,可以回答像“你們的營(yíng)業(yè)時(shí)間是幾點(diǎn)?”或“我的訂單到哪了?”這樣的常見問題,但如果問題稍微復(fù)雜一點(diǎn),比如“我的訂單為什么延遲了?”,它就很難給出有用的回答了。
4.2 Level 2: 上下文智能體
上下文智能體比反應(yīng)性智能體更聰明一些,它們能理解基本的語(yǔ)境信息。不像只能簡(jiǎn)單回應(yīng)的智能體,它們可以通過分析環(huán)境中的線索做出更合理的決定。雖然它們?nèi)匀灰蕾囈?guī)則,但能根據(jù)用戶的歷史記錄、位置等條件調(diào)整回應(yīng)方式。
主要特點(diǎn):
- 能利用有限的上下文信息提高回應(yīng)的準(zhǔn)確性。
- 可以根據(jù)環(huán)境變化調(diào)整行為。
- 適合需要結(jié)合簡(jiǎn)單上下文來(lái)提升服務(wù)質(zhì)量的場(chǎng)景。
舉個(gè)例子:比如,一個(gè)虛擬助手可以根據(jù)用戶的位置推薦附近的商店?duì)I業(yè)時(shí)間,或者根據(jù)用戶過去的互動(dòng)記錄提供更個(gè)性化的建議。這種智能體能讓服務(wù)更貼心、更實(shí)用。
4.3 Level 3: 適應(yīng)性智能體
自適應(yīng)智能體就像會(huì)學(xué)習(xí)的小助手,它們利用機(jī)器學(xué)習(xí)技術(shù)從過去的互動(dòng)中總結(jié)經(jīng)驗(yàn),不斷改進(jìn)自己的表現(xiàn)。它們能根據(jù)用戶的反饋調(diào)整行為,非常適合需要靈活應(yīng)對(duì)的場(chǎng)景。這類智能體常用于客服和支持工作,通過分析用戶反饋來(lái)提升服務(wù)質(zhì)量。
主要特點(diǎn):
- 借助機(jī)器學(xué)習(xí),能夠持續(xù)進(jìn)步。
- 通過分析用戶反饋和行為模式,優(yōu)化回應(yīng)方式。
- 非常適合需要靈活適應(yīng)、依賴數(shù)據(jù)的任務(wù)。
舉個(gè)例子:比如,一個(gè)客服機(jī)器人可以通過分析過去的對(duì)話和用戶反饋,更好地理解客戶需求,提供更精準(zhǔn)的幫助。
4.4 Level 4: 目標(biāo)驅(qū)動(dòng)的智能體
目標(biāo)驅(qū)動(dòng)型智能體就像“有主見的小助手”,它們被設(shè)計(jì)成能夠獨(dú)立完成特定目標(biāo),并通過策略性方法解決問題。與只能執(zhí)行簡(jiǎn)單任務(wù)或適應(yīng)環(huán)境的智能體不同,它們會(huì)評(píng)估多種策略,并選擇最有可能達(dá)成目標(biāo)的方式。這讓它們特別適合處理需要多步計(jì)劃和執(zhí)行的復(fù)雜任務(wù)。
主要特點(diǎn):
- 獨(dú)立運(yùn)作,能評(píng)估不同方法來(lái)實(shí)現(xiàn)目標(biāo)。
- 可以給任務(wù)排優(yōu)先級(jí),并根據(jù)結(jié)果靈活調(diào)整策略。
- 非常適合需要戰(zhàn)略規(guī)劃和分步執(zhí)行的復(fù)雜任務(wù)。
舉個(gè)例子:比如,一個(gè)銷售助手機(jī)器人可以根據(jù)客戶的購(gòu)物記錄,主動(dòng)推薦商品,甚至建議搭配單品,幫客戶完成一整套服裝搭配,實(shí)現(xiàn)他們的購(gòu)物目標(biāo)。
4.5 Level 5: 完全自主的適應(yīng)性智能體
完全自主的適應(yīng)性智能體就像“超級(jí)智能助手”,它們幾乎可以獨(dú)立完成復(fù)雜任務(wù),幾乎不需要人類干預(yù)。它們能理解雜亂無(wú)章的數(shù)據(jù),靈活應(yīng)對(duì)突發(fā)情況,并根據(jù)實(shí)時(shí)反饋調(diào)整策略。這種智能體非常適合高風(fēng)險(xiǎn)、快節(jié)奏的環(huán)境,因?yàn)樗鼈兊姆磻?yīng)速度和準(zhǔn)確性都非常出色。
主要特點(diǎn):
- 能夠自我學(xué)習(xí)并實(shí)時(shí)調(diào)整行為。
- 主動(dòng)根據(jù)用戶行為和上下文采取行動(dòng)。
- 在高度變化的環(huán)境中也能高效工作,幾乎不需要人類監(jiān)督。
舉個(gè)例子:比如,一個(gè)醫(yī)療AI智能體可以實(shí)時(shí)監(jiān)測(cè)患者的健康數(shù)據(jù),發(fā)現(xiàn)潛在的健康風(fēng)險(xiǎn),并根據(jù)每個(gè)患者的病史和風(fēng)險(xiǎn)因素,給出預(yù)防性護(hù)理建議或進(jìn)一步檢查的方案。
圖片
AI Agent 標(biāo)志著商業(yè)技術(shù)的一次重大飛躍,它能夠自動(dòng)化處理那些復(fù)雜且高價(jià)值的任務(wù),而這些任務(wù)在過去是無(wú)法交給機(jī)器完成的。隨著機(jī)器學(xué)習(xí)、自然語(yǔ)言處理和計(jì)算能力的不斷進(jìn)步,AI Agent 將變得更加智能和自主,能夠更好地理解上下文、學(xué)習(xí)新知識(shí)并做出明智的決策。
采用 AI Agent 的企業(yè)將從中獲得顯著的好處,比如提高工作效率、降低運(yùn)營(yíng)成本以及提升客戶滿意度。隨著 AI Agent 能力的不斷增強(qiáng),我們可以預(yù)見它們將在戰(zhàn)略決策、客戶互動(dòng)以及跨行業(yè)的流程優(yōu)化中發(fā)揮越來(lái)越重要的作用,成為推動(dòng)企業(yè)發(fā)展的核心力量。
5. 小結(jié)
將大模型應(yīng)用的能力進(jìn)行分級(jí),不僅有助于推動(dòng)技術(shù)發(fā)展,還能更好地匹配實(shí)際應(yīng)用場(chǎng)景,同時(shí)也讓公眾更容易理解其價(jià)值。
根據(jù)微軟的研究,RAG 的能力可以按照搜索的復(fù)雜程度分為四個(gè)層次:顯式事實(shí)查詢、隱式事實(shí)查詢、可解釋的推理查詢和隱式的推理查詢。無(wú)論處于哪個(gè)層次,外部數(shù)據(jù)來(lái)源都起著關(guān)鍵作用。
而根據(jù) AI Agent 的自主性,可以將其分為五個(gè)層次:反應(yīng)性智能體、上下文智能體、適應(yīng)性智能體、目標(biāo)驅(qū)動(dòng)的智能體和完全自主的適應(yīng)性智能體。未來(lái)的 AI 將是一個(gè)由多個(gè)相互關(guān)聯(lián)、高度自主的智能體組成的生態(tài)系統(tǒng)。這些智能體將支持和增強(qiáng)人類的能力,提供更加個(gè)性化、高效且靈活的全新解決方案。
【參考資料】
- Retrieval Augmented Generation (RAG) and Beyond: A Comprehensive Survey on How to Make your LLMs use External Data More Wisely,https://arxiv.org/pdf/2409.14924
- https://blog.kore.ai/cobus-greyling/five-levels-of-ai-agents
- https://blog.spheron.network/the-5-levels-of-ai-agents-a-comprehensive-guide-to-autonomous-ai-systems