智能體(Agent)的三種表現(xiàn)類型:聊天助手、工作流與對話流 原創(chuàng)
智能體主要由大語言模型(LLM)+ 提示詞(Prompt)+知識庫(RAG)+工作流(WorkFlow)+工具(Tools)等若干元素組成。
今天我們開啟《人人都會做智能體》公開課第 2 節(jié):智能體(Agent)的 3種表現(xiàn)類型——聊天助手類型、工作流類型、對話流類型。
「本文配圖主要來源于我的長篇圖文寫作助手」
??讓DeepSeek聊天記錄秒變長篇圖文和PPT的智能體,Claude3.7手把手喂飯教程!??
與智能體的組成不同,所謂的智能體表現(xiàn)模式,就是智能體呈現(xiàn)給大家的樣子或者交互方式。智能體開發(fā)平臺Dify里面,將智能體的類型分成了5種,但是我覺得這種分法很容易讓初學(xué)者產(chǎn)生誤解。
上圖種的Agent竟然是應(yīng)用類型,Agent不是智能體的英文名稱嗎?下圖種工作流的節(jié)點(diǎn)也叫Agent??
Dify的插件分類中也有Agent?另外Dify中的工具和插件的區(qū)別是什么?
所以說,Dify產(chǎn)品雖然非常優(yōu)秀,但是在我這種喜歡扣字眼的產(chǎn)品經(jīng)理眼里,Dify對產(chǎn)品的功能組件的定義顯得太過隨意,大部分人只是時(shí)間長了,用習(xí)慣了,自然而然的接受了,但是對于初學(xué)智能體開發(fā)的人來說,理解這些功能將會非常痛苦。
經(jīng)過對各種智能體的分析總結(jié),智能體其實(shí)主要分為這么三類,下面給大家詳細(xì)介紹一下。
(1)聊天助手類型
這種是最常見的智能體形態(tài),騰訊混元、通義千問、DeepSeek 的網(wǎng)頁聊天窗口其實(shí)就是智能體,也是普通用戶使用大模型使用的入口,越來越多的功能掛載到這個(gè)入口,這個(gè)網(wǎng)頁聊天窗口已經(jīng)從最簡單的聊天對話助手,變成了一個(gè)整合多模態(tài)能力的超級智能體。
聊天助手類型的主要有以下特點(diǎn):
在Dify種,聊天助手類型的智能體,開發(fā)界面一般是這樣的,如果這個(gè)智能體需要在對話時(shí)調(diào)用外部工具,則只需將工具添加進(jìn)來就可以了。
(2)工作流類型
工作流類型的智能體更加復(fù)雜和強(qiáng)大,它允許用戶設(shè)計(jì)一系列預(yù)定義的步驟,讓智能體按照這些步驟自動(dòng)執(zhí)行任務(wù)。
工作流型Agent具備執(zhí)行復(fù)雜任務(wù)的能力,通過集成外部工具、API和數(shù)據(jù)庫實(shí)現(xiàn)更強(qiáng)大的功能。它們能夠按照預(yù)設(shè)流程完成一系列操作,如自動(dòng)化數(shù)據(jù)分析、文檔處理或信息搜集。
工作流的本質(zhì)是一個(gè)流程圖或者說決策樹。
在Dify中,工作流類型的智能體開發(fā)及效果通常是這樣:
(3)對話流類型
對話流類型融合了聊天助手和工作流的特點(diǎn),它通過預(yù)設(shè)的對話路徑和決策樹,引導(dǎo)用戶完成特定目標(biāo)。對話流l類型智能體是最高級的智能體形態(tài),它結(jié)合了聊天助手的自然交互和工作流的任務(wù)執(zhí)行能力。這類智能體能在對話中理解用戶需求,動(dòng)態(tài)規(guī)劃并執(zhí)行任務(wù)序列,同時(shí)保持上下文一致性。
代表性產(chǎn)品如Siri、Google Assistant等多輪對話系統(tǒng),它們能夠處理復(fù)雜意圖解析,并通過多輪交互完成漸進(jìn)式任務(wù),為用戶提供沉浸式智能體驗(yàn)。
在Dify中,對話流類型的智能體界面通常是這樣:
智能體類型選擇
不同類型的智能體各有特點(diǎn),根據(jù)應(yīng)用場景選擇合適的類型可以提升效率和用戶體驗(yàn)。以下是三種主要智能體類型及其應(yīng)用建議。
以上就是智能體三種類型的主要內(nèi)容,下節(jié)課我們將重點(diǎn)將圍繞每種類型,講解智能體的組成元素以及制作步驟。
本文轉(zhuǎn)載自公眾號九歌AI大模型 作者:九歌AI
原文鏈接:??https://mp.weixin.qq.com/s/fEFaFvsNicNAoExnBM2U3w??
