Agent 智能體開發(fā)框架如何優(yōu)雅選型? 原創(chuàng)
1、Agent 智能體進(jìn)入黃金發(fā)展期
Agent 智能體的發(fā)展正步入黃金時(shí)代。隨著眾多新框架的層出不窮和對(duì)該領(lǐng)域的持續(xù)投入,現(xiàn)在 Agent 智能體已逐步擺脫初期的動(dòng)蕩,迅速崛起,成為開發(fā)者的首選,超越了 RAG。那么,2024年是否會(huì)成為 Agent 智能體系統(tǒng)全面接管撰寫郵件、預(yù)訂航班、數(shù)據(jù)分析等任務(wù)的元年呢?
?
這或許有可能,但距離這一目標(biāo)還有許多挑戰(zhàn)需要克服。在構(gòu)建 Agent 智能體的過(guò)程中,開發(fā)者們不僅要考慮選用哪種大模型、應(yīng)用場(chǎng)景和技術(shù)架構(gòu),還需要在眾多開發(fā)框架中做出抉擇。是繼續(xù)沿用較為成熟的 LangGraph,還是擁抱新興的 LlamaIndex Workflows?或者回歸傳統(tǒng),親自編寫所有代碼?
本文旨在幫助您更輕松地做出決策。在過(guò)去幾周,我們利用多個(gè)主流框架構(gòu)建了相同的智能體,并從技術(shù)角度對(duì)它們的優(yōu)勢(shì)和不足進(jìn)行了分析。
2、Code-Based Agent(不使用智能體框架)
在著手開發(fā) Agent 智能體應(yīng)用時(shí),你可以選擇不依賴任何框架,而是完全自主構(gòu)建,整體流程如下所示:
以下 Agent 智能體應(yīng)用完全由代碼構(gòu)建而成,其核心是一個(gè)由 OpenAI 技術(shù)支撐的技能調(diào)度器。該調(diào)度器通過(guò)函數(shù)調(diào)用機(jī)制來(lái)決定激活哪項(xiàng)技能。技能操作完成后,控制權(quán)將重新交還給技能調(diào)度器,以便于它能夠繼續(xù)調(diào)度其他技能或者直接對(duì)用戶進(jìn)行反饋。
在整個(gè)交互過(guò)程中,Agent 智能體不斷記錄用戶的提問和自身的回答,并在每次技能調(diào)用時(shí),將這一系列對(duì)話完整地傳遞給技能調(diào)度器,以此保證交互的連貫性和上下文的完整性。
3、LangGraph
LangGraph 是眾多 Agent 智能體框架中最早出現(xiàn)的一個(gè),它在 2024 年 1 月首次亮相。這個(gè)框架的創(chuàng)建目的是為了克服現(xiàn)有流程和鏈條中的非循環(huán)性挑戰(zhàn),通過(guò)運(yùn)用 Pregel 圖模型來(lái)應(yīng)對(duì)這一難題。LangGraph 通過(guò)引入節(jié)點(diǎn)、邊以及條件邊的概念,簡(jiǎn)化了在智能體內(nèi)部構(gòu)建循環(huán)流程的步驟,使得圖結(jié)構(gòu)的遍歷更為直觀易懂。LangGraph 是建立在 LangChain 之上的,它沿用了 LangChain 的對(duì)象和類型系統(tǒng)。
乍一看,LangGraph 智能體與傳統(tǒng)的基于代碼的智能體似乎有共通之處,然而它們的底層實(shí)現(xiàn)卻存在顯著差異。盡管 LangGraph 也采用了“路由器”這一術(shù)語(yǔ),指的是通過(guò)函數(shù)調(diào)用與 OpenAI 交互并利用其輸出推動(dòng)流程前進(jìn),但是它在不同技能間的切換邏輯卻是獨(dú)樹一幟的。
在所描述的圖結(jié)構(gòu)中,我們定義了一個(gè)用于啟動(dòng) OpenAI 調(diào)用的節(jié)點(diǎn),即“agent”,以及一個(gè)用于執(zhí)行工具處理步驟的節(jié)點(diǎn),即“tools”。LangGraph 提供了一個(gè)名為 ToolNode 的內(nèi)置對(duì)象,該對(duì)象能夠接收并調(diào)用一系列工具,根據(jù) ChatMessage 的反饋來(lái)激活這些工具,并在操作完成后返回到“agent”節(jié)點(diǎn)。
每當(dāng)“agent”節(jié)點(diǎn)(在基于代碼的智能體中相當(dāng)于技能路由器)被激活后,should_continue 這條邊將決定是將輸出直接傳送給用戶,還是傳遞給 ToolNode 以進(jìn)行工具調(diào)用。
在每個(gè)節(jié)點(diǎn)內(nèi)部,“state” 負(fù)責(zé)存儲(chǔ)與 OpenAI 之間的交互消息和響應(yīng)歷史,這一點(diǎn)與基于代碼的智能體在維持上下文方面有著相似的做法。
4、LlamaIndex Workflows
Workflows 是 Agent 智能體框架領(lǐng)域的新加入者,它在今年夏天初首次發(fā)布。與 LangGraph 相似,其設(shè)計(jì)目標(biāo)是簡(jiǎn)化循環(huán)智能體的構(gòu)建流程。此外,Workflows 特別突出了其異步操作的功能。
在 Workflows 的設(shè)計(jì)中,某些概念似乎是為了直接與 LangGraph 競(jìng)爭(zhēng),尤其是它使用事件而不是邊或條件邊作為邏輯連接的手段。在 Workflows 中,智能體的邏輯被封裝在“步驟”中(與 LangGraph 的“節(jié)點(diǎn)”相對(duì)應(yīng)),而事件的觸發(fā)和監(jiān)聽則負(fù)責(zé)在不同步驟之間傳遞信息。
這兩個(gè)框架在結(jié)構(gòu)上有著顯著的相似性,但存在一個(gè)差異:為 Workflows 增加了一個(gè)專門的初始化步驟,用于設(shè)置智能體的環(huán)境上下文,這一點(diǎn)我將在后面詳細(xì)說(shuō)明。盡管它們的結(jié)構(gòu)設(shè)計(jì)相近,但它們所依賴的代碼基礎(chǔ)卻完全不同。
以下代碼展示了 Workflow 的結(jié)構(gòu)。與 LangGraph 類似,在此部分,我設(shè)定了狀態(tài)信息,并將各種技能與 LLM 對(duì)象關(guān)聯(lián)起來(lái)。
此外,我還定義了一個(gè)附加步驟——“prepare_agent”。這個(gè)步驟負(fù)責(zé)將用戶的輸入轉(zhuǎn)換成 ChatMessage 格式,并將其存入工作流的歷史記憶中。將這一轉(zhuǎn)換過(guò)程獨(dú)立為一個(gè)單獨(dú)的步驟,意味著智能體在執(zhí)行工作流步驟時(shí),能夠多次回到這個(gè)步驟,從而避免了重復(fù)將用戶信息加載到記憶存儲(chǔ)的必要性。
在 LangGraph 的實(shí)現(xiàn)中,我采用了位于圖結(jié)構(gòu)之外的 run_agent 方法來(lái)實(shí)現(xiàn)相同的目的。這種改變主要是基于個(gè)人編碼風(fēng)格的偏好,但我認(rèn)為,將這一邏輯融合到 Workflow 和圖中,會(huì)使整體結(jié)構(gòu)更加清晰和高效。
在完成了 Workflow 的配置之后,我繼續(xù)編寫了以下路由代碼:
以及工具調(diào)用的處理代碼:
5、三種開發(fā)框架的比較
比較這三種方法,各有特色。
無(wú)框架方法最直接。所有抽象層由開發(fā)者自定義,管理類型和對(duì)象相對(duì)簡(jiǎn)單。但隨著 Agent 智能體復(fù)雜性增加,缺乏結(jié)構(gòu)可能導(dǎo)致難以管理。
LangGraph 提供了明確的 Agent 智能體結(jié)構(gòu),有利于團(tuán)隊(duì)協(xié)作和規(guī)范統(tǒng)一。對(duì)結(jié)構(gòu)不熟悉的開發(fā)者也易于上手,但可能需要更多調(diào)試,若不適應(yīng)框架則可能感到困擾。
Workflows 則介于兩者之間,基于事件的架構(gòu)在特定項(xiàng)目中有優(yōu)勢(shì),對(duì) LlamaIndex 依賴性低,給開發(fā)者更多自由。
核心問題在于是否已使用 LlamaIndex 或 LangChain。LangGraph 和 Workflows 與依賴框架緊密集成,其額外優(yōu)勢(shì)可能不足以成為轉(zhuǎn)換的理由。
純代碼方法始終有吸引力。只要能嚴(yán)格記錄和執(zhí)行抽象概念,就能確保外部框架不會(huì)成為障礙。
6、三種開發(fā)框架如何選擇?
當(dāng)然,僅僅說(shuō)“視具體情況而定”并不能完全滿足我們的需求。以下三個(gè)問題可能有助于你為下一個(gè)智能體項(xiàng)目選擇合適的框架。
你的項(xiàng)目是否已經(jīng)與 LlamaIndex 或 LangChain 緊密集成?
如果是,那么這兩個(gè)框架應(yīng)該是你的首選。
你是否熟悉 Agent 智能體的標(biāo)準(zhǔn)架構(gòu),還是更希望得到構(gòu)建 Agent 智能體結(jié)構(gòu)的指導(dǎo)?
如果你偏向于得到指導(dǎo),Workflows 可能是合適的選擇。如果你非常需要指導(dǎo),LangGraph 可能更合適。
你是否有現(xiàn)成的 Agent 智能體示例作為參考?
框架的一大優(yōu)勢(shì)在于提供了豐富的教程和案例供你參考,而純代碼構(gòu)建的智能體可能缺乏這樣的資源。
本文轉(zhuǎn)載自公眾號(hào)玄姐聊AGI 作者:玄姐
