自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認證廠商認證 IT技術(shù)PMP項目管理免費題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺

51CTO學(xué)堂

IT職業(yè)在線教育平臺

智能體時代：Agent開發(fā)的三重境界

發(fā)布于 2024-5-14 09:31

瀏覽

0收藏

引言

隨著人工智能技術(shù)的飛速發(fā)展，Agent（智能體）的概念已經(jīng)從科幻小說走進了現(xiàn)實世界。Agent可以被理解為一種具有一定智能的軟件實體，它能夠自主地執(zhí)行任務(wù)、做出決策并與其他系統(tǒng)交互。

在AI技術(shù)公眾號的運營過程中，我們收到了許多關(guān)于Agent開發(fā)的咨詢，因此，本文將從技術(shù)角度出發(fā)，為大家解析這三個階段的演進方式，并各自提供一個代碼demo案例，為新手程序員提供一份Agent開發(fā)的指南。

Demo地址：https://github.com/q2wxec/langgraph-demo/tree/master/coalagent/

當(dāng)作能理解語義的API使用

在Agent開發(fā)的初級階段，我們可以將大語言模型視為一種能理解自然語言的API。這意味著，我們可以像調(diào)用任何傳統(tǒng)API一樣，向Agent發(fā)送請求，并期望得到一個經(jīng)過理解和處理的響應(yīng)。

在這個階段開發(fā)的智能體，大多是在傳統(tǒng)軟件業(yè)務(wù)流程中，嵌入LLM的能力，對軟件功能進行增強。對LLM使用局限在其對自然語言的理解能力上，應(yīng)用場景大多局限在，文本生成、總結(jié)等方面，與傳統(tǒng)軟件開發(fā)調(diào)用各類工具的api的模式并無明顯區(qū)別。典型用例如下：

短視頻文案創(chuàng)作

我們可以將Agent作為一個內(nèi)容生成器，輸入視頻的關(guān)鍵信息，Agent則能夠根據(jù)這些信息生成吸引人的文案。這個過程可以看作是將Agent作為一個文本生成API來使用。

新聞日報總結(jié)

另一個典型的應(yīng)用場景是新聞內(nèi)容的自動總結(jié)。Agent可以接收大量的新聞數(shù)據(jù)，然后通過自然語言理解能力，提煉出關(guān)鍵信息，生成一份簡潔的新聞日報。結(jié)合網(wǎng)頁信息獲取工具，我基于LangChain做了一個簡單的新聞總結(jié)demo見github。

在這一階段，Agent的開發(fā)主要集中在如何更好地理解和處理自然語言上。開發(fā)者在AI領(lǐng)域只需要熟悉自然語言處理（NLP）的基本原理，在AI工程上用到最多的也限于提示詞優(yōu)化，就能夠利用現(xiàn)有的AI模型來實現(xiàn)這一功能。

當(dāng)作自然語言編程工具使用

從API到編程工具的轉(zhuǎn)變

在第二階段，Agent不再僅僅是一個理解語言的API，而是一個可以進行自然語言編程的工具。這意味著，開發(fā)者可以通過自然語言來指導(dǎo)Agent完成更復(fù)雜的任務(wù)。

在這個階段開發(fā)的智能體，不再局限于文本理解的場景。通過提示詞工程，function_calling等方式，能夠讓大語言模型按提示要求格式化輸出內(nèi)容，進而在一定程度上能夠重塑傳統(tǒng)軟件業(yè)務(wù)流程的多個環(huán)節(jié)，可以說是通過LLM進行自然語言編程應(yīng)用。典型用例如下：

數(shù)據(jù)表匯總與去重

在這個場景中，Agent接收多個數(shù)據(jù)表，然后通過自然語言提示，自動進行數(shù)據(jù)匯總和去重，最終輸出一份整潔的匯總表。使用LangGraph的流程編排，我實現(xiàn)了一個結(jié)合數(shù)據(jù)處理，過濾，去重，匯總的數(shù)據(jù)表匯總demo見github。

自動推動業(yè)務(wù)流程

通過AI執(zhí)行意圖識別，Agent可以在某些業(yè)務(wù)流程中減少人工審核環(huán)節(jié)，自動識別并推動流程的執(zhí)行。關(guān)于大語言模型的意圖識別，我在之前的一篇文章??LLM意圖識別器實踐??中進行過詳細講解，有興趣的小伙伴可以點擊詳讀。

為了實現(xiàn)這一階段的功能，開發(fā)者需要掌握提示詞工程和function_calling等技術(shù)。這些技術(shù)允許開發(fā)者通過自然語言來指導(dǎo)Agent的行為，使其能夠按照預(yù)期執(zhí)行特定的任務(wù)。

當(dāng)作真正的智能使用

在Agent開發(fā)的第三階段，Agent被真正當(dāng)作一個智能體來使用。這時，Agent不再只是一個簡單的API或者工具，而是成為了一個具有自主決策能力的智能伙伴。

這個階段的智能體開發(fā)，與大家理解的AI原生應(yīng)用開發(fā)大體相同（雖然AI原生應(yīng)用也沒有一個規(guī)范統(tǒng)一的定義），但這個階段的應(yīng)用開發(fā)與傳統(tǒng)軟件開發(fā)的思維方式確實是完全不同了，LLM被真正當(dāng)作智能來使用。

在軟件開發(fā)時，可能更多要思考的是，這個事情如果是由一個人類團隊來執(zhí)行，

需要哪些角色（提示詞Role限定）
這些相關(guān)角色需要具備哪些技能（tools綁定）
團隊之間應(yīng)該如何交互（state設(shè)置）
團隊之間的工作如何流轉(zhuǎn)（workflow的設(shè)置）

可以看到，這個階段LLM不再作為API獨立存在，而是綁定了角色和技能，并需要進行多個agent的組合，已經(jīng)與人類智能的使用方式一致。典型用例如下：

Plan-and-Execute

智能體時代：Agent開發(fā)的三重境界-AI.x社區(qū)

Plan-and-Execute指的是涉及規(guī)劃與執(zhí)行兩個主要步驟的過程，Agent需要根據(jù)給定的目標(biāo)自主生成計劃，并基于計劃步驟自動執(zhí)行任務(wù)，這要求Agent具備理解計劃、制定策略并執(zhí)行任務(wù)的能力。

例如，如果給定的任務(wù)是“計劃一次從北京到上海的旅行”，那么大語言模型的“規(guī)劃”步驟可能包括確定旅行日期、選擇交通方式、預(yù)訂住宿和活動等，而“執(zhí)行”步驟則可能涉及生成詳細的行程安排和必要的預(yù)訂步驟。

作者結(jié)合搜索和自動問答工具，使用Plan-and-Execute做了一款搜索問答增強demo見github。

示例2：BabyAgI

BabyAGI是一個由開發(fā)者Yohei Nakajima創(chuàng)建的AI驅(qū)動的任務(wù)管理系統(tǒng)。它利用OpenAI和Pinecone APIs來創(chuàng)建、優(yōu)先排序和執(zhí)行任務(wù)

在這一階段，開發(fā)者需要考慮的是如何將Agent與人類團隊的工作方式相結(jié)合。這涉及到角色限定、技能綁定、狀態(tài)設(shè)置以及工作流程的設(shè)置等多個方面。

結(jié)語

Agent開發(fā)的三重境界代表了AI技術(shù)從簡單應(yīng)用到深度融合的演進過程。隨著技術(shù)的不斷進步，我們有理由相信，Agent將在未來的軟件開發(fā)中扮演越來越重要的角色。對于程序員而言，理解并掌握Agent開發(fā)的這三個階段，將有助于他們更好地適應(yīng)未來的技術(shù)發(fā)展趨勢。

標(biāo)簽

贊

收藏

回復(fù)

舉報

回復(fù)

相關(guān)推薦

AI大模型時代，Agent智能體開發(fā)的三重境界

玄姐聊AGI ? 2846瀏覽 ? 0回復(fù)
Agent 智能體開發(fā)框架選型指南

Baihai_IDP ? 3983瀏覽 ? 0回復(fù)
Agent 智能體開發(fā)框架如何優(yōu)雅選型？

玄姐聊AGI ? 2277瀏覽 ? 0回復(fù)
從0到1開發(fā)AI Agent（智能體）| LangChain 的快速入門

AI取經(jīng)路 ? 5210瀏覽 ? 0回復(fù)
人工智能智能體(AI Agent)發(fā)展趨勢2024年總結(jié)與2025年展望

十一月雨_55 ? 8315瀏覽 ? 0回復(fù)
谷歌剛剛發(fā)布AI Agent智能體白皮書，2025年AI Agent時代已到來！

玄姐聊AGI ? 4329瀏覽 ? 0回復(fù)
2025年，AI Agent 智能體開發(fā)框架如何優(yōu)雅選型？

玄姐聊AGI ? 2279瀏覽 ? 0回復(fù)
AI Agent 智能體開發(fā)工作手冊詳細指南

玄姐聊AGI ? 4551瀏覽 ? 0回復(fù)
OpenAI重磅：AI Agent智能體Function Calling 2.0！

玄姐聊AGI ? 2797瀏覽 ? 0回復(fù)
OpenAI深夜發(fā)布Agent開發(fā)三劍客！開源一個新的SDK，現(xiàn)場手搓三個Agent！還抖了一個內(nèi)部的料

51CTO技術(shù)棧 ? 1988瀏覽 ? 0回復(fù)
手把手教你使用Qwen-Agent開發(fā)智能體應(yīng)用實戰(zhàn)教程

九歌AI大模型 ? 2543瀏覽 ? 0回復(fù)
玩轉(zhuǎn)智能體一站式AI Agent開發(fā)工具鏈攻破Manus護城河

數(shù)字化助推器 ? 2376瀏覽 ? 0回復(fù)
【人人都會做智能體】Agent是什么,簡單中等復(fù)雜商用的智能體又是什么?

九歌AI大模型 ? 1330瀏覽 ? 0回復(fù)
三大AI智能體平臺深度對比：Dify、Coze、AWS AI Agent，哪款更適合你？

王吉偉自頻道 ? 3142瀏覽 ? 0回復(fù)
OpenAI凌晨發(fā)布三款語音模型，語音AI Agent時代即將到來？

AI博物院 ? 1146瀏覽 ? 0回復(fù)
智能體（Agent）的三種表現(xiàn)類型：聊天助手、工作流與對話流

九歌AI大模型 ? 1035瀏覽 ? 0回復(fù)
AI智能體融合時代數(shù)據(jù)隱私安全的“守護之道”

數(shù)字化助推器 ? 1016瀏覽 ? 0回復(fù)
MCP 架構(gòu)設(shè)計深度剖析 & 使用 Spring AI + MCP 四步教你實現(xiàn) Agent 智能體開發(fā)

玄姐聊AGI ? 7071瀏覽 ? 0回復(fù)
多智能體（Multi Agent）AI系統(tǒng)：企業(yè)智能化轉(zhuǎn)型的未來

Halo咯咯 ? 1135瀏覽 ? 0回復(fù)

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

告別“玩具” Agent！深度解析智能體框架，構(gòu)建真正可靠的 AI 應(yīng)用 14h前發(fā)布
Agent卡成PPT？6 大核彈級提速方案+一線大廠代碼級拆解 9天前發(fā)布

熱門推薦

大半精銳盡出！o1下線！滿血o3之后，模型本身就是Manus，最大賣點：替代人干真活！ 1回復(fù)

王炸！MCP 架構(gòu)設(shè)計深度剖析 & 使用 Spring AI + MCP 四步教你實現(xiàn) Agent 智能體開發(fā) 0回復(fù)

Dify從入門到高階系列二：手把手教學(xué)！超詳細的Dify知識庫配置全攻略 0回復(fù)

Crawl4AI：GitHub榜首40K星標(biāo)！LLM專屬極速開源爬蟲神器 0回復(fù)

只需5分鐘，教你用Python搭建MCP Server 0回復(fù)

上一篇： LangChain v0.2：向穩(wěn)定性邁進的一大步

下一篇：如何構(gòu)建終極的AI自動化系統(tǒng)：多代理協(xié)作指南

社區(qū)精華內(nèi)容

目錄

<legend id="7uhe5"><abbr id="7uhe5"></abbr></legend>