自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

智能體時代:Agent開發(fā)的三重境界

發(fā)布于 2024-5-14 09:31
瀏覽
0收藏

引言

隨著人工智能技術(shù)的飛速發(fā)展,Agent(智能體)的概念已經(jīng)從科幻小說走進了現(xiàn)實世界。Agent可以被理解為一種具有一定智能的軟件實體,它能夠自主地執(zhí)行任務(wù)、做出決策并與其他系統(tǒng)交互。

在AI技術(shù)公眾號的運營過程中,我們收到了許多關(guān)于Agent開發(fā)的咨詢,因此,本文將從技術(shù)角度出發(fā),為大家解析這三個階段的演進方式,并各自提供一個代碼demo案例,為新手程序員提供一份Agent開發(fā)的指南。

  • Demo地址:https://github.com/q2wxec/langgraph-demo/tree/master/coalagent/

當(dāng)作能理解語義的API使用

在Agent開發(fā)的初級階段,我們可以將大語言模型視為一種能理解自然語言的API。這意味著,我們可以像調(diào)用任何傳統(tǒng)API一樣,向Agent發(fā)送請求,并期望得到一個經(jīng)過理解和處理的響應(yīng)。

在這個階段開發(fā)的智能體,大多是在傳統(tǒng)軟件業(yè)務(wù)流程中,嵌入LLM的能力,對軟件功能進行增強。對LLM使用局限在其對自然語言的理解能力上,應(yīng)用場景大多局限在,文本生成、總結(jié)等方面,與傳統(tǒng)軟件開發(fā)調(diào)用各類工具的api的模式并無明顯區(qū)別。典型用例如下:

短視頻文案創(chuàng)作

我們可以將Agent作為一個內(nèi)容生成器,輸入視頻的關(guān)鍵信息,Agent則能夠根據(jù)這些信息生成吸引人的文案。這個過程可以看作是將Agent作為一個文本生成API來使用。

新聞日報總結(jié)

另一個典型的應(yīng)用場景是新聞內(nèi)容的自動總結(jié)。Agent可以接收大量的新聞數(shù)據(jù),然后通過自然語言理解能力,提煉出關(guān)鍵信息,生成一份簡潔的新聞日報。結(jié)合網(wǎng)頁信息獲取工具,我基于LangChain做了一個簡單的新聞總結(jié)demo見github。

在這一階段,Agent的開發(fā)主要集中在如何更好地理解和處理自然語言上。開發(fā)者在AI領(lǐng)域只需要熟悉自然語言處理(NLP)的基本原理,在AI工程上用到最多的也限于提示詞優(yōu)化,就能夠利用現(xiàn)有的AI模型來實現(xiàn)這一功能。

當(dāng)作自然語言編程工具使用

從API到編程工具的轉(zhuǎn)變

在第二階段,Agent不再僅僅是一個理解語言的API,而是一個可以進行自然語言編程的工具。這意味著,開發(fā)者可以通過自然語言來指導(dǎo)Agent完成更復(fù)雜的任務(wù)。

在這個階段開發(fā)的智能體,不再局限于文本理解的場景。通過提示詞工程,function_calling等方式,能夠讓大語言模型按提示要求格式化輸出內(nèi)容,進而在一定程度上能夠重塑傳統(tǒng)軟件業(yè)務(wù)流程的多個環(huán)節(jié),可以說是通過LLM進行自然語言編程應(yīng)用。典型用例如下:

數(shù)據(jù)表匯總與去重

在這個場景中,Agent接收多個數(shù)據(jù)表,然后通過自然語言提示,自動進行數(shù)據(jù)匯總和去重,最終輸出一份整潔的匯總表。使用LangGraph的流程編排,我實現(xiàn)了一個結(jié)合數(shù)據(jù)處理,過濾,去重,匯總的數(shù)據(jù)表匯總demo見github。

自動推動業(yè)務(wù)流程

通過AI執(zhí)行意圖識別,Agent可以在某些業(yè)務(wù)流程中減少人工審核環(huán)節(jié),自動識別并推動流程的執(zhí)行。關(guān)于大語言模型的意圖識別,我在之前的一篇文章??LLM意圖識別器實踐??中進行過詳細講解,有興趣的小伙伴可以點擊詳讀。

為了實現(xiàn)這一階段的功能,開發(fā)者需要掌握提示詞工程和function_calling等技術(shù)。這些技術(shù)允許開發(fā)者通過自然語言來指導(dǎo)Agent的行為,使其能夠按照預(yù)期執(zhí)行特定的任務(wù)。

當(dāng)作真正的智能使用

在Agent開發(fā)的第三階段,Agent被真正當(dāng)作一個智能體來使用。這時,Agent不再只是一個簡單的API或者工具,而是成為了一個具有自主決策能力的智能伙伴。

這個階段的智能體開發(fā),與大家理解的AI原生應(yīng)用開發(fā)大體相同(雖然AI原生應(yīng)用也沒有一個規(guī)范統(tǒng)一的定義),但這個階段的應(yīng)用開發(fā)與傳統(tǒng)軟件開發(fā)的思維方式確實是完全不同了,LLM被真正當(dāng)作智能來使用。

在軟件開發(fā)時,可能更多要思考的是,這個事情如果是由一個人類團隊來執(zhí)行,

  • 需要哪些角色(提示詞Role限定)
  • 這些相關(guān)角色需要具備哪些技能(tools綁定)
  • 團隊之間應(yīng)該如何交互(state設(shè)置)
  • 團隊之間的工作如何流轉(zhuǎn)(workflow的設(shè)置)

可以看到,這個階段LLM不再作為API獨立存在,而是綁定了角色和技能,并需要進行多個agent的組合,已經(jīng)與人類智能的使用方式一致。典型用例如下:

Plan-and-Execute

智能體時代:Agent開發(fā)的三重境界-AI.x社區(qū)

Plan-and-Execute指的是涉及規(guī)劃與執(zhí)行兩個主要步驟的過程,Agent需要根據(jù)給定的目標(biāo)自主生成計劃,并基于計劃步驟自動執(zhí)行任務(wù),這要求Agent具備理解計劃、制定策略并執(zhí)行任務(wù)的能力。

例如,如果給定的任務(wù)是“計劃一次從北京到上海的旅行”,那么大語言模型的“規(guī)劃”步驟可能包括確定旅行日期、選擇交通方式、預(yù)訂住宿和活動等,而“執(zhí)行”步驟則可能涉及生成詳細的行程安排和必要的預(yù)訂步驟。

作者結(jié)合搜索和自動問答工具,使用Plan-and-Execute做了一款搜索問答增強demo見github。

示例2:BabyAgI

BabyAGI是一個由開發(fā)者Yohei Nakajima創(chuàng)建的AI驅(qū)動的任務(wù)管理系統(tǒng)。它利用OpenAI和Pinecone APIs來創(chuàng)建、優(yōu)先排序和執(zhí)行任務(wù)

在這一階段,開發(fā)者需要考慮的是如何將Agent與人類團隊的工作方式相結(jié)合。這涉及到角色限定、技能綁定、狀態(tài)設(shè)置以及工作流程的設(shè)置等多個方面。

結(jié)語

Agent開發(fā)的三重境界代表了AI技術(shù)從簡單應(yīng)用到深度融合的演進過程。隨著技術(shù)的不斷進步,我們有理由相信,Agent將在未來的軟件開發(fā)中扮演越來越重要的角色。對于程序員而言,理解并掌握Agent開發(fā)的這三個階段,將有助于他們更好地適應(yīng)未來的技術(shù)發(fā)展趨勢。

收藏
回復(fù)
舉報
回復(fù)
相關(guān)推薦