自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

什么是AI Agent,以及怎么實(shí)現(xiàn)AI Agent? 原創(chuàng)

發(fā)布于 2024-12-3 13:13
瀏覽
0收藏
“ AI Agent的核心是推理規(guī)劃能力,其次才是函數(shù)調(diào)用和記憶能力;但三者又缺一不可?!?/strong>


最近發(fā)現(xiàn)有些人還不了解什么是AI Agent,或者是看了Agent的概念,但還是不知道什么是AI Agent,今天我們就來(lái)詳細(xì)介紹一下什么是AI Agent。

什么是AI Agent?

這篇關(guān)于Agent的文章,即是對(duì)AI Agent的介紹,也是為了記錄自己對(duì)AI Agent的理解。

網(wǎng)上的介紹說(shuō),AI Agent中文翻譯叫智能體,是一種能夠感知環(huán)境,進(jìn)行決策和執(zhí)行動(dòng)作的智能實(shí)體。

看了以上的定義,可能很多人還是覺(jué)得一頭霧水,這都是什么玩意,能不能說(shuō)點(diǎn)人能看懂的東西。

那下面我們就用大白話介紹AI Agent,大家都說(shuō)大模型的功能很強(qiáng)大,能回答問(wèn)題,繪畫等等;但如果你想讓大模型去工地搬磚怎么辦?它又沒(méi)手沒(méi)腳,而且也不知道該往哪搬啊。

難道因?yàn)檫@個(gè)原因,就不讓大模型去工地搬磚了嗎?這顯然是不可能的,發(fā)展科技的目的就是為了人類服務(wù)的;所以就需要一種讓大模型能夠搬磚的方法。當(dāng)然,類似的還有讓大模型去幫忙處理工作,去控制生產(chǎn)等等。

所以,簡(jiǎn)單來(lái)說(shuō)所謂的AI Agent就是一種讓大模型能夠與現(xiàn)實(shí)世界接觸的方法,讓大模型能夠去替代人類處理一些工作與問(wèn)題,這就是AI Agent。

什么是AI Agent,以及怎么實(shí)現(xiàn)AI Agent?-AI.x社區(qū)

那么,說(shuō)起來(lái)簡(jiǎn)單Agent就是讓大模型去干活;但回到技術(shù)上來(lái)看,大模型沒(méi)有手腳,你想讓它干活它就能干活了?這顯然是不可能的,因此就需要一種方式——函數(shù)調(diào)用。

因?yàn)槟壳笆切畔r(shí)代,各種企業(yè)生產(chǎn)都開(kāi)始慢慢接入工業(yè)互聯(lián)網(wǎng)中;在以前干活時(shí)需要員工在流水線上操作,而現(xiàn)在只需要讓員工點(diǎn)點(diǎn)鼠標(biāo)即可。

而這一切都是通過(guò)API的方式進(jìn)行的,因此只需要給大模型設(shè)計(jì)一個(gè)能夠使用API的功能,就可以讓大模型去干這些事情,而這就是函數(shù)調(diào)用;函數(shù)調(diào)用是實(shí)現(xiàn)AI Agent的基礎(chǔ)之一。

ok有了函數(shù)調(diào)用也就意味著大模型有了現(xiàn)實(shí)中的手和腳,但我們知道大模型目前的能力還有限;它還無(wú)法做到像真正的人類一樣聰明,面對(duì)復(fù)雜的問(wèn)題它還是無(wú)法處理。因此,雖然大模型有了“手腳”,但它依然什么都干不了,因?yàn)闆](méi)有一個(gè)能夠指揮它的大腦。

因此,就需要一種方式來(lái)提高大模型這個(gè)大腦的邏輯思維能力,在遇到問(wèn)題時(shí),大模型能夠根據(jù)自己的邏輯思維能力進(jìn)行判斷和處理。

而由此也誕生了一些新的技術(shù),比如說(shuō)思維鏈(CoT)技術(shù)等;目的就是讓大模型具備任務(wù)分解的能力,把一個(gè)復(fù)雜的工作任務(wù)拆解成多個(gè)簡(jiǎn)單的可行的小任務(wù);而這就是大模型的推理能力。

還有,目前的大模型沒(méi)有記憶功能,也就是說(shuō)你每次和它說(shuō)話都是全新的, 沒(méi)有上下文,這也是目前大模型的一個(gè)短板;因此你想連續(xù)和它交流就需要有一種解決這個(gè)問(wèn)題的辦法,這個(gè)辦法就是怎么讓大模型具備上下文記憶的能力,比如連續(xù)對(duì)話的能力。

如果沒(méi)有記憶能力,那么AI Agent會(huì)發(fā)生什么事情?

那就會(huì)出現(xiàn),上一秒大模型讓做的事情,下一秒它自己就忘了;而這就會(huì)導(dǎo)致重大的生產(chǎn)事故。而目前大模型的記憶能力主要是通過(guò)外部存儲(chǔ)庫(kù)實(shí)現(xiàn)的——比如說(shuō)向量數(shù)據(jù)庫(kù)。

而有了以上三個(gè)東西,函數(shù)調(diào)用——大模型現(xiàn)實(shí)中的手腳;邏輯推理能力——大模型任務(wù)分解和規(guī)劃的能力;以及記憶能力——大模型上下文理解和連續(xù)對(duì)話的能力。大模型就可以像真正的人類一樣,去完成各種復(fù)雜的任務(wù)。

最后,還需要一個(gè)東西,那就是行動(dòng)力;在大模型具備這些能力之后,我們就可以通過(guò)對(duì)話或其它方式,讓大模型按照具體的任務(wù)去行動(dòng);也就是先調(diào)用邏輯推理模型去分析和拆解任務(wù);然后使用函數(shù)調(diào)用去實(shí)現(xiàn)外部功能的控制;最后使用向量數(shù)據(jù)庫(kù)報(bào)錯(cuò)連續(xù)對(duì)話。

因此,這才有了AI Agent的一個(gè)經(jīng)典架構(gòu)圖:

什么是AI Agent,以及怎么實(shí)現(xiàn)AI Agent?-AI.x社區(qū)

即:工具模塊(函數(shù)調(diào)用),規(guī)劃模塊和記憶模塊;最后大模型通過(guò)這三個(gè)模塊來(lái)處理現(xiàn)實(shí)中的任務(wù)。

而具體這幾個(gè)模塊之間,怎么實(shí)現(xiàn),使用了哪些技術(shù),這就是另一個(gè)話題了。


本文轉(zhuǎn)載自公眾號(hào)AI探索時(shí)代 作者:DFires

原文鏈接:??https://mp.weixin.qq.com/s/0LNqw3V0_PnMNgk6w4R0tw??

?著作權(quán)歸作者所有,如需轉(zhuǎn)載,請(qǐng)注明出處,否則將追究法律責(zé)任
標(biāo)簽
收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦