AI 時代你應(yīng)該要知道的 Agent 概念
這兩年,隨著人工智能(AI)和計算能力的發(fā)展,AI應(yīng)用的落地速度大大加快。以ChatGPT為代表的AI應(yīng)用迅速火遍全球,成為打工人的常用工具。緊接著,多模態(tài)、AI Agent等各種高大尚的名詞也逐漸進(jìn)入大眾視野,吸引了大量關(guān)注。那么,到底什么是AI Agent?下文半支煙將帶你詳細(xì)了解這個概念。
1. 一句話總結(jié):什么是AI Agent
AI Agent,經(jīng)常被翻譯為:智能體或代理。
一句話總結(jié),AI Agent就是一個有著聰明大腦而且能夠感知外部環(huán)境并采取行動的智能系統(tǒng)。
我們可以把它想象成一個能思考和行動的人,而大型語言模型(LLM)就是這個人的“大腦”。通過這個大腦,再加上一些能夠感知外部世界和執(zhí)行任務(wù)的部件,AI Agent就變成了一個有“智慧”的機器人。
要讓AI Agent充分利用它的“大腦”和各種組件,需要一種協(xié)調(diào)機制。ReAct機制就是常用的協(xié)調(diào)機制。通過ReAct機制,AI Agent能夠結(jié)合外部環(huán)境和行動組件,完成復(fù)雜的任務(wù)。
為什么我們需要AI Agent呢?其實說到底是因為單一的模型對我們來說作用不大,我們需要的是一個具備智能的復(fù)雜系統(tǒng)。只有復(fù)雜系統(tǒng)才能真正的應(yīng)到到實際生產(chǎn)工作中。
2. 從單一模型到復(fù)合AI系統(tǒng)
要理解AI Agent,我們先看看AI領(lǐng)域的一些變化。
以前的AI系統(tǒng)通常是單一模型,受訓(xùn)練數(shù)據(jù)的限制,只能解決有限的任務(wù)或者固定領(lǐng)域的任務(wù),難以適應(yīng)新的情況。
而現(xiàn)在,我們有了LLM通用大模型,訓(xùn)練的數(shù)據(jù)更多,能完成更多領(lǐng)域的任務(wù),比如內(nèi)容生成、文生圖、文生視頻等等。同時還可以把大模型和各種外部組件結(jié)合起來,構(gòu)建復(fù)合AI系統(tǒng),這樣就能解決更復(fù)雜的問題。
舉個例子,如果直接讓單一模型幫我制定一個去三亞的旅游計劃,它無法做到。如果讓LLM大模型幫我制定一個去三亞的旅游計劃,它可以制定一個雞肋的計劃,幾乎不可用,因為它不知道我的個人信息、也不知道航班信息,也不知道天氣情況。
但如果我們設(shè)計一個復(fù)雜AI系統(tǒng),讓系統(tǒng)里的LLM大模型能夠通過工具能訪問我的個人信息,訪問互聯(lián)網(wǎng)上的天氣情況,訪問航班信息,再結(jié)合航班系統(tǒng)的開放接口,就可以自動幫我預(yù)定機票,自動制定行程規(guī)劃了。
這就是復(fù)合AI系統(tǒng)的魅力,它能夠結(jié)合工具、記憶、其余各種組件 來解決復(fù)雜問題。
3. 復(fù)合AI系統(tǒng)的模塊化
復(fù)合AI系統(tǒng)是模塊化的,就像拼積木一樣。你可以選擇不同的模型和組件,然后把它們組合在一起,解決不同的問題。
比如,你可以用一個模型來生成文本,用另一個模型來處理圖像,還可以用一些編寫的程序代碼,一起構(gòu)建出復(fù)雜AI系統(tǒng)。
4. AI Agent的推理與行動能力
AI Agent的核心是讓LLM大模型 掌控 復(fù)雜AI系統(tǒng)的邏輯,說白了就是讓LLM主導(dǎo)AI Agent的思維過程。我們向LLM輸入復(fù)雜問題,它可以將復(fù)雜問題分解并一步步的制定解決方案。
這與設(shè)計一個程序系統(tǒng)不同,在AI系統(tǒng)里,LLM大模型會一步一步的思考、制定一步一步的計劃,然后一個一個的去解決。并不是按照某個指定程序去執(zhí)行的。
AI Agent的組件包括:大模型的推理能力、行動能力 和 記憶能力。
- 大模型的推理能力是解決問題的核心。
- 行動能力通過工具(外部程序)實現(xiàn),模型可以定義何時調(diào)用它們以及如何調(diào)用它們。工具可以是搜索引擎、計算器、操作數(shù)據(jù)庫等。
- 記憶能力使大模型能夠存儲內(nèi)部日志和對話歷史,從而使體驗更加個性化。記憶可以幫助大模型在解決復(fù)雜問題時保持上下文連貫。
5. 總結(jié)
我們正處于AI Agent發(fā)展的早期階段。未來,我們將看到更多的系統(tǒng)利用AI Agent進(jìn)行"AI+"的轉(zhuǎn)型。
總結(jié)來說,AI Agent通過整合LLM的推理能力和外部工具的行動能力,能夠在復(fù)雜環(huán)境中自主解決問題。ReAct機制很好的實現(xiàn)了AI Agent的理念。