GenAI的新潮流:如何利用智能體的力量
AI和機(jī)器學(xué)習(xí)的發(fā)展歷程是顛覆性的。最初,我們從手動(dòng)編碼轉(zhuǎn)向通過數(shù)據(jù)訓(xùn)練計(jì)算機(jī)。在早期階段,AI只能處理特定任務(wù),例如分類和物體識(shí)別——這些是它們經(jīng)過明確訓(xùn)練后能夠執(zhí)行的功能。
但這一切在2022年底隨著OpenAI推出ChatGPT而發(fā)生了改變,這一突破性工具不僅可以生成內(nèi)容,還能執(zhí)行各種任務(wù),迅速吸引了全球數(shù)百萬人的關(guān)注。正如Gartner在2023年AI技術(shù)成熟度曲線中所指出的那樣,GenAI已經(jīng)達(dá)到了“膨脹期的頂峰”,預(yù)計(jì)將在未來5到10年內(nèi)進(jìn)入“生產(chǎn)力平臺(tái)期”。
克服挑戰(zhàn)與局限性
根據(jù)Gartner的定義,達(dá)到生產(chǎn)力平臺(tái)期意味著AI將被廣泛采用,其優(yōu)勢將得到明確定義,并有清晰的實(shí)施指南。要實(shí)現(xiàn)這一目標(biāo),我們首先必須解決當(dāng)前AI技術(shù)的局限性,并探索如何通過智能體來克服這些挑戰(zhàn)。
盡管當(dāng)今的大型語言模型(LLMs)在生成電子郵件、寫作文章和進(jìn)行情感分析等任務(wù)上表現(xiàn)出色,但它們在處理復(fù)雜任務(wù)時(shí)仍然存在困難,例如復(fù)雜的數(shù)學(xué)計(jì)算或多步驟問題解決。此外,LLMs還存在其他顯著的局限性:
? 幻覺或誤導(dǎo)性輸出
? 技術(shù)限制,如有限的上下文長度和內(nèi)存
? 輸出中的偏見
? 可能產(chǎn)生有害或不當(dāng)言論
? 知識(shí)有限(例如,ChatGPT 3.5的知識(shí)截止日期為2021年9月)
有趣的是,這些挑戰(zhàn)與我們?nèi)祟愃媾R的問題并無太大不同。我們也容易犯錯(cuò)誤、存在偏見、記憶有限,有時(shí)甚至?xí)龀鲇泻Φ幕貞?yīng)。為了管理這些不足,我們通常會(huì):
? 在線尋找信息,使用Excel和Word等工具。
? 多次修改我們的工作以糾正錯(cuò)誤并提高質(zhì)量。
? 尋求同事和導(dǎo)師的反饋,并吸收他們的見解。
? 團(tuán)隊(duì)合作以取得更好的結(jié)果。
通過應(yīng)用類似的策略,我們可以改進(jìn)大型語言模型(LLM)的輸出,從而引出GenAI智能體的概念。
什么是GenAI智能體?
GenAI智能體旨在克服當(dāng)前LLM的許多局限性,能夠執(zhí)行單一模型無法處理的復(fù)雜任務(wù)。例如,如果你想從一個(gè)數(shù)據(jù)集中識(shí)別出按收入排名前三的公司,智能體將會(huì):
? 獲取所有公司的收入數(shù)據(jù)。
? 按收入對公司進(jìn)行排序。
? 返回排名前三的公司。
為了實(shí)現(xiàn)這一目標(biāo),智能體將LLM與關(guān)鍵組件結(jié)合起來,如規(guī)劃、記憶和工具:
? 規(guī)劃:智能體使用LLM制定并執(zhí)行計(jì)劃。
? 記憶:智能體在執(zhí)行多個(gè)步驟時(shí)保留信息,從而能夠處理復(fù)雜任務(wù)。
? 工具:智能體使用各種工具來執(zhí)行特定任務(wù),以下將對此進(jìn)行更詳細(xì)的討論。
GenAI智能體的關(guān)鍵特性
GenAI智能體被設(shè)計(jì)為:
? 規(guī)劃和執(zhí)行任務(wù)
? 反思結(jié)果
? 使用工具實(shí)現(xiàn)特定目標(biāo)
? 在最少的人工干預(yù)下運(yùn)行
此類智能體的例子包括網(wǎng)站建設(shè)工具、從Excel表格中提供見解的數(shù)據(jù)分析師,以及根據(jù)用戶輸入規(guī)劃旅行的旅游代理。
工具在GenAI智能體中的作用
工具對于智能體至關(guān)重要,使其能夠有效地執(zhí)行任務(wù)。在GenAI的領(lǐng)域中,工具使LLM智能體能夠與外部環(huán)境和應(yīng)用程序進(jìn)行交互,例如進(jìn)行互聯(lián)網(wǎng)搜索、代碼解釋器和數(shù)學(xué)引擎等,這些工具可以訪問數(shù)據(jù)庫、知識(shí)庫以及外部模型。
例如,一個(gè)旅行代理需要工具來搜索和預(yù)訂航班,還需要搜索互聯(lián)網(wǎng)的工具。其他工具可能包括:
? 實(shí)體提?。簭姆墙Y(jié)構(gòu)化文檔中提取特定信息。
? Chat DB:無需SQL知識(shí)即可從數(shù)據(jù)庫中檢索信息。
? 知識(shí)機(jī)器人:使用檢索增強(qiáng)生成(RAG)技術(shù),根據(jù)自定義知識(shí)庫回答問題。
? 互聯(lián)網(wǎng)搜索:根據(jù)用戶查詢從搜索引擎獲取內(nèi)容。
? 摘要生成:為大型文檔提供針對特定角色的摘要。
? 程序執(zhí)行:執(zhí)行Python代碼以解決特定問題。
? 維基百科搜索:根據(jù)用戶查詢從維基百科檢索內(nèi)容。
? 比較:回答比較性問題,如性能指標(biāo)或產(chǎn)品推薦。
智能體設(shè)計(jì)模式
為了執(zhí)行復(fù)雜任務(wù),智能體必須有效地協(xié)調(diào)這些工具?;贏ndrew NG的講座,已經(jīng)出現(xiàn)了幾種智能體設(shè)計(jì)模式:
? 反思:LLM評估自己的工作以改進(jìn)輸出。
? 工具使用:LLM利用工具,如網(wǎng)絡(luò)搜索或代碼執(zhí)行,來收集信息和處理數(shù)據(jù)。
? 規(guī)劃:LLM制定多步驟計(jì)劃以實(shí)現(xiàn)目標(biāo),然后執(zhí)行該計(jì)劃。
? 多智能體協(xié)作:多個(gè)AI智能體協(xié)作,分配任務(wù)并討論想法,以尋找更好的解決方案。
盡管前兩種模式會(huì)產(chǎn)生可預(yù)測的結(jié)果,但后兩種仍處于實(shí)驗(yàn)階段。
LLM智能體框架
基于對智能體、工具和設(shè)計(jì)模式的理解,規(guī)劃模式的一種變體逐漸形成。這個(gè)框架包括定義一個(gè)任務(wù)或目標(biāo),然后通過迭代的方式規(guī)劃并執(zhí)行下一個(gè)動(dòng)作,接著進(jìn)入反饋循環(huán)。
一個(gè)LLM智能體由核心組件組成:
? 大腦/LLM:作為協(xié)調(diào)者。
? 記憶(向量數(shù)據(jù)庫):存儲(chǔ)中間步驟和結(jié)果。
短期記憶:在上下文窗口內(nèi)保存上下文信息。
長期記憶:一個(gè)外部的向量存儲(chǔ),提供相關(guān)的上下文信息。
? 工具/互聯(lián)網(wǎng):使智能體能夠執(zhí)行任務(wù),如網(wǎng)絡(luò)搜索或程序執(zhí)行。
? 政策:通過設(shè)計(jì)確保信任,防止處理有害輸入。
智能體的未來
GenAI的未來在于智能體與人類的協(xié)作。試想一個(gè)世界,醫(yī)生、設(shè)計(jì)師和客戶服務(wù)代表都由增強(qiáng)其能力的智能體支持。從科學(xué)發(fā)現(xiàn)到藝術(shù)創(chuàng)作,可能性是無窮的。
對于企業(yè)而言,將GenAI智能體融入運(yùn)營中可以帶來戰(zhàn)略優(yōu)勢,釋放出新的效率提升、個(gè)性化服務(wù)和問題解決能力,這些智能體不會(huì)取代人類的創(chuàng)造力,而是會(huì)增強(qiáng)它,推動(dòng)一個(gè)充滿創(chuàng)新和進(jìn)步的未來。