自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

吳恩達大佬關(guān)于智能體趨勢的最新觀點!

發(fā)布于 2024-11-29 15:17
瀏覽
0收藏

大語言模型(LLM)通常被優(yōu)化用來回答人們的問題。但是現(xiàn)在有一個趨勢是模型也在被優(yōu)化以適應(yīng)智能體工作流程。這將大大提升智能體的性能! 

在ChatGPT在問答方面取得突破性成功之后,大量的LLM開發(fā)都集中在提供良好的消費者體驗上。因此,LLM被調(diào)教來回答問題("為什么莎士比亞要寫《麥克白》?")或遵循人類提供的指令("解釋為什么莎士比亞寫了《麥克白》")。指令微調(diào)數(shù)據(jù)集中的很大一部分都在引導(dǎo)模型為人類編寫的問題和指令提供更有幫助的回應(yīng),這些問題和指令類似于人們可能會向面向消費者的LLM提出的問題,比如ChatGPT、Claude或Gemini的網(wǎng)頁界面所提供的服務(wù)?!?/p>

但智能體的工作負載需要不同的行為。AI軟件可能會在迭代工作流程中使用模型來反思自己的輸出、使用工具、制定計劃,并在多智能體環(huán)境中協(xié)作,而不是直接為消費者生成回應(yīng)。主要的模型開發(fā)商越來越多地優(yōu)化模型,使其也能用于AI智能體?!?/p>

以工具使用(或函數(shù)調(diào)用)為例。如果有人詢問LLM當(dāng)前的天氣,它無法從訓(xùn)練數(shù)據(jù)中得出所需的信息。相反,它可能會生成一個API調(diào)用請求來獲取這些信息。即使在GPT-4原生支持函數(shù)調(diào)用之前,應(yīng)用程序開發(fā)者就已經(jīng)在使用LLM生成函數(shù)調(diào)用,但需要編寫更復(fù)雜的提示(比如ReAct提示的變體),告訴LLM有哪些函數(shù)可用,然后讓LLM生成一個字符串,由單獨的軟件程序解析(可能使用正則表達式)來確定是否要調(diào)用函數(shù)?!?/p>

在GPT-4和隨后許多其他模型原生支持函數(shù)調(diào)用之后,生成這樣的調(diào)用變得更加可靠。如今,LLM可以決定調(diào)用函數(shù)來搜索信息用于檢索增強生成(RAG)、執(zhí)行代碼、發(fā)送電子郵件、在線下單等等?!?/p>

最近,Anthropic發(fā)布了其模型的一個版本,能夠使用計算機,通過鼠標(biāo)點擊和按鍵操作計算機(通常是虛擬機)。我很享受使用這個演示。雖然其他團隊一直在提示LLM使用計算機來構(gòu)建新一代RPA(機器人流程自動化)應(yīng)用程序,但主要LLM提供商原生支持計算機使用是一個重大進步。這將幫助很多開發(fā)者! 

隨著智能體工作流程的成熟,我觀察到以下趨勢:  

  • 首先,許多開發(fā)者正在提示LLM執(zhí)行他們想要的智能體行為。這允許快速、豐富的探索!
  • 在較少的情況下,從事高價值應(yīng)用程序開發(fā)的開發(fā)者會對LLM進行微調(diào),使其更可靠地執(zhí)行特定的智能體功能。例如,即使許多LLM原生支持函數(shù)調(diào)用,它們也是通過接收可用函數(shù)的描述,然后(希望)生成輸出標(biāo)記來請求正確的函數(shù)調(diào)用。對于生成正確函數(shù)調(diào)用很重要的關(guān)鍵任務(wù)應(yīng)用,針對應(yīng)用程序特定函數(shù)調(diào)用進行微調(diào)可以顯著提高可靠性。(但請避免過早優(yōu)化!今天我仍然看到太多團隊在應(yīng)該花更多時間在提示上之前就急于進行微調(diào)。)
  • 最后,當(dāng)某項功能(如工具使用或計算機使用)對許多開發(fā)者來說顯得有價值時,主要的LLM提供商正在將這些功能直接構(gòu)建到他們的模型中。盡管OpenAI的o1-preview的高級推理有助于消費者,但我預(yù)計它在智能體推理和規(guī)劃方面會更加有用。

大多數(shù)LLM主要是為了提供良好的消費者體驗而優(yōu)化回答問題的能力,我們已經(jīng)能夠?qū)⑺鼈?嫁接"到復(fù)雜的智能體工作流程中來構(gòu)建有價值的應(yīng)用程序。LLM為原生支持特定智能體操作而構(gòu)建的趨勢將大大提升智能體的性能。我相信在這個方向上的重大智能體性能提升將在未來幾年內(nèi)實現(xiàn)。 

本文轉(zhuǎn)載自 ??AI 思與行??,作者:cc

收藏
回復(fù)
舉報
回復(fù)
相關(guān)推薦