自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

Agent遇上4萬個(gè)工具?一個(gè)Token搞定!

發(fā)布于 2024-10-30 14:09
瀏覽
1收藏

ToolGen: Unified Tool Retrieval and Calling via Generation

隨著大型語言模型(LLMs)的發(fā)展,它們無法與外部工具直接交互以自主執(zhí)行任務(wù),這仍然是一個(gè)關(guān)鍵的限制。傳統(tǒng)方法依賴于將工具描述作為上下文進(jìn)行輸入,這受到上下文長度的限制,并且需要單獨(dú)的、通常效率不高的檢索機(jī)制。我們引入了 ToolGen,這是一種范式轉(zhuǎn)變,通過將每個(gè)工具表示為唯一的token,直接將工具知識(shí)集成到LLM的參數(shù)中。這使得LLM能夠生成工具調(diào)用和參數(shù)作為其下一次token預(yù)測能力的一部分,無縫結(jié)合工具調(diào)用和語言生成。我們的框架允許LLM訪問和利用大量的工具,而無需進(jìn)行額外的檢索步驟,從而大大提高了性能和可擴(kuò)展性。對(duì)超過 47,000 個(gè)工具進(jìn)行的實(shí)驗(yàn)結(jié)果表明,ToolGen 不僅在工具檢索和自主任務(wù)完成方面取得了優(yōu)越的結(jié)果,而且為能夠適應(yīng)不同領(lǐng)域工具的新時(shí)代 AI 代理奠定了基礎(chǔ)。ToolGen 通過從根本上將工具檢索轉(zhuǎn)變?yōu)樯蛇^程,為更通用、高效和自主的 AI 系統(tǒng)鋪平了道路。ToolGen 能夠?qū)崿F(xiàn)端到端的工具學(xué)習(xí),并與其他先進(jìn)技術(shù)(如思維鏈和強(qiáng)化學(xué)習(xí))集成,從而擴(kuò)展了LLMs 的實(shí)際能力。代碼開源:??https://github.com/Reason-Wang/ToolGen??

現(xiàn)實(shí)場景中,工具可能會(huì)很多,無法全部放進(jìn)模型的上下文中。因此在給定一個(gè)用戶問題之后,一般會(huì)存在一個(gè)工具召回模塊,它的目標(biāo)是從一個(gè)工具集中找到與用戶問題相關(guān)的工具來解決這個(gè)問題。

經(jīng)典的ToolBench,有16000個(gè)工具集,總共有47000個(gè)API。從中撈出來與問題相關(guān)的工具,還是很困難的一個(gè)問題。

這個(gè)過程對(duì)應(yīng)了下圖的上半部分。圖片上左為工具召回模塊,一般借助相似度方法獲取數(shù)量有限的工具。圖片上右就是常見的Agent引擎做出相應(yīng)的Action。

Agent遇上4萬個(gè)工具?一個(gè)Token搞定!-AI.x社區(qū)

而本文介紹的ToolGen,整個(gè)流程分為2大步

  1. 工具映射到詞表id,這樣模型做決策的時(shí)候,就只需要預(yù)測出對(duì)應(yīng)的token id即可

Agent遇上4萬個(gè)工具?一個(gè)Token搞定!-AI.x社區(qū)

  1. 微調(diào)新添加進(jìn)去的id,分為3小步
  • 輸入工具描述,輸出對(duì)應(yīng)的工具token id,學(xué)習(xí)新增id的具體含義
  • 輸入query,輸出對(duì)應(yīng)的工具token id,學(xué)會(huì)根據(jù)用戶問題召回對(duì)應(yīng)的工具
  • 端到端的Agent訓(xùn)練,引導(dǎo)模型輸出完整的plan,action,params

Agent遇上4萬個(gè)工具?一個(gè)Token搞定!-AI.x社區(qū)

總的來說,ToolGen是將工具檢索和執(zhí)行統(tǒng)一為一個(gè)生成任務(wù),簡化了檢索過程,并且可以與其他LLM功能(如鏈?zhǔn)酵评砗蛷?qiáng)化學(xué)習(xí))集成。訓(xùn)練還算容易,最后結(jié)果也很亮眼。

Agent遇上4萬個(gè)工具?一個(gè)Token搞定!-AI.x社區(qū)

本文轉(zhuǎn)載自?? 探索AGI??,作者: 獼猴桃

標(biāo)簽
已于2024-11-1 16:17:20修改
收藏 1
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦