自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認證廠商認證 IT技術(shù)PMP項目管理免費題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺

51CTO學(xué)堂

IT職業(yè)在線教育平臺

ACL2024：一個開源的通用語言代理訓(xùn)練框架LUMOS 原創(chuàng)

發(fā)布于 2024-6-24 16:08

瀏覽

0收藏

ACL2024：一個開源的通用語言代理訓(xùn)練框架LUMOS -AI.x社區(qū)

想象一下,擁有一個不僅能回答問題,還能瀏覽網(wǎng)頁、解決復(fù)雜數(shù)學(xué)問題、編寫代碼,甚至能推理圖像和基于文本的游戲的數(shù)字助手。聽起來好得難以置信?好吧,準備好迎接人工智能的未來,因為隨著LUMOS的引入,它變得更加易于獲取和透明。

在一項突破性的發(fā)展中,來自艾倫人工智能研究所、UCLA和華盛頓大學(xué)的研究人員推出了LUMOS,這是一個開源框架,有望徹底改變我們與語言代理的交互方式。與現(xiàn)有的閉源解決方案不同,LUMOS提供了前所未有的可負擔(dān)性、透明度和可重復(fù)性,使其成為人工智能世界的一個游戲規(guī)則改變者。

ACL2024：一個開源的通用語言代理訓(xùn)練框架LUMOS -AI.x社區(qū)

但LUMOS到底是什么,為什么它在人工智能社區(qū)引起如此轟動?系好安全帶,因為我們將深入探討這項卓越創(chuàng)新的細節(jié),探索它如何工作、它能做什么,以及為什么它比你想象的更重要。

當(dāng)前的語言代理通常依賴于GPT-4或ChatGPT等大型閉源語言模型作為核心組件。雖然功能強大,但這些模型價格昂貴,需要更多的透明度,并提供有限的可重復(fù)性和可控性。

LUMOS框架采用了不同的方法,利用開源大型語言模型(LLMs)作為基礎(chǔ)模型。它采用了一個統(tǒng)一和模塊化的架構(gòu),由三個關(guān)鍵組件組成:規(guī)劃模塊、基礎(chǔ)模塊和執(zhí)行模塊。

規(guī)劃模塊將復(fù)雜任務(wù)分解為一系列用自然語言表達的高級子目標。例如,對于"她手中的設(shè)備來自哪個國家?"這樣的多模態(tài)問題,規(guī)劃模塊可能會生成兩個子目標:"識別設(shè)備品牌"和"回答設(shè)備品牌的國家"。

然后,基礎(chǔ)模塊將這些高級子目標轉(zhuǎn)換為可由執(zhí)行模塊中的各種工具執(zhí)行的可執(zhí)行低級操作。例如,第一個子目標可能會被轉(zhuǎn)化為"VQA(, 品牌是什么..?)"這樣的操作,以使用視覺問答工具從圖像中識別設(shè)備品牌。

執(zhí)行模塊包含一系列現(xiàn)成的工具,包括API、神經(jīng)模型和虛擬模擬器,可以執(zhí)行基礎(chǔ)化的操作。這些執(zhí)行操作的結(jié)果隨后被反饋到規(guī)劃和基礎(chǔ)模塊中,實現(xiàn)迭代和自適應(yīng)的代理行為。

LUMOS的一個關(guān)鍵優(yōu)勢是其模塊化設(shè)計,可以輕松升級并廣泛適用于各種交互任務(wù)。通過分離規(guī)劃、基礎(chǔ)和執(zhí)行組件,研究人員可以改進或替換單個模塊而不影響其他模塊。

為了訓(xùn)練LUMOS,研究人員整理了一個大規(guī)模、高質(zhì)量的數(shù)據(jù)集,包含超過56,000個注釋,這些注釋源自各種復(fù)雜交互任務(wù)的多樣化真實推理理由,包括問答、數(shù)學(xué)、編碼、網(wǎng)頁瀏覽和多模態(tài)推理。這些注釋是通過使用GPT-4和其他先進的語言模型將現(xiàn)有基準轉(zhuǎn)換為與LUMOS架構(gòu)兼容的統(tǒng)一格式獲得的。由此產(chǎn)生的數(shù)據(jù)集是最大的開源代理微調(diào)資源之一,使較小的語言模型能夠有效地被訓(xùn)練為語言代理。

在跨九個數(shù)據(jù)集的評估中,LUMOS展現(xiàn)了幾個關(guān)鍵優(yōu)勢。它在每種任務(wù)類型的保留數(shù)據(jù)集上超越了多個更大的開源代理,在某些情況下甚至超越了GPT代理在問答和網(wǎng)頁任務(wù)上的表現(xiàn)。LUMOS還優(yōu)于其他訓(xùn)練方法(如思維鏈和非模塊化集成訓(xùn)練)產(chǎn)生的代理。值得注意的是,LUMOS展示了令人印象深刻的泛化能力,在涉及新環(huán)境和操作的未見任務(wù)上顯著優(yōu)于30B規(guī)模(WizardLM-30B和Vicuna-v1.3-33B)和特定領(lǐng)域的代理。

憑借其開源性質(zhì)、競爭性表現(xiàn)和強大的泛化能力,LUMOS代表了在開發(fā)用于復(fù)雜交互任務(wù)的可負擔(dān)、透明和可重復(fù)的語言代理方面的重大進步。

譯自(有刪改)：https://www.marktechpost.com/2024/04/01/lumos-an-open-source-generalizable-language-agent-training-framework/

本文轉(zhuǎn)載自公眾號AIGC最前線

原文鏈接：??https://mp.weixin.qq.com/s/Hv6sECtrkTQvxS5q9XdXCw??

?著作權(quán)歸作者所有，如需轉(zhuǎn)載，請注明出處，否則將追究法律責(zé)任

標簽

大型語言模型

已于2024-6-24 16:11:31修改

贊

收藏

回復(fù)

舉報

回復(fù)

相關(guān)推薦

ACL 2024 | 讓純LLM實現(xiàn)類人的符號邏輯推理能力，開源框架SymbCoT來了

輕薄滴假象 ? 3471瀏覽 ? 0回復(fù)
CVPR 2024｜讓圖像擴散模型生成高質(zhì)量360度場景，只需要一個語言模型

輕薄滴假象 ? 2983瀏覽 ? 0回復(fù)
谷歌開源TimesFM：1000億個時間點訓(xùn)練，入選ICML 2024

duhorse ? 2752瀏覽 ? 0回復(fù)
ChatGPT是第一個真正意義的人工通用智能

ceesoft ? 2825瀏覽 ? 0回復(fù)
ACL2024 | NLP-KG：一個比Google Scholar更強大的NLP文獻搜索工具

Tang_Lan ? 3218瀏覽 ? 0回復(fù)
LFPLM：基于預(yù)訓(xùn)練語言模型的通用靈活負荷預(yù)測框架

AIRoobt ? 3636瀏覽 ? 0回復(fù)
OpenDevin：一個面向通用型Agent AI軟件開發(fā)者的開放平臺

sbf_2000 ? 2857瀏覽 ? 0回復(fù)
RAGLAB：又來一個RAG框架，還是模塊化的

大語言模型論文跟蹤 ? 2262瀏覽 ? 0回復(fù)
一個開源、清晰、強大且可定制的RAG UI

PaperAgent ? 2839瀏覽 ? 0回復(fù)
WordLlama：一個開源、快速、輕量級（16MB）的自然語言處理工具包！

Halo咯咯 ? 3066瀏覽 ? 0回復(fù)
使用開源框架部署一個微信公眾號智能客服

一起AI技術(shù) ? 2303瀏覽 ? 0回復(fù)
ACL2024 |解釋引導(dǎo)的大語言模型主動蒸餾：一種優(yōu)化知識轉(zhuǎn)移的創(chuàng)新框架 "ELAD"

arnoldzhw ? 2531瀏覽 ? 0回復(fù)
PydanticAI：一個基于 Python 的新代理框架，用于構(gòu)建生產(chǎn)級 LLM 支持的應(yīng)用程序

Halo咯咯 ? 3405瀏覽 ? 0回復(fù)
ACL2024 ｜利用GPT4構(gòu)建的多Agent系統(tǒng)自動發(fā)現(xiàn)科學(xué)假設(shè)

arnoldzhw ? 2151瀏覽 ? 0回復(fù)
自己打包一個數(shù)據(jù)集代碼案例——使用Numpy計算框架自定義一個類似MINST的數(shù)據(jù)集

AI探索時代 ? 1474瀏覽 ? 0回復(fù)
開源一個新的SDK，現(xiàn)場手搓三個Agent！還抖了一個內(nèi)部的料

51CTO技術(shù)棧 ? 1986瀏覽 ? 0回復(fù)
開源：9個GraphRAG框架大一統(tǒng)

大語言模型論文跟蹤 ? 1660瀏覽 ? 0回復(fù)
我們?nèi)绾螛?gòu)建了一個LangGraph代理以確定GitOps漏洞的優(yōu)先級？

51CTO內(nèi)容精選 ? 2004瀏覽 ? 0回復(fù)
五個開源 MCP 服務(wù)器，讓你的AI代理勢如破竹

51CTO技術(shù)棧 ? 938瀏覽 ? 0回復(fù)

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

預(yù)測未來模型能力！微調(diào)揭示LLM涌現(xiàn)能力的關(guān)鍵 2024-12-09 09:10:30發(fā)布
預(yù)測未來模型能力！微調(diào)揭示LLM涌現(xiàn)能力的關(guān)鍵 2024-12-03 15:46:55發(fā)布

熱門推薦

大半精銳盡出！o1下線！滿血o3之后，模型本身就是Manus，最大賣點：替代人干真活！ 1回復(fù)

王炸！MCP 架構(gòu)設(shè)計深度剖析 & 使用 Spring AI + MCP 四步教你實現(xiàn) Agent 智能體開發(fā) 0回復(fù)

Dify從入門到高階系列二：手把手教學(xué)！超詳細的Dify知識庫配置全攻略 0回復(fù)

Crawl4AI：GitHub榜首40K星標！LLM專屬極速開源爬蟲神器 0回復(fù)

只需5分鐘，教你用Python搭建MCP Server 0回復(fù)

上一篇：微軟發(fā)布Florence-2：用于處理各種視覺任務(wù)的小模型

下一篇： PWM: 基于世界模型的策略學(xué)習(xí)

社區(qū)精華內(nèi)容

目錄

<em id="83d1q"><rt id="83d1q"><form id="83d1q"></form></rt></em>

<style id="83d1q"></style><legend id="83d1q"><track id="83d1q"></track></legend>

<sub id="83d1q"></sub>

<s id="83d1q"><li id="83d1q"></li></s>