自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊(cè)
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺(tái)

51CTO學(xué)堂

IT職業(yè)在線教育平臺(tái)

Octopus v4：八爪魚來襲，整合各開源大模型一起玩耍，取長(zhǎng)補(bǔ)短！

發(fā)布于 2024-5-7 13:11

瀏覽

0收藏

大語言模型在多種應(yīng)用中展現(xiàn)出強(qiáng)大效力，但頂尖模型往往價(jià)格昂貴且能耗高，如GPT-4、Anthropic。開源社區(qū)則以Llama3為例，提供了節(jié)能且成本效益高的替代方案，并且定制化小型語言模型在特定領(lǐng)域如法律、醫(yī)療或金融中，已超越了大型專有模型，顯示出更高的效率和精準(zhǔn)度。

Octopus v4新型語言模型框架，通過構(gòu)建一個(gè)包含不同垂直領(lǐng)域語言模型的圖（graph）來使用各種開源語言模型。

從使用萬億參數(shù)模型的單一模型推理，轉(zhuǎn)變?yōu)橛烧卖~模型協(xié)調(diào)的多節(jié)點(diǎn)協(xié)作。該框架通過根據(jù)用戶的查詢選擇最合適的專業(yè)化模型，優(yōu)化推理過程，僅激活兩個(gè)每個(gè)模型少于100億參數(shù)的模型進(jìn)行一步推理。只展示了一個(gè)小圖，但該框架可以支持一個(gè)大圖。請(qǐng)查看圖的演示（https://graph.nexa4ai.com/）。

Octopus v4：八爪魚來襲，整合各開源大模型一起玩耍，取長(zhǎng)補(bǔ)短！-AI.x社區(qū)

Octopus v4模型利用功能標(biāo)記（functional tokens）智能地將用戶查詢定向到最合適的垂直模型，并重新格式化查詢以實(shí)現(xiàn)最佳性能。該模型是Octopus v1、v2和v3模型的進(jìn)化版，在選擇、參數(shù)理解和重新格式化方面表現(xiàn)出色。

Octopus v4的核心是使用功能性標(biāo)記（functional tokens）來激活特定的模型功能，簡(jiǎn)化了語言模型的功能設(shè)計(jì)，使其只需要單一輸入和輸出。通過構(gòu)建一個(gè)有向的異構(gòu)圖，其中包含主節(jié)點(diǎn)和工作節(jié)點(diǎn)，可以有效地處理用戶查詢并生成響應(yīng)。主節(jié)點(diǎn)負(fù)責(zé)協(xié)調(diào)查詢并將其導(dǎo)向合適的工作節(jié)點(diǎn)，而工作節(jié)點(diǎn)則執(zhí)行任務(wù)并使用Octopus模型進(jìn)行進(jìn)一步協(xié)調(diào) 。

章魚模型被用來確定最優(yōu)的鄰近節(jié)點(diǎn)并生成適當(dāng)?shù)男畔⒁怨﹤鬏?。設(shè)想一個(gè)場(chǎng)景，章魚模型的鄰居包括MathGPT、LawGPT、HealthCareGPT、CodeGPT和RoomGPT。章魚模型能夠識(shí)別出最相關(guān)的GPT，并將初始查詢轉(zhuǎn)換為最適合所選GPT的格式。

Octopus v4：八爪魚來襲，整合各開源大模型一起玩耍，取長(zhǎng)補(bǔ)短！-AI.x社區(qū)

規(guī)劃多步驟任務(wù)架構(gòu)由兩個(gè)抽象層組成。第一層使用功能標(biāo)記來表示Octopus v2模型可以執(zhí)行的操作。這一層包括三個(gè)不同的Octopus v2模型，每個(gè)模型都由不同的功能標(biāo)記標(biāo)識(shí)，有效地將它們區(qū)分為獨(dú)立的AI代理。第二層抽象涉及Octopus v4模型，其中內(nèi)部的功能標(biāo)記映射到各種v2模型。為了簡(jiǎn)單起見，只包括了三個(gè)v2模型，但在實(shí)際使用案例中，可以映射到多個(gè)v2模型。

Octopus v4：八爪魚來襲，整合各開源大模型一起玩耍，取長(zhǎng)補(bǔ)短！-AI.x社區(qū)

語言模型圖系統(tǒng)設(shè)計(jì)：其中主節(jié)點(diǎn)部署在中心設(shè)備上，工作節(jié)點(diǎn)分布在各種設(shè)備上。采用Kubernetes（k8s）對(duì)每個(gè)單獨(dú)的工作語言模型進(jìn)行無服務(wù)器部署。為了高效的數(shù)據(jù)共享，利用了由Redis支持的分布式緩存機(jī)制。對(duì)于每個(gè)工作節(jié)點(diǎn)，都附加了一個(gè)小的章魚v4 Lora，以指導(dǎo)多代理用例中的下一個(gè)鄰居節(jié)點(diǎn)。

Octopus v4：八爪魚來襲，整合各開源大模型一起玩耍，取長(zhǎng)補(bǔ)短！-AI.x社區(qū)

在10B參數(shù)規(guī)模的模型中，Octopus v4實(shí)現(xiàn)了74.8的SOTA MMLU得分。

Octopus v4與其他模型在MMLU得分上的比較。在Octopus v4與的推理過程中，僅激活了兩個(gè)小型語言模型，每個(gè)模型的參數(shù)少于100億。Octopus v4與在MMLU得分上取得了顯著提升，由于利用了功能標(biāo)記，僅需要少量的標(biāo)記犧牲。

Octopus v4：八爪魚來襲，整合各開源大模型一起玩耍，取長(zhǎng)補(bǔ)短！-AI.x社區(qū)

??https://arxiv.org/pdf/2404.19296 ??

Octopus v4: Graph of language models

??https://github.com/NexaAI/octopus-v4 ??

??https://hf-mirror.com/NexaAIDev/Octopus-v4??

本文轉(zhuǎn)載自 ??PaperAgent??，作者： PaperAgent

標(biāo)簽

已于2024-5-7 13:12:52修改

贊

收藏

回復(fù)

舉報(bào)

回復(fù)

相關(guān)推薦

您的版權(quán)權(quán)益，平臺(tái)和您一起守護(hù)?。?！

AI.x社區(qū)官方賬號(hào) ? 2394瀏覽 ? 1回復(fù)
YOLO v4：物體檢測(cè)的最佳速度和精度

mb61e52f0ac174a ? 3797瀏覽 ? 0回復(fù)
我們一起聊聊基于 KAN、KAN卷積的軸承故障診斷模型

Tang_Lan ? 5834瀏覽 ? 0回復(fù)
我們一起聊聊Google DeepMind推出Gemma 2 技術(shù)報(bào)告

AI論文解讀 ? 3098瀏覽 ? 0回復(fù)
一起聊聊圖檢索增強(qiáng)生成

sbf_2000 ? 2577瀏覽 ? 0回復(fù)
我們一起聊聊基于時(shí)空特征提取的高創(chuàng)新預(yù)測(cè)模型

Tang_Lan ? 2258瀏覽 ? 0回復(fù)
我們一起聊聊基于時(shí)空特征提取的并行預(yù)測(cè)模型

Tang_Lan ? 2215瀏覽 ? 0回復(fù)
Suno AI v4：音樂創(chuàng)作人的飯碗正逐漸被提示詞所取代

lintoms ? 2354瀏覽 ? 0回復(fù)
我們一起聊聊基于 VMD滾動(dòng)分解+Transformer-GRU并行的鋰電池剩余壽命預(yù)測(cè)模型

Tang_Lan ? 2871瀏覽 ? 0回復(fù)
我們一起聊聊基于快速傅里葉卷積（FFC）的故障診斷模型

xuxiangda ? 2105瀏覽 ? 0回復(fù)
我們一起聊聊分類模型：層次聚類

寶寶數(shù)模AI ? 1658瀏覽 ? 0回復(fù)
我們一起聊聊故障診斷圖卷積合集！新增GAT、SGCN、GIN分類模型

Tang_Lan ? 1608瀏覽 ? 0回復(fù)
我們一起聊聊軸承故障特征—SHAP 模型 3D 可視化

Tang_Lan ? 1671瀏覽 ? 0回復(fù)
s1-32B 模型：超越 o1-preview，一起探索其原因

AI論文解讀 ? 1709瀏覽 ? 0回復(fù)
外網(wǎng)夸爆DeepSeek開源周！今天一口氣開源3個(gè)重磅！壓軸戲期待拉滿，R2、V4、被提名

51CTO技術(shù)棧 ? 1852瀏覽 ? 0回復(fù)
我們一起聊聊大模型 SFT 有監(jiān)督微調(diào)教程

AI悠閑區(qū) ? 1222瀏覽 ? 0回復(fù)
我們一起聊聊基于1DCNN-Informer+MATT融合的故障診斷模型

Tang_Lan ? 998瀏覽 ? 0回復(fù)
Llama 4三大模型來襲，開源免費(fèi)還超能打

Halo咯咯 ? 1582瀏覽 ? 0回復(fù)
我們一起聊聊視覺語言模型

丟翅膀的魚 ? 1102瀏覽 ? 0回復(fù)

這個(gè)用戶很懶，還沒有個(gè)人簡(jiǎn)介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

熱門推薦

大半精銳盡出！o1下線！滿血o3之后，模型本身就是Manus，最大賣點(diǎn)：替代人干真活！ 1回復(fù)

王炸！MCP 架構(gòu)設(shè)計(jì)深度剖析 & 使用 Spring AI + MCP 四步教你實(shí)現(xiàn) Agent 智能體開發(fā) 0回復(fù)

Dify從入門到高階系列二：手把手教學(xué)！超詳細(xì)的Dify知識(shí)庫配置全攻略 0回復(fù)

Crawl4AI：GitHub榜首40K星標(biāo)！LLM專屬極速開源爬蟲神器 0回復(fù)

只需5分鐘，教你用Python搭建MCP Server 0回復(fù)

上一篇： Microsoft提出FILM-7B，解決大模型lost-in-the-middle問題，達(dá)到GPT-4-Turbo水平！

下一篇： NL2Plan: 基于最小文本描述的魯棒性大模型驅(qū)動(dòng)任務(wù)規(guī)劃

社區(qū)精華內(nèi)容

目錄

<sub id="zwyzp"></sub>

<legend id="zwyzp"><track id="zwyzp"></track></legend>