自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<pre id="h65b5"></pre>

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

AI.x社區(qū)

登錄/注冊(cè)
51CTO

中國(guó)優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺(tái)

51CTO學(xué)堂

IT職業(yè)在線教育平臺(tái)

AMD開源30億小參數(shù)模型，媲美Qwen-2.5

發(fā)布于 2025-3-19 12:06

瀏覽

0收藏

AMD在官網(wǎng)開源了最新小參數(shù)模型Instella-3B。比較特別的是，這是一個(gè)基AMD Instinct? MI300X GPU從頭訓(xùn)練的模型。

根據(jù)測(cè)試數(shù)據(jù)顯示，Instella-3B的性能超過了Llama-3.2-3B、Gemma-2-2B，可以媲美阿里開源的Qwen-2.5-3B，這也證明了AMD的GPU也能訓(xùn)練出高性能的大模型。

AMD開源30億小參數(shù)模型，媲美Qwen-2.5-AI.x社區(qū)

開源地址：https://huggingface.co/amd/Instella-3B

Instella-3B-SFT是經(jīng)過監(jiān)督微調(diào)的模型，使用了89.02億tokens的數(shù)據(jù)，增強(qiáng)了遵循指令的能力。Instella-3B-Instruct則是經(jīng)過直接偏好優(yōu)化的模型，使用了7.6億tokens的數(shù)據(jù)，使模型的輸出更符合人類偏好，增強(qiáng)了聊天能力。

架構(gòu)方面，Instella模型是基于文本的自回歸Transformer架構(gòu)，擁有30億參數(shù)，包含36個(gè)解碼器層，每層有32個(gè)注意力頭，支持最長(zhǎng)4096tokens的序列長(zhǎng)度，詞匯量約為50,000tokens。

在預(yù)訓(xùn)練和微調(diào)過程中，AMD使用了FlashAttention-2、Torch Compile和bfloat16混合精度訓(xùn)練，以減少內(nèi)存使用，提高計(jì)算速度和資源利用率。此外，AMD還采用了全分片數(shù)據(jù)并行（FSDP）與混合分片技術(shù)，以平衡集群內(nèi)節(jié)點(diǎn)間的內(nèi)存效率和節(jié)點(diǎn)內(nèi)通信開銷。

AMD開源30億小參數(shù)模型，媲美Qwen-2.5-AI.x社區(qū)

Instella模型的訓(xùn)練分為四個(gè)階段，每個(gè)階段都逐步增強(qiáng)了模型從基礎(chǔ)自然語(yǔ)言理解到遵循指令以及與人類偏好對(duì)齊的能力。在第一階段預(yù)訓(xùn)練中，AMD使用了4.065萬(wàn)億tokens的數(shù)據(jù)，這些數(shù)據(jù)來(lái)自O(shè)LMoE-mix-0924，是一個(gè)涵蓋編碼、學(xué)術(shù)、數(shù)學(xué)和網(wǎng)絡(luò)爬取等領(lǐng)域的高質(zhì)量數(shù)據(jù)集組合。這一階段為Instella模型奠定了自然語(yǔ)言理解的基礎(chǔ)。

在第二階段預(yù)訓(xùn)練中，AMD在第一階段的基礎(chǔ)上進(jìn)一步訓(xùn)練了模型，使用了額外的575.75億tokens的數(shù)據(jù)，這些數(shù)據(jù)來(lái)自多個(gè)高質(zhì)量和多樣化的數(shù)據(jù)集，包括Dolmino-Mix-1124、SmolLM-Corpus（python-edu）、Deepmind Mathematics以及對(duì)話數(shù)據(jù)集等。

AMD開源30億小參數(shù)模型，媲美Qwen-2.5-AI.x社區(qū)

此外，AMD還使用了內(nèi)部合成數(shù)據(jù)集，專注于數(shù)學(xué)問題。這些合成數(shù)據(jù)是通過使用GSM8k數(shù)據(jù)集的訓(xùn)練集生成的，通過抽象數(shù)值、生成Python程序解決問題，并替換數(shù)值以生成新的問題-答案對(duì)。這一階段的訓(xùn)練使Instella-3B模型在多個(gè)基準(zhǔn)測(cè)試中表現(xiàn)出色，與現(xiàn)有的先進(jìn)開源權(quán)重模型相比具有競(jìng)爭(zhēng)力。

在指令微調(diào)階段，AMD使用Instella-3B作為基礎(chǔ)模型，使用89億tokens的高質(zhì)量指令-響應(yīng)對(duì)數(shù)據(jù)進(jìn)行了三個(gè)周期的訓(xùn)練，以增強(qiáng)模型在交互式環(huán)境中的表現(xiàn)，使其更適合執(zhí)行用戶指令的任務(wù)。訓(xùn)練數(shù)據(jù)來(lái)自多個(gè)任務(wù)和領(lǐng)域的精選數(shù)據(jù)集，確保模型能夠泛化各種指令類型。

在最后的對(duì)齊階段，AMD使用直接偏好優(yōu)化（DPO）技術(shù)，以Instella-3B-SFT為基礎(chǔ)模型，使用7.6億tokens的數(shù)據(jù)進(jìn)行了訓(xùn)練，以確保模型的輸出符合人類價(jià)值觀和期望，從而提高其輸出的質(zhì)量和可靠性。

Instella-3B在多個(gè)基準(zhǔn)測(cè)試中超越了現(xiàn)有的全開源模型，并且與阿里開源的Qwen-2.5-3B能力差不多。例如，在MMLU、BBH和GSM8k等基準(zhǔn)測(cè)試中，Instella-3B模型的表現(xiàn)優(yōu)于Llama-3.2-3B和Gemma-2-2B等模型。

AMD開源30億小參數(shù)模型，媲美Qwen-2.5-AI.x社區(qū)

經(jīng)過指令微調(diào)和對(duì)齊后的Instella-3B-Instruct模型在指令遵循任務(wù)和多輪問答任務(wù)中表現(xiàn)出色，同時(shí)在訓(xùn)練數(shù)據(jù)量上更少。

本文轉(zhuǎn)自 AIGC開放社區(qū) ，作者：AIGC開放社區(qū)

原文鏈接:??https://mp.weixin.qq.com/s/UefvMir-v6Bzc--TDIyBaA??

標(biāo)簽

已于2025-3-19 13:30:32修改

贊

收藏

回復(fù)

舉報(bào)

回復(fù)

相關(guān)推薦

2萬(wàn)億訓(xùn)練數(shù)據(jù)，120億參數(shù)！開源大模型Stable LM 2-12B

Aceryt ? 3564瀏覽 ? 0回復(fù)
70億LLaMA媲美5400億PaLM！MIT驚人研究用「博弈論」改進(jìn)大模型｜ICLR 2024

duhorse ? 2231瀏覽 ? 0回復(fù)
Meta 開源最強(qiáng)大模型Llama 3.1，參數(shù)多達(dá) 405B，超16000塊H100訓(xùn)練，燃燒數(shù)億經(jīng)費(fèi)！小扎：堅(jiān)定開源不動(dòng)搖！

51CTO技術(shù)棧 ? 3737瀏覽 ? 0回復(fù)
沒有等來(lái)Qwen2.5，但等來(lái)了Qwen2-Math

NLP工作站 ? 2354瀏覽 ? 0回復(fù)
專用于法律的兩個(gè)開源大模型，最高1410億參數(shù)

Aceryt ? 2729瀏覽 ? 0回復(fù)
Qwen2.5系列模型開源，你值得擁有?。?！

NLP工作站 ? 7692瀏覽 ? 0回復(fù)
探索阿里通義千問 Qwen2.5：新一代開源大模型的卓越力量

穿越時(shí)空111 ? 4792瀏覽 ? 0回復(fù)
超級(jí)新星降臨：Arcee AI發(fā)布SuperNova-Medius，14億參數(shù)的小模型，大作為！

Halo咯咯 ? 2361瀏覽 ? 0回復(fù)
AMD 開源 AMD OLMo：完全開源的 1B 語(yǔ)言模型系列

Halo咯咯 ? 2138瀏覽 ? 0回復(fù)
超GPT-4o，1240億參數(shù)！最強(qiáng)開源多模態(tài)模型 Pixtral Large！

Aceryt ? 2052瀏覽 ? 0回復(fù)
開源最大AI視頻模型，130億參數(shù)，性能媲美閉源，擊敗Runway Gen-3、Luma 1.6

51CTO技術(shù)棧 ? 2187瀏覽 ? 0回復(fù)
阿里巴巴Qwen團(tuán)隊(duì)發(fā)布QwQ-32B-Preview：包含320億參數(shù)的開放模型，專為解決高級(jí)推理任務(wù)而設(shè)計(jì)

Halo咯咯 ? 4354瀏覽 ? 0回復(fù)
AI Video Composer：Qwen2.5-Coder 賦能，簡(jiǎn)易開源視頻創(chuàng)作神器來(lái)襲

穿越時(shí)空111 ? 3108瀏覽 ? 0回復(fù)
基于阿里開源Qwen2.5-7B-Instruct模型進(jìn)行多代理RAG開發(fā)實(shí)戰(zhàn)

51CTO內(nèi)容精選 ? 2298瀏覽 ? 0回復(fù)
阿里開源QwQ-32B，性能與Deepseek R1持平。一個(gè)擁有320億參數(shù)的全新推理模型

Halo咯咯 ? 2145瀏覽 ? 0回復(fù)
【AI 界大地震】AMD 開源 30 億參數(shù)大模型 Instella：性能碾壓同類，訓(xùn)練成本暴跌 80%？

Halo咯咯 ? 1245瀏覽 ? 0回復(fù)
Llama 4開源王者歸來(lái)！推理、編碼打平DeepSeek V3但參數(shù)減一半，一張H100就能跑，還有巨獸2萬(wàn)億參數(shù)模型！

51CTO技術(shù)棧 ? 1152瀏覽 ? 0回復(fù)
32B參數(shù)模型硬剛GPT-4o，性能驚艷

Halo咯咯 ? 1770瀏覽 ? 0回復(fù)
港大&字節(jié)開源GigaTok首次破解圖像重建與生成矛盾，30億參數(shù)登頂SOTA！

angel ? 1111瀏覽 ? 0回復(fù)

這個(gè)用戶很懶，還沒有個(gè)人簡(jiǎn)介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

剛剛，OpenAI發(fā)布GPT-image-1模型，更強(qiáng)吉卜力版本來(lái)啦 6天前發(fā)布
字節(jié)跳動(dòng)開源多模態(tài)AI Agent—UI-TARS-1.5 7天前發(fā)布

熱門推薦

微軟開源DeepSeek-R1魔改版：響應(yīng)99%敏感提示，風(fēng)險(xiǎn)降50% 0回復(fù)

大半精銳盡出！o1下線！滿血o3之后，模型本身就是Manus，最大賣點(diǎn)：替代人干真活！ 1回復(fù)

王炸！MCP 架構(gòu)設(shè)計(jì)深度剖析 & 使用 Spring AI + MCP 四步教你實(shí)現(xiàn) Agent 智能體開發(fā) 0回復(fù)

Dify從入門到高階系列二：手把手教學(xué)！超詳細(xì)的Dify知識(shí)庫(kù)配置全攻略 0回復(fù)

Crawl4AI：GitHub榜首40K星標(biāo)！LLM專屬極速開源爬蟲神器 0回復(fù)

上一篇：英偉達(dá)全力發(fā)展AI Agent！開源專屬大模型，最強(qiáng)AI工廠

下一篇：比DeepSeek、o1高3倍！首創(chuàng)無(wú)服務(wù)器強(qiáng)化微調(diào)，只需十幾個(gè)數(shù)據(jù)點(diǎn)

社區(qū)精華內(nèi)容

目錄

<style id="qcc6h"></style>