自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

^{<blockquote id="scvti"></blockquote>}

<sub id="scvti"></sub>

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺

51CTO學(xué)堂

IT職業(yè)在線教育平臺

2萬億訓(xùn)練數(shù)據(jù)，120億參數(shù)！開源大模型Stable LM 2-12B

發(fā)布于 2024-4-10 10:04

瀏覽

0收藏

4月9日，著名大模型開源平臺Stability.ai在官網(wǎng)開源了，全新類ChatGPT模型Stable LM 2 12B。

據(jù)悉，Stable LM 2 12B有120億參數(shù)，使用了英語、西班牙語、德語等7種語言2萬億tokens的訓(xùn)練數(shù)據(jù)。一共有基礎(chǔ)模型和指令微調(diào)兩個(gè)版本，能生成文本、代碼等內(nèi)容，還能作為RAG的核心來使用。

同時(shí)，Stability.ai還對之前發(fā)布的模型Stable LM 2 1.6B進(jìn)行了更新，尤其是在硬件需求方面進(jìn)行了大幅度優(yōu)化。所以，這兩款模型非常適合小企業(yè)、個(gè)人開發(fā)者使用。其性能也超過了Qwen1.5-14B-Chat、Mistral-7B-Instruct-v0.2等知名開源同類小參數(shù)模型。

12B開源地址：??https://huggingface.co/stabilityai/stablelm-2-12b??

1.6B新版本：??https://huggingface.co/stabilityai/stablelm-2-1_6b-chat??

技術(shù)報(bào)告：??https://arxiv.org/abs/2402.17834??

在線demo：https://huggingface.co/spaces/stabilityai/stablelm-2-chat

2萬億訓(xùn)練數(shù)據(jù)，120億參數(shù)！開源大模型Stable LM 2-12B-AI.x社區(qū)

StableLM 2架構(gòu)介紹

?

Stable LM 2 12B/1.6B皆使用的是Transformer架構(gòu)，一共24層、32個(gè)自注意力頭，并使用大量公開且多樣化大約2萬億tokens的數(shù)據(jù)集進(jìn)行了預(yù)訓(xùn)練。

這些數(shù)據(jù)包括Arxiv、PubMed、S2ORC、PhilPapers等學(xué)術(shù)論文數(shù)據(jù)集，以及BookCorpusOpen、PG-19、FanFics等圖書和小說數(shù)據(jù)集。

2萬億訓(xùn)練數(shù)據(jù)，120億參數(shù)！開源大模型Stable LM 2-12B-AI.x社區(qū)

Stability.ai還使用了來自Web的數(shù)據(jù)集，如Cultura-X、OpenWebText2、RefinedWeb等，以及來自社交媒體和法律領(lǐng)域的數(shù)據(jù)集。

此外，每個(gè)數(shù)據(jù)集都有相應(yīng)的權(quán)重，為每個(gè)數(shù)據(jù)集提供了詳細(xì)的統(tǒng)計(jì)信息，包括標(biāo)記數(shù)量、訓(xùn)練時(shí)長等。還使用了一種創(chuàng)新的分詞技術(shù)，對原始分詞器進(jìn)行了擴(kuò)展，以便更好地壓縮代碼和非英文語言數(shù)據(jù)。

訓(xùn)練策略方面，Stability.ai使用了一種稱為“FlashAttention-2”的高效序列并行優(yōu)化技術(shù)，以4096的上下文長度從頭開始訓(xùn)練StableLM 2。同時(shí)訓(xùn)練過程中采用BFloat16混合精度，并使用標(biāo)準(zhǔn)的AdamW優(yōu)化器進(jìn)行訓(xùn)練。

2萬億訓(xùn)練數(shù)據(jù)，120億參數(shù)！開源大模型Stable LM 2-12B-AI.x社區(qū)

模型微調(diào)階段，Stability.ai使用了監(jiān)督微調(diào)（SFT）、直接偏好優(yōu)化（DPO）和自我知識學(xué)習(xí)三種方法，對生成的文本進(jìn)行排序，然后使用排序結(jié)果來調(diào)整模型的參數(shù)，使其生成更符合人類偏好的文本。

StableLM 2測試數(shù)據(jù)

?

Stability.ai將兩款StableLM 2 模型在ARC、HellaSwag、MMLU、TriviaQA、Winograd、GSM8K等知名測試平臺上進(jìn)行了綜合測試。

零樣本和少樣本基準(zhǔn)測試方面，StableLM 2 1.6B在綜合平均分?jǐn)?shù)上獲得45.3分,在1.6B以下模型中名列前茅,但仍低于一些更大的模型如phi-2和stablelm-3b-4e1t。

2萬億訓(xùn)練數(shù)據(jù)，120億參數(shù)！開源大模型Stable LM 2-12B-AI.x社區(qū)

而Stable LM 2 12B的性能超過了Qwen1.5-14B-Chat、Mistral-7B-Instruct-v0.2等模型，略低于mistralai/Mixtral-8x7B-Instruct-v0.1。

多語言基準(zhǔn)測試：StableLM 2 1.6B在不同語種任務(wù)上的表現(xiàn)都很出色，在所有語種的綜合分?jǐn)?shù)為40.5分,在英語任務(wù)上得分48.7分、德語39.1分、西班牙語39.0分等。

2萬億訓(xùn)練數(shù)據(jù)，120億參數(shù)！開源大模型Stable LM 2-12B-AI.x社區(qū)

多輪對話基準(zhǔn)測試：StableLM 2 1.6B與其他模型在MT-Bench多輪對話任務(wù)上進(jìn)行了深度對比。StableLM 2 1.6B的綜合得分與規(guī)模明顯更大的模型如Mistral-7B和MPT-30B不相上下,在某些指標(biāo)上甚至獲得了更高的分?jǐn)?shù)。

本文轉(zhuǎn)自 AIGC開放社區(qū) ，作者：AIGC開放社區(qū)

原文鏈接:??https://mp.weixin.qq.com/s/2CV1qK1po0lD7MAQA3vhfw??

標(biāo)簽

贊

收藏

回復(fù)

舉報(bào)

回復(fù)

相關(guān)推薦

無限上下文處理，2萬億token碾壓Llama 2

duhorse ? 2650瀏覽 ? 0回復(fù)
Stable Diffusion 3將在6月12日正式開源

Aceryt ? 2218瀏覽 ? 0回復(fù)
大語言模型llama-2-7b推理服務(wù)實(shí)戰(zhàn)

zhcs333 ? 4304瀏覽 ? 0回復(fù)
用大模型開卡車，還融了2億美元

Aceryt ? 2182瀏覽 ? 0回復(fù)
Meta 開源最強(qiáng)大模型Llama 3.1，參數(shù)多達(dá) 405B，超16000塊H100訓(xùn)練，燃燒數(shù)億經(jīng)費(fèi)！小扎：堅(jiān)定開源不動搖！

51CTO技術(shù)棧 ? 3735瀏覽 ? 0回復(fù)
比Stable Diffusion便宜118倍！1890美元訓(xùn)出11.6億參數(shù)高質(zhì)量文生圖模型

duhorse ? 2090瀏覽 ? 0回復(fù)
LG開源韓語大模型Exaone 3.0，8萬億token訓(xùn)練數(shù)據(jù)

Aceryt ? 2177瀏覽 ? 0回復(fù)
專用于法律的兩個(gè)開源大模型，最高1410億參數(shù)

Aceryt ? 2708瀏覽 ? 0回復(fù)
Mistral開源首個(gè)多模態(tài)大模型—Pixtral 12B

Aceryt ? 2416瀏覽 ? 0回復(fù)
Qwen2-VL (2B、7B、72B)：迄今為止最好的開源視覺模型?。。〒魯?Claude 和 GPT-4o）

老蛀蟲 ? 3942瀏覽 ? 0回復(fù)
Ai2開源OLMo 2：數(shù)據(jù)集、訓(xùn)練方法、權(quán)重大放送

Aceryt ? 1924瀏覽 ? 0回復(fù)
艾倫人工智能研究所 (AI2) 發(fā)布 OLMo 2：在多達(dá) 5T 代幣上訓(xùn)練的新系列開源 7B 和 13B 語言模型

Halo咯咯 ? 2660瀏覽 ? 0回復(fù)
Hugging Face 發(fā)布 SmolVLM：用于設(shè)備端推理的 2B 參數(shù)視覺語言模型

Halo咯咯 ? 2249瀏覽 ? 0回復(fù)
9B參數(shù)吊打GPT-4V！NVIDIA開源新模型（Eagle 2），竟靠“透明數(shù)據(jù)”逆襲？

Halo咯咯 ? 1656瀏覽 ? 0回復(fù)
阿里開源QwQ-32B，性能與Deepseek R1持平。一個(gè)擁有320億參數(shù)的全新推理模型

Halo咯咯 ? 2132瀏覽 ? 0回復(fù)
【AI 界大地震】AMD 開源 30 億參數(shù)大模型 Instella：性能碾壓同類，訓(xùn)練成本暴跌 80%？

Halo咯咯 ? 1241瀏覽 ? 0回復(fù)
AMD開源30億小參數(shù)模型，媲美Qwen-2.5

Aceryt ? 1221瀏覽 ? 0回復(fù)
Llama 4開源王者歸來！推理、編碼打平DeepSeek V3但參數(shù)減一半，一張H100就能跑，還有巨獸2萬億參數(shù)模型！

51CTO技術(shù)棧 ? 1152瀏覽 ? 0回復(fù)
Kimi-VL開源多模態(tài)大模型結(jié)構(gòu)、訓(xùn)練方法、訓(xùn)練數(shù)據(jù)淺析

大模型自然語言處理 ? 1007瀏覽 ? 0回復(fù)

這個(gè)用戶很懶，還沒有個(gè)人簡介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

剛剛，OpenAI發(fā)布GPT-image-1模型，更強(qiáng)吉卜力版本來啦 6天前發(fā)布
字節(jié)跳動開源多模態(tài)AI Agent—UI-TARS-1.5 7天前發(fā)布

熱門推薦

微軟開源DeepSeek-R1魔改版：響應(yīng)99%敏感提示，風(fēng)險(xiǎn)降50% 0回復(fù)

大半精銳盡出！o1下線！滿血o3之后，模型本身就是Manus，最大賣點(diǎn)：替代人干真活！ 1回復(fù)

王炸！MCP 架構(gòu)設(shè)計(jì)深度剖析 & 使用 Spring AI + MCP 四步教你實(shí)現(xiàn) Agent 智能體開發(fā) 0回復(fù)

Dify從入門到高階系列二：手把手教學(xué)！超詳細(xì)的Dify知識庫配置全攻略 0回復(fù)

Crawl4AI：GitHub榜首40K星標(biāo)！LLM專屬極速開源爬蟲神器 0回復(fù)

上一篇：谷歌重磅發(fā)布Gemini 1.5 Pro：能自動寫影評，理解視頻！

下一篇：音樂版Sora！文生超逼真歌曲，可自定義歌詞、時(shí)間延長

社區(qū)精華內(nèi)容

目錄

<sub id="n6zvs"><p id="n6zvs"></p></sub>