自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<label id="dgyuo"></label>

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺

51CTO學(xué)堂

IT職業(yè)在線教育平臺

CPU推理僅29ms，微軟開源第一個(gè)原生 1 bit 大模型，內(nèi)存只需Qwen 1.5B的1/15

發(fā)布于 2025-4-21 00:47

瀏覽

0收藏

微軟研究院發(fā)布了第一個(gè)開源的、原生的 1 bit 大型語言模型（LLM）：BitNet b1.58 2B4T：

內(nèi)存占用：BitNet b1.58 2B4T 的非嵌入層內(nèi)存占用僅為0.4GB，遠(yuǎn)低于其他全精度模型。
能耗：估計(jì)的解碼能耗為0.028焦耳，遠(yuǎn)低于其他模型。
解碼延遲：在CPU上，BitNet b1.58 2B4T 的平均延遲為29ms，遠(yuǎn)低于其他模型。

CPU推理僅29ms，微軟開源第一個(gè)原生 1 bit 大模型，內(nèi)存只需Qwen 1.5B的1/15-AI.x社區(qū)

BitNet b1.58 2B4T參數(shù)規(guī)模達(dá)到20億，在包含4T tokens的語料庫上進(jìn)行訓(xùn)練，并在多個(gè)基準(zhǔn)測試中表現(xiàn)出與同規(guī)模的領(lǐng)先全精度模型（LLaMA 3.2 1B、Qwen2.5 1.5B、Gemma-3 1B等）相當(dāng)?shù)男阅堋?/span>

CPU推理僅29ms，微軟開源第一個(gè)原生 1 bit 大模型，內(nèi)存只需Qwen 1.5B的1/15-AI.x社區(qū)

選擇了一個(gè)領(lǐng)先的全精度模型Qwen2.5 1.5B，并對其應(yīng)用了兩種標(biāo)準(zhǔn)的INT4量化方法：GPTQ和AWQ。

內(nèi)存占用：BitNet b1.58 2B4T的非嵌入層內(nèi)存占用僅為0.4GB，遠(yuǎn)低于Qwen2.5 1.5B的2.6GB（即使在INT4量化后，Qwen2.5 1.5B的內(nèi)存占用仍為0.7GB）。
性能：盡管INT4量化顯著減少了Qwen2.5 1.5B的內(nèi)存占用，但BitNet b1.58 2B4T在大多數(shù)基準(zhǔn)測試中保持了更強(qiáng)的性能。

CPU推理僅29ms，微軟開源第一個(gè)原生 1 bit 大模型，內(nèi)存只需Qwen 1.5B的1/15-AI.x社區(qū)

模型權(quán)重已通過 Hugging Face 公開發(fā)布，沖上熱榜Top1，并提供了針對 GPU 和 CPU 架構(gòu)的開源推理實(shí)現(xiàn)。

CPU推理僅29ms，微軟開源第一個(gè)原生 1 bit 大模型，內(nèi)存只需Qwen 1.5B的1/15-AI.x社區(qū)

現(xiàn)有的1bit模型要么是基于全精度模型的后訓(xùn)練量化（PTQ），導(dǎo)致性能顯著下降；要么是規(guī)模較小的原生1bit模型；BitNet b1.58 2B4T 模型完全從頭開始訓(xùn)練，核心創(chuàng)新是用自定義的 BitLinear 層替換了標(biāo)準(zhǔn)的全精度線性層。這些 BitLinear 層包括：

權(quán)重量化：在前向傳播中，模型權(quán)重被量化為1.58bit，使用絕對均值（absmean）量化方案將權(quán)重映射到三元值{-1, 0, +1}。
激活量化：線性投影中的激活被量化為8bit整數(shù)，使用絕對最大值（absmax）量化策略，按token應(yīng)用。
歸一化：引入子層歸一化（subln）以增強(qiáng)訓(xùn)練穩(wěn)定性。

除了 BitLinear 層外，還集成了多種已建立的 LLM 技術(shù)以增強(qiáng)性能和穩(wěn)定性，包括在前饋網(wǎng)絡(luò)（FFN）子層中使用 ReLU2 激活函數(shù)、RoPE 以及去除所有線性層和歸一化層的偏置項(xiàng)。

BitNet b1.58 2B4T 的訓(xùn)練過程包括三個(gè)階段：

預(yù)訓(xùn)練：目標(biāo)是賦予模型廣泛的世界知識和基礎(chǔ)語言能力。使用了兩階段學(xué)習(xí)率計(jì)劃和權(quán)重衰減策略，以及包含公共文本和代碼數(shù)據(jù)集的預(yù)訓(xùn)練語料庫。
監(jiān)督微調(diào)（SFT）：通過多樣化的指令跟隨和對話數(shù)據(jù)集增強(qiáng)模型的指令跟隨能力和對話交互格式的性能。
直接偏好優(yōu)化（DPO）：進(jìn)一步使模型的行為與人類對有用性和安全性的偏好對齊，直接優(yōu)化語言模型以使用偏好數(shù)據(jù)，避免了訓(xùn)練單獨(dú)的獎(jiǎng)勵(lì)模型。

CPU推理僅29ms，微軟開源第一個(gè)原生 1 bit 大模型，內(nèi)存只需Qwen 1.5B的1/15-AI.x社區(qū)

https://arxiv.org/pdf/2504.12285
https://hf-mirror.com/microsoft/bitnet-b1.58-2B-4T
BitNet b1.58 2B4T Technical Report

本文轉(zhuǎn)載自??PaperAgent??

標(biāo)簽

贊

收藏

回復(fù)

舉報(bào)

回復(fù)

相關(guān)推薦

AI下一個(gè)重大飛躍是理解情感！第一個(gè)具有情商的對話型AI來了

duhorse ? 2678瀏覽 ? 0回復(fù)
第一個(gè)能聽懂人類語氣的AI火了，網(wǎng)友：感覺在和真人交談

Crystalcxt ? 3432瀏覽 ? 0回復(fù)
Alphafold可能成為第一個(gè)獲諾貝爾獎(jiǎng)的深度學(xué)習(xí)模型？

魚蟲子 ? 2413瀏覽 ? 0回復(fù)
ChatGPT是第一個(gè)真正意義的人工通用智能

ceesoft ? 2832瀏覽 ? 0回復(fù)
世界上第一個(gè)聊天機(jī)器人并非旨在成為聊天機(jī)器人

xuxiangda ? 4403瀏覽 ? 0回復(fù)
使用LangChain，上手開發(fā)我們第一個(gè)人工智能APP

ermulong ? 2291瀏覽 ? 0回復(fù)
Aria: 第一個(gè)多模態(tài)MoE | Pixtral 12B | AI教學(xué)新突破：DataEnvGym讓模型自我進(jìn)化

sbf_2000 ? 2164瀏覽 ? 0回復(fù)
Bitnet.cpp：微軟開源1比特推理框架，CPU跑100B模型

老蛀蟲 ? 5220瀏覽 ? 0回復(fù)
Qwen開源強(qiáng)大、多樣、實(shí)用的Qwen2.5-Coder系列（0.5B/1.5B/3B/7B/14B/32B）

Halo咯咯 ? 3648瀏覽 ? 0回復(fù)
LLaVA-o1：第一個(gè)能夠進(jìn)行自發(fā)、系統(tǒng)推理的視覺語言模型，類似于 GPT-o1

Halo咯咯 ? 2353瀏覽 ? 0回復(fù)
使用Cursor和Claude AI打造你的第一個(gè)App

小虎哦哦 ? 3731瀏覽 ? 0回復(fù)
微軟：GPT-4o-mini只有8B，o1-mini僅100B

PaperAgent ? 1801瀏覽 ? 0回復(fù)
Reyes：一個(gè)從0到1開始訓(xùn)練的多模態(tài)大模型（技術(shù)報(bào)告）

大模型自然語言處理 ? 1860瀏覽 ? 0回復(fù)
DeepSeek-R1-Distill-Qwen-1.5B 在某些基準(zhǔn)測試中超越了 GPT-4o

Halo咯咯 ? 1.0w瀏覽 ? 0回復(fù)
阿里開源QwQ-32B，性能與Deepseek R1持平。一個(gè)擁有320億參數(shù)的全新推理模型

Halo咯咯 ? 2154瀏覽 ? 0回復(fù)
Qwen原生多模態(tài)開源，淺析一下！

NLP前沿1 ? 1035瀏覽 ? 0回復(fù)
基于 DeepSeek GRPO 的 1.5B Rust 代碼生成模型訓(xùn)練實(shí)戰(zhàn)

Baihai_IDP ? 913瀏覽 ? 0回復(fù)
智譜AI開源6款模型，推理速度200 tokens/秒碾壓競品，價(jià)格僅1/30！

AI博物院 ? 1623瀏覽 ? 0回復(fù)
剛剛，Qwen3強(qiáng)勢登頂，成開源新王！國內(nèi)首個(gè)混合推理模型，235B擊敗R1、o1!源神火力全開

51CTO技術(shù)棧 ? 456瀏覽 ? 0回復(fù)

這個(gè)用戶很懶，還沒有個(gè)人簡介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

OpenAI大佬：AI上半場忙著開發(fā)新訓(xùn)練方法和模型GPT-4/o1/o3，下半場呢？ 9天前發(fā)布
Llama4 剛開源就要被網(wǎng)友玩壞了！ 2025-04-08 07:20:33發(fā)布

熱門推薦

大半精銳盡出！o1下線！滿血o3之后，模型本身就是Manus，最大賣點(diǎn)：替代人干真活！ 1回復(fù)

王炸！MCP 架構(gòu)設(shè)計(jì)深度剖析 & 使用 Spring AI + MCP 四步教你實(shí)現(xiàn) Agent 智能體開發(fā) 0回復(fù)

Dify從入門到高階系列二：手把手教學(xué)！超詳細(xì)的Dify知識庫配置全攻略 0回復(fù)

Crawl4AI：GitHub榜首40K星標(biāo)！LLM專屬極速開源爬蟲神器 0回復(fù)

只需5分鐘，教你用Python搭建MCP Server 0回復(fù)

上一篇： Llama4 剛開源就要被網(wǎng)友玩壞了！

下一篇： OpenAI大佬：AI上半場忙著開發(fā)新訓(xùn)練方法和模型GPT-4/o1/o3，下半場呢？

社區(qū)精華內(nèi)容

目錄

<blockquote id="crves"><dfn id="crves"></dfn></blockquote>

<blockquote id="crves"></blockquote>

^{<blockquote id="crves"></blockquote>}

^{<blockquote id="crves"></blockquote>}