自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

谷歌“Wi-Fi密碼”式的最瘦大模型

人工智能
Google 這次玩的是 QAT —— 訓(xùn)練過(guò)程直接讓模型在低精度環(huán)境下“吃苦頭”,提前適應(yīng)精度損失。Google 自己也說(shuō)了:“因?yàn)?QAT,這些模型對(duì)量化魯棒,性能和原版近乎持平?!?/div>

Gemma 3 的“低門檻 AI”計(jì)劃露面了,谷歌這次直接把 Gemma 3 做成了“跑得動(dòng)的”AI。

—Gemma-3-27b-it-qat-q4_0-gguf 聽(tīng)上去像個(gè) Wi-Fi 密碼,其實(shí)卻是谷歌迄今為止最精簡(jiǎn)的大模型

是的,不再只屬于高端服務(wù)器和土豪顯卡,普通玩家的游戲卡,甚至手機(jī),都能一試身手。

這波操作的核心是三個(gè)字:量化訓(xùn)練(Quantization-Aware Training, QAT)。

為什么量化訓(xùn)練讓 AI 變“親民”?

以前的 Gemma 3需要“天花板配置”:NVIDIA H100,BFloat16 精度,普通人家根本用不起。

而這次,Google 把量化訓(xùn)練用到了極致。簡(jiǎn)單說(shuō),就是讓模型在訓(xùn)練階段就習(xí)慣低精度(比如 int4、int8),以后部署時(shí)直接“瘦身”,幾乎不掉智商。

圖片圖片

顯存節(jié)省效果非常明顯。以 27B 參數(shù)的模型為例,原本需要 54 GB 的顯存,在 int4(4 位整型)格式下只需 14.1 GB;12B 版本從 24 GB 降到了 6.6 GB。即便是小尺寸模型也受益明顯:4B 版本僅需 2.6 GB,1B 版本甚至只要 0.5 GB 顯存。

量化訓(xùn)練的“魔法”到底在哪里?

普通的量化是什么?后處理。模型訓(xùn)完了,直接把參數(shù)壓縮成低精度,代價(jià)就是:掉分,掉智商。

Google 這次玩的是 QAT —— 訓(xùn)練過(guò)程直接讓模型在低精度環(huán)境下“吃苦頭”,提前適應(yīng)精度損失。Google 自己也說(shuō)了:“因?yàn)?QAT,這些模型對(duì)量化魯棒,性能和原版近乎持平?!?/span>

當(dāng)然,benchmark 數(shù)據(jù)沒(méi)公開(kāi),多少有點(diǎn)賣關(guān)子,但社區(qū)已經(jīng)開(kāi)始實(shí)測(cè)和玩梗。

不過(guò),僅看顯存和推理速度的變化,這次量化訓(xùn)練確實(shí)把大模型帶進(jìn)了“民用領(lǐng)域”。

責(zé)任編輯:武曉燕 來(lái)源: 大數(shù)據(jù)文摘
相關(guān)推薦

2024-01-29 10:26:00

Wi-Fi

2018-06-05 16:05:01

Windows 10WiFi 密碼

2011-11-28 14:36:41

2012-07-04 10:49:54

Wi-Fi

2020-04-08 16:09:37

機(jī)器學(xué)習(xí)Wi-Fi網(wǎng)絡(luò)

2016-01-13 10:45:57

Wi-FiHalow

2014-05-29 10:27:08

Wi-Fi誤解

2012-07-13 10:23:04

Wi-Fi

2021-08-01 12:39:26

Wi-Fi 7網(wǎng)絡(luò)Wi-Fi 6

2020-12-07 11:28:02

Wi-FiWi-Fi 6

2018-10-11 14:45:53

Wi-Fi無(wú)線通信網(wǎng)絡(luò)

2018-02-27 16:12:30

Wi-Fi

2019-07-10 16:23:55

Wi-Fi

2018-03-29 16:34:05

Wi-Fi

2022-02-24 09:34:29

Wi-Fi 6Wi-Fi 7路由

2023-03-07 14:54:40

Wi-Fi 7無(wú)線技術(shù)

2022-12-21 11:20:08

2018-12-25 15:20:05

Windows10Wi-Fi密碼Windows
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)