自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<sub id="h16ih"><rt id="h16ih"></rt></sub>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考華為認證廠商認證 IT技術(shù)PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺

51CTO學堂

IT職業(yè)在線教育平臺

使用Unsloth微調(diào)與運行Gemma 3，速度提升1.6倍，VRAM使用減少60%

發(fā)布于 2025-3-17 00:41

瀏覽

0收藏

Gemma 3是谷歌新推出的最先進多模態(tài)（文本+圖像）模型，有1B、4B、12B和27B四種規(guī)?！，F(xiàn)已在Unsloth支持，Gemma 3擁有128K上下文窗口和多語言支持。

（1）使用Unsloth的Colab筆記本微調(diào)Gemma 3。Unsloth修復了一些Gemma 3訓練問題。

（2）Unsloth使Gemma 3（12B）微調(diào)速度提升1.6倍，VRAM使用減少60%，在48GB GPU上比使用Flash Attention 2的環(huán)境能處理6倍更長的內(nèi)容。

（3）Unsloth在Hugging Face這里上傳了所有版本的Gemma 3，包括2-8位GGUF、動態(tài)4位和16位版本。還修復了之前Unsloth的GGUF不支持視覺功能的問題。

（4）閱讀Unsloth的指南，了解如何正確運行Gemma 3。

Unsloth現(xiàn)在還支持一切功能*，包括：完全微調(diào)、8位訓練、預(yù)訓練、所有transformer風格模型（Mixtral、MOE、Cohere等）以及任何訓練算法，如與VLM一起使用的GRPO。

獲取最新穩(wěn)定版Unsloth：

pip install --upgrade --force-reinstall --no-cache-dir unsloth unsloth_zoo

Gemma 3微調(diào)

Unsloth在Gemma 3（1B到27B）微調(diào)過程中還遇到了許多無限梯度問題。Unsloth發(fā)現(xiàn)float16混合精度（Tesla T4，RTX 2080系列）工作不佳，因此默認使用float32精度。Float16在A100上也失敗，所以這是一個與硬件無關(guān)的問題。不過bfloat16運行良好！Unsloth會自動選擇最佳數(shù)據(jù)類型！您不需要做任何事情！

使用Unsloth，Gemma 3（27B）微調(diào)所需VRAM不到22GB！速度也提升了1.6倍，默認使用Unsloth 動態(tài)4位量化以獲得更高精度！您還可以直接使用Gemma 3與Unsloth的GRPO訓練自己的推理模型。

嘗試在Unsloth免費的Google Colab筆記本中用Unsloth微調(diào)Gemma 3（4B）。要查看Unsloth所有的筆記本和模型上傳，請訪問Unsloth的文檔。

Unsloth還在與Hugging Face合作開發(fā)R1推理課程 - Gemma 3 GRPO筆記本將在下周初發(fā)布。

性能基準測試

使用Unsloth微調(diào)與運行Gemma 3，速度提升1.6倍，VRAM使用減少60%-AI.x社區(qū)

Unsloth使用Alpaca數(shù)據(jù)集進行測試，批量大小為2，梯度累積步驟為4，rank = 32，并在所有線性層（q, k, v, o, gate, up, down）應(yīng)用QLoRA。

使用Unsloth微調(diào)與運行Gemma 3，速度提升1.6倍，VRAM使用減少60%-AI.x社區(qū)

Blog地址：??https://unsloth.ai/blog/gemma3??

GitHub地址: ??https://github.com/unslothai/unsloth??

Colab地址：???https://colab.research.google.com/github/unslothai/notebooks/blob/main/nb/Gemma3_(4B).ipynb??

本文轉(zhuǎn)載自??AI帝國??，作者：無影寺

標簽

贊

收藏

回復

舉報

回復

相關(guān)推薦

Stable Diffusion 3，可通過API使用啦

Aceryt ? 2238瀏覽 ? 0回復
3倍生成速度還降內(nèi)存成本，超越Medusa2的高效解碼框架終于來了

輕薄滴假象 ? 2040瀏覽 ? 0回復
本地使用Groq Llama 3 70B的逐步指南

51CTO內(nèi)容精選 ? 3237瀏覽 ? 0回復
如何使用Hugging Face Transformers為情緒分析微調(diào)BERT？

51CTO內(nèi)容精選 ? 3009瀏覽 ? 0回復
史上首個實時AI視頻生成技術(shù)：DiT通用，速度提升10.6倍

輕薄滴假象 ? 2963瀏覽 ? 0回復
長視頻生成速度提升100倍！新加坡國立提出Video-Infinity：分布式長視頻生成

angel ? 2765瀏覽 ? 0回復
讓Google大牛告訴你，他是如何使用LLM提升10倍效率的？

Syrupup ? 2007瀏覽 ? 0回復
清華大學提出1-Bit FQT：將全量化訓練極限推到極致,訓練速度提升5倍！

AI論文解讀 ? 2266瀏覽 ? 0回復
Unsloth揭秘：如何將模型微調(diào)效率提升2-5倍

穿越時空111 ? 7646瀏覽 ? 0回復
如何使用Hugging Face Transformers微調(diào)F5以回答問題？

51CTO內(nèi)容精選 ? 2353瀏覽 ? 0回復
使用MCTS顯著提升LLM在復雜任務(wù)的推理能力

arnoldzhw ? 5793瀏覽 ? 0回復
使用 LlamaFactory 結(jié)合開源大語言模型實現(xiàn)文本分類：從數(shù)據(jù)集構(gòu)建到 LoRA 微調(diào)與推理評估

AI悠閑區(qū) ? 5146瀏覽 ? 0回復
Model2Vec：RAG 加速新引擎，模型瘦身15倍，速度提升500倍，最新emb benchmark

鴻煊的學習筆記 ? 2148瀏覽 ? 0回復
阿里QwQ-32B開源引爆AI效率革命：單卡運行、成本降60倍，國產(chǎn)芯片突圍AGI

墨風如雪小站 ? 2844瀏覽 ? 0回復
谷歌開源Gemma-3：媲美DeepSeek，算力暴降10倍

Aceryt ? 2158瀏覽 ? 0回復
Google Gemma 3：性能“炸裂”還是榜單優(yōu)化？

amei2000go ? 1369瀏覽 ? 0回復
Gemma 3：采用Docker Model Runner釋放GenAI的潛力

51CTO內(nèi)容精選 ? 380瀏覽 ? 0回復
一文帶你了解【SFT微調(diào)】與【Unsloth】

碼農(nóng)隨心筆記 ? 297瀏覽 ? 0回復
阿里Qwen3一夜封神！開源模型跑出3倍推理速度，OpenAI沉默

AI博物院 ? 415瀏覽 ? 0回復

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

別擔心！AI微調(diào)后變"壞"也有解法：揭秘LLM對齊技術(shù)新突破 8天前發(fā)布
ReTool：AI工具使用的突破性進展，推理能力顯著提升 8天前發(fā)布

熱門推薦

大半精銳盡出！o1下線！滿血o3之后，模型本身就是Manus，最大賣點：替代人干真活！ 1回復

王炸！MCP 架構(gòu)設(shè)計深度剖析 & 使用 Spring AI + MCP 四步教你實現(xiàn) Agent 智能體開發(fā) 0回復

Dify從入門到高階系列二：手把手教學！超詳細的Dify知識庫配置全攻略 0回復

Crawl4AI：GitHub榜首40K星標！LLM專屬極速開源爬蟲神器 0回復

只需5分鐘，教你用Python搭建MCP Server 0回復

上一篇：挑戰(zhàn)LLM邏輯推理極限！新基準TEXTGAMES能否揭開大模型的短板？

下一篇： TinyR1-32B-Preview: 通過全新分支合并蒸餾技術(shù)讓大模型瘦身不掉智商

社區(qū)精華內(nèi)容

目錄

<blockquote id="n6ojq"></blockquote>

<style id="n6ojq"></style>

<sub id="n6ojq"></sub>

<sub id="n6ojq"><p id="n6ojq"></p></sub>

^{<blockquote id="n6ojq"></blockquote>}<style id="n6ojq"></style>