自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<sub id="z6obo"><input id="z6obo"></input></sub>

<s id="z6obo"><li id="z6obo"></li></s>

^{<blockquote id="z6obo"></blockquote>}

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺

51CTO學(xué)堂

IT職業(yè)在線教育平臺

大模型微調(diào)方法之QLoRA 原創(chuàng)

發(fā)布于 2024-10-15 14:00

瀏覽

0收藏

?本文介紹大模型微調(diào)方法中的QLoRA。

QLoRA由華盛頓大學(xué)UW NLP小組的成員于2023年提出發(fā)，旨在進(jìn)一步降低微調(diào)大模型的微調(diào)成本，因?yàn)閷τ谏习賰|參數(shù)量的模型，LoRA微調(diào)的成本還是很高。

感興趣的小伙伴可以去閱讀一下原文：https://arxiv.org/pdf/2305.14314

模型介紹

大模型微調(diào)方法之QLoRA-AI.x社區(qū)

上圖為QLoRA的訓(xùn)練過程圖，QLoRA更多的是在工程上進(jìn)行了量化和優(yōu)化，從圖中可知，主要有4個(gè)部分的改進(jìn)：

QLORA：是一種優(yōu)化的4-bit量化數(shù)據(jù)類型，專為正態(tài)分布權(quán)重設(shè)計(jì)，通過結(jié)合低精度存儲和中等精度計(jì)算來提升模型性能。它使用4-bit存儲權(quán)重以減少內(nèi)存使用，并在計(jì)算時(shí)將權(quán)重轉(zhuǎn)換為16-bit的BFloat16格式以保持準(zhǔn)確性。這種方法適用于模型加載和訓(xùn)練過程，旨在平衡存儲效率和計(jì)算精度。
Double Quantization：是一種模型量化技術(shù)，它通過對已經(jīng)量化過的常量進(jìn)行二次量化，進(jìn)一步減少存儲空間的需求。這種方法比傳統(tǒng)的模型量化方法更能節(jié)省顯存空間，每個(gè)參數(shù)平均可以節(jié)省0.37bit。例如，在65B的LLaMA模型中，這種雙量化技術(shù)能夠節(jié)省大約3GB的顯存空間。
Paged Optimizers：是一種利用NVIDIA統(tǒng)一內(nèi)存特性的優(yōu)化技術(shù)，旨在解決GPU在處理過程中偶爾出現(xiàn)內(nèi)存溢出（OOM）的問題。該技術(shù)通過自動(dòng)在CPU和GPU之間進(jìn)行分頁到分頁的數(shù)據(jù)傳輸，確保GPU處理過程無錯(cuò)誤進(jìn)行。其工作原理類似于CPU內(nèi)存與磁盤之間的常規(guī)內(nèi)存分頁機(jī)制。具體來說，Paged Optimizers為優(yōu)化器狀態(tài)分配分頁內(nèi)存，當(dāng)GPU內(nèi)存不足時(shí)，自動(dòng)將優(yōu)化器狀態(tài)卸載到CPU內(nèi)存中；而在需要更新優(yōu)化器狀態(tài)時(shí)，再將其加載回GPU內(nèi)存。
Adapter：為了彌補(bǔ)4-bit NormalFloat和Double Quantization帶來的性能損失，作者采用了插入更多adapter的方法。在LoRA中，通常只在query和value的全連接層處插入adapter。而在QLoRA中，作者在所有全連接層處都插入了adapter，以增加訓(xùn)練參數(shù)并彌補(bǔ)由于精度降低而導(dǎo)致的性能損失。

Adapter實(shí)現(xiàn)

QLoRA的一個(gè)重要的改進(jìn)和核心工作則是將量化的思想和LoRA的低秩適配器的思想結(jié)合到一起拿來對大模型進(jìn)行微調(diào)，因此單獨(dú)拎出來說，實(shí)現(xiàn)的代碼如下：

if checkpoint_dir is not None:
    print("Loading adapters from checkpoint.")
    model = PeftModel.from_pretrained(model, join(checkpoint_dir, 'adapter_model'), is_trainable=True)
else:
    print(f'adding LoRA modules...')
    modules = find_all_linear_names(args, model)
    config = LoraConfig(
        r=args.lora_r,
        lora_alpha=args.lora_alpha,
        target_modules=modules,
        lora_dropout=args.lora_dropout,
        bias="none",
        task_type="CAUSAL_LM",
    )
    model = get_peft_model(model, config)

???find_all_linear_names???：找到所有的全連接層
???get_peft_model???：在所有全連接層中插入LoRA模塊

?

本文轉(zhuǎn)載自公眾號瓦力算法學(xué)研所，作者：喜歡瓦力的卷卷

原文鏈接：??https://mp.weixin.qq.com/s/i1kJ7kwIIG_qIsfEAei7mQ???

?著作權(quán)歸作者所有，如需轉(zhuǎn)載，請注明出處，否則將追究法律責(zé)任

標(biāo)簽

贊

收藏

回復(fù)

舉報(bào)

回復(fù)

相關(guān)推薦

CVPR 2024 Oral：生命之樹大模型

AIGC最前線 ? 3727瀏覽 ? 0回復(fù)
從零實(shí)現(xiàn)大模型-BERT微調(diào)

魚蟲子 ? 2819瀏覽 ? 0回復(fù)
MLLM QLoRA微調(diào)實(shí)戰(zhàn)：基于最新的袖珍Mini-InternVL模型

51CTO內(nèi)容精選 ? 2920瀏覽 ? 0回復(fù)
你知道什么是微調(diào)嗎？大模型為什么要微調(diào)？以及大模型微調(diào)的原理是什么？

AI探索時(shí)代 ? 6025瀏覽 ? 0回復(fù)
大模型微調(diào)技巧 | 高質(zhì)量指令數(shù)據(jù)篩選方法-MoDS

NLP工作站 ? 3493瀏覽 ? 0回復(fù)
大模型學(xué)習(xí)方法之——大模型技術(shù)學(xué)習(xí)路線

AI探索時(shí)代 ? 3879瀏覽 ? 0回復(fù)
大模型技術(shù)學(xué)習(xí)之——大模型常用架構(gòu)以及技術(shù)難點(diǎn)

AI探索時(shí)代 ? 3453瀏覽 ? 0回復(fù)
大模型微調(diào)終極指南

NLP工作站 ? 3437瀏覽 ? 0回復(fù)
大模型開發(fā)之算子

AI探索時(shí)代 ? 7927瀏覽 ? 0回復(fù)
大模型之視頻圖像生成之工作流——ComfyUI和AI煉丹師

AI探索時(shí)代 ? 3910瀏覽 ? 0回復(fù)
大模型思維鏈升級之DoT框架

shizhi02 ? 1852瀏覽 ? 0回復(fù)
大模型體驗(yàn)之Qwen2模型

一起AI技術(shù) ? 2690瀏覽 ? 0回復(fù)
大模型三階段訓(xùn)練方法(LLaMa Factory)

一起AI技術(shù) ? 1.1w瀏覽 ? 0回復(fù)
大模型之Agent的初步了解

一起AI技術(shù) ? 2005瀏覽 ? 0回復(fù)
大模型之深入探索RAG流程

一起AI技術(shù) ? 2423瀏覽 ? 0回復(fù)
大模型語義分析之嵌入(Embedding)模型

AI探索時(shí)代 ? 2763瀏覽 ? 0回復(fù)
大模型前置處理之——特征提取

AI探索時(shí)代 ? 2174瀏覽 ? 0回復(fù)
GoRA: 基于梯度驅(qū)動(dòng)的自適應(yīng)低秩微調(diào)方法

頓數(shù)AI ? 1847瀏覽 ? 0回復(fù)
RAG分塊優(yōu)化之語義分塊方法CrossFormer模型技術(shù)思路

大模型自然語言處理 ? 961瀏覽 ? 0回復(fù)

這個(gè)用戶很懶，還沒有個(gè)人簡介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

大模型面經(jīng)：RAG與Long context“相愛相殺”背景下，如何設(shè)計(jì)最優(yōu)解決方案？ 2025-04-09 12:17:30發(fā)布
ZeroHSI-一種零樣本的四維人類-場景交互合成方法 2025-03-24 13:12:04發(fā)布

熱門推薦

大半精銳盡出！o1下線！滿血o3之后，模型本身就是Manus，最大賣點(diǎn)：替代人干真活！ 1回復(fù)

王炸！MCP 架構(gòu)設(shè)計(jì)深度剖析 & 使用 Spring AI + MCP 四步教你實(shí)現(xiàn) Agent 智能體開發(fā) 0回復(fù)

Dify從入門到高階系列二：手把手教學(xué)！超詳細(xì)的Dify知識庫配置全攻略 0回復(fù)

Crawl4AI：GitHub榜首40K星標(biāo)！LLM專屬極速開源爬蟲神器 0回復(fù)

只需5分鐘，教你用Python搭建MCP Server 0回復(fù)

上一篇： RAG工程如何評測？

下一篇：從OmniGen的數(shù)據(jù)、模型設(shè)計(jì)與訓(xùn)練策略中深度了解多模態(tài)統(tǒng)一生成模型

社區(qū)精華內(nèi)容

目錄