自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<cite id="xmcvk"></cite>

^{<blockquote id="xmcvk"><i id="xmcvk"></i></blockquote>}

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項目管理免費題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺

51CTO學(xué)堂

IT職業(yè)在線教育平臺

LLaMA-Factory 微調(diào)與部署詳細(xì)流程：從入門到實踐

AI悠閑區(qū)

發(fā)布于 2025-1-8 13:31

瀏覽

0收藏

介紹

時隔已久的 llama-factory 系列教程更新了。本篇文章是第七篇，之前的六篇，大家酌情選看即可。因為llama-factory進(jìn)行了更新，我前面幾篇文章的實現(xiàn)部分，都不能直接用了。

我將為大家介紹如何使用 llama-factory Lora 微調(diào)模型、部署模型、使用python調(diào)用API。

llama-factory 安裝

首先建議大家閱讀一遍兩份不錯的文章：

官方readme: https://github.com/hiyouga/LLaMA-Factory/blob/v0.9.1/README_zh.md
官方推薦的知乎教程：https://zhuanlan.zhihu.com/p/695287607
官方文檔: https://llamafactory.readthedocs.io/zh-cn/latest/

我這篇博客的與他們的不同在于，我按照我做實驗的流程，給大家演示一遍。方便大家一看就懂，心里對大致的流程有個大概。

安裝包

git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git
cd LLaMA-Factory
pip install -e ".[torch,metrics]"

LLaMA-Factory 默認(rèn)是從Huggingface 下載模型，建議大家改為從國內(nèi)下載模型。

如果您在 Hugging Face 模型和數(shù)據(jù)集的下載中遇到了問題，可以通過下述方法使用魔搭社區(qū)。

export USE_MODELSCOPE_HUB=1Windows 使用set USE_MODELSCOPE_HUB=1將 model_name_or_path 設(shè)置為模型 ID 來加載對應(yīng)的模型。在魔搭社區(qū)查看所有可用的模型，例如 LLM-Research/Meta-Llama-3-8B-Instruct。

您也可以通過下述方法，使用魔樂社區(qū)下載數(shù)據(jù)集和模型。

export USE_OPENMIND_HUB=1Windows 使用set USE_OPENMIND_HUB=1將 model_name_or_path 設(shè)置為模型 ID 來加載對應(yīng)的模型。在魔樂社區(qū)查看所有可用的模型，例如 TeleAI/TeleChat-7B-pt。

下載模型

我喜歡使用可視化的網(wǎng)站頁面下載模型權(quán)重。

llamafactory-cli webui

LLaMA-Factory 微調(diào)與部署詳細(xì)流程：從入門到實踐-AI.x社區(qū)

啟動服務(wù)之后，進(jìn)入主機對應(yīng)的 ip 和端口就可以看到網(wǎng)頁。

LLaMA-Factory 微調(diào)與部署詳細(xì)流程：從入門到實踐-AI.x社區(qū)

在 Model name 下拉框中挑選模型，選中之后，再點擊下述的加載模型。如果模型權(quán)重沒有下載，則會進(jìn)行下載，然后加載進(jìn)顯存中。在下方就會出現(xiàn)對話框就可以與模型進(jìn)行對話了。

LLaMA-Factory 微調(diào)與部署詳細(xì)流程：從入門到實踐-AI.x社區(qū)

微調(diào)模型

數(shù)據(jù)集

點擊 Train 后，就可以看到當(dāng)前可用的很多數(shù)據(jù)集。

LLaMA-Factory 微調(diào)與部署詳細(xì)流程：從入門到實踐-AI.x社區(qū)

在選中數(shù)據(jù)集后，點擊預(yù)覽數(shù)據(jù)集，即可看到數(shù)據(jù)集的樣例。如果我們想微調(diào)模型，也需要把數(shù)據(jù)集的樣式給整理成上述格式。

LLaMA-Factory 微調(diào)與部署詳細(xì)流程：從入門到實踐-AI.x社區(qū)

點擊查看關(guān)于數(shù)據(jù)集的說明：https://github.com/hiyouga/LLaMA-Factory/tree/v0.9.1/data

大家仿照alpaca_zh_demo.json的樣式準(zhǔn)備好數(shù)據(jù)集，然后在dataset_info.json完成數(shù)據(jù)集的注冊。

注冊數(shù)據(jù)集，下圖是我在dataset_info.json注冊的guihua_ner數(shù)據(jù)集，然后就可以找到該數(shù)據(jù)集，并訓(xùn)練模型：

LLaMA-Factory 微調(diào)與部署詳細(xì)流程：從入門到實踐-AI.x社區(qū)

訓(xùn)練模型

可以直接點擊可視化界面的 Start 按鈕訓(xùn)練模型。也可點擊預(yù)覽命令查看在終端運行的命令。

我一般不使用可視化窗口訓(xùn)練模型。我喜歡直接運行訓(xùn)練模型的命令

LLaMA-Factory 微調(diào)與部署詳細(xì)流程：從入門到實踐-AI.x社區(qū)

llamafactory-cli train \
    --stage sft \
    --do_train True \
    --model_name_or_path qwen/Qwen2.5-7B-Instruct \
    --preprocessing_num_workers 16 \
    --finetuning_type lora \
    --template qwen \
    --flash_attn auto \
    --dataset_dir data \
    --dataset alpaca_zh_demo \
    --cutoff_len 2048 \
    --learning_rate 5e-05 \
    --num_train_epochs 3.0 \
    --max_samples 100000 \
    --per_device_train_batch_size 2 \
    --gradient_accumulation_steps 8 \
    --lr_scheduler_type cosine \
    --max_grad_norm 1.0 \
    --logging_steps 5 \
    --save_steps 100 \
    --warmup_steps 0 \
    --packing False \
    --report_to none \
    --output_dir saves/Qwen2.5-7B-Instruct/lora/train_2024-11-25-09-56-29 \
    --bf16 True \
    --plot_loss True \
    --ddp_timeout 180000000 \
    --optim adamw_torch \
    --lora_rank 8 \
    --lora_alpha 16 \
    --lora_dropout 0 \
    --lora_target all

除了使用上述的命令行方式訓(xùn)練模型外，llama-factory還提供了使用 yaml 文件訓(xùn)練模型的方式。在example文件夾下可看到很多訓(xùn)練和推理的 yaml 文件，針對其中的參數(shù)就行修改，即可使用。

LLaMA-Factory 微調(diào)與部署詳細(xì)流程：從入門到實踐-AI.x社區(qū)

我以微調(diào)qwen/Qwen2.5-7B-Instruct為例：

qwen2.5-7B-ner.yaml文件內(nèi)容：

### model
model_name_or_path: qwen/Qwen2.5-7B-Instruct

### method
stage: sft
do_train: true
finetuning_type: lora
lora_target: all

### dataset
dataset: guihua_ner
template: qwen
cutoff_len: 2048
max_samples: 1000
overwrite_cache: true
preprocessing_num_workers: 16

### output
output_dir: saves/qwen2.5-7B/ner_epoch5
logging_steps: 10
save_steps: 500
plot_loss: true
overwrite_output_dir: true

### train
per_device_train_batch_size: 1
gradient_accumulation_steps: 8
learning_rate: 1.0e-4
num_train_epochs: 5.0
lr_scheduler_type: cosine
warmup_ratio: 0.1
bf16: true
ddp_timeout: 180000000

### eval
val_size: 0.1
per_device_eval_batch_size: 1
eval_strategy: steps
eval_steps: 500

在 llamafactory-cli train 后，填入 yaml 文件的路徑：

llamafactory-cli train config/qwen2.5-7B-ner.yaml

然后就會開始訓(xùn)練模型，最終訓(xùn)練完成的模型保存在output_dir: saves/qwen2.5-7B/ner_epoch5。

在輸出文件夾路徑中，可以找到訓(xùn)練過程的損失值變化圖片。

微調(diào)后的模型推理

在完成模型的微調(diào)后，測試一下模型的微調(diào)效果。對于微調(diào)模型推理，除原始模型和模板外，還需要指定適配器路徑 adapter_name_or_path 和微調(diào)類型 finetuning_type。

lora_vllm.yaml的文件內(nèi)容如下：

model_name_or_path: qwen/Qwen2.5-7B-Instruct
adapter_name_or_path: ../saves/qwen2.5-7B/ner_epoch5
template: qwen
finetuning_type: lora
infer_backend: vllm
vllm_enforce_eager: true

運行下述命令，就可以看到下圖的對話窗口：

llamafactory-cli webchat lora_vllm.yaml

LLaMA-Factory 微調(diào)與部署詳細(xì)流程：從入門到實踐-AI.x社區(qū)

根據(jù)上圖命名實體識別的輸出，可以發(fā)現(xiàn)微調(diào)模型確實有效果。

除了網(wǎng)頁聊天的部署之外，還可通過下述多種方式進(jìn)行部署:

# llamafactory-cli chat xxx.yaml
# llamafactory-cli webchat xxx.yaml
# API_PORT=8000 llamafactory-cli api xxx.yaml

本文轉(zhuǎn)載自 ??AI悠閑區(qū)??，作者： jieshenai

標(biāo)簽

已于2025-1-8 13:47:02修改

贊

收藏

回復(fù)

舉報

回復(fù)

相關(guān)推薦

碳實踐 | 你真的會做碳數(shù)據(jù)收集么？入門必看！

AMT企源 ? 2618瀏覽 ? 0回復(fù)
LLM高效微調(diào)詳解-從Adpter、PrefixTuning到LoRA

angel ? 3566瀏覽 ? 0回復(fù)
從構(gòu)思到成稿：全網(wǎng)最全的論文流程和指令

數(shù)師兄 ? 5181瀏覽 ? 0回復(fù)
從數(shù)據(jù)倉庫到數(shù)據(jù)飛輪：技術(shù)進(jìn)化與實踐案例解析

wx6110dd2be671e ? 2115瀏覽 ? 0回復(fù)
大模型微調(diào)：Hugging Face Transformers全流程實戰(zhàn)

51CTO內(nèi)容精選 ? 5903瀏覽 ? 0回復(fù)
從 Llama 1 到 3.1：Llama 模型架構(gòu)演進(jìn)詳解

Baihai_IDP ? 3902瀏覽 ? 0回復(fù)
從0到1開發(fā)AI Agent（智能體）| LangChain 的快速入門

AI取經(jīng)路 ? 5223瀏覽 ? 0回復(fù)
大模型三階段訓(xùn)練方法(LLaMa Factory)

一起AI技術(shù) ? 1.1w瀏覽 ? 0回復(fù)
AI 賦能深度思考：從六頂思考帽到智能體實踐

ermulong ? 2847瀏覽 ? 0回復(fù)
Python語言openAI庫詳解：從入門到精通（從0到1手把手教程）

唐克 ? 4366瀏覽 ? 0回復(fù)
RAG從入門到精通系列：基礎(chǔ)RAG

PyTorch研習(xí)社 ? 2403瀏覽 ? 0回復(fù)
Python與OpenCV圖像處理：從基礎(chǔ)到高級的詳細(xì)教程

唐克 ? 2525瀏覽 ? 0回復(fù)
如何利用 DeepSeek-R1 本地部署強大的推理模型：從 ChatGPT 風(fēng)格界面到 API 集成

Halo咯咯 ? 2763瀏覽 ? 0回復(fù)
從大模型性能優(yōu)化到DeepSeek部署

卓勝微wjp ? 4150瀏覽 ? 0回復(fù)
從推理到編程，詳細(xì)比較DeepSeek 32B、70B、R1實踐性能

小虎哦哦 ? 9613瀏覽 ? 0回復(fù)
用好云服務(wù)，托起GenAI：從數(shù)據(jù)準(zhǔn)備到部署的全流程梳理

51CTO內(nèi)容精選 ? 1426瀏覽 ? 0回復(fù)
探索智能代理增強檢索生成（Agentic RAG）：從基礎(chǔ)到實踐

Halo咯咯 ? 1391瀏覽 ? 0回復(fù)
Dify從入門到高階系列二：手把手教學(xué)！超詳細(xì)的Dify知識庫配置全攻略

AI博物院 ? 5583瀏覽 ? 0回復(fù)
從碎片化到一體化：Rankify 如何重塑檢索、重排與生成的全流程

Halo咯咯 ? 805瀏覽 ? 0回復(fù)

AI悠閑區(qū)

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

提示詞繞過大模型安全限制 5天前發(fā)布
從零開始微調(diào)Embedding模型：基于BERT的實戰(zhàn)教程 2025-04-14 01:31:07發(fā)布

熱門推薦

大半精銳盡出！o1下線！滿血o3之后，模型本身就是Manus，最大賣點：替代人干真活！ 1回復(fù)

王炸！MCP 架構(gòu)設(shè)計深度剖析 & 使用 Spring AI + MCP 四步教你實現(xiàn) Agent 智能體開發(fā) 0回復(fù)

Dify從入門到高階系列二：手把手教學(xué)！超詳細(xì)的Dify知識庫配置全攻略 0回復(fù)

Crawl4AI：GitHub榜首40K星標(biāo)！LLM專屬極速開源爬蟲神器 0回復(fù)

只需5分鐘，教你用Python搭建MCP Server 0回復(fù)

上一篇：深度學(xué)習(xí)二分類評估詳細(xì)解析與代碼實戰(zhàn)

下一篇：基于 LlamaFactory 微調(diào)大模型的實體識別的評估實現(xiàn)

社區(qū)精華內(nèi)容

目錄