自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開(kāi)發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問(wèn)答課堂專欄直播

51CTO

鴻蒙開(kāi)發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開(kāi)發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開(kāi)發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

賬號(hào)設(shè)置退出

Hugging Face 模型格式大揭秘：從 PyTorch 到 GGUF，一文搞懂！

2025-03-26 10:57:40

通過(guò)這篇文章，我們一起了解了 Hugging Face 上常見(jiàn)的模型格式，從 PyTorch 的靈活易用到 SafeTensors 的安全高效，再到 ONNX 和 GGUF 在跨平臺(tái)與輕量化部署上的獨(dú)特優(yōu)勢(shì)，每種格式都有其獨(dú)到之處。

還記得我剛接觸 Hugging Face 時(shí)，面對(duì)各種模型格式和一堆陌生的文件名，我的腦袋瞬間宕機(jī)。

每次下載模型時(shí)，我都在想：“這堆 .bin、.json、.txt 究竟是干啥的？”后來(lái)，隨著我不斷摸索，終于搞清楚了這些文件的門道。

今天，我就來(lái)幫大家捋清楚 Hugging Face 上模型的常見(jiàn)格式，以及每種格式里到底都裝了些什么。

常見(jiàn)模型格式概覽

在 Hugging Face 上，模型主要有以下幾種格式：

PyTorch 格式
TensorFlow 格式
Flax（JAX）格式
SafeTensors 格式
ONNX 格式
GGUF 格式

接下來(lái)，我們逐一拆解每種格式及其包含的關(guān)鍵文件。

PyTorch 格式

PyTorch 格式是 Hugging Face 上最常見(jiàn)的模型格式，適用于使用 PyTorch 框架的開(kāi)發(fā)者。它的核心文件包括：

pytorch_model.bin
模型的權(quán)重文件，包含了訓(xùn)練過(guò)程中學(xué)到的參數(shù)，類似于模型的大腦。
config.json
模型配置文件，記錄了網(wǎng)絡(luò)結(jié)構(gòu)、層數(shù)、隱藏維度等關(guān)鍵信息，相當(dāng)于模型的“身份證”。
tokenizer_config.json
分詞器的配置信息，告訴模型如何處理輸入文本。
vocab.txt或vocab.json
模型使用的詞匯表，記錄了每個(gè)詞及其對(duì)應(yīng)的編號(hào)。
special_tokens_map.json
定義特殊標(biāo)記（如 [CLS]、[SEP]、[PAD] 等）的映射規(guī)則。
merges.txt
僅限 BPE 分詞器，描述詞匯合并規(guī)則，是 BPE 分詞算法的關(guān)鍵文件。

TensorFlow 格式

TensorFlow 模型在 Hugging Face 上也很常見(jiàn)，特別是那些使用 Keras 的開(kāi)發(fā)者更喜歡這種格式。它的主要文件包括：

tf_model.h5或saved_model.pb等
模型的權(quán)重文件，包含了訓(xùn)練過(guò)程中學(xué)到的參數(shù)，類似于模型的大腦。
config.json
模型配置文件，記錄了網(wǎng)絡(luò)結(jié)構(gòu)、層數(shù)、隱藏維度等關(guān)鍵信息，相當(dāng)于模型的“身份證”。

注：其他文件作用與 PyTorch 版本相同。

Flax（JAX）格式

Flax 是基于 JAX 的神經(jīng)網(wǎng)絡(luò)庫(kù)，專為高性能、加速計(jì)算而生。Flax 格式的 Hugging Face 模型通常包含以下文件：

flax_model.msgpack
模型的權(quán)重文件，使用 MessagePack 格式，兼顧高效與緊湊。
config.json
模型配置文件，記錄了網(wǎng)絡(luò)結(jié)構(gòu)、層數(shù)、隱藏維度等關(guān)鍵信息，相當(dāng)于模型的“身份證”。
tokenizer_config.json
分詞器的配置信息，告訴模型如何處理輸入文本。

注：其他配置文件與 PyTorch、TensorFlow 格式類似。

SafeTensors 格式

SafeTensors 是 Hugging Face 推出的新一代安全格式，主打“安全、快速、內(nèi)存友好”。

model.safetensors
模型的核心權(quán)重文件，避免了 .bin 文件在加載時(shí)的潛在安全風(fēng)險(xiǎn)。
config.json
模型配置文件，記錄了網(wǎng)絡(luò)結(jié)構(gòu)、層數(shù)、隱藏維度等關(guān)鍵信息，相當(dāng)于模型的“身份證”。
tokenizer_config.json
分詞器的配置信息，告訴模型如何處理輸入文本。
vocab.txt或vocab.json
模型使用的詞匯表，記錄了每個(gè)詞及其對(duì)應(yīng)的編號(hào)。
special_tokens_map.json
定義特殊標(biāo)記（如 [CLS]、[SEP]、[PAD] 等）的映射規(guī)則。
merges.txt
僅限 BPE 分詞器，描述詞匯合并規(guī)則，是 BPE 分詞算法的關(guān)鍵文件。

注：配置、詞匯表和特殊標(biāo)記映射等文件仍與 PyTorch 格式類似。

SafeTensors 格式以其更高效的加載速度和更安全的數(shù)據(jù)結(jié)構(gòu)，逐漸成為 Hugging Face 上的新寵。

ONNX 格式

ONNX是一種開(kāi)放的模型交換格式，旨在幫助不同框架之間的模型互操作。ONNX 格式的 Hugging Face 模型通常包含：

model.onnx
核心模型權(quán)重文件，支持多平臺(tái)部署（如 TensorRT、ONNX Runtime 等）。
config.json
模型配置文件，記錄了網(wǎng)絡(luò)結(jié)構(gòu)、層數(shù)、隱藏維度等關(guān)鍵信息，相當(dāng)于模型的“身份證”。
tokenizer_config.json
分詞器的配置信息，告訴模型如何處理輸入文本。

注：配置、詞匯表和特殊標(biāo)記映射等文件仍與 PyTorch 格式類似。

GGUF 格式

GGUF是一種專為 GPT 類模型設(shè)計(jì)的新型格式，強(qiáng)調(diào)易用性和高效部署。它的主要包括：

model.gguf
核心模型權(quán)重文件，優(yōu)化了 GPT 系列模型的參數(shù)存儲(chǔ)，適合高效推理和快速加載。自包含所有數(shù)據(jù)，包括配置和分詞器信息。

注：GGUF 格式特別適合 GPT 模型在輕量化環(huán)境下的部署，性能優(yōu)異且便于遷移。

模型格式對(duì)比表

通過(guò)這篇文章，我們一起了解了 Hugging Face 上常見(jiàn)的模型格式，從 PyTorch 的靈活易用到 SafeTensors 的安全高效，再到 ONNX 和 GGUF 在跨平臺(tái)與輕量化部署上的獨(dú)特優(yōu)勢(shì)，每種格式都有其獨(dú)到之處。

希望這篇指南能讓你在面對(duì)琳瑯滿目的 `.bin`、`.h5`、`.onnx` 和 `.gguf` 文件時(shí)不再迷茫，輕松選出最適合你的“武器”。祝你在模型的世界里探索愉快，跑得又快又穩(wěn)！

責(zé)任編輯：龐桂玉來(lái)源：寫(xiě)代碼的中年人

點(diǎn)贊

51CTO技術(shù)棧公眾號(hào)

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開(kāi)發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營(yíng)

<legend id="ivjvs"><track id="ivjvs"></track></legend>