自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<u id="4ssu0"><rp id="4ssu0"></rp></u>

<s id="4ssu0"></s>

<sub id="4ssu0"></sub>

<cite id="4ssu0"></cite>

<style id="4ssu0"></style>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓

鴻蒙開發(fā)者社區(qū)

WOT技術大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質的IT技術網(wǎng)站

51CTO博客

專業(yè)IT技術創(chuàng)作平臺

51CTO學堂

IT職業(yè)在線教育平臺

將端側大模型進行到底-MiniCPM3-4B開源

發(fā)布于 2024-9-9 01:07

瀏覽

0收藏

面壁一直都在做端側大模型，之前有文本系列MiniCPM-2B模型，還有多模態(tài)系列的MiniCPM-V系列模型，今天又開源了MiniCPM3-4B模型，真是端側一路走到低。

這次MiniCPM3-4B也是在效果上有了巨大的提升，超過Phi-3.5-mini-Instruct模型，肩比Llama3.1-8B-Instruct、GLM-4-9B-Chat、Qwen2-7B-Instruct等一眾模型，堪稱小模型之王。

之前的MiniCPM-2B模型報告也是干活滿滿，詳見：https://shengdinghu.notion.site/MiniCPM-c805a17c5c8046398914e47f0542095a

這里說一下哈，MiniCPM-2B是1.0版本模型，MiniCPM-1B是2.0版本模型，現(xiàn)在是3.0版本4B。

模型改進

下面是3個版本的模型結構（1->2->3）的區(qū)別：

位置編碼：RoPE->RoPE->RoPE

注意力機制：MHA->GQA->MLA，MLA也是DeepSeek-V2的核心創(chuàng)新

將端側大模型進行到底-MiniCPM3-4B開源-AI.x社區(qū)

詞表大小：123K->73K->73K
模型層數(shù)：40->52->62
隱藏層節(jié)點：2304->1536->2560
最大長度：4k->4K->32k
系統(tǒng)提示詞：不支持->不支持->支持
工具調用和代碼解釋器：不支持->不支持->支持

同時，還發(fā)布了RAG套件MiniCPM-Embedding模型和MiniCPM-Reranker模型，針對 RAG場景還發(fā)布了微調版MiniCPM3-RAG-LoRA模型。

模型效果

MiniCPM3-4B模型在中文英文遵循、數(shù)據(jù)推理、代碼能力、工具調用上表現(xiàn)均很不錯的效果。

將端側大模型進行到底-MiniCPM3-4B開源-AI.x社區(qū)

其中，工具調用能力尤為突出，在Berkeley Function Calling Leaderboard上優(yōu)于Llama3.1-8B-Instruct、GLM-4-9B-Chat、Qwen2-7B-Instruct等更大模型。

將端側大模型進行到底-MiniCPM3-4B開源-AI.x社區(qū)

長文檔的大海撈針也是全綠。

將端側大模型進行到底-MiniCPM3-4B開源-AI.x社區(qū)

模型快速使用

PS：模型下載有困難的同學，詳見我之前寫的一篇文章??《大模型下載使我痛苦》??。

from transformers import AutoModelForCausalLM, AutoTokenizer
import torch

# 模型加載
path = "openbmb/MiniCPM3-4B"

tokenizer = AutoTokenizer.from_pretrained(path, trust_remote_code=True)
model = AutoModelForCausalLM.from_pretrained(path, torch_dtype=torch.bfloat16, device_map="cuda", trust_remote_code=True)

# 輸入構造
messages = [
    {"role": "user", "content": "你知道劉聰NLP是誰嗎？"},
]
model_inputs = tokenizer.apply_chat_template(messages, return_tensors="pt").to("cuda")

# 模型生成
model_outputs = model.generate(
    model_inputs,
    max_new_tokens=1024,
    top_p=0.8,
    temperature=0.9,
    repetition_penalty=1.1
)

# 模型解碼
output_token_ids = [
    model_outputs[i][len(model_inputs[i]):] for i in range(len(model_inputs))
]

responses = tokenizer.batch_decode(output_token_ids, skip_special_tokens=True)[0]
print(responses)

本文轉載自 ??NLP工作站??，作者：劉聰NLP

標簽

贊

收藏

回復

舉報

回復

相關推薦

國產(chǎn)RISC-V狂奔：端側能跑大模型，AI計算成重頭戲

level ? 4747瀏覽 ? 0回復
端側實時運行、3B媲美7B！美團、浙大等提出MobileVLM V2：更快、更強的端側視覺語言模型

kcoufee ? 5220瀏覽 ? 0回復
蘋果定義新的端側模型，“大大優(yōu)于GPT-4，擺脫文本，可視化模擬屏幕信息，最小參數(shù)模型相

51CTO技術棧 ? 2487瀏覽 ? 0回復
Mistral開源8X22B大模型，OpenAI更新GPT-4 Turbo視覺，都在欺負谷歌

輕薄滴假象 ? 2281瀏覽 ? 0回復
Llama 3來了！首批開源 8B 和 70B兩個版本，未來有望開源400B大模型！

AIGC最前線 ? 1.2w瀏覽 ? 0回復
Llama3.2開源：Meta發(fā)布1B和3B端側模型、11B和90B多模態(tài)模型

NLP工作站 ? 4052瀏覽 ? 0回復
Llama 3.2 強勢震撼登場：從 1B 純文本躍至 90B 多模態(tài)，成就端側 AI 巔峰杰作

穿越時空111 ? 3249瀏覽 ? 0回復
最新端側全模態(tài)大模型Megrez-3B-Omni

NLP工作站 ? 3340瀏覽 ? 0回復
Infinigence AI 發(fā)布 Megrez-3B-Omni：3B 設備上開源多模態(tài)大語言模型 MLLM

Halo咯咯 ? 1841瀏覽 ? 0回復
Megrez-3B-Omni：無問芯穹端側全模態(tài)大模型技術剖析與應用指南

穿越時空111 ? 2303瀏覽 ? 0回復
基于阿里開源Qwen2.5-7B-Instruct模型進行多代理RAG開發(fā)實戰(zhàn)

51CTO內容精選 ? 2298瀏覽 ? 0回復
OpenAI將開源 o3-mini，或適合手機大模型

Aceryt ? 1598瀏覽 ? 0回復
DeepSeek算力平權后端側AI和Agent智能體迎來爆發(fā)

數(shù)字化助推器 ? 1835瀏覽 ? 0回復
Kimi開源Moonlight-16B-A3B的MoE模型??！

NLP工作站 ? 1862瀏覽 ? 0回復
自家的大模型秘方開源到底！國產(chǎn)大模型雄起

51CTO技術棧 ? 2307瀏覽 ? 0回復
Llama 4三大模型來襲，開源免費還超能打

Halo咯咯 ? 1586瀏覽 ? 0回復
清華發(fā)布GLM 4！32B參數(shù)模型硬剛GPT-4o，性能驚艷

Halo咯咯 ? 1754瀏覽 ? 0回復
國產(chǎn)大模型崛起！智譜發(fā)布GLM-4-32B-0414系列模型，以32B模型參數(shù)比肩GPT-4o和DeepSeek V3/R1

AIGCStudio ? 762瀏覽 ? 0回復
部署一個大模型，到底需要多大機器？

hm673c38238a021 ? 1069瀏覽 ? 0回復

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關注

最近發(fā)布

LLM實戰(zhàn)系列 | 大模型的多Lora部署，將顯存節(jié)省到極致 8天前發(fā)布
Llama4 模型細節(jié) & 效果實測 2025-04-09 07:07:26發(fā)布

熱門推薦

大半精銳盡出！o1下線！滿血o3之后，模型本身就是Manus，最大賣點：替代人干真活！ 1回復

王炸！MCP 架構設計深度剖析 & 使用 Spring AI + MCP 四步教你實現(xiàn) Agent 智能體開發(fā) 0回復

Dify從入門到高階系列二：手把手教學！超詳細的Dify知識庫配置全攻略 0回復

Crawl4AI：GitHub榜首40K星標！LLM專屬極速開源爬蟲神器 0回復

只需5分鐘，教你用Python搭建MCP Server 0回復

上一篇：大模型微調終極指南

下一篇：如何獲取高質量數(shù)據(jù)進行代碼指令調優(yōu)？

社區(qū)精華內容

目錄

<optgroup id="hiklx"></optgroup>

<s id="hiklx"><li id="hiklx"></li></s>

<u id="hiklx"></u>

<kbd id="hiklx"></kbd>

<acronym id="hiklx"></acronym>