自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<ruby id="qg533"><blockquote id="qg533"></blockquote></ruby>

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺

51CTO學(xué)堂

IT職業(yè)在線教育平臺

沒有等來Qwen2.5，但等來了Qwen2-Math

發(fā)布于 2024-8-9 16:45

瀏覽

0收藏

Qwen2又出新作Math大模型，你值得擁有。

我沒有等來Qwen2.5，但等來了Qwen2-Math，在數(shù)學(xué)推理能力上大幅度提高，先來一張圖陣陣場子，72B模型超過GPT4-o、Claude-3.5-Sonnet和Gemini-1.5-Pro。

沒有等來Qwen2.5，但等來了Qwen2-Math-AI.x社區(qū)

Blog: https://qwenlm.github.io/blog/qwen2-math/
HF：https://huggingface.co/collections/Qwen/qwen2-6659360b33528ced941e557f

本次開源共涉及3個尺寸2個版本，分別為Qwen2-Math-1.5B、Qwen2-Math-1.5B-Instruct、Qwen2-Math-7B、Qwen2-Math-7B-Instruct、Qwen2-Math-72B和Qwen2-Math-72B-Instruct。

模型訓(xùn)練初始化采用Qwen2-1.5B、Qwen2-7B和Qwen2-72B，訓(xùn)練語料涉及高質(zhì)量的數(shù)學(xué)網(wǎng)絡(luò)文本、書籍、代碼、考試題目以及由Qwen2模型合成的數(shù)學(xué)預(yù)訓(xùn)練數(shù)據(jù)。

指令微調(diào)階段是先用Qwen2-Math-72B訓(xùn)練了一個數(shù)學(xué)專用的獎勵模型，然后利用該獎勵模型和指示模型回答問題是否正確這兩個指標(biāo)一起拒絕采用構(gòu)建SFT數(shù)據(jù)集，并利用GRPO進(jìn)一步對齊模型效果。

注意：模型在預(yù)訓(xùn)練和指令微調(diào)階段為了防止數(shù)據(jù)泄露，均進(jìn)行數(shù)據(jù)去污染除了，移除測試集中13-gram重復(fù)且最長公共子序列比例大于0.6的訓(xùn)練樣本。

模型在GSM8K、MATH、Aqua、SAT Math、OlympiadBench、College Math、AIME24、AMC23多個等數(shù)據(jù)集上均取得了很好的效果。

沒有等來Qwen2.5，但等來了Qwen2-Math-AI.x社區(qū)

相較于原版Qwen2有很大的提升

HF快速使用：

from transformers import AutoModelForCausalLM, AutoTokenizer

model_name = "Qwen/Qwen2-Math-1.5B-Instruct"
device = "cuda"

model = AutoModelForCausalLM.from_pretrained(
    model_name,
    torch_dtype="auto",
    device_map="auto"
)
tokenizer = AutoTokenizer.from_pretrained(model_name)

prompt = "Find the value of $x$ that satisfies the equation $4x+5 = 6x+7$."
messages = [
    {"role": "system", "content": "You are a helpful assistant."},
    {"role": "user", "content": prompt}
]
text = tokenizer.apply_chat_template(
    messages,
    tokenize=False,
    add_generation_prompt=True
)
model_inputs = tokenizer([text], return_tensors="pt").to(device)

generated_ids = model.generate(
    **model_inputs,
    max_new_tokens=512
)
generated_ids = [
    output_ids[len(input_ids):] for input_ids, output_ids in zip(model_inputs.input_ids, generated_ids)
]

response = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)[0]
print(response)

最后說一下，官方表示目前的模型僅為英文模型，后續(xù)會推出中英雙語模型。

本文轉(zhuǎn)載自??NLP工作站??，作者：劉聰NLP ????

標(biāo)簽

贊

收藏

回復(fù)

舉報(bào)

回復(fù)

相關(guān)推薦

ChatGLM3、Qwen、Baichuan2、ChatGPT

PaperAgent ? 5252瀏覽 ? 0回復(fù)
Qwen2.5系列模型開源，你值得擁有?。。?/a>

NLP工作站 ? 7665瀏覽 ? 0回復(fù)
探索阿里通義千問 Qwen2.5：新一代開源大模型的卓越力量

穿越時空111 ? 4788瀏覽 ? 0回復(fù)
Qwen2.5：13個新模型來襲！開源通用、編碼、數(shù)學(xué)模型全解讀，72B超越Llama 405B - 本地安裝測試

老蛀蟲 ? 4802瀏覽 ? 0回復(fù)
多模態(tài)大模型Qwen2的深入了解

一起AI技術(shù) ? 3057瀏覽 ? 0回復(fù)
Qwen2.5：13個新模型來襲！開源通用、編碼、數(shù)學(xué)模型全解讀，72B超越Llama 405B - 本地安裝測試

老蛀蟲 ? 4018瀏覽 ? 0回復(fù)
本地部署Qwen2.5-Coder大模型，打造你的專屬編程助手

AI科技論談 ? 4854瀏覽 ? 0回復(fù)
大模型體驗(yàn)之Qwen2模型

一起AI技術(shù) ? 2687瀏覽 ? 0回復(fù)
AI Video Composer：Qwen2.5-Coder 賦能，簡易開源視頻創(chuàng)作神器來襲

穿越時空111 ? 3106瀏覽 ? 0回復(fù)
基于阿里開源Qwen2.5-7B-Instruct模型進(jìn)行多代理RAG開發(fā)實(shí)戰(zhàn)

51CTO內(nèi)容精選 ? 2298瀏覽 ? 0回復(fù)
Dolphin 3.0 發(fā)布（Llama 3.1 + 3.2 + Qwen 2.5）：本地優(yōu)先、可操縱的 AI 模型

Halo咯咯 ? 2028瀏覽 ? 0回復(fù)
Qwen AI發(fā)布Qwen2.5-VL：打破視覺與語言的壁壘，助力AI更智能地理解和互動

Halo咯咯 ? 2175瀏覽 ? 0回復(fù)
AMD開源30億小參數(shù)模型，媲美Qwen-2.5

Aceryt ? 1221瀏覽 ? 0回復(fù)
阿里震撼發(fā)布，32B的Qwen2.5，開發(fā)者福音！實(shí)測：AI可以幫抓小偷了！

51CTO技術(shù)棧 ? 2352瀏覽 ? 0回復(fù)
Qwen2.5-VL-32B 更小更聰明！與grok、gemini同臺打造“治愈老奶奶”，誰更強(qiáng)？

Syrupup ? 1279瀏覽 ? 0回復(fù)
阿里Qwen家族又添猛將！Qwen2.5-Omni能看能聽能說能寫，性能超越Gemini，視頻實(shí)時互動

老蛀蟲 ? 1246瀏覽 ? 0回復(fù)
當(dāng)Qwen2.5-Omni遇見老師：教育創(chuàng)新的N種可能

風(fēng)云2002_1 ? 847瀏覽 ? 0回復(fù)
Qwen2.5-VL-32B：多模態(tài)大模型的性能與效率新標(biāo)桿

Halo咯咯 ? 1098瀏覽 ? 0回復(fù)
【LLM合集】Qwen2.5-Omni：像人類一樣「看聽想說」的全能助手來了！

AIPaperDaily ? 875瀏覽 ? 0回復(fù)

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

LLM實(shí)戰(zhàn)系列 | 大模型的多Lora部署，將顯存節(jié)省到極致 8天前發(fā)布
Llama4 模型細(xì)節(jié) & 效果實(shí)測 2025-04-09 07:07:26發(fā)布

熱門推薦

大半精銳盡出！o1下線！滿血o3之后，模型本身就是Manus，最大賣點(diǎn)：替代人干真活！ 1回復(fù)

王炸！MCP 架構(gòu)設(shè)計(jì)深度剖析 & 使用 Spring AI + MCP 四步教你實(shí)現(xiàn) Agent 智能體開發(fā) 0回復(fù)

Dify從入門到高階系列二：手把手教學(xué)！超詳細(xì)的Dify知識庫配置全攻略 0回復(fù)

Crawl4AI：GitHub榜首40K星標(biāo)！LLM專屬極速開源爬蟲神器 0回復(fù)

只需5分鐘，教你用Python搭建MCP Server 0回復(fù)

上一篇：淺談—領(lǐng)域模型訓(xùn)練

下一篇：大模型 VS 小模型

社區(qū)精華內(nèi)容

目錄