出品 | 51CTO技術(shù)棧(微信號:blog51cto)
剛剛,DeepSeek放出了更新模型的官方報告,并發(fā)推文:
?? DeepSeek-V3-0324 現(xiàn)已推出!
??推理能力大幅提升
??更強的前端開發(fā)技能
??更智能的工具使用能力
?對于非復(fù)雜推理任務(wù),我們建議使用 V3 — 只需關(guān)閉“DeepThink”
?? API 使用保持不變
??模型現(xiàn)在根據(jù) MIT 許可證發(fā)布,就像 DeepSeek-R1 一樣!
報告細(xì)節(jié)已經(jīng)可以在HF上進行查看:https://huggingface.co/deepseek-ai/DeepSeek-V3-0324
??模型參數(shù):685B
?更新版V3的幾項改進:
1.推理能力
基準(zhǔn)測試表現(xiàn)顯著提升
2.前端 Web 開發(fā)
- 提高代碼的可執(zhí)行性
- 生成更美觀的網(wǎng)頁和游戲前端
3.中文寫作能力 風(fēng)格和內(nèi)容質(zhì)量提升
- 符合 R1 寫作風(fēng)格
- 中長篇寫作質(zhì)量更優(yōu)
4.功能增強
- 多輪交互改寫能力提升
- 翻譯質(zhì)量和書信寫作優(yōu)化
5.中文搜索能力
- 報告分析請求的輸出更加詳細(xì)
6.函數(shù)調(diào)用改進
- 函數(shù)調(diào)用準(zhǔn)確率提升,修復(fù)了 V3 版本中的相關(guān)問題
在推文下,海外網(wǎng)友紛紛在評論區(qū)“催更”DeepSeek-R2!
相信不久的將來,DeepSeek就會給我們想要的驚喜吧!