DeepSeek V3深夜低調(diào)升級(jí),代碼進(jìn)化令人震驚,網(wǎng)友實(shí)測(cè)可媲美Claude 3.5/3.7 Sonnet
昨夜,DeepSeek V3 毫無征兆地來了一波更新,升級(jí)到了「DeepSeek-V3-0324」版本。
目前,新版本在 Hugging Face 上可以下載并部署。
Hugging Face 地址:https://huggingface.co/deepseek-ai/DeepSeek-V3-0324/tree/main
不過,DeepSeek-V3-0324 沒有公布詳細(xì)的模型卡。我們只能看到它的參數(shù)為 6850 億以及張量類型。
此外,DeepSeek-V3-0324 支持了更寬松的 MIT 開源協(xié)議。
模型放出來后,DeepSeek-V3-0324 的代碼能力讓所有人震驚了!
有人表示,經(jīng)過自己的測(cè)試,DeepSeek-V3-0324 在數(shù)學(xué)推理和前端開發(fā)方面的表現(xiàn)優(yōu)于 Claude 3.5 和 Claude 3.7 Sonnet。
圖源:https://x.com/selcukemiravci/status/1904311856313028870
X 博主「@KuittinenPetri」表示,Anthropic 和 OpenAI 陷入了困境。更新后的 DeepSeek-V3-0324 可以輕松免費(fèi)地創(chuàng)建漂亮的 HTML5、CSS 和前端。
圖源:https://x.com/KuittinenPetri/status/1904224441384771909
提示詞如下:為 AI 公司「NexusAI」創(chuàng)建一個(gè)外觀精美的響應(yīng)式首頁(yè),將所有內(nèi)容包含在一個(gè) HTML5 文件中。結(jié)果如下圖所示,所有圖像,包括用戶故事和他們的面孔,一切都是用這個(gè)提示完成的。
他認(rèn)為:DeepSeek-V3-0324 是 DeepSeek 最好的非推理模型,通常更適合創(chuàng)意寫作任務(wù),但現(xiàn)在也比 R1 更適合制作 HTML5 + CSS + 前端。上述提示的結(jié)果代碼總共 958 行,但它實(shí)際上實(shí)現(xiàn)了一個(gè)交互式網(wǎng)站,包括所有圖像。并且結(jié)果也適用于移動(dòng)設(shè)備。
他還稱,DeepSeek-V3-0324 在編寫代碼方面確實(shí)很棒!早期測(cè)試顯示,它是所有開源選擇中最好的非推理模型,甚至可以與 Claude 3.5/3.7 Sonnet 相媲美。
另一位網(wǎng)友也讓 DeepSeek-V3-0324 創(chuàng)建網(wǎng)站,只見該模型一口氣寫了 800 多行代碼,中途一次都沒卡殼,生成的網(wǎng)站布局也非常完美。
這位網(wǎng)友還把提示語(yǔ)放出來了,簡(jiǎn)單的幾行字,大家可以前去一試。
Hyperbolic 聯(lián)合創(chuàng)始人兼 CTO Yuchen 稱自己的氛圍測(cè)試顯示,DeepSeek- V3-0324 已經(jīng)有了一些思維鏈模型的影子。
他測(cè)試了題目「strawberry 中有多少個(gè) r」,可以看到,DeepSeek-V3-0324 展示了詳細(xì)的推理步驟。他表示,真正的「Open AI」又贏了。
圖源:https://x.com/Yuchenj_UW/status/1904223627509465116
還有人將 DeepSeek-V3-0324 與 OpenAI o1-pro 生成小球的效果進(jìn)行了比較。下面是 o1-pro 的效果:
他表示,DeepSeek-V3-0324 大約可以實(shí)現(xiàn) o1-pro70% 的性能,但它免費(fèi)并且 API 價(jià)格比后者便宜了至少 50 倍。二者選誰一目了然!
圖源:https://x.com/michaelkaoi/status/1904178015833297342
X 博主「orange.ai」對(duì) DeepSeek V3、DeepSeek-V3-0324 與 Claude Sonnet 3.7 的海報(bào)設(shè)計(jì)結(jié)果進(jìn)行了比較,同樣表示前端代碼能力相比上代有了顯著增強(qiáng)。
圖源:https://x.com/oran_ge/status/1904306405823467526