一手實(shí)測DeepSeek-V3-0324,AI編程大躍進(jìn)
DeepSeek悄悄更新了他們的基座模型。
版本號DeepSeek-V3-0324,參數(shù)685B(上一個版本671B)。一如既往,DeepSeek繼續(xù)在Hugging Face上開源發(fā)布,而且是MIT許可(也就是任何人都可以免費(fèi)使用、修改、分發(fā)和商用這塊模型)。
新模型發(fā)布后,很快就成為了Hugging Face上最熱門的開源模型。
體驗(yàn)地址(關(guān)掉深度思考):https://chat.deepseek.com/
我在看到這條消息后,一直猶豫到底要不要寫稿。最后還是決定先睡一覺,讓子彈飛一會兒。
在過去12個小時里,很多同行將它與Claude sonnet 3.7的代碼能力媲美。我覺得這是不對的,從實(shí)測來看,DeepSeek-V3-0324的代碼能力與Claude 3.7還有差距,大致與Claude 3.5水平相當(dāng)。
1.怎么體驗(yàn)DeepSeek-V3-0324?
首先,訪問DeepSeek官網(wǎng)chat.deepseek.com。
然后,關(guān)掉深度思考,會默認(rèn)啟用DeepSeek-V3-0324基礎(chǔ)模型,就可以體驗(yàn)了。
比如,我們輸入提示詞:幫我制作一個抽獎頁面,從1-100中隨機(jī)抽取。這個頁面叫“沃垠AI抽獎頁面”。畫面背景:全屏Canvas實(shí)現(xiàn)的二進(jìn)制數(shù)字瀑布流動畫;熒光綠(#00FF00)配色方案與CRT顯示器視覺效果。
然后,等它生成完整的代碼。根據(jù)需求不同,生成時間不同。比如我這個case,DeepSeek大概跑了2分鐘。
生成好后,在html代碼塊的右下角,有一行提示“運(yùn)行HTML”。
點(diǎn)擊這個圖標(biāo),就會進(jìn)入代碼預(yù)覽頁面。
比如,我制作的這個抽獎頁面。
點(diǎn)擊“開始抽獎”,直接就可以使用了。
你也可以將代碼保存為HTML文件,然后在瀏覽器里打開進(jìn)行預(yù)覽;也可以部署到自己的網(wǎng)站上使用。
使用方法:新建一個txt文檔,把代碼復(fù)制進(jìn)來,保存txt文檔,然后將txt文檔的后綴改為.html格式,一份HTML文件就得到了。
這里,我給大家錄了一個演示視頻,你看一眼就明白。
一句話總結(jié):關(guān)閉深度思考,即可體驗(yàn)到DeepSeek-V3-0324模型;點(diǎn)擊“運(yùn)行HTML”,即可預(yù)覽代碼效果。
2.更多實(shí)測
在后續(xù)使用中,我還測了這些case。
勾選聯(lián)網(wǎng)功能,輸入提示詞:查詢成都未來5天的天氣,用代碼寫一張擬態(tài)風(fēng)格的天氣卡片。
今天,我們用DeepSeek-V3-0324模型來做一個中獎?wù)故卷撁妗?/p>
上傳附件,輸入提示詞:這是一個中獎名單,幫我寫一個中獎結(jié)果公示頁面,整體風(fēng)格參考Linear App的簡約現(xiàn)代設(shè)計,使用清晰的視覺層次結(jié)構(gòu),配色專業(yè)、和諧。
一起來看下DeepSeek生成的網(wǎng)頁。
Nice,這審美真好看。
也可以生成網(wǎng)站,比如DeepSeek自己的官網(wǎng)。
提示詞:為DeepSeek生成一個官方網(wǎng)站(html),展示公司的發(fā)展沿革,科技風(fēng),添加適當(dāng)?shù)奈⒔换バЧ?/p>
然后,它就自己去寫代碼了。寫了……總共有10來分鐘吧,才終于把完整代碼寫出來,保守估計消耗了10多萬的tokens。
既然花了10分鐘,我倒要看看你到底寫了個啥。
當(dāng)我點(diǎn)開預(yù)覽的那一刻,我驚呆了。。
首頁有粒子特效,發(fā)展沿革是時間軸交互,還有導(dǎo)航欄滾動、懸浮、平滑、漸顯動畫以及漸變式標(biāo)題等各種微交互效果。
這整個網(wǎng)頁,放到任何技術(shù)團(tuán)隊,它不得開發(fā)個把周才能上線啊?
太強(qiáng)了,真的太強(qiáng)了。
這里,也推薦給大家一個做可視化網(wǎng)頁的提示詞(作者:歸藏),大家可根據(jù)不同需求進(jìn)行修改。
我會給你一個文件,分析內(nèi)容,并將其轉(zhuǎn)化為美觀漂亮的中文可視化網(wǎng)頁:
## 內(nèi)容要求
- 所有頁面內(nèi)容必須為簡體中文
- 保持原文件的核心信息,但以更易讀、可視化的方式呈現(xiàn)
- 在頁面底部添加作者信息區(qū)域,包含:
* 作者姓名: [作者姓名]
* 社交媒體鏈接: 至少包含GitHub、Twitter/X、LinkedIn等主流平臺
* 版權(quán)信息和年份
## 設(shè)計風(fēng)格
- 整體風(fēng)格參考Linear App的簡約現(xiàn)代設(shè)計
- 使用清晰的視覺層次結(jié)構(gòu),突出重要內(nèi)容
- 配色方案應(yīng)專業(yè)、和諧,適合長時間閱讀
## 技術(shù)規(guī)范
- 使用HTML5、TailwindCSS 3.0+(通過CDN引入)和必要的JavaScript
- 實(shí)現(xiàn)完整的深色/淺色模式切換功能,默認(rèn)跟隨系統(tǒng)設(shè)置
- 代碼結(jié)構(gòu)清晰,包含適當(dāng)注釋,便于理解和維護(hù)
## 響應(yīng)式設(shè)計
- 頁面必須在所有設(shè)備上(手機(jī)、平板、桌面)完美展示
- 針對不同屏幕尺寸優(yōu)化布局和字體大小
- 確保移動端有良好的觸控體驗(yàn)
## 圖標(biāo)與視覺元素
- 使用專業(yè)圖標(biāo)庫如Font Awesome或Material Icons(通過CDN引入)
- 根據(jù)內(nèi)容主題選擇合適的插圖或圖表展示數(shù)據(jù)
- 避免使用emoji作為主要圖標(biāo)
## 交互體驗(yàn)
- 添加適當(dāng)?shù)奈⒔换バЧ嵘脩趔w驗(yàn):
* 按鈕懸停時有輕微放大和顏色變化
* 卡片元素懸停時有精致的陰影和邊框效果
* 頁面滾動時有平滑過渡效果
* 內(nèi)容區(qū)塊加載時有優(yōu)雅的淡入動畫
## 性能優(yōu)化
- 確保頁面加載速度快,避免不必要的大型資源
- 圖片使用現(xiàn)代格式(WebP)并進(jìn)行適當(dāng)壓縮
- 實(shí)現(xiàn)懶加載技術(shù)用于長頁面內(nèi)容
## 輸出要求
- 提供完整可運(yùn)行的單一HTML文件,包含所有必要的CSS和JavaScript
- 確保代碼符合W3C標(biāo)準(zhǔn),無錯誤警告
- 頁面在不同瀏覽器中保持一致的外觀和功能
請根據(jù)上傳文件的內(nèi)容類型(文檔、數(shù)據(jù)、圖片等),創(chuàng)建最適合展示該內(nèi)容的可視化網(wǎng)頁。
3.寫在最后
剛剛(兩小時前),DeepSeek還在Hugging Face上公布了最新模型的評測結(jié)果。
給大家簡單介紹下這張圖:
- 在MMLU-Pro基準(zhǔn)的語言理解能力上,DeepSeek-V3-0324優(yōu)于Claude 3.7,僅次于GPT-4.5。
- 在GPQA Diamond基準(zhǔn)的圖形問題(幾何)能力上,DeepSeek-V3-0324同樣優(yōu)于Claude 3.7,僅次于GPT-4.5。
- 在MATH-500基準(zhǔn)的數(shù)學(xué)能力上,DeepSeek-V3-0324是目前最好的模型。以及測數(shù)學(xué)競賽的AIME 2024基準(zhǔn),DeepSeek-V3-0324更是遙遙領(lǐng)先。
- 最后,在LiveCodeBench基準(zhǔn)的編程能力上,DeepSeek-V3-0324也超過了Claude 3.7和GPT-4.5。
簡單說就是:這次更新,DeepSeek大幅優(yōu)化了自己的代碼能力和數(shù)學(xué)能力,其網(wǎng)頁設(shè)計美感和代碼質(zhì)量大幅提升。在語言理解能力上(尤其是中文),DeepSeek則繼續(xù)保持著自己的優(yōu)勢。
可以這么說,目前,DeepSeek-V3-0324就是世界前三的基礎(chǔ)模型。
我們知道,有了基礎(chǔ)模型才會有其他,比如推理模型,或者基于基礎(chǔ)模型的一些模型微調(diào)、蒸餾等。
DeepSeek此次基模更新,無疑是在為接下來的R2打基礎(chǔ)。
期待“源神”又一次的華麗登臺。
本文轉(zhuǎn)載自??沃垠AI??,作者:冷逸
