自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<blockquote id="zrqg5"><i id="zrqg5"></i></blockquote>

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開(kāi)發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠(chǎng)商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線(xiàn)學(xué)習(xí)

文章資源問(wèn)答課堂專(zhuān)欄直播

51CTO

鴻蒙開(kāi)發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開(kāi)發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開(kāi)發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

賬號(hào)設(shè)置退出

DeepSeek-V3深夜驚爆上新！代碼數(shù)學(xué)飆升劍指GPT-5，一臺(tái)Mac可跑

作者：新智元 2025-03-25 10:07:00

人工智能新聞

685B的DeepSeek-V3新版本，就在昨夜悄悄上線(xiàn)了。參數(shù)量685B的V3，代碼數(shù)學(xué)推理再次顯著提升，甚至代碼追平Claude 3.7，網(wǎng)友們實(shí)測(cè)后大呼強(qiáng)到離譜！有人預(yù)測(cè)說(shuō)，按照此前的節(jié)奏，DeepSeek-R2大概率幾周內(nèi)就將上線(xiàn)。

昨晚，DeepSeek-V3悄然升級(jí)！

新模型版本為DeepSeek-V3-0324，參數(shù)量為6850億，相較上個(gè)版本參數(shù)增幅不大（6710億）。

從發(fā)布時(shí)間和技術(shù)特點(diǎn)來(lái)看，DeepSeek-V3-0324，很可能是DeepSeek-R2的基礎(chǔ)架構(gòu)。

所以按照DeepSeek一貫的產(chǎn)品發(fā)布節(jié)奏（先推出基礎(chǔ)模型，幾周后再發(fā)布專(zhuān)門(mén)的推理增強(qiáng)版）來(lái)看，DeepSeek-R2很可能在幾周后就將上線(xiàn)！

升級(jí)后的V3在代碼、數(shù)學(xué)推理能力上，得到顯著提升。尤其是代碼領(lǐng)域，不少網(wǎng)友直呼「眼前一亮」。

相較于上一版，從一個(gè)球在超立方體彈跳的Python腳本，即可看出V3代碼性能的改善。

甚至，它還能解鎖Claude 3.7 Sonnet很多玩法，代碼可以與之正面較量。

值得一提的是，DeepSeek V3另一大亮點(diǎn)在于采用MIT開(kāi)源協(xié)議，上個(gè)版本還是自定義許可證。

這不僅可以自由修改、分發(fā)模型，還支持模型蒸餾、商業(yè)化應(yīng)用。

模型文件總計(jì)641GB，主要以model-00035-of-000163.safetensors形式存在

685B雖大，但也能在消費(fèi)級(jí)設(shè)備上跑起來(lái)。

這不，蘋(píng)果機(jī)器學(xué)習(xí)工程師Awni Hannun就基于MLX框架和4-bit量化，在512GB M3 Ultra實(shí)現(xiàn)了超過(guò)20 token/s的運(yùn)行速度。

這種量化方式直接將模型的磁盤(pán)占用空間減少到352GB。

有M3 Ultra的童鞋們，可以按照下面的方式使用llm-mlx跑起來(lái)：

llm mlx download-model mlx-community/DeepSeek-V3-0324-4bit
llm chat -m mlx-community/DeepSeek-V3-0324-4bit

若是本地跑不了的朋友，除了官網(wǎng)之外，還可以在OpenRouter上體驗(yàn)。

體驗(yàn)地址：openrouter.ai/chat?models=deepseek/deepseek-chat-v3-0324:free

相比起某些會(huì)在發(fā)布前數(shù)月就開(kāi)始大肆宣傳造勢(shì)的O和A開(kāi)頭的AI公司，DeepSeek這種低調(diào)辦大事的風(fēng)格可謂是天壤之別。

沒(méi)有白皮書(shū)，沒(méi)有博客文章，只有一個(gè)空白的README文件和模型權(quán)重本身——上線(xiàn)即可直接可以下載使用。

新版V3代碼能力飆升，追平Claude 3.7

遺憾的是，DeepSeek尚未公布新版模型的系統(tǒng)卡，暫時(shí)無(wú)法窺探更多技術(shù)細(xì)節(jié)。

官方小助手的更新提示

不過(guò)，這并未阻擋全網(wǎng)對(duì)新模型的熱情，已有機(jī)構(gòu)、網(wǎng)友紛紛對(duì)V3展開(kāi)通用能力、代碼、數(shù)學(xué)等多維度的測(cè)評(píng)。

根據(jù)網(wǎng)友Xeophon的自測(cè)，DeepSeek-V3-0324所有指標(biāo)性能暴漲，擊敗了Claude 3.5 Sonnet，成為目前最強(qiáng)的非推理模型。

就代碼能力來(lái)看，DeepSeek-V3-0324同樣能夠與Claude 3.5 Sonnet一決高下。

另外，在Aider的多語(yǔ)言基準(zhǔn)測(cè)試中，DeepSeek-V3-0324拿下55%成績(jī)，較前代版本顯著提升，成為僅次于Sonnet 3.7的非推理類(lèi)模型第二名。

其表現(xiàn)已可媲美R1和o3-mini等具備推理能力的模型。

網(wǎng)友「karminski-牙醫(yī)」還帶來(lái)了全網(wǎng)最速的代碼實(shí)測(cè)，新模型直接干翻了DeepSeek R1，與Claude 3.7相匹敵。

在 KCORES大模型競(jìng)技場(chǎng)中，Claude-3.7-Sonnet-Thinking無(wú)疑是LLM當(dāng)之無(wú)愧的王者，DeepSeek-V3-0324以328.3分拿下第三名，僅次于Claude 3.5 Sonnet。

他還展開(kāi)了四項(xiàng)評(píng)測(cè)，20個(gè)小球碰撞測(cè)試，上個(gè)版本結(jié)果擠成一團(tuán)，DeepSeek-V3-0324在物理模擬上表現(xiàn)更好。

在mandelbrot-set-meet-libai測(cè)試中，DeepSeek-V3-0324沒(méi)有過(guò)多變化，較初版僅僅低了2分，完成度提升很高。

還有火星任務(wù)測(cè)試中，DeepSeek-V3-0324星球渲染正確，所有模型中位列第三。

九大行星測(cè)試，DeepSeek-V3-0324真正繪制出了太陽(yáng)系的完整圖。

此外，DeepSeek-V3-0324在Misguided Attention基準(zhǔn)上，躍居非推理類(lèi)模型榜首，甚至超越了Claude Sonnet 3.7（非推理模型）。

令人驚訝的是，它現(xiàn)在能解決一些此前只有推理模型才能處理的提示，比如「4升水壺問(wèn)題」。

V3-0324似乎學(xué)會(huì)了識(shí)別推理循環(huán)，并跳出循環(huán)——這種能力甚至是許多專(zhuān)業(yè)推理模型都不具備的。

顏色越深代表特定提示的正確響應(yīng)次數(shù)越多

接下來(lái)，看看DeepSeek-V3-0324在多項(xiàng)實(shí)測(cè)中的具體表現(xiàn)如何。

網(wǎng)友實(shí)測(cè)，一個(gè)提示即出網(wǎng)頁(yè)

網(wǎng)友「Deepanshu Sharma」表示，更新后的DeepSeek-V3-0324簡(jiǎn)直「強(qiáng)的過(guò)分了」。

他用這個(gè)新模型一氣呵成創(chuàng)建了一個(gè)新網(wǎng)站，編寫(xiě)了800多行代碼，一次都沒(méi)有出錯(cuò)！

「看到這些厲害的開(kāi)源模型不斷給大公司施加壓力，迫使他們以低成本構(gòu)建更好的模型，真是太棒了！」Deepanshu寫(xiě)道。

網(wǎng)友「Risphere」體驗(yàn)完新的DeepSeek-V3-0324后表示，其在編碼方面已經(jīng)與Claude 3.7 Sonnet處于同一水平上了。

要知道，Claude模型一直以來(lái)都是公認(rèn)的代碼能力最強(qiáng)的模型。

不僅如此，Risphere甚至認(rèn)為DeepSeek-V3-0324在前端開(kāi)發(fā)方面超越了o1-pro和GPT-4.5！

要知道，o1-pro可是需要付費(fèi)200美元每月的ChatGPT Pro會(huì)員才可以體驗(yàn)的模型。

Petri Kuittinen體驗(yàn)完DeepSeek-V3-0324后認(rèn)為，「Anthropic和OpenAI遇上麻煩了！」。

他使用了一段非常簡(jiǎn)短的提示詞就制作出了一個(gè)精美的響應(yīng)式網(wǎng)頁(yè)，提示詞如下：

Create a great-looking responsive front page for AI company. Include everything in one HTML5 file.

為AI公司創(chuàng)建一個(gè)看起來(lái)很棒的響應(yīng)式首頁(yè)。將所有內(nèi)容包含在一個(gè)HTML5文件中。

Petri認(rèn)為，DeepSeek-V3-0324是在前端編程上也優(yōu)于DeepSeek-R1。

他完成的這個(gè)網(wǎng)站共有958行代碼，包括所有圖像，而且也適合手機(jī)上觀(guān)看。

不只是編程問(wèn)題，數(shù)學(xué)競(jìng)賽也難不倒它。

數(shù)學(xué)博士、奧賽金牌得主Jasper用AIME 2025中的題目測(cè)試了一下DeepSeek-V3-0324，它順利解決了。

Jasper表示，他現(xiàn)在對(duì)開(kāi)源AI模型最終獲勝更有信心了！

編碼智能體Cline的速度很快，第一時(shí)間更新了DeepSeek-V3-0324。

他們還給出了使用的理由，DeepSeek-V3-0324在編碼任務(wù)上性能與Claude 3.7 Sonnet不相上下，價(jià)格卻低了53倍。

不止如此，Cline還表示，DeepSeek-V3-0324較之前的版本增加了60%的專(zhuān)家（從160增加到256），使用了FP8精度訓(xùn)練將計(jì)算效率翻倍，不僅使前端編碼能力增強(qiáng)，數(shù)學(xué)與邏輯能力也有所提升。

DeepSeek注定改變?nèi)駻I格局

這次DeepSeek-V3的突然上線(xiàn)，節(jié)奏也與過(guò)去他們?cè)谑フQ節(jié)期間發(fā)布V3、幾周后推出R1的模式完全吻合。

本來(lái)，業(yè)界就一直傳聞R2將在4月亮相，V3的上線(xiàn)基本吹響了R2的前奏。

先進(jìn)開(kāi)源推理模型的影響，已經(jīng)不必多說(shuō)了。如果它們能免費(fèi)提供，那原本只有財(cái)力雄厚的大型機(jī)構(gòu)才能獲得的高級(jí)AI系統(tǒng)，會(huì)變得人人可用。

而如果DeepSeek-R2能延續(xù)R1的發(fā)展路線(xiàn)，但它很可能會(huì)直接單挑OpenAI捂著的大炸彈GPT-5。這就讓OpenAI靠封閉生態(tài)和雄厚資金支持帶來(lái)的壟斷，被徹底打破。

當(dāng)OpenAI和Anthropic還在為模型設(shè)置付費(fèi)訪(fǎng)問(wèn)限制時(shí)，DeepSeek已經(jīng)實(shí)現(xiàn)了封閉模型無(wú)法達(dá)到的爆發(fā)式創(chuàng)新。

而中美AI差異，已經(jīng)日漸縮小，全球AI格局已被重塑。幾個(gè)月前，大部分分析師估計(jì)，中國(guó)在AI能力上落后美國(guó)1-2年，今天這一差距已經(jīng)縮小至3-6個(gè)月，甚至呈現(xiàn)中國(guó)領(lǐng)先的趨勢(shì)。

而開(kāi)源的方式，甚至還解決了中國(guó)公司的特殊挑戰(zhàn)（受限于英偉達(dá)先進(jìn)芯片），因?yàn)楦⒅卦谒懔τ邢薜那闆r下達(dá)到有競(jìng)爭(zhēng)力的性能，現(xiàn)在這已成為中國(guó)企業(yè)的潛在優(yōu)勢(shì)。

就像Android系統(tǒng)一樣，憑著廣泛的普及性和數(shù)千開(kāi)發(fā)者的集體創(chuàng)新，DeepSeek很可能最終超越封閉系統(tǒng)。

誰(shuí)將通過(guò)AI擁有對(duì)世界最大的影響力？讓我們拭目以待。

責(zé)任編輯：張燕妮來(lái)源：新智元

哎模型數(shù)據(jù)

點(diǎn)贊

51CTO技術(shù)棧公眾號(hào)

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開(kāi)發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營(yíng)

<sub id="k6huv"></sub>

<cite id="k6huv"></cite>