DeepSeek R2提前泄露?周二或周三發(fā)布?海外謠言一夜刷屏,HggingFace CEO一帖子引瘋狂猜想,DS又被消費(fèi)了
出品 | 51CTO技術(shù)棧(微信號(hào):blog51cto)
昨天晚上,“DeepSeek R2提前泄露”的傳言刷屏 AI 圈,原因盡然來(lái)自Hugging Face CEO 在推特的一條帖子,引發(fā)全網(wǎng)猜測(cè)。
帖子表達(dá)的信息有些晦澀:三個(gè)眼睛表情,配上了DeepSeek 在 Hugging Face 的倉(cāng)庫(kù)鏈接(https://huggingface.co/deepseek-ai)以及相關(guān)配圖。
網(wǎng)友難免會(huì)聯(lián)想猜測(cè):也許DeepSeek R2 即將上線(xiàn)發(fā)布。
緊接著就是各種有關(guān)DeepSeekR2的離譜謠言:
一位X用戶(hù)“預(yù)告”:
“Deepseek-R2 明天或周三發(fā)布,在大多數(shù)基準(zhǔn)測(cè)試中比 o3 稍差,但便宜 97%,幻覺(jué)更少?!?/p>
當(dāng)然最多瘋傳的則是未經(jīng)證實(shí)的“參數(shù)和細(xì)節(jié)”——
(1)擁有 1.2 萬(wàn)億參數(shù),活躍參數(shù)為 780 億,采用混合 MoE 架構(gòu)
(2)成本比 GPT-4o 便宜 97.3%(輸入每百萬(wàn)次 0.07 美元,輸出每百萬(wàn)次 0.27 美元)
(3)使用了 5.2PB 的訓(xùn)練數(shù)據(jù),在 C-Eval2.0 測(cè)試中取得了 89.7% 的得分
(4)視覺(jué)能力更強(qiáng),在 COCO 測(cè)試集上達(dá)到了 92.4%
(5)某國(guó)產(chǎn)芯片910B利用率達(dá)82%
(6)大規(guī)模轉(zhuǎn)移,遠(yuǎn)離美國(guó)供應(yīng)鏈
傳的煞有其事,不過(guò)據(jù)小編看到業(yè)內(nèi)人士對(duì)此事的反應(yīng):從瘋傳的部分圖片來(lái)源看,是一個(gè)炒股網(wǎng)站。
所以,DeepSeek又被某些人“薅羊毛”了??梢钥隙ㄟ@些參數(shù)肯定是謠言。
另外,X上已經(jīng)有別有用心的用戶(hù)注冊(cè)了DeepSeek R2的昵稱(chēng),大家注意防詐。
不過(guò)大家對(duì)于R2的發(fā)布充滿(mǎn)了期待,小編上周在做直播欄目時(shí),嘉賓表示對(duì)于多模態(tài)推理方面很有期待,希望 R2 能給出更多的意外之喜。
截至發(fā)稿時(shí),DeepSeek 和 Qwen 官方均未對(duì)相關(guān)傳聞作出回應(yīng)。
本文轉(zhuǎn)載自??51CTO技術(shù)棧??
