昨天晚上,“DeepSeek R2提前泄露”的傳言刷屏 AI 圈,原因盡然來自Hugging Face CEO 在推特的一條帖子,引發(fā)全網(wǎng)猜測。
帖子表達的信息有些晦澀:三個眼睛表情,配上了DeepSeek 在 Hugging Face 的倉庫鏈接(https://huggingface.co/deepseek-ai)以及相關(guān)配圖。
網(wǎng)友難免會聯(lián)想猜測:也許DeepSeek R2 即將上線發(fā)布。
緊接著就是各種有關(guān)DeepSeekR2的離譜謠言:
一位X用戶“預告”:
“Deepseek-R2 明天或周三發(fā)布,在大多數(shù)基準測試中比 o3 稍差,但便宜 97%,幻覺更少。”
當然最多瘋傳的則是未經(jīng)證實的“參數(shù)和細節(jié)”——
(1)擁有 1.2 萬億參數(shù),活躍參數(shù)為 780 億,采用混合 MoE 架構(gòu)
(2)成本比 GPT-4o 便宜 97.3%(輸入每百萬次 0.07 美元,輸出每百萬次 0.27 美元)
(3)使用了 5.2PB 的訓練數(shù)據(jù),在 C-Eval2.0 測試中取得了 89.7% 的得分
(4)視覺能力更強,在 COCO 測試集上達到了 92.4%
(5)某國產(chǎn)芯片910B利用率達82%
(6)大規(guī)模轉(zhuǎn)移,遠離美國供應鏈
傳的煞有其事,不過據(jù)小編看到業(yè)內(nèi)人士對此事的反應:從瘋傳的部分圖片來源看,是一個炒股網(wǎng)站。
所以,DeepSeek又被某些人“薅羊毛”了??梢钥隙ㄟ@些參數(shù)肯定是謠言。
另外,X上已經(jīng)有別有用心的用戶注冊了DeepSeek R2的昵稱,大家注意防詐。
不過大家對于R2的發(fā)布充滿了期待,小編上周在做直播欄目時,嘉賓表示對于多模態(tài)推理方面很有期待,希望 R2 能給出更多的意外之喜。
截至發(fā)稿時,DeepSeek 和 Qwen 官方均未對相關(guān)傳聞作出回應。