自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

一文看懂多模態(tài)思維鏈DeepSeek V3“小版本升級(jí)”實(shí)測(cè)堪比V3.5,非推理模型也有“啊哈時(shí)刻”,7米甘蔗過(guò)2米門(mén)想通了

人工智能 新聞
官方輕描淡寫(xiě)只說(shuō)是“小版本升級(jí)”,但很多人實(shí)測(cè)下來(lái)可一點(diǎn)也不小。

DeepSeek V3升級(jí)了,新版本V3-0324。

官方輕描淡寫(xiě)只說(shuō)是“小版本升級(jí)”,但很多人實(shí)測(cè)下來(lái)可一點(diǎn)也不小。

圖片

把流行的小球彈跳測(cè)試,提升難度到4維空間超立方體也沒(méi)問(wèn)題。

天哪,如果這只是一個(gè)小更新,那我想象不出大更新會(huì)是什么樣子。

圖片

編程這塊,只需一句提示詞開(kāi)發(fā)一個(gè)完整產(chǎn)品著陸頁(yè),帶自適應(yīng)布局帶動(dòng)效,被評(píng)價(jià)為與Claude 3.7 Sonnet同一水平。

圖片

由于發(fā)布時(shí)間太短,還沒(méi)有正式測(cè)評(píng)結(jié)果,不過(guò)在開(kāi)發(fā)者Xeophon的個(gè)人Benchmark上所有指標(biāo)都有大提升,成為該測(cè)試下最好的非推理模型。

圖片

不是推理模型也有“啊哈時(shí)刻”

DeepSeek-V3-0324并非推理模型,在回答之前不會(huì)給出思考過(guò)程,但依然遵循一定的思維方式分解問(wèn)題。

走入死胡同的話,還表現(xiàn)出自主回到上一步重新思考的能力。

在“9.11和9.9那個(gè)大”、“Straberry有多少個(gè)r”已經(jīng)不成問(wèn)題的今天,最新折磨AI的難題是“讓7米長(zhǎng)的甘蔗通過(guò)2米高1米寬的門(mén)”。

在量子位的測(cè)試中,DeepSeek-V3-0324先是像它的前輩以及許多其他AI一樣碰壁。

圖片

碰壁之后開(kāi)始重新思考題目本身的含義,后面依舊陷入誤區(qū),但突然在中文解題過(guò)程中夾雜一句英語(yǔ)思考,類似DeepSeek-R1技術(shù)報(bào)告中的“啊哈時(shí)刻”。

等等,這似乎與之前的對(duì)角線方法相似,也許我遺漏了什么。

圖片

頓悟之后,突然就走上了正確的道路,注意到了題目中沒(méi)直接提到的隱藏條件。

圖片

雖然從計(jì)算過(guò)程看,還是沒(méi)理解到問(wèn)題的本質(zhì),但好歹得出了解決方案,還認(rèn)識(shí)到了自己的誤區(qū)。

圖片

依舊免費(fèi), 依舊開(kāi)源

像這樣的優(yōu)秀模型依舊免費(fèi), 依舊開(kāi)源,權(quán)重文件已火速上線HuggingFace,使用最寬松的MIT協(xié)議。

圖片

所有權(quán)重文件加起來(lái)占硬盤(pán)空間約688GB,與初代v3保持一致,說(shuō)明依然是671B參數(shù)的MoE模型,目前沒(méi)有更多技術(shù)細(xì)節(jié),還需等待官方進(jìn)一步發(fā)布公告。

目前在官網(wǎng)和官方APP(關(guān)閉深度思考即可)、HuggingFace等渠道都能體驗(yàn)到v3-0324。

圖片

也可以到大模型競(jìng)技場(chǎng)去與其他模型pk,不過(guò)投票結(jié)果還要等一段時(shí)間才能出來(lái)。

圖片

當(dāng)然最讓大家期待的還是,v3更新了,r2還會(huì)遠(yuǎn)嗎?

圖片

官網(wǎng)試玩:

https://chat.deepseek.com/

HuggingFace:

https://huggingface.co/deepseek-ai/DeepSeek-V3-0324/blob/main/README.md

責(zé)任編輯:張燕妮 來(lái)源: 量子位
相關(guān)推薦

2025-04-29 09:03:00

2025-03-25 09:06:11

2025-03-17 08:15:00

AI技術(shù)模型

2025-02-12 08:30:18

2012-12-24 13:37:42

zTreeCSS

2025-03-25 09:48:22

2024-12-30 20:32:36

2025-03-06 01:00:00

2024-07-23 10:34:57

2024-12-31 12:35:46

2024-12-30 09:25:00

數(shù)據(jù)訓(xùn)練摩擦

2025-03-26 09:12:59

DeepSeek VChat2BISQL

2017-09-08 15:49:42

互聯(lián)網(wǎng)

2023-10-27 09:47:22

模態(tài)框架

2025-02-08 09:15:00

2024-11-13 09:39:13

2011-08-01 18:02:33

2025-02-10 07:10:00

多模態(tài)embeddingsAI
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)