自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

DeepSeek V3“報錯家門”:我是ChatGPT

人工智能 新聞
從目前網(wǎng)友們整體討論的觀點來看,說DeepSeek V3是在ChatGPT輸出上訓(xùn)練的可能性不大。

要說這兩天大模型圈的頂流話題,那絕對是非DeepSeek V3莫屬了。

不過在網(wǎng)友們紛紛測試之際,有個bug也成了熱議的焦點——

只是少了一個問號,DeepSeek V3竟然稱自己是ChatGPT。

圖片

甚至讓它講個笑話,生成的結(jié)果也是跟ChatGPT一樣:

圖片

加之DeepSeek V3這次爆火的一個亮點,就是訓(xùn)練只花了557.6萬美元的成本。

于是乎,有人就開始懷疑了:它不會是在ChatGPT的輸出基礎(chǔ)上訓(xùn)練的吧?

好巧不巧,Altman也發(fā)了一個狀態(tài),似乎在暗諷著什么……

圖片

不過DeepSeek V3并非是第一個出現(xiàn)“報錯家門”的大模型。

例如Gemini就曾說過自己是百度的文心一言……

圖片

那么這到底是怎么一回事?

為什么DeepSeek V3報錯家門?

首先需要強調(diào)的一點是,從目前網(wǎng)友們整體討論的觀點來看,說DeepSeek V3是在ChatGPT輸出上訓(xùn)練的可能性不大

圖片

之所以這么說,正如網(wǎng)友Riley Goodside所總結(jié)的那樣——因為ChatGPT的影子無處不在。

即便DeepSeek V3故意用ChatGPT的輸出做了訓(xùn)練,但這并不重要。所有在ChatGPT之后出現(xiàn)的大模型,幾乎都見過它。

例如ShareGPT,一個并不新鮮的ChatGPT對話數(shù)據(jù)集,許多人已經(jīng)嘗試在它和其它ChatGPT數(shù)據(jù)源上進行調(diào)整。但即便如此,也沒能出現(xiàn)DeepSeek V3級別的大模型。

圖片

緊接著,Riley Goodside又拿出了DeepSeek V3報告中的一些證據(jù):

而且要是用了ChatGPT數(shù)據(jù)的話,有些關(guān)于DeepSeek V3質(zhì)量的問題是解釋不通的。

例如Pile測試(基礎(chǔ)模型壓縮Pile的效果),DeepSeek V3得分幾乎與Llama 3.1 405B相當(dāng),這跟它接沒接觸ChatGPT數(shù)據(jù)無關(guān)。

而且報告稱95%的GPU-hours用于預(yù)訓(xùn)練基礎(chǔ)模型,即便是跟ChatGPT數(shù)據(jù)有關(guān),那這部分也會在post-training階段發(fā)生(后5%)。

圖片

而比起用沒用ChatGPT數(shù)據(jù),或許我們應(yīng)當(dāng)更加關(guān)注的是為什么大模型會頻繁出現(xiàn)“報錯家門”的問題。

TechCrunch針對這個問題給出了一句犀利的點評:

因為AI公司們獲取數(shù)據(jù)的地方——網(wǎng)絡(luò),正在充斥著AI垃圾。

畢竟歐盟的一份報告曾預(yù)測,到2026年,90%的在線內(nèi)容可能是AI生成的。

這種“AI污染”就會讓“訓(xùn)練數(shù)據(jù)徹底過濾AI的輸出”變得困難。

圖片

AI Now Institute的首席科學(xué)家Heidy Khlaaf則表示:

盡管存在風(fēng)險,開發(fā)者依然被從現(xiàn)有AI模型中“蒸餾”知識所帶來的成本節(jié)約所吸引。

意外地在ChatGPT或GPT-4輸出上進行訓(xùn)練的模型,也不一定會展示出讓人想起OpenAI定制消息的輸出。

那么現(xiàn)在對于網(wǎng)友們熱議的問題,量子位進行了一波實測,DeepSeek V3目前還沒有解決這個bug。

依舊是少了個問號,回答結(jié)果會不一樣:

圖片

DeepSeek V3更多玩法

不過有一說一,絕大部分網(wǎng)友對于DeepSeek V3的能力是給予了大大的肯定。

從各路AI大佬們集體直呼“優(yōu)雅”中就能印證這一點。

而就在這兩天,網(wǎng)友們陸續(xù)曬出了更多DeepSeek V3加持的實用玩法

例如有網(wǎng)友拿DeepSeek V3和Claude Sonnet 3.5一決高下,在Scroll Hub中分別用它倆創(chuàng)建網(wǎng)站

博主在測試之后,認為DeepSeek V3完全勝出!

還有網(wǎng)友分享了用DeepSeek V3在AI視頻編輯器中的體驗。

他表示以后不用再在FFMPEG命令上浪費時間了,DeepSeek V3不僅免費,還能改變你的工作流程:

AI編程神器Cursor也能跟DeepSeek V3結(jié)合,來看一個做貪吃蛇的案例:

嗯,DeepSeek V3是有點好用在身上的。

One More Thing

對于此前公布的53頁論文,也有網(wǎng)友關(guān)注到了一個非技術(shù)性的細節(jié)——

貢獻列表中,不僅展示了技術(shù)人員,還有數(shù)據(jù)注釋和商務(wù)等工作人員:

圖片

網(wǎng)友認為這種做法非常符合DeepSeek的調(diào)性:

圖片

責(zé)任編輯:張燕妮 來源: 量子位
相關(guān)推薦

2024-12-30 20:32:36

2025-03-26 09:12:59

DeepSeek VChat2BISQL

2025-03-31 00:00:00

DeepSeekAI人工智能

2011-05-20 07:52:54

RADVISIONSCOPIA Mobi

2025-03-13 06:34:49

2025-02-19 10:49:30

2024-12-27 09:50:00

模型數(shù)據(jù)測試

2025-03-03 08:17:00

DeepSeek模型數(shù)據(jù)

2023-12-25 09:41:37

點云訓(xùn)練

2025-02-05 12:53:21

2025-02-18 00:04:00

DeepSeek模型ChatGPT

2011-03-28 12:17:03

ibmdwRational

2010-07-30 13:17:33

NFS V3

2012-12-12 14:52:36

2024-12-31 12:35:46

2025-03-28 04:30:00

2025-03-11 03:00:00

2013-06-03 10:24:49

E3-1230 v3英特爾至強
點贊
收藏

51CTO技術(shù)棧公眾號