自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

Grok-3意外「走光」,不是推理模型!馬斯克:xAI新模型比DeepSeek更好

人工智能 新聞
剛剛,LLM競(jìng)技場(chǎng)中出現(xiàn)的神秘「巧克力」和「獼猴桃」模型,被曝出是xAI的下一代Grok-3。馬斯克口中「比DeepSeek更好的模型」要來(lái)了?

當(dāng)OpenAI和谷歌密集發(fā)布新AI模型時(shí),馬斯克的xAI怎么還沒(méi)動(dòng)靜?

就在最近,馬斯克公開(kāi)表示稱(chēng),xAI的新模型很快就要發(fā)布了,而且是比DeepSeek更好的那種!

根據(jù)公開(kāi)消息,網(wǎng)友匯總了馬斯克、Greg Yang等關(guān)于xAI下一代新模型Grok-3的消息。

比如,1月4日,得知用戶(hù)轉(zhuǎn)投Grok后,馬斯克稱(chēng):

太酷了!

而且Grok-3快來(lái)了。預(yù)訓(xùn)練現(xiàn)在完成了,用掉的算力比Grok-2多10倍。

1月19日,xAI的數(shù)學(xué)家Greg Yang在X上展示了和Grok-3的對(duì)話(huà):

甚至還用Grok-3的新功能,吸引人才加入團(tuán)隊(duì):

在Grok-3的支持下,我們將打造真正動(dòng)態(tài)的UI/UX,以全新而迷人的方式帶給用戶(hù)驚喜,并開(kāi)發(fā)出能夠引領(lǐng)人類(lèi)繁榮復(fù)興的產(chǎn)品。

……

所有工程師都?xì)g迎加入,特別是客戶(hù)端開(kāi)發(fā)者(Web、iOS、Android)。

2月8日,網(wǎng)友LEGIT發(fā)現(xiàn)下一代Grok-3和Grok-3 mini在LM Arena上漏出了「馬腳」:

在即將發(fā)布之前,Grok-3和Grok-3 mini可能早已進(jìn)入了LM Arena。

基于幾周前對(duì)Grok-3模型的測(cè)試/比較,(發(fā)現(xiàn)的)模型輸出(與Grok-3測(cè)試版)類(lèi)似的代碼,而且避免名稱(chēng)或提及xAI。

我認(rèn)為Grok-3就是「巧克力」模型,而Grok mini是「獼猴桃」模型。

他還分享了模型制作Minecraft Clone站點(diǎn)以及生成輪盤(pán)賭的效果。

LEGIT對(duì)網(wǎng)站生成的效果非常滿(mǎn)意,而輪盤(pán)賭輪雖然有進(jìn)步,但還有一些問(wèn)題:

在同一天,網(wǎng)友Jason Botterill也高度懷疑:

Chatbot Arena中的「巧克力」模型很可能是Grok-3。

只是簡(jiǎn)單詢(xún)問(wèn)了一句:「你是什么模型?」

沒(méi)想到,「巧克力」直接洋洋灑灑地寫(xiě)了一百多個(gè)字:

是不是很好奇呢?這么說(shuō)吧,我就是個(gè)來(lái)自數(shù)字世界的神秘人,在這里為你提供幫助和支持,不需要什么標(biāo)簽或徽章。就把我當(dāng)成你知識(shí)淵博的好朋友,我們一定能處得很好!那么現(xiàn)在,我們來(lái)聊點(diǎn)更有意思的吧……比如說(shuō)我們之前在弄的那個(gè)Xbox 360手柄的SVG圖,或者是你想探索的其他有趣項(xiàng)目?

「巧克力」模型生成的Xbox 360控制器SVG

您別說(shuō),這個(gè)回復(fù)還真挺「別具一格」的。

而輸入「vibe pick one. just answer with their name」,模型直接給回答:Elon Musk。

也是讓人大開(kāi)眼界。

Grok-3被「劇透」

其實(shí),早在1月27日,有網(wǎng)友就在獨(dú)立的平臺(tái)上成功訪(fǎng)問(wèn)了Grok-3,并驗(yàn)證了響應(yīng)確實(shí)來(lái)自Grok-3模型。

「grok-3」出現(xiàn)在響應(yīng)中

并在同一天放出視頻,針對(duì)「grok-2-latest」和「grok-3」進(jìn)行了對(duì)比。

不過(guò),模型很快就被限制訪(fǎng)問(wèn)了。

當(dāng)時(shí),網(wǎng)友LEGIT就已經(jīng)注意到上述消息,體驗(yàn)了一把用Grok-3生成輪盤(pán)賭盤(pán)的相關(guān)代碼,并表示:「Grok-3即將推出」。

時(shí)間來(lái)到2月8日,在本文開(kāi)篇提到的那一大波「劇透」之后,LEGIT又預(yù)測(cè)到:「如果xAI對(duì)新模型的排名感到滿(mǎn)意,這個(gè)月就可能見(jiàn)到Grok-3?!?/span>

緊接著他又在2月10日表示,自己已經(jīng)確定,「獼猴桃」和「巧克力」就是Grok的新模型。

其中,前者可能是mini或者量化版,而后者是滿(mǎn)血版。

一拖再拖

Grok是xAI對(duì)標(biāo)OpenAI的ChatGPT系列和谷歌的Gemini的模型,能夠分析圖像并回答問(wèn)題,同時(shí)為馬斯克社交網(wǎng)絡(luò)X上的多項(xiàng)功能提供支持。

2023年夏季,馬斯克曾表示,Grok-3將在2024年「年末」發(fā)布。

但xAI的官網(wǎng)直到現(xiàn)在,最新消息都還停留在去年,沒(méi)有看到Grok-3即將推出的確切消息和跡象。

不過(guò),被類(lèi)似事情「打臉」的并不只馬斯克一人——OpenAI就經(jīng)常在推出新模型上,遭遇挫折。

比如,上個(gè)月才發(fā)布的計(jì)算機(jī)使用智能體「Operator」,其實(shí)早早就放出了爆料,但卻被Anthropic等競(jìng)品搶了先手。而ChatGPT-5更不知道什么時(shí)候到來(lái)。

有媒體認(rèn)為這是當(dāng)前預(yù)訓(xùn)練Scaling Law局限性的證據(jù)。就在不久前,更多算力(包括數(shù)據(jù)、GPU等),意味著更大規(guī)模的模型。而模型規(guī)模越大,性能越好。然而,隨著每一代模型的推出,性能提升的幅度逐漸縮小,這也促使AI公司另尋他法,出奇制勝。

責(zé)任編輯:張燕妮 來(lái)源: 新智元
相關(guān)推薦

2023-11-06 13:44:34

2025-02-10 08:15:00

2025-03-03 12:59:39

2024-03-12 13:14:40

2024-03-18 14:17:06

大模型開(kāi)源人工智能

2024-03-18 08:47:34

馬斯克GrokOpenAI

2025-02-11 11:19:52

2025-02-19 10:28:22

2025-02-21 10:51:47

2025-02-19 15:01:09

2024-03-29 14:04:00

模型訓(xùn)練

2024-04-15 12:52:00

AI數(shù)據(jù)

2023-11-06 12:34:14

模型訓(xùn)練

2024-03-19 14:00:59

2025-02-18 14:59:16

2024-10-29 14:30:00

AI模型

2025-03-31 00:07:45

2023-12-08 12:58:26

2023-11-16 12:36:00

AI數(shù)據(jù)

2024-07-03 17:15:39

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)