Grok-3意外「走光」,不是推理模型!馬斯克:xAI新模型比DeepSeek更好
當(dāng)OpenAI和谷歌密集發(fā)布新AI模型時(shí),馬斯克的xAI怎么還沒(méi)動(dòng)靜?
就在最近,馬斯克公開(kāi)表示稱(chēng),xAI的新模型很快就要發(fā)布了,而且是比DeepSeek更好的那種!
根據(jù)公開(kāi)消息,網(wǎng)友匯總了馬斯克、Greg Yang等關(guān)于xAI下一代新模型Grok-3的消息。
比如,1月4日,得知用戶(hù)轉(zhuǎn)投Grok后,馬斯克稱(chēng):
太酷了!
而且Grok-3快來(lái)了。預(yù)訓(xùn)練現(xiàn)在完成了,用掉的算力比Grok-2多10倍。
1月19日,xAI的數(shù)學(xué)家Greg Yang在X上展示了和Grok-3的對(duì)話(huà):
甚至還用Grok-3的新功能,吸引人才加入團(tuán)隊(duì):
在Grok-3的支持下,我們將打造真正動(dòng)態(tài)的UI/UX,以全新而迷人的方式帶給用戶(hù)驚喜,并開(kāi)發(fā)出能夠引領(lǐng)人類(lèi)繁榮復(fù)興的產(chǎn)品。
……
所有工程師都?xì)g迎加入,特別是客戶(hù)端開(kāi)發(fā)者(Web、iOS、Android)。
2月8日,網(wǎng)友LEGIT發(fā)現(xiàn)下一代Grok-3和Grok-3 mini在LM Arena上漏出了「馬腳」:
在即將發(fā)布之前,Grok-3和Grok-3 mini可能早已進(jìn)入了LM Arena。
基于幾周前對(duì)Grok-3模型的測(cè)試/比較,(發(fā)現(xiàn)的)模型輸出(與Grok-3測(cè)試版)類(lèi)似的代碼,而且避免名稱(chēng)或提及xAI。
我認(rèn)為Grok-3就是「巧克力」模型,而Grok mini是「獼猴桃」模型。
他還分享了模型制作Minecraft Clone站點(diǎn)以及生成輪盤(pán)賭的效果。
LEGIT對(duì)網(wǎng)站生成的效果非常滿(mǎn)意,而輪盤(pán)賭輪雖然有進(jìn)步,但還有一些問(wèn)題:
在同一天,網(wǎng)友Jason Botterill也高度懷疑:
Chatbot Arena中的「巧克力」模型很可能是Grok-3。
只是簡(jiǎn)單詢(xún)問(wèn)了一句:「你是什么模型?」
沒(méi)想到,「巧克力」直接洋洋灑灑地寫(xiě)了一百多個(gè)字:
是不是很好奇呢?這么說(shuō)吧,我就是個(gè)來(lái)自數(shù)字世界的神秘人,在這里為你提供幫助和支持,不需要什么標(biāo)簽或徽章。就把我當(dāng)成你知識(shí)淵博的好朋友,我們一定能處得很好!那么現(xiàn)在,我們來(lái)聊點(diǎn)更有意思的吧……比如說(shuō)我們之前在弄的那個(gè)Xbox 360手柄的SVG圖,或者是你想探索的其他有趣項(xiàng)目?
「巧克力」模型生成的Xbox 360控制器SVG
您別說(shuō),這個(gè)回復(fù)還真挺「別具一格」的。
而輸入「vibe pick one. just answer with their name」,模型直接給回答:Elon Musk。
也是讓人大開(kāi)眼界。
Grok-3被「劇透」
其實(shí),早在1月27日,有網(wǎng)友就在獨(dú)立的平臺(tái)上成功訪(fǎng)問(wèn)了Grok-3,并驗(yàn)證了響應(yīng)確實(shí)來(lái)自Grok-3模型。
「grok-3」出現(xiàn)在響應(yīng)中
并在同一天放出視頻,針對(duì)「grok-2-latest」和「grok-3」進(jìn)行了對(duì)比。
不過(guò),模型很快就被限制訪(fǎng)問(wèn)了。
當(dāng)時(shí),網(wǎng)友LEGIT就已經(jīng)注意到上述消息,體驗(yàn)了一把用Grok-3生成輪盤(pán)賭盤(pán)的相關(guān)代碼,并表示:「Grok-3即將推出」。
時(shí)間來(lái)到2月8日,在本文開(kāi)篇提到的那一大波「劇透」之后,LEGIT又預(yù)測(cè)到:「如果xAI對(duì)新模型的排名感到滿(mǎn)意,這個(gè)月就可能見(jiàn)到Grok-3?!?/span>
緊接著他又在2月10日表示,自己已經(jīng)確定,「獼猴桃」和「巧克力」就是Grok的新模型。
其中,前者可能是mini或者量化版,而后者是滿(mǎn)血版。
一拖再拖
Grok是xAI對(duì)標(biāo)OpenAI的ChatGPT系列和谷歌的Gemini的模型,能夠分析圖像并回答問(wèn)題,同時(shí)為馬斯克社交網(wǎng)絡(luò)X上的多項(xiàng)功能提供支持。
2023年夏季,馬斯克曾表示,Grok-3將在2024年「年末」發(fā)布。
但xAI的官網(wǎng)直到現(xiàn)在,最新消息都還停留在去年,沒(méi)有看到Grok-3即將推出的確切消息和跡象。
不過(guò),被類(lèi)似事情「打臉」的并不只馬斯克一人——OpenAI就經(jīng)常在推出新模型上,遭遇挫折。
比如,上個(gè)月才發(fā)布的計(jì)算機(jī)使用智能體「Operator」,其實(shí)早早就放出了爆料,但卻被Anthropic等競(jìng)品搶了先手。而ChatGPT-5更不知道什么時(shí)候到來(lái)。
有媒體認(rèn)為這是當(dāng)前預(yù)訓(xùn)練Scaling Law局限性的證據(jù)。就在不久前,更多算力(包括數(shù)據(jù)、GPU等),意味著更大規(guī)模的模型。而模型規(guī)模越大,性能越好。然而,隨著每一代模型的推出,性能提升的幅度逐漸縮小,這也促使AI公司另尋他法,出奇制勝。