自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

AI領(lǐng)域的“新王”誕生! 馬斯克發(fā)布Grok 3,趕超OpenAI o1和Deepseek R1! 原創(chuàng)

發(fā)布于 2025-2-20 14:33
瀏覽
0收藏

在2月18日,馬斯克旗下的xAI公司推出新一代大語(yǔ)言模型Grok 3。馬斯克在發(fā)布會(huì)上自信滿滿地表示:“Grok 3比Grok 2強(qiáng)大一個(gè)數(shù)量級(jí)?!边@話聽(tīng)起來(lái)有點(diǎn)夸張,但看看Grok 3的表現(xiàn),還真不是吹牛。根據(jù)xAI工程師的說(shuō)法,Grok 3的訓(xùn)練量是Grok 2的10倍,推理能力更是直接碾壓了包括ChatGPT和DeepSeek在內(nèi)的其他AI模型。馬斯克甚至放話:“Grok 3是地球上最聰明的人工智能?!?/p>

Grok 3到底有多強(qiáng)?

咱們先來(lái)看一組數(shù)據(jù)。在數(shù)學(xué)能力測(cè)試(AIME'24)中,Grok 3拿到了52分,而DeepSeek-V3只有39分;科學(xué)知識(shí)評(píng)估(GPQA)中,Grok 3以75分領(lǐng)先DeepSeek-V3的65分;編程能力測(cè)試(LCB Oct-Feb)中,Grok 3更是以57分完勝DeepSeek-V3的36分。這差距,簡(jiǎn)直像是學(xué)霸和普通學(xué)生的區(qū)別。

AI領(lǐng)域的“新王”誕生! 馬斯克發(fā)布Grok 3,趕超OpenAI o1和Deepseek R1!-AI.x社區(qū)

更讓人驚訝的是,Grok 3在AIME 2025性能測(cè)試中的表現(xiàn)。它的推理和計(jì)算時(shí)間復(fù)合評(píng)分高達(dá)93分,精簡(jiǎn)版Grok-3 mini也有90分。相比之下,DeepSeek-R1只有75分,而Gemini-2 Flash Thinking更是只有54分。這差距,已經(jīng)不是“碾壓”能形容的了,簡(jiǎn)直是“降維打擊”。

Grok 3的“殺手锏”:推理能力

馬斯克特別強(qiáng)調(diào)了Grok 3的推理能力。在他看來(lái),Grok 3的推理能力不僅超越了現(xiàn)有的AI模型,甚至可能成為AI領(lǐng)域的“顛覆者”。從測(cè)試數(shù)據(jù)來(lái)看,Grok 3在數(shù)學(xué)推理、科學(xué)推理和編程推理中都表現(xiàn)出了顯著優(yōu)勢(shì)。特別是在數(shù)學(xué)推理中,Grok 3拿到了93分,而DeepSeek-R1只有73分。這差距,足以讓Grok 3在AI領(lǐng)域站穩(wěn)腳跟。


AI領(lǐng)域的“新王”誕生! 馬斯克發(fā)布Grok 3,趕超OpenAI o1和Deepseek R1!-AI.x社區(qū)

Grok 3的“精簡(jiǎn)版”也不簡(jiǎn)單

除了Grok 3,xAI還推出了它的精簡(jiǎn)版——Grok-3 mini。雖然名字里帶了個(gè)“mini”,但它的表現(xiàn)一點(diǎn)也不“迷你”。在AIME 2025測(cè)試中,Grok-3 mini拿到了90分,幾乎和Grok 3持平。這意味著,即便是精簡(jiǎn)版,Grok-3 mini也能在復(fù)雜數(shù)學(xué)推理和計(jì)算效率方面表現(xiàn)出色。


AI領(lǐng)域的“新王”誕生! 馬斯克發(fā)布Grok 3,趕超OpenAI o1和Deepseek R1!-AI.x社區(qū)

越來(lái)越“卷”了

從Grok 1.5到Grok 3,xAI的進(jìn)步速度讓人驚嘆。而Grok 3的發(fā)布,無(wú)疑讓AI領(lǐng)域的競(jìng)爭(zhēng)更加白熱化。DeepSeek在過(guò)去幾個(gè)月里表現(xiàn)不俗,但在Grok 3面前,似乎還是稍遜一籌。這不禁讓人感慨:AI領(lǐng)域的“內(nèi)卷”,已經(jīng)卷到了一個(gè)新高度!


本文轉(zhuǎn)載自公眾號(hào)AI 博物院 作者:longyunfeigu

原文鏈接:??https://mp.weixin.qq.com/s/aW_55mvTVySUqvn1eRTHJw??


?著作權(quán)歸作者所有,如需轉(zhuǎn)載,請(qǐng)注明出處,否則將追究法律責(zé)任
收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦