Grok 3沖擊諾獎(jiǎng)級(jí)突破,成證明「黎曼猜想」關(guān)鍵!AI與數(shù)學(xué)家打出終極組合拳
困擾人類一個(gè)多世紀(jì)的「黎曼猜想」,如今可能正站在被破解的邊緣。
這周發(fā)布的Grok 3異軍突起,不僅橫掃各大排行榜,更將目光投向了這個(gè)「猜想界的皇冠」。
風(fēng)投機(jī)構(gòu)IBC Group創(chuàng)始人Mario Nawfal發(fā)文稱,破解黎曼猜想的競(jìng)賽正在升溫,而Grok 3可能正是關(guān)鍵所在!
究竟是什么原因,讓他敢于做出這樣一個(gè)判斷?
- 暴力計(jì)算:憑借足夠的計(jì)算能力和驗(yàn)證器,AI可以窮舉所有解法。
- 人工智能+人類合作 :AI輔助頂尖科學(xué)家,可能會(huì)帶來(lái)圖靈獎(jiǎng)、菲爾茲獎(jiǎng),甚至諾獎(jiǎng)級(jí)別的突破。
有了這雙重buff的加持,Grok估計(jì)什么時(shí)候可以解決這一世紀(jì)難題?根據(jù)馬斯克的預(yù)測(cè),「基于AI的進(jìn)展,可能將在兩年內(nèi)實(shí)現(xiàn)」。
在Mario看來(lái),雖然目前還沒(méi)有解決方案——但Grok 3正在逐步接近破解這個(gè)數(shù)學(xué)界最大的未解之謎之一!
網(wǎng)友對(duì)此激動(dòng)地表示,「暴力計(jì)算和人類洞察力的結(jié)合,簡(jiǎn)直是終極組合拳」。
甚至,還有人大膽預(yù)言,下一個(gè)諾獎(jiǎng)得主就是AI。
Grok 3對(duì)決黎曼猜想:突破即將到來(lái)?
在Grok 3還未橫空出世之前,曾被xAI工程師硬廣了一波。
去年11月,工程師Hieu Pham「爆料」稱,Grok 3證明了黎曼猜想。
為此,xAI不得不終止模型訓(xùn)練,以驗(yàn)證它的證明。他表示,如果結(jié)果是正確的,將會(huì)完全終止模型的訓(xùn)練。
之后,Hieu Pham發(fā)帖稱這只是自己的惡搞
要知道,黎曼猜想可是千禧年七大數(shù)學(xué)難題之一。
這一次,基于20萬(wàn)塊GPU訓(xùn)出的Grok 3,在數(shù)學(xué)基準(zhǔn)測(cè)試中AIME 2024上刷新SOTA,創(chuàng)下了52高分。mini版本性能幾乎與Claude 3.5 持平。
與此同時(shí),xAI團(tuán)隊(duì)專門針對(duì)最新AIME 2025基準(zhǔn),對(duì)Grok 3模型推理版本進(jìn)行了測(cè)試,更是創(chuàng)下了93分紀(jì)錄。
AI大神Karpathhy在Grok 3還未發(fā)布之前,曾拿到了灰度測(cè)試資格,讓其去證明黎曼猜想猜想。
他表示,相較于其他模型(如o1-pro、Claude、Gemini 2.0 Flash Thinking),只會(huì)簡(jiǎn)單表示——這是一個(gè)偉大的未解之謎,Grok 3非常有勇氣,會(huì)嘗試去解決問(wèn)題。
雖然沒(méi)有攻克,但是邁出了「嘗試」的重要一步。
正如Karpathhy所言,誰(shuí)知呢,總會(huì)有那么一天...
甚至,就連菲爾茲獎(jiǎng)得主陶哲軒大膽預(yù)測(cè),2026年,AI將與搜索和符號(hào)數(shù)學(xué)工具相結(jié)合,成為數(shù)學(xué)研究中值得信賴的合著者。
對(duì)此,有網(wǎng)友對(duì)于人工智能輔助破解數(shù)學(xué)謎題的前景感到興奮。
更有網(wǎng)友期待Grok 3將量子力學(xué)與相對(duì)論一起聯(lián)系起來(lái)。
「可能性是無(wú)限的」該網(wǎng)友評(píng)論道。
Grok 3全面領(lǐng)先!
Grok 3目前在聊天機(jī)器人競(jìng)技場(chǎng)(Chatbot Arena)上大幅領(lǐng)先,并且是長(zhǎng)期以來(lái)第一個(gè)在所有類別中都排名第一的模型。
這些排名是基于人類的盲測(cè)評(píng)估得出的。
對(duì)此,馬斯克表示,Grok位居第一,并持續(xù)改進(jìn)。
「這個(gè)結(jié)果是基于兩周前的Grok版本。自那時(shí)以來(lái)Grok有顯著改進(jìn)?!顾硎?。
網(wǎng)友Gavin Baker評(píng)論說(shuō),從2022年夏季到2024年春季,OpenAI曾大幅領(lǐng)先,隨后谷歌和Anthropic趕上了GPT-4的水平。
OpenAI能夠主導(dǎo)大約7個(gè)季度,這歸功于他們率先積極押注于預(yù)訓(xùn)練的傳統(tǒng)「Scaling Law」。然而,率先實(shí)現(xiàn)o1級(jí)別的推理僅僅使得OpenAI領(lǐng)先幾個(gè)月。
目前,Deepseek、谷歌和xAI與OpenAI大致處于同等水平。xAI甚至可以說(shuō)處于領(lǐng)先地位。
谷歌和xAI的基礎(chǔ)模型更優(yōu)秀,因此它們很可能很快就會(huì)徹底超越o3。因此,OpenAI迫切需要GPT-5,作為假定的o5推理模型的基礎(chǔ)。
奧特曼指出,OpenAI未來(lái)的領(lǐng)先優(yōu)勢(shì)將會(huì)縮小。微軟CEO納德拉也基本表示認(rèn)同,OpenAI在模型能力方面擁有巨大領(lǐng)先優(yōu)勢(shì)的時(shí)期即將結(jié)束。
網(wǎng)友Gavin表示,在他看來(lái),這就是為什么Nadell根據(jù)Theinformation的消息,選擇不為OpenAI 1600億美元的預(yù)訓(xùn)練提供資金的原因。相反,他希望通過(guò)為OpenAI提供推理服務(wù)來(lái)賺錢。
Google和xAI都擁有獨(dú)特且有價(jià)值的數(shù)據(jù)來(lái)源,這將使它們與Deepseek、OpenAI和Anthropic之間的差異越來(lái)越大。如果Meta在模型能力方面趕上來(lái),情況也是如此。
Gavin同時(shí)指出,無(wú)法獲得獨(dú)特、有價(jià)值數(shù)據(jù)的前沿模型是歷史上貶值最快的資產(chǎn)。模型蒸餾只會(huì)加劇這種情況。
Nadella在最近一次播客中說(shuō),數(shù)據(jù)中心建設(shè)過(guò)剩即將到來(lái),租用比購(gòu)買更好。甚至在某個(gè)時(shí)候,微軟可能會(huì)使用開源模型來(lái)驅(qū)動(dòng)CoPilot。
未來(lái)的前沿模型,如果無(wú)法獲得像YouTube、X、TeslaVision、Instagram和Facebook這樣獨(dú)特、有價(jià)值的數(shù)據(jù),可能無(wú)法獲得任何投資回報(bào) (ROI)。從這個(gè)角度來(lái)看,扎克伯格的策略似乎也更加合理。獨(dú)特的數(shù)據(jù)最終可能成為區(qū)分多萬(wàn)億或千萬(wàn)億參數(shù)模型預(yù)訓(xùn)練的唯一基礎(chǔ),也是獲得投資回報(bào)的唯一基礎(chǔ)。
如果這是正確的,那么只有2-3家公司會(huì)進(jìn)行前沿模型的預(yù)訓(xùn)練,我們只需要少數(shù)幾個(gè)巨型數(shù)據(jù)中心來(lái)構(gòu)建預(yù)訓(xùn)練所需的相干集群。
其余的人工智能計(jì)算將由較小的數(shù)據(jù)中心完成,這些數(shù)據(jù)中心在地理位置上進(jìn)行了優(yōu)化,以實(shí)現(xiàn)低延遲和/或具有成本效益的推理。具有成本效益的推理等于更便宜、質(zhì)量較低的電力(對(duì)核電的需求減少),在短期內(nèi)對(duì)液冷的需求減少等。
這與目前6-10家公司都在進(jìn)行前沿模型預(yù)訓(xùn)練的世界截然不同。
推理模型需要極高的計(jì)算量。測(cè)試時(shí)計(jì)算意味著計(jì)算能力本身就是智能。因此,在這種情況下,所需的計(jì)算量甚至可能比2023-2024年整個(gè)市場(chǎng)所預(yù)期的以「預(yù)訓(xùn)練」為中心的計(jì)算場(chǎng)景還要多。
但這將是一種截然不同的計(jì)算類型,如上所述。預(yù)訓(xùn)練和推理之間的比例將不再是50/50,而是5/95?;A(chǔ)設(shè)施的卓越性將至關(guān)重要。
對(duì)于網(wǎng)友Gavin Baker的這番分析,馬斯克也表示認(rèn)同。
「良好的分析」他評(píng)論道。
用戶離開ChatGPT轉(zhuǎn)向Grok
有網(wǎng)友在x發(fā)文稱,現(xiàn)在大量用戶正在在從ChatGPT轉(zhuǎn)向Grok,并配上了一段形象的視頻。
有網(wǎng)友調(diào)侃說(shuō),他妻子嫉妒Grok 3,因?yàn)樗鶪rok 3說(shuō)的話比跟他妻子還多。
對(duì)于大家紛紛轉(zhuǎn)向Grok這事兒,網(wǎng)友紛紛表示贊同。
什么是黎曼猜想?
黎曼猜想是一個(gè)數(shù)學(xué)領(lǐng)域里非常重要但至今沒(méi)有解決的問(wèn)題,它主要研究質(zhì)數(shù)的分布規(guī)律,以及一個(gè)叫黎曼zeta函數(shù)的數(shù)學(xué)工具跟質(zhì)數(shù)的關(guān)系。
質(zhì)數(shù)是那些大于1、只能被1和自己整除的數(shù)字,比如2、3、5、7、11、13等等。它們像是自然數(shù)的「積木」,因?yàn)槿魏我粋€(gè)自然數(shù)都可以拆成質(zhì)數(shù)的乘積,比如15 = 3 × 5。
質(zhì)數(shù)的出現(xiàn)看起來(lái)很隨機(jī),沒(méi)有簡(jiǎn)單的規(guī)律可循。
比如在1到10里有4個(gè)質(zhì)數(shù)(2、3、5、7),11到20里也有4個(gè)(11、13、17、19),但21到30里只有2個(gè)(23、29),數(shù)量分布不太好預(yù)測(cè)。
這讓研究質(zhì)數(shù)分布成了數(shù)學(xué)中一個(gè)大難題。
質(zhì)數(shù)的研究不只是數(shù)學(xué)家的興趣,它在現(xiàn)實(shí)生活中也很重要。比如,互聯(lián)網(wǎng)上的安全通信(像網(wǎng)上銀行、購(gòu)物)靠一種叫RSA的密碼系統(tǒng)保護(hù),而RSA的基礎(chǔ)就是利用大質(zhì)數(shù)的不可預(yù)測(cè)性。
什么是黎曼zeta函數(shù)
1859年,德國(guó)數(shù)學(xué)家伯恩哈德·黎曼(Bernhard Riemann)想出了一個(gè)研究質(zhì)數(shù)的新辦法,引入了一個(gè)叫黎曼zeta函數(shù)的東西,記作ζ(s)。
簡(jiǎn)單來(lái)說(shuō),zeta函數(shù)是一個(gè)無(wú)限加法公式:
這里的「s」是一個(gè)復(fù)數(shù),復(fù)數(shù)是一種特別的數(shù)字,比如s = a + bi(a是實(shí)部,b是虛部,i是虛數(shù)單位)。
這個(gè)函數(shù)的神奇之處在于,它跟質(zhì)數(shù)的分布有很深的聯(lián)系。
zeta函數(shù)的零點(diǎn)
零點(diǎn)就是讓?duì)?s)等于0的s值。研究發(fā)現(xiàn),這些零點(diǎn)分成兩類:
- 平凡零點(diǎn):這些零點(diǎn)出現(xiàn)在s = -2, -4, -6等負(fù)的偶數(shù)位置。它們比較容易找到,性質(zhì)也很明確。
- 非平凡零點(diǎn):這些零點(diǎn)的實(shí)部(a值)在0到1之間,而且虛部(b值)不是0。它們的位置很神秘,很難算出來(lái)。目前通過(guò)計(jì)算機(jī)檢查發(fā)現(xiàn),所有已知的非平凡零點(diǎn)的實(shí)部都是1/2,但這只是觀察結(jié)果,還沒(méi)有數(shù)學(xué)證明能確認(rèn)所有零點(diǎn)都這樣。
黎曼猜想到底在猜什么?
黎曼猜想的核心是:所有的非平凡零點(diǎn)的實(shí)部都等于1/2。
想象一下,把復(fù)數(shù)s = a + bi畫在平面上,橫軸是實(shí)部a,縱軸是虛部b。
黎曼猜想說(shuō),所有非平凡零點(diǎn)都會(huì)整整齊齊地排在實(shí)部a = 1/2這條豎線上。
如果這個(gè)猜想是真的,它能讓我們更清楚地知道質(zhì)數(shù)是怎么分布的。
比如,它能更精確地預(yù)測(cè)某個(gè)范圍內(nèi)有多少個(gè)質(zhì)數(shù)。這跟一個(gè)叫素?cái)?shù)定理的東西有關(guān),素?cái)?shù)定理告訴我們質(zhì)數(shù)的「大趨勢(shì)」,而黎曼猜想則能解釋趨勢(shì)里的「小起伏」。
打個(gè)比方,把質(zhì)數(shù)分布想象成一條河的流量,素?cái)?shù)定理像是告訴你河水平均每天流多少水;黎曼猜想則是幫你搞清楚為什么有些天水流多些,有些天少些。
這種對(duì)質(zhì)數(shù)的深入了解不只對(duì)數(shù)學(xué)家重要,還會(huì)影響像密碼學(xué)這樣的領(lǐng)域,因?yàn)槊艽a系統(tǒng)需要質(zhì)數(shù)盡量「隨機(jī)」。
為什么這么受關(guān)注?
黎曼猜想從1859年提出到現(xiàn)在,已經(jīng)160多年了,但還是沒(méi)人能證明它是對(duì)是錯(cuò)。
它被認(rèn)為是數(shù)學(xué)里最重要的問(wèn)題之一,出現(xiàn)在1900年希爾伯特提出的23個(gè)數(shù)學(xué)難題里(第8個(gè)問(wèn)題),也被2000年Clay數(shù)學(xué)研究所列為「千禧年七大難題」之一。
Clay研究所還懸賞100萬(wàn)美元,鼓勵(lì)全世界數(shù)學(xué)家來(lái)挑戰(zhàn)這個(gè)問(wèn)題?,F(xiàn)在,計(jì)算機(jī)已經(jīng)檢查了無(wú)數(shù)個(gè)非平凡零點(diǎn),發(fā)現(xiàn)它們的實(shí)部都是1/2,但這只是證據(jù),不是嚴(yán)格的數(shù)學(xué)證明。
一些數(shù)學(xué)家,比如Larry Guth和James Maynard,最近在這個(gè)問(wèn)題上有了一些新進(jìn)展,但離徹底解決還很遠(yuǎn)。
黎曼猜想不只是數(shù)學(xué)里的「腦洞」,它的研究還推動(dòng)了很多數(shù)學(xué)分支的發(fā)展,比如復(fù)分析和數(shù)論的結(jié)合。