自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓

鴻蒙開發(fā)者社區(qū)

WOT技術大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設置退出

Grok 3證明黎曼猜想，訓練遭災難性事件？數(shù)學家稱不夸張，兩年內(nèi)AI將解出千禧年難題

作者：新智元 2024-11-18 14:10:00

人工智能新聞

最近，大家都被這條消息嚇到了：傳說Grok 3已經(jīng)成功證明出黎曼猜想？！雖然這是在玩梗，但還是讓我們來仔細剖析下，目前的AI距離千禧年數(shù)學難題，究竟還有多遠。

黎曼猜想，竟被Grok 3「證明」了？

為此，xAI暫停了Grok 3的訓練來驗證它的證明，如果結果是正確的，將會完全終止模型的訓練。

xAI工程師Hieu Pham在社交媒體的最新「爆料」，成為AI圈最火爆的話題。

要知道，黎曼猜想是千禧年七大數(shù)學難題之一，被譽為「猜想界的皇冠」。

2000年，黎曼猜想被美國克雷數(shù)學研究所（Clay Mathematics Institute of Cambridge，CMI）指定為「七大千禧年難題之一」

由于信息量太大，網(wǎng)友們直接被整懵了，分不清這是真的還是在玩?！?/span>

幾個小時之后，在Pham另一個帖子中，證明了這只是自己的調(diào)侃。

惡搞的起因是，一位網(wǎng)友Andrew Curran最先「爆料」，傳言稱Grok3在訓練時發(fā)生了災難性事件。

明眼的網(wǎng)友很快便質(zhì)疑道：LLM訓練怎么會出現(xiàn)災難性事件？

即便是出現(xiàn)loss激增，也只需要回到上一個Checkpoint，調(diào)整一下，就可以接著訓了。

除非是服務器全燒了，數(shù)據(jù)全都不剩了……

眼瞧著消息越傳越廣，xAI聯(lián)創(chuàng)Greg Yang坐不住了。

對此，他用諷刺的語氣調(diào)侃道：「對對對，Grok 3訓著訓著突然開始攻擊辦公室的保安了?！?/span>

另一位研究人員Heinrich Kuttler也接梗道：「對對對，情況非常糟糕！我們后來用nan（Not a Number，非數(shù)）把所有壞的權重都替換了一遍，才恢復?！?/span>

網(wǎng)友見狀，也跟著玩起了梗。

要攻克黎曼猜想，還差些什么？

言歸正傳，讓我們來仔細看一下，目前人類離攻克黎曼猜想還差幾步。

如今，「黎曼猜想」就像是一座巍峨的高峰，165年來從未有人成功攀上。

它就像大海中的燈塔，為數(shù)學領域的發(fā)展指明方向：很多數(shù)論和復變函數(shù)領域的工作都基于黎曼猜想為真這個前提，因此一旦證明了黎曼猜想，許多其他工作也會得到完整的證明。

黎曼猜想起源于德國數(shù)學家高斯，他給出了一個公式，能夠近似地預測出任意數(shù)字的素數(shù)個數(shù)。

在1859年，德國數(shù)學家波恩哈德·黎曼改進了高斯的公式，用涉及復變量函數(shù)演算的方法，得出一個原創(chuàng)公式。

這就是赫赫有名的「黎曼猜想」。

根據(jù)公式，能夠畫出無窮多個點。黎曼猜測，這些點有一定的排列規(guī)律，一部分在一條橫線上，另一部分則在一條豎線上，所有點都在兩條直線上排列，無一例外。

黎曼ζ函數(shù)可視化

理論上，無法證明是否所有的點都在這兩條線上，但是，只要有一個點不在，就能推翻黎曼猜想！

現(xiàn)在，數(shù)學家們已經(jīng)用計算機驗證了最初的15億個點，全部符合黎曼猜想。

2022年，張益唐發(fā)表111頁論文，宣布本質(zhì)上已證明朗道-西格爾零點問題——廣義黎曼猜想的一種特殊且弱得多的形式。

雖然是一個弱一點的形式，但本質(zhì)上已經(jīng)是解決了朗道—西格爾零點問題。

用他的話說就是，關于零點猜想問題，「大海里的針我沒撈到, 但海底地貌我探得差不多了」。

論文鏈接：https://arxiv.org/abs/2211.02515

2024年，陶哲軒力推MIT數(shù)學教授Larry Guth和牛津大學菲爾茲獎得主James Maynard的一篇新論文，認為兩人在證明黎曼猜想方面取得了重大突破。

過程中，他們犧牲了一枚棄子，情況雖然變得更棘手，卻反而離答案更近了。

論文地址：https://arxiv.org/abs/2405.20552

當然，盡管我們離完全解決這一猜想還很遙遠。

AI的數(shù)學能力，到底什么水平？

這么說起來，目前的AI是否真的有證明黎曼猜想的能力呢？

我們可以來看看，爆火全網(wǎng)的AI證明工具AlphaProof，是如何做出IMO 2024的三道題的。

從某種角度來說，IMO數(shù)學競賽題跟「猜想界的皇冠」黎曼猜想距離有多遠，那離AI證明黎曼猜想也就有多遠。

谷歌DeepMind研究人員，AlphaProof負責人Rishi Mehta最新博客中，介紹了AlphaProof在IMO中的最新表現(xiàn)。

4個月前，谷歌DeepMind團隊發(fā)布了兩個數(shù)學推理新模型AlphaProof和AlphaGeometry 2。

前者在破解IMO 2024六道競賽試題中，做對了其中4道，而且每道題拿下了滿分，相當于銀牌選手水平（28分）。

而在最新進展文章中，Mehta揭示了AlphaProof在IMO 2024解題中最酷的想法。

在證明過程中，AlphaProof會使用到Lean 生成證明，并且每個Lean證明由一系列策略組成。

因此，Mehta將挑選出對應于這些想法的策略，針對AlphaProof解決的第 1、2和6題進行分析。

問題 1

問題

確定所有實數(shù)α，使得對于每一個正整數(shù)n，整數(shù)?α?+?2α?+?+?nα?是n的倍數(shù)。（注意，?z?表示小于或等于z的最大整數(shù)。例如，??π?=?4 和?2?=?2.9?=2。）

解答

答案是所有偶整數(shù)。

需要注意的是，AlphaProof解決這些問題的方式是，提出許多解答候選者，嘗試證明和反駁每一個，最終僅為正確答案找到證明。

這里看到的證明是，證明答案是偶整數(shù)集的那個。

證明偶整數(shù)滿足給定性質(zhì)顯而易見，而這個證明的難點在于，證明除了偶整數(shù)之外沒有其他α能夠滿足它。

AlphaProof以一種有趣（盡管復雜）的方式做到這一點：

它首先設定一個整數(shù)?，使得 2?=?α?+?2α?。這是成立的，因為通過將n=2代入給定性質(zhì)，便可知道右側是偶數(shù)。

existsλx L=>(L 2 two_pos).rec λl Y=>?_

L 2是在n=2的情況下使用給定性質(zhì)。此外，AlphaProof經(jīng)常將幾個策略組合在一行中。一個更易理解的版本是：

constructor· intro x Lobtain ?l, Y? := L 2 (by exact two_pos)

注意，我們還將α重命名為x。接下來，它聲稱（并繼續(xù)證明）對于所有自然數(shù) n，?(n+1)α?=?α?+2n(???α?) ……（1）.

suffices: ? (n : ?),?(n+1)*x? =? x?+2 * ↑ (n : ?) * (l-(?(x)?))

從中，它能夠得到α=2(???α?)。

use(l-?x?)*2

這必須是一個偶整數(shù)（因為它是一個整數(shù)乘以 2）。

它證明這些事情的方式涉及一些相當復雜的簡化。但設置（1）中的聲明是使其余證明成立的令人印象深刻的一步。

Mehta稱，對我來說，這一聲明的動機相當不直觀，而事實上一切都能奏效幾乎是神奇的。

AlphaProof的完整解決方案如下：

問題 2

問題

找到所有滿足條件的正整數(shù)對(a,b)，使得存在正整數(shù)g和N，使得gcd(an+b,bn+a)=g對于所有整數(shù)n≥N成立。

解答

AlphaProof正確給出 (1,1) 是唯一的解。

為了證明沒有其他解可以成立，它要求我們考慮數(shù)ab+1。它聲稱（并隨后證明）ab+1必須整除g。

suffices:b.1*b.2+1∣Y

需要注意的是，AlphaProof決定將對 (a,b) 重命名為b，以便它必須將元素引用為b.1和b.2。出于某種原因，它還選擇將變量g重命名為 Y。

現(xiàn)在，選擇n=N?(ab+1)，可以得到(ab+1)∣(aN?(ab+1)+b) 和 (ab+1)∣(bN?(ab+1)+a)。

由于ab+1與a和b互質(zhì)，因此可以應用歐拉定理，即

a?(ab+1)≡1(modab+1)

b?(ab+1)≡1(modab+1)

所以有ab+1∣1+b和ab+1∣1+a，由此可以得出a=b=1。

這一策略緊密地遵循了人類對此問題的證明。選擇考慮ab+1是構建證明的巧妙想法。

AlphaProof 的完整解決方案如下：

問題 6

問題

設Q是所有有理數(shù)的集合。一個函數(shù)f:Q→Q被稱為aquaesulian函數(shù)，如果對于每個x,y∈Q，滿足以下性質(zhì)：f(x+f(y))=f(x)+y或f(f(x)+y)=x+f(y)。

證明存在一個整數(shù)c，使得對于任何aquaesulian函數(shù)f，形式為f(r)+f(?r)的有理數(shù)最多有c個不同的值，并找出c的最小可能值。

解答

AlphaProof求解答案為c=2，證明過程分為兩部分。

首先，它通過證明f(r)+f(?r)只能是0或某個單一的其他值來證明c≤2。這部分證明相當復雜，并巧妙地利用了給定的aquaesulian性質(zhì)。

完成這一步后，c可以是1或2。

為了證明 c=2，AlphaProof提出了一個aquaesulian函數(shù) f(x)=?x+2?x?，使得 f(r)+f(?r)取兩個不同的值。

specialize V $ λ N=>-N+2 *Int.ceil N

然后它展示了f(?1)+f(1)=0和f(1/2)+f(?1/2)=2，這給出了需要的兩個不同的值。

use Finset.one_lt_card.2$ by exists@0,V.1.mem_toFinset.2 (by exists-1),2,V.1.mem_toFinset.2 (by exists 1/2)

再次，很多內(nèi)容被壓縮到一行中，但通過exists -1和 exists 1/2展示了兩個不同的值。

這是一個值得注意的函數(shù)構造，而且相當難以找到！在509名參與者中只有5人解決了 P6，值得注意的是Tim Gowers在評審這個解決方案時也嘗試了一下，但沒有找到一個能給出兩個不同值的函數(shù)。

畢竟，IMO 2024第六題被稱為「終極boss」，可不是那么輕易就解決掉的。

AlphaProof的完整解決方案如下：

AI距離千禧年難題，還有多遠？

關于AI究竟能做什么程度的數(shù)學題，網(wǎng)友們也就此展開了討論。

很多人認為，數(shù)學將是AI最先突破的領域之一，因為存在一個可用的既便宜又快速的反饋循環(huán)。

數(shù)學具有這樣的特性：你可以以很少的成本，100%去驗證你所做的事是否正確。

而相對于Lean之類的數(shù)學證明工具來說，AI驗證實驗的成本（時間、精力、金錢、安全）都要高出許多數(shù)量級。

有網(wǎng)友腦洞大開預測道：數(shù)學前沿運動的加速，值得人類建更多發(fā)電站！

不過，有一名數(shù)學家卻在評論區(qū)現(xiàn)身說法，認為并不值得用AI這么做。

在他看來，計算時間/成本與問題復雜性之間的權衡，值得嚴肅考慮。

理論上講，用形式語言找到證明是一件很輕松的事，因為只需一直搜索可能的證明，直到找到所需陳述結尾的證明就可以了。

計算的并行化程度如何，硬件能力有多大，AI工具對于數(shù)學問題的優(yōu)化程度如何，都會決定AI用多長時間把證明做出來。

但要說專門建數(shù)據(jù)中心和發(fā)電站，把大量能源用于做數(shù)學題，他覺得沒有必要——因為這并不是為了數(shù)學界的利益，而是硅谷大廠們自己的愿景。

不過如果進一步設想，現(xiàn)在的Alphaproof如果變成具有天文數(shù)字計算資源的定理證明器，我們或許有一天就可以證明「P/NP問題」。

因為，任何可證明的定理，都可以通過耐心地使用窮舉法，列舉所有可能的證明來找到。

如果存在一個有限的、格式良好的公式，該公式具有該定理作為結果，那么該定理就可以根據(jù)定義證明。

而如果說LLM有什么用處，那就是尋找出令人驚訝的聯(lián)系，以人類搜索之外的方式，應用現(xiàn)有工具。

AI通過幫助人類解決引理、檢查錯誤、形式化證明，來加速數(shù)學研究，在肉眼可見的未來幾年內(nèi)，即將成為現(xiàn)實。

而在去年，微軟亞洲研究院、北大、北航等機構的研究人員，就已經(jīng)通過97個回合的「蘇格拉底式」嚴格推理，成功讓GPT-4得出了「P≠NP」的結論。

而這97輪對話，可以說構建出了一個極難的NP完全問題，其中一些實例在時間復雜度低于O(2^n)（即窮舉搜索）的情況下是不可解的，也就是說，證明結論為P≠NP。

論文地址：https://arxiv.org/abs/2309.05689

當然，這個證明過程并不嚴謹，作者用一個假設（假定任意CSP問題的精確算法都有一個等價的分治算法），繞過了P≠NP問題的難點。

其實，像Christian Szegedy這樣的AI專家已經(jīng)做過此類預測：到2026年底，AI將成為「超人數(shù)學家」，解決出黎曼猜想等問題。

離AI解決P/NP問題、黎曼猜想這樣的的千禧年難題，還會有多遠呢？

馬斯克曾許諾，用10萬塊H100訓練的Grok 3將在年底發(fā)布，應該會令人驚嘆。

而如今，這個規(guī)模已經(jīng)擴展到了20萬臺，再給一點時間，說不定Grok 3真能出奇跡。

責任編輯：張燕妮來源：新智元

51CTO技術棧公眾號

業(yè)務
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學堂精培企業(yè)培訓 CTO訓練營