AI破解50年未解數(shù)學難題!南大校友用OpenAI模型完成首個非平凡數(shù)學證明
就在剛剛,AI完成了首個非平凡研究數(shù)學證明!
完成這項研究的,是美國紐約布魯克海文國家實驗室凝聚態(tài)物理與材料科學分部的一位華人學者Weiguo Yin。
論文地址:https://arxiv.org/abs/2503.23758
在這項研究中,作者在一維J_1-J_2 q態(tài)Potts模型,通過引入最大對稱子空間(MSS)方法,對其精確求解。
具體來說,作者將q^2×q^2的傳遞矩陣進行塊對角化。
而q=3的情況,正是基于OpenAI的最新推理模型o3-mini-high來精確求解的。
在AI的幫助下,研究者成功證明,模型可以映射為一維q態(tài)Potts模型,其中J_2作為最近鄰相互作用,J_1則作為有效的磁場,這一結(jié)果擴展了之前在q=2,即Ising模型的證明。
注意,這個問題,在數(shù)學界有50年沒有解決。
論文引用了關(guān)于J_1?J_2伊辛模型(即q=2的Potts模型)的工作,這些工作可以追溯到1969年和1970年。
而o3-mini-high幫忙完成的這項證明,為眾多懸而未決的物理問題(層狀材料中原子或電子順序堆疊的問題,以及非常規(guī)超導體中常見的T_c-拱形相的形成等),提供了全新的見解。
AI模型在科學研究中的巨大潛力,也再一次被證實!
Weiguo于2004年加入布魯克海文國家實驗室擔任研究員,并于2006年晉升為助理物理學家,2008年晉升為副物理學家,2011年晉升為物理學家。
他的專長在于結(jié)合第一性原理、有效哈密頓量和機器學習方法,研究強關(guān)聯(lián)體系、挫敗磁性、超導性、多鐵性、混合的3d-5d化合物、拓撲材料和非平衡態(tài)。
1998年,他獲得南京大學的博士學位,并榮獲2000年國家優(yōu)秀博士學位論文獎。
五十年未解的數(shù)學難題,被AI解決了
在凝聚態(tài)物理、材料科學、量子信息學和微電子學等研究領域中,發(fā)現(xiàn)新的相和相變是一個核心挑戰(zhàn)。
挫敗磁體中存在許多不尋常的相,這些磁體通常用伊辛模型(Ising model)或量子海森堡模型(quantum Heisenberg model)來描述。
統(tǒng)計力學的第三個基本模型是q狀態(tài)Potts模型。
它是伊辛模型(q=2)的推廣,可以作為研究從離散(伊辛)對稱性到連續(xù)(海森堡)對稱性轉(zhuǎn)變的有效中介。
特別是,一維J_1-J_2 Potts模型可能與眾多問題相關(guān),這些問題涵蓋了從層狀材料中原子或電子有序的面外堆疊,如1T-TaS_2 中的「大衛(wèi)之星」電荷密度波,到每個時間步都有多種選擇的時間序列問題,如乒乓球訓練設計。
1T-TaS2中的「大衛(wèi)之星」電荷密度波相關(guān)論文插圖
一維J_1-J_2 Potts模型
盡管一維和二維的J_1-J_2伊辛模型和海森堡模型已被廣泛研究,但只有一維J_1-J_2伊辛模型通過轉(zhuǎn)移矩陣法得到了精確解。
對于一維J_1-J_2 Potts模型,至今仍沒有精確的解析解。
因為當q=3時,該模型已經(jīng)展現(xiàn)出與q=2(即伊辛模型)不同的基態(tài)相行為(見下圖),因此精確求解任意q的模型具有基礎性的重要性。
伊辛模型:不同的基態(tài)相行為
挑戰(zhàn)在于轉(zhuǎn)移矩陣的階數(shù)迅速增加,階數(shù)為q^2。
可想而知,q=3時的9×9矩陣已經(jīng)很難進行解析求解,而q=10^10時的10^10×10^10矩陣,即使是數(shù)值計算也無能為力。
先前的研究將任務轉(zhuǎn)化為數(shù)值計算有效的q×q矩陣,采用整數(shù)q形式的轉(zhuǎn)移矩陣法,或連續(xù)q形式的轉(zhuǎn)移矩陣。
盡管物理學的透明度較低,但仍然無法得到精確的解析結(jié)果。
因此,對于一維J_1-J_2 Potts模型,至今仍然缺乏其中豐富相行為的直觀理解。
OpenAI o3-mini的創(chuàng)舉:非平凡證明
最近的兩個發(fā)展為這一長期未解問題提供了新的視角。
第一個發(fā)展是通過基于對稱性的塊對角化,將裝飾伊辛梯形的4×4轉(zhuǎn)移矩陣簡化為有效的2×2矩陣。
這些發(fā)現(xiàn)為一維挫敗Potts模型找到精確解,可能成為這一重要新方向的里程碑。
第二個發(fā)展是OpenAI最新的推理模型o3-mini-high,推導出了一個優(yōu)雅的方程,在外部磁場下,可以確定裝飾伊辛模型中UNPC的臨界溫度。
論文鏈接:https://arxiv.org/abs/2502.11270
因此,作者受到啟發(fā),逐步提示AI推理模型,去處理整數(shù)q形式的轉(zhuǎn)移矩陣。
盡管AI的回答中有不少錯誤,針對q=3的情況,最終找到了一種基于對稱性的塊對角化方法,可以將一維J_1-J_2三狀態(tài)Potts模型的9×9轉(zhuǎn)移矩陣解析地簡化為有效的2×2矩陣。
對于一般的q,關(guān)鍵的對稱性是q個Potts狀態(tài)的全排列對稱性。
換句話說,哈密頓量(因此在整數(shù)q形式中的轉(zhuǎn)移矩陣)在任何對標簽{1,2,3,...,q}的排列下都是不變的;它的對稱群是Sq。
雖然AI未能進一步推進,但警告說隨著q的增大,排列的數(shù)量急劇增加。
然而,q=2和q=3的精確結(jié)果,特別是兩者都歸結(jié)為2×2矩陣,啟發(fā)了作者:
由于在熱力學極限下只有轉(zhuǎn)移矩陣的最大特征值(λ)才重要,因此任務簡化為識別包含λ的對稱分離子空間。
隨后,作者發(fā)現(xiàn)這個子空間由兩個最大對稱向量張成,因為所有轉(zhuǎn)移矩陣元素都是正的,這使得最終得到了一個解析的2×2矩陣。
因此,任意q的一維J_1-J_2 Potts模型的精確解,就這樣被找到了,而且過程出奇的簡單!
o3-mini-high具體起了什么作用
下面我們就來看看,o3-mini-high是如何在這項研究中推導出關(guān)鍵方程,對q=3的情況精確求解,從而確定了裝飾伊辛模型中UNPC的臨界溫度的。
首先,o3-mini-high證明,根據(jù)其知識,1D J_1-J_2 Potts模型尚未被精確求解。
接著,模型被提示使用1D J_1-J_2三態(tài)Potts模型的之字形梯形版本。
在這種情況下,AI正確地給出了以下哈密頓量表達式:
隨后,AI正確地生成了以下傳遞矩陣的表達式。
其中,(a, b)是由一對自旋組成的「梯級」狀態(tài),(a', b')是鄰近梯級狀態(tài)。
假設一組梯級狀態(tài)按以下順序排列:(1, 1), (1, 2), (1, 3), (2, 1), (2, 2), (2, 3), (3, 1), (3, 2), (3, 3)。
若使用簡寫符號,則傳遞矩陣可以明確地表達為如下形式。
對于上面這個T'矩陣,AI被提示說,一定要確保,從而糾正它的錯誤,并且識別出S_3的對稱群。
然后,AI被提示將T'進行塊對角化。
它發(fā)現(xiàn),T'可以通過變換下列這個矩陣來進行塊對角化,從而得到。
因此,得到的塊對角化傳遞矩陣的前2×2塊由
給出,其較大的特征值是λ,即傳遞矩陣T'的最大特征值。
最后,AI被提示生成上述對話的原生Wolfram Mathematica 14.2代碼。
這個任務在幾秒鐘內(nèi)就完成了,幾乎不需要修正。
然而,AI卻未能生成適用于一般q的可用Mathematica代碼。
相反,它警告說,隨著q的增加,S_q對稱群中的排列數(shù)會急劇增加。
當被進一步要求時,AI創(chuàng)建了一些假Mathematica函數(shù),并表示「這些函數(shù)可能值得實現(xiàn)」。
五十年數(shù)學難題的精確解
考慮以下哈密頓量[圖1(a)]:
為了構(gòu)建轉(zhuǎn)移矩陣,研究者使用了重疊對的形式化方法來處理方程(1),每個單位格有一個自旋,得到轉(zhuǎn)移矩陣T。
同時使用該模型的等效鋸齒梯形表示,其中每個單位格有兩個自旋來獲得T′。
而且要滿足T′=T^2。
在熱力學極限N→∞時,配分函數(shù)為
其中λ是轉(zhuǎn)移矩陣T的最大特征值。
每個自旋的自由能由下式給出:
其中,β=1/(k_BT),T是絕對溫度,k_B是玻爾茲曼常數(shù)。
由此得到的變換矩陣是一個q^2×2矩陣,它將q^2×q轉(zhuǎn)移矩陣T投影到與其余部分解耦的2×2塊矩陣T_2,并且該矩陣由于不同的對稱性,得到如下方程4:
需要注意的是,最大對稱子空間意味著u、v和w的表達式可以通過組合分析直接得到。
轉(zhuǎn)移矩陣T的最大特征值是T_2的較大特征值,為
方程(4)的簡潔性為理解一維J_1-J_2 Potts模型中的豐富相行為提供了直觀的視角。
圖1:(a)單鏈J_1?J_2 Potts模型的示意圖和(b)其等效的鋸齒梯形表示。圖中的小球代表具有q個狀態(tài)的自旋。橙色的鍵表示最近鄰相互作用J_1,綠色的鍵表示次近鄰相互作用J_2
Potts模型的歷史性進展
為了深入理解這些豐富的相圖,首先分析基態(tài)的相行為。
在T=0時,對于所有q值,一維J_1-J_2 Potts模型有三個相,這些相由兩個臨界點(CPs)分開,這些臨界點由方程(4)中u、w、v的相對大小決定。
對于q=2(即伊辛模型),與q≥3情況有兩個方面的不同:
(1)q=2的兩個臨界點是對稱相關(guān)的,位于J_1=±2,而對于q≥3,它們位于J_1=0和J_1=2。
(2)對于q=2,三個相沒有宏觀的簡并性,而對于q≥3,存在一個或兩個具有殘余熵的非平凡狀態(tài)。
圖3總結(jié)了左側(cè)和中間相以及兩個臨界點(CPs)殘余熵的q依賴關(guān)系。
對于小的q,臨界點的殘余熵(虛線)明顯大于相鄰相的殘余熵(實線)。
因此,每個臨界點在J_1?T相圖中隨著溫度升高發(fā)展出V形區(qū)域(圖2左,q=2,3,4)。
兩個臨界點的V形區(qū)域匯聚在一起,形成一個類似T_c圓頂?shù)膮^(qū)域,代表q≥3的中間隨機二聚化相。
當系統(tǒng)靠近臨界點時,它并不遵循常規(guī)的現(xiàn)象——即轉(zhuǎn)變到具有更高宏觀簡并性的相,而是轉(zhuǎn)變到臨界點發(fā)展的V形區(qū)域,這也在熵的T曲線中表現(xiàn)為平坦區(qū)域(圖2右q=2,3,4),此時熵值等于對應臨界點的殘余熵。
圖2:q=2,3,4和10^6的相圖
圖2左:在J_1?T平面上,歸一化熵2S(J_1,T)/ln(q)的密度圖。
圖2右:在臨界點附近,選定J_1值的2S(J_1,T)/ln(q)的溫度依賴性。?J_2=1被設定為能量單位。
另一方面,圖3顯示,對于大的q,臨界點的殘余熵(虛線)趨近于其相鄰相的殘余熵(實線),最終變得無法區(qū)分——不再有V形的臨界點區(qū)域(圖2左,q=10^6)。
圖3:對于q≥3,在J_1的四個不同區(qū)域下,零溫度歸一化熵2S(J_1,0)/ln?q的依賴關(guān)系
當系統(tǒng)靠近相邊界時,它似乎遵循常規(guī)的現(xiàn)象,即轉(zhuǎn)變到具有更高宏觀簡并性的相。
特別是,當J_1>2時,低溫鐵磁相將經(jīng)歷一個兩步的相交叉:首先轉(zhuǎn)變到中間的隨機二聚化相,然后轉(zhuǎn)變到左側(cè)的順磁相。
Tc圓頂是非常規(guī)超導性(如銅氧化物、鐵基超導體、扭曲雙層石墨烯等)中的一個關(guān)鍵現(xiàn)象。
它已被解釋為(i)一種預形成的有序狀態(tài),隨著相位相干性的逐漸建立,或(ii)兩種競爭相的結(jié)果。
目前通過q依賴性出現(xiàn)和消失的類似圓頂?shù)慕Y(jié)構(gòu),這一結(jié)構(gòu)由相的兩個臨界點的殘余熵的相對強度控制,為形成圓頂形相提供了另一種可能性。
AI輔助科學研究,潛力巨大
總而言之,用簡單的話概括就是,一維J_1-J_2 q狀態(tài)Potts模型得到了精確解,其中的關(guān)鍵在于發(fā)現(xiàn)q^2×q^2轉(zhuǎn)移矩陣的最大特征值位于一個2×2的最大對稱子空間。
而且維J_1-J_2 q狀態(tài)Potts模型被證明與一維q狀態(tài)Potts模型等價,其中J_2充當最近鄰(NN)相互作用,J_1充當磁場。
模型的基態(tài)被發(fā)現(xiàn)包含三個相,這些相由兩個臨界點分開,對于所有q值均如此。
兩個臨界點的殘余熵的相對強度,隨著q變大而變大。
對于小q和大q出現(xiàn)和消失的類似圓頂?shù)碾S機二聚化相,新研究提供了一種新的形成圓頂形相的機制。
而這項研究之所以能完成,都是基于o3-mini-high精確解決了q=3的情況。
這也提示我們,AI提供的廣泛信息中,能給研究者提供充分的洞察和激勵,盡管它的結(jié)論可能并不完美。
就在最近,諾獎得主、GoogleDeepMind CEO Demis Hassabis 評論AlphaFold時這樣表示:通過AI,人類現(xiàn)在可以在一年內(nèi)完成10億年的博士研究時間。
可以想見,未來AI輔助做出的科研突破還將層出不窮。