何愷明帶隊(duì)馴服AI更懂物理!去噪方法+哈密頓網(wǎng)絡(luò),清華校友一作
不過(guò)半個(gè)月,何愷明又有新作了,這次的主題是:
去噪方法結(jié)合哈密頓神經(jīng)網(wǎng)絡(luò),讓AI更懂物理。
何愷明團(tuán)隊(duì)認(rèn)為,現(xiàn)有機(jī)器學(xué)習(xí)框架在處理物理問(wèn)題時(shí)存在以下局限:
- 主要關(guān)注局部時(shí)間關(guān)系,如預(yù)測(cè)下一個(gè)時(shí)間步長(zhǎng)的物理狀態(tài),而忽略了長(zhǎng)程和高層物理交互
- 主要聚焦于正向模擬,如根據(jù)初始條件預(yù)測(cè)系統(tǒng)的演變,而忽視了其他物理推理任務(wù)
受到生成圖像的擴(kuò)散模型啟發(fā),新框架去噪哈密頓網(wǎng)絡(luò)將哈密頓神力學(xué)運(yùn)算符推廣為通用的神經(jīng)運(yùn)算符,既遵循物理約束,又利用神經(jīng)網(wǎng)絡(luò)的靈活性和表現(xiàn)力,并在鐘擺等物理推理任務(wù)中展示了去噪哈密頓網(wǎng)絡(luò)的有效性和靈活性。
讓AI更懂物理,怎么做到的?
首先來(lái)介紹哈密頓力學(xué),將系統(tǒng)的演化通過(guò)相空間中的軌跡表示,其中的動(dòng)力學(xué)規(guī)律由哈密頓方程給出。
傳統(tǒng)的哈密頓神經(jīng)網(wǎng)絡(luò)(HNN)將哈密頓量視為由神經(jīng)網(wǎng)絡(luò)參數(shù)化的黑盒函數(shù),并通過(guò)優(yōu)化參數(shù)最小化損失函數(shù)。
但HNN在推理時(shí)卻受到挑戰(zhàn),由于確定新的系統(tǒng)狀態(tài)需要解決優(yōu)化問(wèn)題,當(dāng)可用數(shù)據(jù)由單個(gè)仿真軌跡組成而沒有額外的參考點(diǎn)時(shí),就會(huì)變得困難。
新的解決辦法是把優(yōu)化過(guò)程合并到網(wǎng)絡(luò)中,統(tǒng)一了每個(gè)時(shí)間步長(zhǎng)狀態(tài)優(yōu)化的去噪更新規(guī)則和跨時(shí)間步的哈密頓建模狀態(tài)關(guān)系。
首先,Block-wise哈密頓量設(shè)計(jì)將系統(tǒng)狀態(tài)按塊劃分和設(shè)置步長(zhǎng),建立起不同時(shí)間塊之間的聯(lián)系,可以觀察系統(tǒng)在不同時(shí)間尺度上的行為,超越了經(jīng)典HNN僅對(duì)相鄰時(shí)間步的建模局限。
由于期望Block-wise哈密頓量不僅能對(duì)跨時(shí)間步的狀態(tài)關(guān)系進(jìn)行建模,還能學(xué)習(xí)每個(gè)時(shí)間步的狀態(tài)優(yōu)化,以用于推理。
因此采用掩碼建模策略,在訓(xùn)練網(wǎng)絡(luò)時(shí),將部分輸入狀態(tài)掩碼掉。
具體操作上,向輸入狀態(tài)添加不同幅度的噪聲,而不是簡(jiǎn)單地掩碼掉輸入狀態(tài)。
通過(guò)設(shè)計(jì)不同的掩碼模式,可實(shí)現(xiàn)適應(yīng)不同任務(wù)的靈活推理策略:
- 自回歸掩碼:掩碼掉最后幾個(gè)狀態(tài),類似于物理模擬中的下一狀態(tài)預(yù)測(cè)的前向建模。在正向模擬任務(wù)中,訓(xùn)練時(shí)模型根據(jù)前面已知狀態(tài)預(yù)測(cè)被掩碼的后續(xù)狀態(tài),學(xué)習(xí)狀態(tài)隨時(shí)間的演變規(guī)律,推理時(shí)利用這些規(guī)律預(yù)測(cè)未來(lái)狀態(tài)。
- 超分辨率掩碼:掩碼掉中間的狀態(tài),可用于數(shù)據(jù)插值。在軌跡插值任務(wù)中,通過(guò)這種掩碼模式,模型學(xué)習(xí)根據(jù)周圍已知狀態(tài)來(lái)推斷中間被掩碼狀態(tài)的值,從而實(shí)現(xiàn)對(duì)稀疏軌跡的超分辨率處理。
- 任意順序掩碼:包括隨機(jī)掩碼,可根據(jù)任務(wù)需求自適應(yīng)設(shè)計(jì)掩碼模式,增強(qiáng)模型在不同場(chǎng)景下的適應(yīng)性。在表示學(xué)習(xí)任務(wù)中,隨機(jī)掩碼有助于模型學(xué)習(xí)到更魯棒的物理系統(tǒng)特征表示。
基于Block-wise哈密頓量構(gòu)建的神經(jīng)網(wǎng)絡(luò)基于僅解碼器Transformer。
總體是與GPT系列類似的架構(gòu),但沒有因果注意力掩碼,對(duì)每個(gè)軌跡使用潛空間編碼z作為哈密頓值輸出的查詢token,編碼每個(gè)狀態(tài)的噪聲標(biāo)度并添加到位置嵌入中。
該架構(gòu)不是依靠編碼器從軌跡數(shù)據(jù)中推斷全局潛空間編碼,而是采用自解碼器框架,為每個(gè)軌跡維護(hù)一個(gè)可學(xué)習(xí)的潛空間編碼z。
這種方法允許模型存儲(chǔ)和優(yōu)化特定于系統(tǒng)的嵌入,而無(wú)需單獨(dú)的編碼過(guò)程。
在訓(xùn)練過(guò)程中,共同優(yōu)化網(wǎng)絡(luò)權(quán)重和Codebook。訓(xùn)練后,給定一個(gè)新的軌跡凍結(jié)網(wǎng)絡(luò)權(quán)重,只優(yōu)化新軌跡的潛空間編碼。
在單擺和雙擺系統(tǒng)上進(jìn)行實(shí)驗(yàn),測(cè)試了去噪哈密頓網(wǎng)絡(luò)在正向模擬、表征學(xué)習(xí)和軌跡插值三個(gè)任務(wù)中的性能。
正向模擬實(shí)驗(yàn)中,噪哈密頓網(wǎng)絡(luò)比傳統(tǒng)哈密頓網(wǎng)絡(luò)在長(zhǎng)期預(yù)測(cè)中表現(xiàn)更優(yōu),顯示出更好的穩(wěn)定性和準(zhǔn)確性。
表征學(xué)習(xí)實(shí)驗(yàn)中,即使在輸入狀態(tài)存在噪聲和不完整的情況下,去噪哈密頓網(wǎng)絡(luò)也能恢復(fù)系統(tǒng)狀態(tài),在處理不完整或損壞的觀測(cè)數(shù)據(jù)時(shí)具有較強(qiáng)的魯棒性,能夠提取到物理系統(tǒng)的關(guān)鍵特征。
軌跡插值實(shí)驗(yàn)中,去噪哈密頓網(wǎng)絡(luò)即使在采樣非常稀疏的情況下也能保持較高的準(zhǔn)確性,與其他基準(zhǔn)模型相比能夠生成更平滑、更接近真實(shí)軌跡的預(yù)測(cè)結(jié)果,展示了其在處理稀疏數(shù)據(jù)方面的優(yōu)勢(shì)。
論文一作清華校友
這項(xiàng)研究由來(lái)自麻省理工學(xué)院、斯坦福大學(xué)、哈佛大學(xué)、布宜諾斯艾利斯大學(xué)、美國(guó)東北大學(xué)的研究人員聯(lián)合完成。
論文一經(jīng)公布,作者就激情當(dāng)起了自個(gè)兒的首批自來(lái)水(doge)。
一作Congyue Deng還在X上留下了幾個(gè)開放性問(wèn)題:
在深度學(xué)習(xí)中,如何定義物理推理?
什么是物理模擬?
神經(jīng)網(wǎng)絡(luò)應(yīng)具備哪些物理屬性?DHN并非終極解決方案,而只是一個(gè)開端 。
值得一提的是,Congyue Deng還是清華校友,2020年本科畢業(yè)于清華大學(xué)數(shù)學(xué)系,GPA(平均學(xué)分績(jī)點(diǎn))在114個(gè)人里面排第一。
現(xiàn)在她是斯坦福大學(xué)計(jì)算機(jī)科學(xué)系五年級(jí)博士生,師從Leonidas Guibas。(這篇論文的部分工作是Congyue Deng在麻省理工學(xué)院做訪問(wèn)生期間完成的)
今年9月起,她將成為麻省理工學(xué)院Tayebati博士后研究員,同時(shí)也是美國(guó)國(guó)家科學(xué)基金會(huì)(NSF)的人工智能和基礎(chǔ)相互作用研究院(IAIFI)研究員,與MIT大牛何愷明、Bill Freeman、Marin Solja?i?合作。
她的個(gè)人主頁(yè)介紹,研究興趣包括3D計(jì)算機(jī)視覺、幾何深度學(xué)習(xí)以及物理表示學(xué)習(xí)。
短期內(nèi),她專注于將幾何表示學(xué)習(xí)整合到生成模型中,以便更好地捕捉數(shù)據(jù)分布的低維流形結(jié)構(gòu),特別關(guān)注其在物理學(xué)和機(jī)器人領(lǐng)域的應(yīng)用。從長(zhǎng)遠(yuǎn)來(lái)看,她希望從數(shù)據(jù)中揭示幾何結(jié)構(gòu),為神經(jīng)網(wǎng)絡(luò)中歸納偏置的設(shè)計(jì)提供參考。
Congyue Deng還特別感謝了在論文中出鏡的貓貓,名叫Rell:
論文地址:https://arxiv.org/abs/2503.07596v1