谷歌AI天氣「神算」登Nature:30秒模擬22天天氣,效率暴漲10萬倍!
今天一早,谷歌CEO劈柴在X上發(fā)布帖子,宣告NeuralGCM在氣候建模領(lǐng)域取得了重大突破!
「NeuralGCM將基于物理的建模與人工智能相結(jié)合,在模擬大氣方面的效率比其他模型高出10萬倍,為科學(xué)家提供了預(yù)測氣候變化的新工具?!?/span>
這項(xiàng)研究成果也被刊登在了Nature上,研究團(tuán)隊(duì)大部分來自Google Research和DeepMind,還有MIT、哈佛和ECMWF的科學(xué)家。
論文地址:https://www.nature.com/articles/s41586-024-07744-y
谷歌開發(fā)的這個(gè)名為NeuralGCM的模型,能夠快速、高效且準(zhǔn)確地模擬地球大氣。
其意義在于,在地球正以前所未有的速度變暖的當(dāng)下,幫助科學(xué)家對(duì)地球氣候做出準(zhǔn)確的預(yù)測——
全球氣溫升高會(huì)使哪些地區(qū)面臨長期干旱?哪些地方會(huì)因大型熱帶風(fēng)暴而使沿海洪水更加頻繁?隨著氣溫上升,野火季節(jié)將如何變化?
面對(duì)這些亟待解決的問題,傳統(tǒng)的基于物理的大氣環(huán)流模型(General Circulation Model,GCM)顯得有些捉襟見肘,GCM在面對(duì)長期天氣和氣候模擬時(shí),缺乏足夠的穩(wěn)定性。
而NeuralGCM是一種基于機(jī)器學(xué)習(xí)的方法,結(jié)合了傳統(tǒng)的物理建模,大大提高了模擬的準(zhǔn)確性和效率。
這種方法生成的2-15天的天氣預(yù)報(bào)比目前最先進(jìn)的物理模型更準(zhǔn)確,并且比傳統(tǒng)的大氣模型更準(zhǔn)確地再現(xiàn)了過去40年的氣溫。
它標(biāo)志著在開發(fā)更強(qiáng)大、更易使用的氣候模型方面邁出了重要一步。
NeuralGCM模擬了2019年12月26日至2020年1月8日期間的特定濕度(specific humidity)變化模式
NeuralGCM變革氣候建模
盡管傳統(tǒng)氣候模型在過去幾十年中有所改進(jìn),但由于科學(xué)家對(duì)地球氣候運(yùn)行機(jī)制和模型構(gòu)建方式的理解不完全,它們往往會(huì)產(chǎn)生誤差和偏差。
這些模型將地球從地表到大氣層的這部分空間,劃分成邊長為50-100公里的立方體,然后預(yù)測每個(gè)立方體在一段時(shí)間內(nèi)的天氣變化。
然后,模型根據(jù)公認(rèn)的物理定律計(jì)算空氣和水分的運(yùn)動(dòng),這也就是天氣預(yù)報(bào)的基本原理。
但問題在于,50-100公里這個(gè)尺度實(shí)在是太大了。
許多重要的氣候過程,包括云和降水,在比當(dāng)前模型使用的立方體尺寸更小的尺度上變化(毫米到公里)。
而且,科學(xué)家們對(duì)某些過程(如云的形成)的物理理解也不完整。
因此,這些傳統(tǒng)模型不僅依賴于基本原理,還使用簡化模型生成稱為「參數(shù)化」的近似值來模擬小尺度和不太了解的過程。
這些簡化的近似值不可避免地降低了基于物理的氣候模型的準(zhǔn)確性。
那么,NeuralGCM是怎么解決這一難題的呢?
像傳統(tǒng)模型一樣,NeuralGCM仍然將地球大氣劃分為立方體,并對(duì)大規(guī)模過程(如空氣和水分運(yùn)動(dòng))的物理進(jìn)行計(jì)算。
不同的是,NeuralGCM不再依賴科學(xué)家制定的「參數(shù)化」近似值來模擬小尺度天氣變化,而是使用神經(jīng)網(wǎng)絡(luò)從現(xiàn)有天氣數(shù)據(jù)中學(xué)習(xí)這些事件的物理原理。
NeuralGCM的一個(gè)關(guān)鍵創(chuàng)新,是用JAX從頭重寫了大規(guī)模過程的數(shù)值求解器。
這使得研究人員能夠使用基于梯度的優(yōu)化,來在線調(diào)整耦合系統(tǒng)在多個(gè)時(shí)間步長上的「在線」行為。
相比之下,之前嘗試使用機(jī)器學(xué)習(xí)增強(qiáng)氣候模型的努力在數(shù)值穩(wěn)定性方面遇到了很大困難,因?yàn)樗鼈兪褂谩鸽x線」訓(xùn)練,忽略了隨著時(shí)間積累的小尺度和大尺度過程之間的重要反饋。
將整個(gè)模型用JAX編寫的另一個(gè)好處是它可以在TPU和GPU上高效運(yùn)行,而傳統(tǒng)的氣候模型大多在CPU上運(yùn)行。
NeuralGCM結(jié)合了傳統(tǒng)的流體動(dòng)力學(xué)求解器和用于小尺度物理的神經(jīng)網(wǎng)絡(luò),這些組件通過一個(gè)微分方程求解器組合在一起,使系統(tǒng)按時(shí)間順序推進(jìn)
谷歌團(tuán)隊(duì)使用了1979年至2019年間ECMWF的天氣數(shù)據(jù),在0.7°、1.4°和2.8°分辨率下訓(xùn)練了一系列NeuralGCM模型。
雖然NeuralGCM是基于天氣預(yù)報(bào)數(shù)據(jù)訓(xùn)練的,但團(tuán)隊(duì)設(shè)計(jì)NeuralGCM為一個(gè)通用的大氣模型。
精準(zhǔn)的天氣預(yù)報(bào)和氣候預(yù)測
最近的地球大氣機(jī)器學(xué)習(xí)(ML)模型,包括Google DeepMind的GraphCast,已經(jīng)在天氣預(yù)測方面展示了革命性的準(zhǔn)確性。
迄今為止,ML預(yù)測的研究主要集中在短期預(yù)測上,遠(yuǎn)未達(dá)到氣候預(yù)測所需的數(shù)年到數(shù)十年時(shí)間。
由于數(shù)十年的氣候預(yù)測難以得到可靠驗(yàn)證,谷歌團(tuán)隊(duì)評(píng)估了NeuralGCM在氣候尺度預(yù)測方面的表現(xiàn),并使用已建立的WeatherBench 2基準(zhǔn)將其作為一個(gè)天氣模型進(jìn)行了評(píng)估。
NeuralGCM在0.7°分辨率下的確定性模型(deterministic model)在天氣預(yù)報(bào)準(zhǔn)確性方面與當(dāng)前最先進(jìn)的模型相當(dāng),天氣預(yù)報(bào)準(zhǔn)確度可達(dá) 5 天。
然而,確定性模式缺乏所需的量化不確定性,無法在較長的準(zhǔn)備時(shí)間內(nèi)做出有用的預(yù)報(bào)。
預(yù)報(bào)集合從略微不同的起始條件生成,以產(chǎn)生一系列同樣可能的天氣情況。這些集合產(chǎn)生的概率天氣預(yù)報(bào)通常比確定性預(yù)報(bào)更準(zhǔn)確。
NeuralGCM在1.4°分辨率下的集成模型(ensemble model),在5至15天的預(yù)測準(zhǔn)確性方面優(yōu)于之前的SOTA。
這種性能提升,得益于NeuralGCM生成的是集合天氣預(yù)測,后者能和ECMWF基于物理的SOTA模型ECMWF-ENS相媲美。
在已發(fā)布的ML模型中,NeuralGCM是第一個(gè)做到這一點(diǎn)的。
在2至15天的預(yù)測中,NeuralGCM的集合預(yù)測有95%的時(shí)間比ECMWF-ENS更準(zhǔn)確。
NeuralGCM在氣候時(shí)間尺度預(yù)測方面,NeuralGCM也優(yōu)于最先進(jìn)的大氣模型。
由于NeuralGCM僅模擬地球氣候的大氣成分,谷歌團(tuán)隊(duì)將其性能與基于物理的大氣模型進(jìn)行了比較。
在預(yù)測1980年至2020年間的溫度時(shí),NeuralGCM的2.8°確定性模型的平均誤差,是大氣模型(AMIP)誤差的三分之一,即0.25 vs. 0.75攝氏度。
對(duì)比NeuralGCM和AMIP在1980年至2020年間預(yù)測1000 hPa全球平均溫度的表現(xiàn)
由于傳統(tǒng)的大氣模型在模擬地球大氣的某些方面存在困難,氣候科學(xué)家有時(shí)會(huì)使用更高分辨率的模型,如X-SHiELD,這些模型雖然更準(zhǔn)確,但計(jì)算成本較高。
與X-SHiELD相比,NeuralGCM的1.4°確定性模型在預(yù)測2020年的濕度和溫度數(shù)據(jù)時(shí)誤差減少了15-50%,這些數(shù)據(jù)由美國國家海洋和大氣管理局(NOAA)提供。
在2020年的氣候模擬期間,NeuralGCM還預(yù)測了熱帶氣旋模式,這些模式與當(dāng)年在相同區(qū)域觀察到的風(fēng)暴數(shù)量和強(qiáng)度相匹配。
NeuralGCM是第一個(gè)能夠生成此類模式的基于機(jī)器學(xué)習(xí)的模型。
NeuralGCM預(yù)測了2020年全球范圍內(nèi)的熱帶氣旋路徑(預(yù)測的風(fēng)暴數(shù)量和強(qiáng)度與ECMWF再分析v5(ERA5)數(shù)據(jù)集中記錄的實(shí)際氣旋數(shù)量和強(qiáng)度相匹配)
開放、快速、高效
NeuralGCM在計(jì)算速度和成本上比傳統(tǒng)的基于物理的氣候模型快了幾個(gè)數(shù)量級(jí)。
其1.4°模型比X-SHiELD快3500多倍,這意味著如果研究人員用X-SHiELD模擬一年的大氣,需要20天,而用NeuralGCM只需8分鐘。
而且,科學(xué)家只需要一臺(tái)帶有單個(gè)TPU(張量處理單元,Tensor Processing Unit)的計(jì)算機(jī)就能運(yùn)行NeuralGCM,而運(yùn)行X-SHiELD則需要請求使用擁有13000個(gè)CPU(中央處理單元,Central Processing Unit)的超級(jí)計(jì)算機(jī)。
總體而言,使用NeuralGCM進(jìn)行氣候模擬的計(jì)算成本比X-SHiELD低10萬倍,相當(dāng)于高性能計(jì)算領(lǐng)域25年的進(jìn)步速度。
NeuralGCM比最先進(jìn)的物理模型模擬大氣的速度更快,同時(shí)生成的預(yù)測具有同樣的準(zhǔn)確性
在此圖表中,NeuralGCM和兩個(gè)物理模型NCAR CAM、NOAA X-SHiELD同場競技,對(duì)比它們在30秒計(jì)算時(shí)間內(nèi)生成的大氣模擬天數(shù)。
這三個(gè)模型分別以不同的分辨率運(yùn)行,其中X-SHiELD的分辨率最高(0.03°),NCAR CAM6的分辨率為1.0°,NeuralGCM的分辨率最低(1.4°)。
值得一提的是,盡管NeuralGCM以低分辨率運(yùn)行,但其準(zhǔn)確性與高分辨率模型相當(dāng)。
那么,在準(zhǔn)確性相當(dāng)?shù)那闆r下,可以看到,NeuralGCM在30s的時(shí)間內(nèi),就能夠生成22.8天的大氣模擬,而X-SHiELD作為一個(gè)必須在超級(jí)計(jì)算機(jī)上運(yùn)行的高分辨率物理模型,則只能生成9分鐘!
這也讓之前因計(jì)算成本較低而頗受研究人員青睞的NCAR CAM6的優(yōu)勢蕩然無存。
谷歌團(tuán)隊(duì)已在GitHub上公開了NeuralGCM的源代碼和模型權(quán)重,供非商業(yè)用途。他們希望其他研究人員可以輕松添加新組件來測試假設(shè)并改進(jìn)模型功能。
此外,由于NeuralGCM可以在筆記本電腦上運(yùn)行,而不需要超級(jí)計(jì)算機(jī)的支持,因此更多的氣候研究人員能夠在他們的工作中使用這一最先進(jìn)的模型。
結(jié)論和未來方向
NeuralGCM目前僅對(duì)地球大氣進(jìn)行建模,但谷歌團(tuán)隊(duì)希望最終將地球氣候系統(tǒng)的其他方面,如海洋和碳循環(huán),納入模型。
通過這種方式,NeuralGCM將能夠在更長的時(shí)間尺度上進(jìn)行預(yù)測,不僅可以預(yù)測幾天和幾周的天氣,還能在氣候時(shí)間尺度上進(jìn)行預(yù)測。
總而言之,NeuralGCM提出了一種構(gòu)建氣候模型的新方法,這種方法可能比現(xiàn)有模型更快、計(jì)算成本更低且更準(zhǔn)確。