自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

AI顛覆材料學(xué)!DeepMind重磅研究登Nature,預(yù)測220萬晶體結(jié)構(gòu)贏人類800年

人工智能 新聞
繼AlphaFold系列改變了生物學(xué)領(lǐng)域之后,谷歌DeepMind今日再發(fā)Nature,全新AI工具GNoME,成功預(yù)測220萬種晶體結(jié)構(gòu),顛覆了材料學(xué)領(lǐng)域。

陶哲軒一直看好,ChatGPT將顛覆數(shù)學(xué)證明,而如今,AI在化學(xué)領(lǐng)域的潛力同樣深不可測。

今天,220萬種晶體結(jié)構(gòu)完全被AI預(yù)測出來了。

這是什么概念?相當(dāng)于近800年的知識價值。

谷歌DeepMind開發(fā)全新AI工具GNoME,能夠預(yù)測新材料的穩(wěn)定性,大大提高了發(fā)現(xiàn)的速度和效率,論文今天刊發(fā)在了Nature上。

論文鏈接:https://www.nature.com/articles/s41586-023-06735-9

在220萬個晶體預(yù)測中,有38萬種特性是最穩(wěn)定的,有潛力成為未來變革性技術(shù)的材料,為超導(dǎo)體、電動汽車電池研發(fā),以及超算供電等領(lǐng)域提供動力。

更進(jìn)一步的是,全世界各地的科學(xué)家已經(jīng)在GNoME的輔助之下,著手將AI發(fā)現(xiàn)的新材料進(jìn)行了合成。

美國勞倫斯國家實驗室和DeepMind合作,在Nature上刊發(fā)了另一篇論文,展示了如何利用GNoME的預(yù)測進(jìn)行自主材料合成。

17天自主合成了41種新材料。

論文鏈接:https://www.nature.com/articles/s41586-023-06734-w

AI對于基礎(chǔ)科學(xué)的推動作用,可能會讓人類文明從此駛上快車道!

如果說,OpenAI是人類在奔向AGI道路上的領(lǐng)航員,DeepMind就是一把人類在科學(xué)領(lǐng)域不斷突破自身極限的利劍。

利用 AI 加速材料發(fā)現(xiàn)

過去,科學(xué)家們通過調(diào)整已知晶體或試驗新的元素組合來尋找新的晶體結(jié)構(gòu)。

這是一個昂貴且耗時的試錯過程。通常需要幾個月的時間才能得到有限的結(jié)果。

在過去的十年中,全世界各國的科學(xué)家通計算機(jī)模擬的方法發(fā)現(xiàn)了28000種新材料。

加上人類利用傳統(tǒng)實驗的方法發(fā)現(xiàn)的大約20000種穩(wěn)定性材料,在使用AI輔助材料發(fā)現(xiàn)之前,人類發(fā)現(xiàn)的穩(wěn)定晶體數(shù)量總共達(dá)到了48000個。

而DeepMind使用AI材料發(fā)現(xiàn)工具GNoME,預(yù)測出了220萬種新的晶體,其中38萬種具有穩(wěn)定的結(jié)構(gòu)。

而在GNoME預(yù)測的新的穩(wěn)定結(jié)構(gòu)中,有736種是和其他科學(xué)家獨立發(fā)現(xiàn)的穩(wěn)定材料是一致的,說明新發(fā)現(xiàn)的材料是客觀真實的。

自此,人類發(fā)現(xiàn)的穩(wěn)定晶體數(shù)量一下子被提升了接近9倍!

而這些材料中,有52000種類似于石墨烯的新型層狀化合物,其中1000種是已經(jīng)被之前的研究所發(fā)現(xiàn)的。

如果在這些材料中能發(fā)現(xiàn)有更強(qiáng)超導(dǎo)特性的材料,有可能徹底顛覆電子學(xué)。

利用GNoME,科學(xué)家還發(fā)現(xiàn)了528種潛在的鋰離子導(dǎo)體,是之前研究成果的25倍。

這些材料都有可能用來提高電池的性能,從而改變?nèi)祟惖哪茉唇Y(jié)構(gòu)。

DeepMind將會在未來發(fā)布這38萬種穩(wěn)定材料的預(yù)測結(jié)構(gòu)。

利用GNN進(jìn)行材料探索

GNoME采用兩條工作流(管道)來發(fā)現(xiàn)穩(wěn)定材料:

「結(jié)構(gòu)管道」創(chuàng)建具有與已知晶體結(jié)構(gòu)相似的候選物,而「成分管道」則采用遵循基于化學(xué)式的更隨機(jī)的方法。

之后,使用密度泛函理論計算來評估兩條工作流的輸出,并將這些結(jié)果添加到GNoME數(shù)據(jù)庫中,為下一輪主動學(xué)習(xí)提供信息。

GNoME是一種最先進(jìn)的圖神經(jīng)網(wǎng)絡(luò)(GNN)模型,可以預(yù)測晶體總能量。

GNN的輸入數(shù)據(jù)采用圖的形式,跟原子之間的連接很像,這使得GNN特別適合發(fā)現(xiàn)新的晶體材料。

模型的輸入通過元素的單次嵌入轉(zhuǎn)換成圖。采用消息傳遞公式,其中聚合投影是具有非線性特性的淺層多層感知器(MLP)。

對于結(jié)構(gòu)模型,重要的是通過整個數(shù)據(jù)集原子的平均鄰接關(guān)系,對從邊到節(jié)點的信息進(jìn)行歸一化。

GNoME的初始模型是在2018年Materials Project(約69000種材料)上訓(xùn)練的,研究人員改進(jìn)了之前工作中,對這項任務(wù)設(shè)置的平均絕對誤差(MAE)。

GNoME使用晶體結(jié)構(gòu)及其穩(wěn)定性的數(shù)據(jù)進(jìn)行訓(xùn)練,這些數(shù)據(jù)可通過Materials Project公開獲得。

研究人員使用GNoME來生成新的候選晶體,并預(yù)測它們的穩(wěn)定性。

為了評估模型在訓(xùn)練周期中的預(yù)測能力,研究人員使用被稱為密度泛函理論 (DFT) 的成熟計算技術(shù),反復(fù)檢查模型輸出的結(jié)果。

DFT被廣泛用于物理、化學(xué)和材料科學(xué)中,幫助人們理解原子的結(jié)構(gòu),對于評估晶體的穩(wěn)定性有重要的作用。

研究人員使用了一種稱為「主動學(xué)習(xí)」的訓(xùn)練過程,極大地提高了GNoME的性能。

「主動學(xué)習(xí)」是一種擴(kuò)展模型的技術(shù),模型首先在小型專用數(shù)據(jù)集上訓(xùn)練,然后,開發(fā)人員可以引入新的目標(biāo),允許模型在人工協(xié)助下標(biāo)記新數(shù)據(jù)。

GNoME會對新型的、穩(wěn)定的晶體結(jié)構(gòu)進(jìn)行預(yù)測,然后使用DFT進(jìn)行測試,并將生成的高質(zhì)量訓(xùn)練數(shù)據(jù)反饋到模型訓(xùn)練中。

GNoME的出現(xiàn),將材料穩(wěn)定性預(yù)測的發(fā)現(xiàn)率從50%左右提高到80%(50%是之前的SOTA)。

另外,GNoME的效率也有很大提升,將發(fā)現(xiàn)率從低于10%提高到了80%以上,——效率的提高會大大節(jié)約每次發(fā)現(xiàn)所需的計算量。

「AI配方」新材料

GNoME的目的是降低發(fā)現(xiàn)新材料的成本。

研究人員在完成了這項工作后,檢索了科學(xué)文獻(xiàn),發(fā)現(xiàn)了由世界各地的實驗室獨立創(chuàng)造的736種新材料,與GNoME預(yù)測的結(jié)果一致。

這證明GNoME對穩(wěn)定晶體的預(yù)測與客觀現(xiàn)實相符。

上圖給出了其中六個例子,從堿土類金剛石光學(xué)材料(一排中間)到潛在的超導(dǎo)體(一排右邊)。

DeepMind已經(jīng)向研究界發(fā)布了新發(fā)現(xiàn)的晶體數(shù)據(jù)庫——通過向科學(xué)家提供新材料的「AI配方」,DeepMind希望幫助科學(xué)家們進(jìn)行測試,并制造出最好的配方。

而利用晶體數(shù)據(jù)庫中的「AI配方」,科學(xué)家可以快速開發(fā)新材料。

在美國勞倫斯國家實驗室發(fā)表的一篇論文中,研究人員展示了,機(jī)器人實驗室可以通過自動合成技術(shù)快速制造新材料。

利用Materials Project(MP)中的材料,和GNoME對穩(wěn)定性的見解,實驗室創(chuàng)造了晶體結(jié)構(gòu)的新配方,并成功合成了超過41種新材料,為人工智能驅(qū)動的材料合成開辟了新的可能性。

上圖是以58種新化合物為目標(biāo)進(jìn)行合成的結(jié)果。箭頭表示接近零的數(shù)值。

我們可以看到共有41個目標(biāo)成功合成(藍(lán)色條),而其余17個目標(biāo)失?。t色條)。

帶有斜杠的目標(biāo)表示使用了主動學(xué)習(xí)。每個條形圖上方的散點表示針對每個目標(biāo)嘗試配方的結(jié)果,按執(zhí)行順序從上到下排列。

插入的餅圖分別展示了成功目標(biāo)(左)和配方(右)的比例。

上圖分析了實驗室無法合成的17種目標(biāo)材料,每種材料都按使其合成復(fù)雜化的特征進(jìn)行了分類。

除去亞穩(wěn)態(tài)的圖片,其余16個穩(wěn)定目標(biāo)所面臨的挑戰(zhàn)可分為兩類:實驗障礙(藍(lán)色,13個)和計算障礙(綠色,3個)。

這些障礙又可分為四種不同的失敗模式:反應(yīng)動力學(xué)緩慢、前體易揮發(fā)、產(chǎn)物非晶化以及在0 K條件下進(jìn)行的DFT計算的局限性。

論文細(xì)節(jié)

發(fā)現(xiàn)能量上有利的無機(jī)晶體是固態(tài)化學(xué)的基本科學(xué)和技術(shù)興趣所在。

幾十年來,實驗方法已在無機(jī)晶體結(jié)構(gòu)數(shù)據(jù)庫(ICSD)中收錄了 20,000 個計算穩(wěn)定結(jié)構(gòu)(總條目數(shù)為 200,000 個)。然而,由于成本、吞吐量和合成復(fù)雜性等原因,這種策略無法推廣。

而材料計劃(MP)、開放量子材料數(shù)據(jù)庫(OQMD)、AFLOWLIB20 和 NOMAD21 所倡導(dǎo)的計算方法采用基于密度泛函理論(DFT)的第一性原理計算作為物理能量的近似值。

根據(jù)我們自己的重新計算(見方法),將 ab initio 計算與簡單的替換相結(jié)合,研究人員已將計算穩(wěn)定的材料提高到 48000 種。盡管人們一直在尋求有助于進(jìn)一步發(fā)現(xiàn)材料的數(shù)據(jù)驅(qū)動方法,但迄今為止,機(jī)器學(xué)習(xí)技術(shù)在估算相對于競爭相能量凸殼(convex hull of energies)的穩(wěn)定性(分解能)方面表現(xiàn)一直不好。

研究人員通過大規(guī)模主動學(xué)習(xí)擴(kuò)大了機(jī)器學(xué)習(xí)在材料探索中的應(yīng)用,首次建立了可準(zhǔn)確預(yù)測穩(wěn)定性的模型,從而為材料探索提供指導(dǎo)。

研究人員的方法依賴于兩大支柱:

首先,他們建立了生成多種候選結(jié)構(gòu)的方法,包括新的對稱感知部分置換(SAPS)和隨機(jī)結(jié)構(gòu)搜索。

其次,研究人員采用了最先進(jìn)的圖神經(jīng)網(wǎng)絡(luò)(GNN),該網(wǎng)絡(luò)可根據(jù)結(jié)構(gòu)或成分改進(jìn)材料特性建模。

在一系列回合中,這些用于材料探索的圖神經(jīng)網(wǎng)絡(luò)(GNoME)根據(jù)現(xiàn)有數(shù)據(jù)進(jìn)行訓(xùn)練,并用于過濾候選結(jié)構(gòu)。

通過DFT計算篩選出的候選結(jié)構(gòu)的能量,既可驗證模型預(yù)測,又可作為數(shù)據(jù)飛輪,在下一輪主動學(xué)習(xí)中在更大的數(shù)據(jù)集上訓(xùn)練更穩(wěn)健的模型。

通過這種迭代程序,GNoME模型已經(jīng)發(fā)現(xiàn)了220多萬種與以前的工作相比穩(wěn)定的結(jié)構(gòu),特別是包含計算和實驗結(jié)構(gòu)的聚合數(shù)據(jù)集。

鑒于已發(fā)現(xiàn)的材料在穩(wěn)定性方面存在競爭,更新后的凸殼包含381000個新條目,總計421000個穩(wěn)定晶體,與之前發(fā)現(xiàn)的所有晶體相比有了數(shù)量級的擴(kuò)展。

與其他機(jī)器學(xué)習(xí)領(lǐng)域的觀察結(jié)果一致,研究人員發(fā)現(xiàn)神經(jīng)網(wǎng)絡(luò)的預(yù)測結(jié)果與數(shù)據(jù)量成冪律關(guān)系。

最終的GNoME模型可以準(zhǔn)確預(yù)測圖片,并將穩(wěn)定預(yù)測的精確度(命中率)提高到80%以上(結(jié)構(gòu)預(yù)測)和33%以上(僅成分預(yù)測),而之前的工作只有1%。

此外,這些網(wǎng)絡(luò)還發(fā)展了分布外泛化。

例如,GNoME能夠準(zhǔn)確預(yù)測含有5個以上獨特元素的結(jié)構(gòu)(盡管在訓(xùn)練中省略了這些元素),為有效探索這一化學(xué)空間提供了首批策略之一。

研究人員將預(yù)測結(jié)果與實驗和更高保真的 r2SCAN計算結(jié)果進(jìn)行了比較,從而驗證了研究結(jié)果。

最后,研究人員證明了在GNoME發(fā)現(xiàn)過程中產(chǎn)生的數(shù)據(jù)集為下游應(yīng)用釋放了新的建模能力。

這些結(jié)構(gòu)提供了一個龐大而多樣的數(shù)據(jù)集,可用于訓(xùn)練學(xué)習(xí)的等變原子間位勢,具有前所未有的準(zhǔn)確性和零樣本泛化能力。

通過分子動力學(xué)模擬估算離子電導(dǎo)率,研究人員展示了這些電位在材料性質(zhì)預(yù)測方面的前景。

候選材料的生成和過濾

可能的材料空間太大,無法以無偏見的方式進(jìn)行采樣。

由于沒有可靠的模型來低成本地估算候選材料的能量,研究人員只能通過化學(xué)直覺來限制候選材料的生成,具體做法是替換相似的離子或列舉原型。

這種策略雖然提高了搜索效率,但從根本上限制了候選物質(zhì)的多樣性。

通過使用神經(jīng)網(wǎng)絡(luò)引導(dǎo)搜索,研究人員能夠使用多樣化的方法生成候選體,并在不影響效率的前提下對晶體空間進(jìn)行更廣泛的探索。

為了生成和篩選候選晶體,研究人員使用了兩個框架,如下圖所示。

首先,通過修改現(xiàn)有晶體生成結(jié)構(gòu)候選體。不過,研究人員通過調(diào)整離子取代概率來優(yōu)先發(fā)現(xiàn)候選結(jié)構(gòu),并使用新提出的對稱性感知部分取代(SAPS)來有效實現(xiàn)不完全取代,從而有力地擴(kuò)展了取代集。

在主動學(xué)習(xí)過程中,這種擴(kuò)展會產(chǎn)生超過109個候選結(jié)構(gòu);產(chǎn)生的結(jié)構(gòu)會通過GNoME進(jìn)行過濾,使用基于體積的測試時間擴(kuò)展,并通過深度集合進(jìn)行不確定性量化。

最后,對結(jié)構(gòu)進(jìn)行聚類,并對多形態(tài)進(jìn)行排序,以便用DFT進(jìn)行評估。

在第二個框架中,成分模型在沒有結(jié)構(gòu)信息的情況下預(yù)測穩(wěn)定性。輸入是還原化學(xué)式。通過氧化態(tài)平衡生成的模型往往過于嚴(yán)格。利用寬松的約束條件,研究人員使用GNoME篩選成分,并初始化100個隨機(jī)結(jié)構(gòu),通過ab initio隨機(jī)結(jié)構(gòu)搜索(AIRSS)進(jìn)行評估。

在這兩個框架中,模型提供能量預(yù)測,并根據(jù)相對于競爭相的相對穩(wěn)定性(分解能)選擇閾值。

評估是通過在維也納Ab initio仿真軟件包(VASP)中進(jìn)行的DFT計算來完成的,與Materials Project(MP)相比,研究人員同時測量了發(fā)現(xiàn)的穩(wěn)定材料的數(shù)量和預(yù)測的穩(wěn)定材料的精確度(命中率)。

GNoME已經(jīng)發(fā)現(xiàn)了380000種穩(wěn)定的晶體,這些晶體具有開發(fā)更環(huán)保技術(shù)的潛力——從用于電動汽車的電池到用于更高效計算的超導(dǎo)體。

DeepMind的GNoME,以及伯克利實驗室、谷歌研究院和世界各地團(tuán)隊的合作者的研究,顯示了使用人工智能來指導(dǎo)材料發(fā)現(xiàn)、實驗和合成的潛力。

希望GNoME與其他AI工具,能夠影響和改變這個領(lǐng)域,指引我們的未來。

網(wǎng)友熱議

有網(wǎng)友根據(jù)GNoME預(yù)測新材料的能力生成了下面這張圖:

不得不說,還挺形象的。

也有網(wǎng)友把LK-99拿出來鞭尸了:

「還記得LK-99嗎?Google DeepMind最新的AI工具GNoME剛剛通過識別220萬種新材料樹立了新的標(biāo)桿,重新定義了我們對材料科學(xué)的理解。這一發(fā)現(xiàn)超越了以前的努力,提供了具有多種應(yīng)用的新晶體目錄?!?/span>

當(dāng)我們期盼看到Google的產(chǎn)品可以正面剛ChatGPT的時候,卻發(fā)現(xiàn)Google把技能點用到了別的地方。

對此有網(wǎng)友表示:

「當(dāng)人們對聊天機(jī)器人失去理智時,真正的人工智能在DeepMind」。

當(dāng)然,也有陰謀論玩家表示:

「想象一下,科學(xué)家們已經(jīng)根據(jù)這樣的研究秘密合成了什么。我敢打賭,DeepMind并不是唯一一家進(jìn)行此類模擬的實驗室。」

責(zé)任編輯:張燕妮 來源: 新智元
相關(guān)推薦

2023-12-04 09:17:00

AI材料

2023-12-01 15:49:56

DeepMindAI 工具GNoME

2024-05-09 11:08:22

2023-09-20 12:58:00

訓(xùn)練研究

2024-11-08 12:18:39

SynthID谷歌AI

2022-12-08 14:12:24

研究Nature

2024-01-02 09:05:58

科學(xué)AI

2025-01-17 09:11:49

2022-07-06 14:51:07

人工智能技術(shù)研究

2023-08-05 12:54:32

2023-07-14 11:47:08

AI醫(yī)生

2025-03-11 08:37:17

2023-05-08 12:32:20

AI讀心

2022-07-12 14:56:30

AI模型研究

2025-04-25 09:08:00

2024-05-27 00:00:00

2022-12-02 15:25:03

2024-11-29 14:10:00

神經(jīng)網(wǎng)絡(luò)AI

2023-06-08 11:33:00

谷歌AI

2025-04-07 03:00:00

Dreamer世界模型
點贊
收藏

51CTO技術(shù)棧公眾號