微軟使用AI加HPC分析3200萬(wàn)種新材料
微軟與太平洋西北國(guó)家實(shí)驗(yàn)室合作,利用AI與高性能計(jì)算(HPC)技術(shù)對(duì)3200種新型候選材料進(jìn)行建模,希望加快高效可充電電池材料的發(fā)現(xiàn)速度。該項(xiàng)目還希望進(jìn)一步支撐微軟的發(fā)展目標(biāo),在未來(lái)25年內(nèi)將綿延250年的人類化學(xué)研究史納入數(shù)據(jù)模型。
Azure量子元素
在本項(xiàng)目中,微軟研究人員使用到旨在加速科學(xué)發(fā)現(xiàn)的Azure量子元素(Quantum Elements)平臺(tái)。盡管目前只是將AI與傳統(tǒng)HPC加以結(jié)合,但該平臺(tái)的目標(biāo)是在未來(lái)能兼容微軟量子超級(jí)計(jì)算機(jī)。與此同時(shí),Azure量子元素還擴(kuò)大了HPC集群規(guī)模并使用AI進(jìn)行高質(zhì)量推理,希望為鋰離子電池的研究貢獻(xiàn)重要力量。此外,微軟Copilot AI則負(fù)責(zé)簡(jiǎn)化數(shù)據(jù)處理、代碼編寫與模擬運(yùn)行等具體操作。
Azure量子元素專注于解決大規(guī)模、高速、高準(zhǔn)確性需求所帶來(lái)的技術(shù)挑戰(zhàn):
- 規(guī)模:處理規(guī)模非常重要,將直接決定新的分子或材料發(fā)現(xiàn)的具體范圍。為了將候選材料從以往的幾千種擴(kuò)大到數(shù)百萬(wàn)種,規(guī)模擴(kuò)展能力至關(guān)重要。研究人員必須對(duì)足夠龐大的系統(tǒng)進(jìn)行建模,準(zhǔn)確捕捉到材料內(nèi)部缺陷或化學(xué)異質(zhì)性等復(fù)雜因素。
- 速度:速度是指將特定化學(xué)模擬速度加快50萬(wàn)倍,借此模擬并分析材料的基本性質(zhì)。更快的計(jì)算流程能夠幫助研究人員高效工作。量子元素平臺(tái)的目標(biāo)是通過(guò)快速處理多種材料的大量模擬數(shù)據(jù)以加快發(fā)現(xiàn)速度,高效識(shí)別出有前途的候選材料。速度也將決定AI與HPC之間的交互效率。
- 準(zhǔn)確性:準(zhǔn)確性并非強(qiáng)調(diào)完全精確,這是因?yàn)榛瘜W(xué)系統(tǒng)中的某些量子力學(xué)效應(yīng)只能取近似結(jié)果。目前的經(jīng)典計(jì)算機(jī)還無(wú)法確切模擬這類場(chǎng)景,因此未來(lái)準(zhǔn)確性的進(jìn)一步提升,還有待量子計(jì)算與AI及HPC的全面結(jié)合。
從3200萬(wàn)種候選材料中找尋答案
微軟Azure研究團(tuán)隊(duì)正著手探索可用于鋰電池制造的理想固態(tài)電解質(zhì)。該團(tuán)隊(duì)通過(guò)離子取代法取代了20萬(wàn)種已知晶體中的特定原子,并使用54種潛在電解質(zhì)原子作為替代選項(xiàng)。在此過(guò)程中,研究人員共創(chuàng)造出超3200萬(wàn)種新材料,但如此龐大的備選庫(kù)太過(guò)寬泛,需要經(jīng)過(guò)進(jìn)一步篩選和精簡(jiǎn)至較易管理的規(guī)模后才能移交給西北國(guó)家實(shí)驗(yàn)室。考慮到傳統(tǒng)HPC物理模型不足以快速解決這樣的大規(guī)模問題集,微軟決定使用AI加速材料的穩(wěn)定性分析。在此類項(xiàng)目中,AI將成為快速且強(qiáng)大的工具選項(xiàng),可用于預(yù)測(cè)材料的電化學(xué)穩(wěn)定性、帶隙、電化學(xué)反應(yīng)性、能量和力等材料特性。通過(guò)使用AI代替HPC模擬中的量子化學(xué)計(jì)算,微軟成功將篩選速度提升至傳統(tǒng)方法的1.5萬(wàn)倍。
通過(guò)這個(gè)過(guò)程,材料庫(kù)被初步過(guò)濾至50萬(wàn)種穩(wěn)定候選項(xiàng)。通過(guò)AI篩選流程對(duì)這50萬(wàn)種候選材料的進(jìn)一步電化學(xué)穩(wěn)定性篩選,最終得出800種有前途的候選項(xiàng)。盡管AI算法速度快、頭飾生高,但薛定諤議程與量子力學(xué)計(jì)算仍難免會(huì)存在一些殘差。正因?yàn)槿绱耍判枰趥鹘y(tǒng)物理效應(yīng)的HPC管線對(duì)剩余800種候選材料做二次處理,以進(jìn)一步分析材料的物化特性。
在這一階段,研究人員同樣使用AI篩選流程來(lái)表征各種新型材料。該管線首先利用預(yù)測(cè)模型來(lái)快速評(píng)估候選項(xiàng),之后再執(zhí)行更準(zhǔn)確的物理模擬驗(yàn)證,最后通過(guò)分子動(dòng)力學(xué)研究來(lái)評(píng)估其基本動(dòng)態(tài)特性與結(jié)構(gòu)漲落。階段結(jié)束時(shí),候選材料數(shù)量已經(jīng)被縮小至18種。
微軟隨后從中挑選6種移交給西北國(guó)家實(shí)驗(yàn)室的研究人員,由他們最終選出最理想的單一材料,其中鋰含量較當(dāng)前鋰離子電池減少了70%。
廣闊天地,大有可為
可以看到,AI與HPC都是項(xiàng)目中重要的技術(shù)組成部分。在AI方面,研究人員使用到微軟專門為分子模擬和能量/力預(yù)測(cè)而設(shè)計(jì)的管線。HPC則負(fù)責(zé)支撐涉及AI模擬結(jié)果與量子化學(xué)計(jì)算的傳統(tǒng)模擬環(huán)節(jié)。
可以想見,整個(gè)新材料發(fā)現(xiàn)過(guò)程之繁復(fù)、數(shù)據(jù)處理量之龐大。為了簡(jiǎn)化流程,基于大語(yǔ)言模型的AI輔助工具消除了其中種種困難障礙,同時(shí)也代替人類專家解決了類型篩選與分步計(jì)算任務(wù)。AI輔助工具還能快速為科學(xué)家們提供配置工具并設(shè)計(jì)功能組合,大大加快了科學(xué)研究中各類復(fù)雜流程的推進(jìn)速度。
憑借微軟Azure量子元素平臺(tái),3200萬(wàn)種新型候選結(jié)構(gòu)的創(chuàng)建和800種穩(wěn)定材料的挑選僅耗時(shí)一周。微軟估計(jì),如果沒有AI技術(shù)的加持,純?nèi)肆π枰?0年才能完成這樣的篩選過(guò)程。
更值得期待的是,隨著時(shí)間推移,整個(gè)過(guò)程的執(zhí)行效率將越來(lái)越高。Azure量子元素平臺(tái)還為現(xiàn)有量子硬件預(yù)留了量子計(jì)算實(shí)驗(yàn)接口。這樣當(dāng)微軟的量子超級(jí)計(jì)算機(jī)最終部署落地后,該平臺(tái)將優(yōu)先訪問量子算力。隨著規(guī)?;孔佑?jì)算開始發(fā)揮實(shí)際作用,相信這項(xiàng)技術(shù)將為高度復(fù)雜化學(xué)系統(tǒng)中的力效應(yīng)與能量建模提供突破性的精度保障。由此帶來(lái)的現(xiàn)有經(jīng)典計(jì)算機(jī)無(wú)法實(shí)現(xiàn)的寶貴見解,有望在材料科學(xué)、制藥等領(lǐng)域交付更多前所未有的新成果。也正因?yàn)槿绱?,微軟量子元素?xiàng)目的影響已經(jīng)遠(yuǎn)遠(yuǎn)超出新型電池鋰材料的研究范疇,必將給各行各業(yè)帶來(lái)無(wú)窮無(wú)盡的探索空間。