自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

ACM 杰出會員姬水旺:量子化學(xué)和物理的深度學(xué)習(xí)

移動開發(fā) Android
今天我將著重談?wù)勅绾芜\用AI以及圖形計算技術(shù)來解決量子物理及量子化學(xué)問題。

本文轉(zhuǎn)自雷鋒網(wǎng),如需轉(zhuǎn)載請至雷鋒網(wǎng)官網(wǎng)申請授權(quán)。

量子技術(shù)和人工智能都是當(dāng)前最先進(jìn)的科學(xué)技術(shù),前者被寄希望于擁有超強(qiáng)的計算能力,后者已經(jīng)在各行各業(yè)“大殺四方”。當(dāng)兩者相遇會碰撞出什么樣的火花?人工智能又能在哪些方面助力量子技術(shù)?

去年12月份,德州農(nóng)工大學(xué)計算機(jī)科學(xué)與工程系(校長有影響力)教授姬水旺在CNCC大會上發(fā)表了《量子化學(xué)和物理的深度學(xué)習(xí)》的演講,表達(dá)了他對兩個學(xué)科的感想。

“量子打破了我們很多常識性的理解,在量子狀態(tài)世界的運行并不確定,我們最多只能預(yù)測各種結(jié)果出現(xiàn)的概率?!?/p>

此外,他還表示,量子的研究對象雖然是原子層級甚至亞原子層級的物體,但與宏觀規(guī)則也有相通之處,例如可以把分子之間的結(jié)構(gòu)看成一張圖,進(jìn)行處理。

姬水旺,2010 年獲得亞利桑那州立大學(xué)計算機(jī)科學(xué)博士學(xué)位,導(dǎo)師為葉杰平教授。研究興趣包括機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、數(shù)據(jù)挖掘和計算生物學(xué),于 2014 年獲得美國國家科學(xué)基金會職業(yè)獎。2020年當(dāng)選為ACM 2020杰出會員。

以下是演講全文,AI科技評論做了不改變原意的整理。

大家好,今天我將著重談?wù)勅绾芜\用AI以及圖形計算技術(shù)來解決量子物理及量子化學(xué)問題。

首先讓我們來了解一些背景:在經(jīng)典物理學(xué)領(lǐng)域,我們討論的是宏觀世界中的物體或者現(xiàn)象。比如,你朝一個球踢了一腳,如果你知道球的具體質(zhì)量、速度以及當(dāng)前的時間,你就能預(yù)測出五秒后這個球的位置。但是在量子領(lǐng)域,由于研究對象是原子層級甚至亞原子層級的物體,例如原子和化學(xué)鍵組成的分子,因此無法按照傳統(tǒng)邏輯思考領(lǐng)域規(guī)則。

近些年,我們不斷與各個領(lǐng)域的專家合作,希望從量子物理學(xué)家、量子化學(xué)家、量子材料學(xué)家等身上獲得研究突破。這些不同領(lǐng)域的學(xué)者都有一些共同需要研究的話題,而這些話題與圖像、AI、尤其是深度學(xué)習(xí)相關(guān)聯(lián)。現(xiàn)在我來匯報最新進(jìn)展。

1 AI遇上量子化學(xué)

分子由原子及原子間的化學(xué)鍵構(gòu)成,例如在分子中,原子用點表示,而分子則由線表示。所以能夠?qū)⒎肿右?D圖形的形式呈現(xiàn)出來。在機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘領(lǐng)域,圖形計算是一個老生常談的話題。但遷移到分子領(lǐng)域,也面臨新的挑戰(zhàn):2D圖形的形式并不能完全挖掘分子的屬性。畢竟,分子實際上不是一個2D的平面,其具有三維空間屬性的。它的結(jié)構(gòu)并不只由點和線的屬性決定,而同時由空間坐標(biāo)、化學(xué)鍵角等等決定。因此,在探索分子功能時,需要重視它的三維結(jié)構(gòu)。

如何高效地利用分子的空間信息去進(jìn)行預(yù)測及生成模型?消息傳播神經(jīng)網(wǎng)絡(luò)(Message Passing Neural Network, MPNN)是一種常用的圖神經(jīng)網(wǎng)絡(luò)框架。我們能發(fā)現(xiàn),此類方法可以歸納為兩個方程:聚合函數(shù)和節(jié)點更新函數(shù)。聚合函數(shù)能將把鄰居節(jié)點的信息聚合起來。

當(dāng)我們嘗試計算一個節(jié)點的信息時,基本上都會考慮節(jié)點在上個時間點本身的屬性以及中介節(jié)點的屬性,以及邊界的信息。計算聚合函數(shù)之后,需要利用節(jié)點更新函數(shù),這一步要求能夠利用之前步驟的信息與屬性,更新現(xiàn)在的節(jié)點信息。但此舉只是簡單地考慮了節(jié)點及邊界的特征。所以,我們近期的工作就是嘗試構(gòu)建三維圖形計算網(wǎng)絡(luò),以便能夠獲取完整的三維信息。

一旦需要納入三維信息,計算網(wǎng)絡(luò)將變得非常復(fù)雜,且信息傳遞也將變得低效。所以我們希望網(wǎng)絡(luò)在高效的同時,讓計算變得等效與穩(wěn)定。如果有一個分子,當(dāng)你旋轉(zhuǎn)這個分子時,他的很多2D屬性也許不會改變,但3D信息卻不一定;因此,我們希望在預(yù)測及生成模型中,當(dāng)分子的一個節(jié)點旋轉(zhuǎn)時,它的量子屬性也保持穩(wěn)定。

模型的預(yù)測功能是指預(yù)測一個給定分子的屬性,例如,我們可以預(yù)測分子是否有作為抗生素的潛力。而生成模型是指根據(jù)給定的屬性去生成/合成相應(yīng)的新分子。

當(dāng)前,已經(jīng)有不少研究者將3D屬性納入考量了。其中一個最早的工作叫SchNet,他們將距離作為三維屬性納入。即使用SchNet意味著會考慮邊界以及邊界的長度。。最近也有一個工作叫DimeNet。DimeNet在SchNet的基礎(chǔ)上更進(jìn)一步,因為它將角度納入了考量。例如你有從j到i的信息,你需要計算mi,j,那么需要不僅僅將節(jié)點信息納入考量,還需要考慮兩個化學(xué)鍵之間的角度。

但在化學(xué)中,我們發(fā)現(xiàn)僅僅考量距離和幾何形狀是遠(yuǎn)遠(yuǎn)不夠的。如上圖,紅色部分代表了一個并不真實存在的平面,藍(lán)色部分也是如此。分子擁有幾何形狀,但是僅僅知道三條化學(xué)鍵的距離、兩個鍵角是沒法完全確定分子的幾何形狀的。

讓我們思考一下,d1,d2確定的平面與由d2,d3確定的平面之間會存在一個φ角。也正是這個角,成為了上述模型中的不確定因素。因為即使擁有相同的兩個鍵角時,而φ角不斷改變,導(dǎo)致分子的幾何形狀也會發(fā)生改變。

我們嘗試構(gòu)建的是一個完整的、能夠解決所有情況的幾何框架,稱之為球形信息傳遞。

為了解決上述問題,將φ角納入了考量,φ角是X與他的投影之間的夾角。

此舉的一個考量是:必須讓呈現(xiàn)出來的分子是穩(wěn)定不變的。例如,當(dāng)旋轉(zhuǎn)分子時,它們的屬性,例如所有的夾角,應(yīng)當(dāng)不發(fā)生變化。。在球形信息傳遞中,我們構(gòu)建一個球坐標(biāo)系,包括參照點、距離和扭角。但此模型不是100%完美的。

因為僅僅考慮了一個對照,所以當(dāng)考慮其他節(jié)點時就會出現(xiàn)不確定因素。所以我們的工作是不完美但是非常具有效率的。

最近有一個叫GemNet的系統(tǒng),他們的想法是,我們的系統(tǒng)僅僅使用了的A節(jié)點的鄰居節(jié)點的信息,并沒有使用2-hop領(lǐng)域信息。GemNet科學(xué)家認(rèn)為,當(dāng)你使用了2-hop領(lǐng)域信息時,這個系統(tǒng)將會趨近完善。確實,當(dāng)你使用2-hop領(lǐng)域信息時,角度信息將被較好地合并,并且達(dá)到近乎完善的效果,但是問題在于,一旦你使用了2-hop信息,信息更新后將納入大量地鄰居節(jié)點,整個信息更新步驟將變得異常復(fù)雜。

相較之下,我們的系統(tǒng)雖然不是100%的完善,但更具效率,能夠直觀地看到復(fù)雜程度:n代表節(jié)點的數(shù)量,K則是所有節(jié)點的平均自由度。在實際效果上,我們的模型與更復(fù)雜的GemNet十分相近。

下圖能夠清晰地展示我們的模型能或不能表示哪些情況。a圖和b圖表示的是在化學(xué)上被稱為手性的現(xiàn)象。

事實上,這兩個分子就像是鏡像。我們設(shè)計的網(wǎng)絡(luò)能夠區(qū)分這兩種情況,而之前很多的方法并不能做到。因為在我們的方法中,我們用到了扭角作為相對角度,而在手性這個例子中,二者q1的角度分別為60°和90°。但是,在第二種情況下,q1的扭角都為90°,所以我們的方法無法區(qū)分出來。第二種情況也是被社區(qū)的同行們指出“希望更正”的情況,但是從化學(xué)意義上說,這種情況發(fā)生的概率非常非常低,因為q2和q3作為不同的原子,他們與q1之間的扭角相同的情況幾乎不可能發(fā)生。所以我們認(rèn)為,盡管我們的模型不是100%覆蓋了所有的情況,無法覆蓋的情況在自然界中很難發(fā)生。

2 AI遇到量子力學(xué)

當(dāng)我們開始著眼于量子力學(xué)時,薛定諤方程為我們提供了解答思路。如果你知道距離角和扭角的數(shù)值,你可以使用方程中的不同函數(shù),例如球面諧波和球面貝塞爾函數(shù),也可以使用其他的基本函數(shù)去收集Θ值,并最終得到一個特征向量。這是一個具有物理意義的特征向量,能夠在實際的信息傳遞中使用。

下圖是系統(tǒng)構(gòu)建過程。有輸入模塊,一個采用扭轉(zhuǎn)角和距離信息作為輸入的交互模塊,這個交互模塊可能會重估很多次,這個重復(fù)的次數(shù)將取決于你的數(shù)據(jù)量。最后是輸出模塊,有了這個模塊,能夠使信息傳遞用于一些賽事當(dāng)中,例如公開催化劑挑戰(zhàn)。

公開催化劑挑戰(zhàn)賽是一個由Facebook AI和CMU發(fā)起的競賽。賽事的宗旨是利用新的大規(guī)模分子數(shù)據(jù)去預(yù)測熱力學(xué)數(shù)據(jù)。在催化劑發(fā)現(xiàn)領(lǐng)域,這些目標(biāo)分子通常都相對較大,每個分子在結(jié)構(gòu)上平均含有80個原子。

所以他們根據(jù)訓(xùn)練與測試的關(guān)系將數(shù)據(jù)集分為四組,打分是根據(jù)每一個絕對誤差的平均值,來評價系統(tǒng)能夠測量的最佳質(zhì)量。每一行代表一個模型,CGCNN來自一個利用模型研究分子的公司,還有SchNet,DimeNet以及GemNet。大家能看到,在所有的系統(tǒng)中,SphereNet能夠占據(jù)一個非常有競爭力的地位。

上圖是來自其他數(shù)據(jù)集QM9的結(jié)果。這是一個相對較小的數(shù)據(jù)集,每一列代表了一個量子屬性,每一行代表了一個預(yù)測方法,從表中能夠看到每個方法在不同屬性上的平均誤差。

在其他數(shù)據(jù)集上我們的系統(tǒng)也是成功的,例如MD17,這是一個更小的數(shù)據(jù)集。正如我們提到的,GemNet因為使用了2-hop數(shù)據(jù),計算力需求更大,所以只能用在較小的數(shù)據(jù)集當(dāng)中。

正如上圖所見,就算在較小的數(shù)據(jù)集中,我們系統(tǒng)的表現(xiàn)也稍優(yōu)于DimeNet,與GemNet相比表現(xiàn)也相差無幾,但GemNet的計算消耗更大。

下圖計算消耗的比較。截至目前,與兩代的GemNet計算相比,我們的計算消耗都是要小得多的。

下圖展示了系統(tǒng)的過濾器。正如所見,每行代表的分子具有不同的扭角,而在很多情況下我們的過濾器展示的結(jié)果在不同扭角下是非常不同的,這也印證了扭角參數(shù)在捕獲不同分子模式時是非常重要的。

簡單小結(jié)一下,我們的想法是嘗試將分子的三維信息完整地展示出來,所以我們構(gòu)建了SphereNet 框架。并且框架是理論上近乎完善且非常高效的,從實際效果上來看我們的框架可能已經(jīng)是100%覆蓋的了,我們在這個方向上也有了很多的進(jìn)展。

目前,相關(guān)工作已經(jīng)開源,設(shè)計成了“dive into graphs”庫。

特別的,對于分子研究應(yīng)用,我們有一個專門的庫叫做“molecule X”。如果你關(guān)注KDD比賽,你會了解我們是圖形神經(jīng)網(wǎng)絡(luò)計算領(lǐng)域的領(lǐng)先者之一,我們也參與了AI Cures 針對Covid-19的開放挑戰(zhàn)目前我們在AUCROC和AUPRC上的成績都是排名第一。

因此我們的工作主要是開發(fā)全新的圖像處理技術(shù),從而解決基礎(chǔ)科學(xué)領(lǐng)域尤其是量子化學(xué)、量子物理、材料科學(xué)中的問題。我的團(tuán)隊開發(fā)了計算方法、開源了軟件庫并在會議、期刊中發(fā)表了我們的成果。同時,我們也參與了多項開放挑戰(zhàn),如KDD杯。

我們的研究人工智能和量子物理的交叉領(lǐng)域,在量子物理中,是以薛定諤方程為基礎(chǔ)的。相應(yīng)的研究花費非常昂貴,如果構(gòu)建粒子系統(tǒng),需要龐大的算力支持才能解決特征值問題。但將量子物理與AI計算結(jié)合起來,將是一個非?;馃岬念I(lǐng)域,目前,該領(lǐng)域仍處在探索階段。

責(zé)任編輯:張燕妮 來源: 雷鋒網(wǎng)
相關(guān)推薦

2020-08-28 15:39:26

谷歌量子計算開發(fā)者

2022-03-21 11:18:48

機(jī)器學(xué)習(xí)量子計算開發(fā)

2025-03-06 09:35:00

2023-09-10 13:18:10

算法量子化

2022-03-02 10:52:30

量子計算科學(xué)家量子處理器

2023-04-12 15:58:58

2024-02-29 11:53:22

神經(jīng)網(wǎng)絡(luò)NNVMC偏微分方程求解器

2017-08-01 15:39:34

2022-05-31 10:45:01

深度學(xué)習(xí)防御

2022-03-25 10:35:20

機(jī)器學(xué)習(xí)深度學(xué)習(xí)強(qiáng)化學(xué)習(xí)

2022-11-22 15:09:58

技術(shù)獲獎

2021-09-17 15:54:41

深度學(xué)習(xí)機(jī)器學(xué)習(xí)人工智能

2020-10-09 09:57:26

深度學(xué)習(xí)技術(shù)人工智能

2025-02-14 10:38:52

2020-05-12 07:00:00

深度學(xué)習(xí)強(qiáng)化學(xué)習(xí)人工智能

2023-12-03 22:08:41

深度學(xué)習(xí)人工智能

2020-05-22 10:32:32

機(jī)器學(xué)習(xí)

2022-03-18 15:14:03

拓?fù)淞孔佑嬎?/a>拓?fù)溟g隙協(xié)議微軟

2023-01-04 10:02:53

強(qiáng)化學(xué)習(xí)自動駕駛

2022-12-31 14:12:58

神經(jīng)網(wǎng)絡(luò)訓(xùn)練
點贊
收藏

51CTO技術(shù)棧公眾號