機器學習如何助力計算化學研究發(fā)展?
在過去的幾年中,化學研究只專注于使用從個人經(jīng)驗和文獻中獲得的先前研究成果的進行試驗的方法。盡管在文獻中一直有很多反應和化學途徑可供科學家使用,但在一系列反應/一系列反應中可能會發(fā)生許多不可預測的自發(fā)場景。這是化學研發(fā)需要時間和耐心才能產(chǎn)生結果的原因之一。
在過去的十年左右的時間里,計算化學領域一直在增長。盡管早在那之前,計算方法的使用還是很有限的,但是近年來,它已經(jīng)成為優(yōu)化和預測化學研究的非常強大的工具。現(xiàn)在,使用計算方法,化學家可以預測反應的工作方式,最佳參數(shù)、要使用的試劑和反應條件,甚至可以使用計算方法來預測他們計劃制造的材料/分子的結構和性質。
因此,計算方法可以在整個概念、開發(fā)和分析過程中為化學家提供幫助。那么,為什么近年來使用量增加了?首先,化學家對計算化學有了更多的了解,并意識到它可以帶來的好處。第二,更多科學家現(xiàn)在更容易獲得支持這些模擬所需的計算能力。第三,機器學習算法的進步以及它們在計算化學過程中的集成,使得可以獲得更準確的結果-實驗進行時,成功的可能性更高。
將機器學習應用于化學過程
像許多實施機器學習的領域一樣,它在計算化學領域的用途是從文獻中獲取所有已知數(shù)據(jù),進行推斷和分析,并預測最可能的結果。對于化學領域,這通常意味著從不同的反應中獲取數(shù)據(jù),例如試劑的類型、化學物質的濃度、工藝條件以及可以生產(chǎn)的產(chǎn)品。
所有這些數(shù)據(jù)都是有價值的,因為它們都是可以決定結果的因素,使反應物成為理想的輸入集,而產(chǎn)物則成為輸出。這些數(shù)據(jù)的使用可以被輸入到機器學習算法中,并且可以用來做三件事。首先是通過使用現(xiàn)有數(shù)據(jù),可以推斷出化學結構形成的最可能原因(從反應/過程的角度來看),并且可以被工業(yè)界用來預測執(zhí)行其所需功能的新分子。
第二種方法更多地與流程本身有關。有時,研究人員會想到一個產(chǎn)品,但不知道其過程??梢詮囊郧暗姆磻蝎@取數(shù)據(jù)并進行分析,這使算法能夠預測哪些條件和試劑將負責分子中不同化學基團的形成。這使算法可以創(chuàng)建反應路徑,該算法顯示了逐步構建分子的最可能途徑。
第三種方法是完整的分子設計方法,該方法以一個想法開始,但沒有定義的產(chǎn)物或反應途徑。這采用了其他兩點的原則。盡管如此,除了一個變量(產(chǎn)物或反應)外,兩者在技術上都是未知的,因此算法需要外推產(chǎn)物和反應條件,以產(chǎn)生可能的結果/途徑。這是一項較難執(zhí)行的任務,但受到了很多關注。
機器學習預測分子
計算化學的另一個主要方面是對材料/分子本身,它們的基本內在特性以及它們在某些情況/環(huán)境下的行為進行預測。與工業(yè)中通常采用的工藝優(yōu)化相比,這是計算化學的更基本、更長時間的使用,并且在學術界研究新材料和分子時通常更常用(因為這是時間、金錢和有效產(chǎn)品規(guī)模的體現(xiàn))。應當指出的是,這些努力不僅限于化學領域,因為在生物和工程領域也使用了類似的計算方法。
即使需要關注的因素較少(即僅關注分子,而不是過程和分子),但在此領域中使用計算化學也很重要,因為它有助于從根本上實現(xiàn)結果。通常是在創(chuàng)建工業(yè)流程之前發(fā)生的階段-機器學習也確實幫助提升了這一領域。
模擬分子的結構及其如何執(zhí)行并非易事。多年來,一直受到需要計算的變量數(shù)量與可用計算能力的限制(許多研究人員共享一臺超級計算機來執(zhí)行上述計算)。機器學習在這方面確實有所幫助,因為與以前相比,計算原子的各種數(shù)量、鍵能、能量和反應勢壘、量子特性、磁和激發(fā)分子態(tài)以及分子間和分子內相互作用都非常容易。
從一組變量和已知數(shù)據(jù)點推斷和預測最佳解決方案是機器學習最擅長的事情,這意味著使用機器學習算法可以更輕松地優(yōu)化必須計算的大量數(shù)據(jù)。上述許多變量對分子/分子系統(tǒng)的結構和性質都有重要影響,因此推論出比往年更準確的分子和性質。它甚至可以使更復雜的原子(例如元素周期表中的d和f塊元素)的計算精度更高,而在過去的幾年中這是不可能的。
總結
即使有幾種不同的計算程序可用于創(chuàng)建這些分子模擬,但是機器學習也可以應用于所有這些模擬中。機器學習不僅有助于優(yōu)化和改善工業(yè)水平上的化學和藥物發(fā)現(xiàn)過程,而且在推論已知和未知分子的分子結構和特性,了解分子在某些情況下的行為以及反應最有可能產(chǎn)生的結果等基礎性方面也發(fā)揮了關鍵作用。
總體而言,機器學習已經(jīng)對計算化學產(chǎn)生了巨大影響,并且隨著越來越多的化學家在嘗試實驗程序之前首先轉向計算/模擬,機器學習將在未來幾年中發(fā)揮更大的作用。