基于量子化學計算和機器學習,從頭開始創(chuàng)建肉眼可檢測的熒光分子
設計熒光分子需要考慮多種相互關聯(lián)的分子特性,而不是與分子結構直接相關的特性,例如分子的光吸收。
在這項研究中,RIKEN 高級智能項目研究中心和東京大學等機構的研究人員合作,使用從頭分子生成器(DNMG)與量子化學計算(QC)相結合來開發(fā)熒光分子,這些分子在各個學科中都引起了廣泛關注。使用大規(guī)模并行計算(1024 核,5 天),DNMG 產生了 3643 個候選分子。
研究人員選擇了一個未報道的分子和七個報道的分子并合成了它們。光致發(fā)光光譜測量表明,DNMG 可以以 75% 的準確度(n = 6/8)成功設計熒光分子,并產生一種未報告的分子,該分子發(fā)出肉眼可檢測到的熒光。
該研究以「De novo creation of a naked eye–detectable fluorescent molecule based on quantum chemical computation and machine learning」為題,于 2022 年 3 月 9 日發(fā)布在《Science Advances》。
簡介
熒光化合物作為可見光發(fā)射體在多個學科的應用中非常重要,包括有機發(fā)光二極管、傳感器和生物成像。盡管已經(jīng)為這些和其他應用開發(fā)了許多熒光分子,但不斷需要新的分子來解決當前材料在功能、可持續(xù)性和低成本方面的缺點。即使是化學結構的細微變化也可能導致重大改進。
熒光是一種受量子力學支配的光化學性質。然而,盡管熒光研究的歷史悠久,但沒有明確的指導方針來制造熒光分子,就像制造吸光分子一樣。
分子熒光發(fā)射的簡化物理化學機制如下圖所示。最初,研究人員認為分子處于單線態(tài)(S0)狀態(tài);在 S0 最小值時,它吸收光并轉變?yōu)閱尉€態(tài)第一激發(fā)態(tài)(S1)。S1 激發(fā)分子在 S1 狀態(tài)下弛豫到最小值并回到 S0 狀態(tài),將 S1 和 S0 狀態(tài)之間的能量差作為光(熒光)發(fā)射。激發(fā)的分子應該在 S1 狀態(tài)下移動到最小值,以便在不失活的情況下發(fā)光。
一些因素,包括與氧分子的反應、分子碰撞、分子內/分子間電子轉移和聚集,可能會在分子在激發(fā)狀態(tài)下運動時使其失活;這導致很難將熒光與分子結構相關聯(lián)。因此,自動化熒光分子設計將是有幫助的。
圖示:熒光分子的單線態(tài)基(S0)態(tài)和單線態(tài)第一激發(fā)(S1)態(tài)的 PES 示意圖。(來源:論文)
近期,基于機器學習(ML)的從頭分子生成器(DNMG)已被開發(fā)用于設計具有簡單和可預測值的分子,例如分配系數(shù)(logP)的對數(shù),可以從分子的組成部分估計。
將 DNMG 與經(jīng)典模擬相結合,成功地生成了具有改進的多功能性和實用性的分子。例如,DNMG 和對接模擬的結合可用于設計生物活性分子;這是通過有機合成研究的。結合分子動力學或預測模型,DNMG 還可以指導功能聚合物的合成。
在之前的研究中,研究人員將量子化學計算(QC)與 DNMG(稱為 ChemTS)相結合,它(原則上)可以從頭設計以量子力學(QM)特性為特征的功能分子。因此,ChemTS 與 QC 相結合被應用于設計可以吸收具有所需波長的光的分子。在 86 個設計和生成的分子中,選擇了 6 個未包含在訓練數(shù)據(jù)集中的已知分子進行紫外-可見 (UV-vis) 吸收測量。結果與發(fā)生器的目標波長一致。
此外,DNMG 增加了發(fā)現(xiàn)新分子的可能性,因為與傳統(tǒng)的高通量 QM 和使用 ML 模型篩選相比,DNMG 的搜索區(qū)域在數(shù)據(jù)集中不受限制。研究人員還使用 QC 對 ChemTS 產生的分子進行了官能團富集分析,以最大化電子增益能量,并發(fā)現(xiàn)了駐極體文獻中未包含的重要官能團。
圖示:在 B3LYP/3-21G* 水平上,生成分子的 S1 狀態(tài)吸收和熒光的 OS 分布曲線。(來源:論文)
雖然相對簡單的特性,如光吸收和電子增益能量,可以直接與分子結構相關,但復雜的現(xiàn)象,如僅由特定分子表現(xiàn)出的熒光,難度要大得多。
在熒光的情況下,有必要考慮多種性質,這些性質錯綜復雜地交織在一起。這使得很難為分子結構的設計建立直觀的指導方針。為了設計實用的化合物,控制目標分子特性的復雜機制必須適當?shù)財?shù)字化以用于 DNMG。此外,必須考慮計算成本隨著探索化學空間的機制復雜性的增加而增加。
圖示:使用 ChemTS 設計的未報告的熒光分子。(來源:論文)
在這項研究中,該團隊設計了具有大規(guī)模并行化 ChemTS 版本的熒光分子。該程序包使用 QC 將熒光機制的最低要求數(shù)字化。有幾個基于電子結構理論的用戶友好軟件包可用于分子和材料的 QC。
為了平衡可靠性與計算成本,研究人員使用密度泛函理論 (DFT) (29) 來評估勢能面 (PES)。為了解決廣泛探索化學空間的計算成本,用基于虛擬損失的概念對 ChemTS 進行大規(guī)模并行化;使用 1024 個核,生成了 3643 個分子。
為了驗證,他們合成了一種未報告的化合物和幾種已報告的化合物。六種化合物,包括一種未報道的化合物,如預期的那樣發(fā)出熒光。未報道的分子可通過市售試劑之間的偶聯(lián)合成,具有意想不到的特性,盡管它由常見的片段[香豆素、吡啶和吡唑并嘧啶]組成。這表明大規(guī)模并行 DNMG 有可能引發(fā)分子設計的范式轉變。
圖示:PC的光致過程。(來源:論文)
討論
幾十年來,QC 在化學和材料科學中發(fā)揮了重要作用。在此期間,計算機輔助分子設計已被用于藥物發(fā)現(xiàn)。然而,QC 只專注于對實驗結果的分析和推測;很少考慮諸如預測各種現(xiàn)象和設計材料之類的創(chuàng)造性工作。
ML 算法最近在化學和材料科學中的應用,代表了計算機輔助化學和材料科學的一個積極轉折點。為了自動設計對有機電子有用的分子,將 QC 與 DNMG 相結合至關重要,因為在此類應用中,量子力學不容忽視。然而,基于 QC 的 DNMG 的價值必須先得到證明,然后才能在實踐中采用。
在這項研究中,研究人員使用 DNMG 來創(chuàng)建具有目前無法輕易預測的特性的分子:熒光。他們使用 DFT 設計了熒光化合物,這是一種固有的量子力學方法。盡管眾所周知,分子受量子力學規(guī)則的支配,但僅憑 QC 很難從頭創(chuàng)建一個新分子。盡管熒光分子具有簡單的 PES,但它們很難從第一原理設計,因為它們的多樣性使得熒光與分子結構的關聯(lián)變得非常困難。
圖示:PC的光化學性質。(來源:論文)
然而,生成器處理了這種多樣性,并成功地從頭開始設計了熒光分子。基于 QC 的大量從頭計算需要大量并行計算(1024 核,5 天);盡管如此,生成器還是成功地產生了 3643 個候選分子。發(fā)生器產生吸收長波長光的分子,以類似于專業(yè)人士的方式控制分子的共軛長度;然而,它無法找到分子的熒光波長/強度與共軛長度/芳環(huán)數(shù)之間的明確相關性。這表明從頭設計熒光分子的困難。
研究人員根據(jù)可合成性和可見熒光標準,選擇了七種已知化合物進行驗證和一種候選化合物進行進一步研究。實驗驗證表明,DNMG 成功設計了 75%(八分之六)的熒光化合物。PC 的熒光(肉眼可見)證明了 DNMG 的創(chuàng)新潛力。
在設計 PC 時,生成器在香豆素中引入了一個不熟悉的基團吡唑并嘧啶;這種連接引起了高空間排斥,但仍導致 OS 增加。
普通化學家很難想出一種通過增加片段之間的空間排斥來增強熒光及其強度的方法。這說明生成器是一種可以超越專業(yè)知識或直覺的工具。DNMG 有可能引發(fā)分子設計的范式轉變。
雖然這項工作中合成的分子的熒光旨在通過肉眼檢測,但通過消除對原子類型的限制并延長設計時間,將產生更多有趣的分子。
此外,通過包括分子的光誘導動力學,可以實現(xiàn)更好的分子設計。通過進一步開發(fā) QC,可以設計出更復雜的功能分子。
因此,具有大規(guī)模并行計算的生成器將能夠創(chuàng)建具有多樣化和有趣功能的復雜分子,可能導致非常復雜的合成路線,這將增加最近開發(fā)的基于 ML 的規(guī)劃逆合成路線的要求。
開源地址:
https://github.com/tsudalab/GaussianRunPack
https://github.com/tsudalab/FL_ChemTS