從300億分子中篩出6款,結(jié)構(gòu)新且易合成,斯坦福抗生素設(shè)計AI模型登Nature子刊
全球每年有近 500 萬人死于抗生素耐藥性,因此迫切需要新的方法來對抗耐藥菌株。
AI 方法可以發(fā)現(xiàn)新的抗生素,但現(xiàn)有方法有明顯的局限性。性質(zhì)預(yù)測模型很難擴(kuò)展到大型化學(xué)空間。直接設(shè)計分子的生成模型可以快速探索廣闊的化學(xué)空間,但生成的分子難以合成。
在此,斯坦福大學(xué)和麥克馬斯特大學(xué)(McMaster University)的研究人員發(fā)明了一種新的生成式 AI 模型 SyntheMol,可以設(shè)計數(shù)十億種新的抗生素分子,這些分子價格低廉且易于在實驗室中合成。
SyntheMol 可以從近 300 億個分子的化學(xué)空間中設(shè)計易于合成的新化合物。該模型可以設(shè)計新的抗生素來阻止鮑曼不動桿菌的傳播。發(fā)現(xiàn) 6 個結(jié)構(gòu)新穎的分子表現(xiàn)出對鮑曼不動桿菌的抗菌活性。
論文作者、斯坦福大學(xué)生物醫(yī)學(xué)數(shù)據(jù)科學(xué)副教授 James Zou 說,「SyntheMol 不僅設(shè)計了有希望的候選藥物的新穎分子,而且還生成了如何制造每種新分子的配方?!?/span>
全球健康藥物研發(fā)中心(GHDDI)首席科學(xué)官張儒民博士表示:「生成式 AI 模型 SyntheMol 在短短三個月之內(nèi),設(shè)計出六款活性不錯(當(dāng)然有待進(jìn)一步改進(jìn))的結(jié)構(gòu)新穎且易于合成的抗生素候選分子。我們因此有理由樂觀地預(yù)期,在不遠(yuǎn)的將來,AI 必將大幅提升制藥成功率,縮短制藥周期,降低研發(fā)成本,更快造福人類。」
相關(guān)研究以《Generative AI for designing and validating easily synthesizable and structurally novel antibiotics》為題,于 2024 年 3 月 22 日發(fā)布在《Nature Machine Intelligence》上。
論文鏈接:https://www.nature.com/articles/s42256-024-00809-7
耐藥細(xì)菌在全球范圍內(nèi)的傳播迫切需要新的抗生素,但即使是現(xiàn)代 AI 方法在分離有希望的化合物方面也受到限制,特別是當(dāng)研究人員還必須找到制造這些新的 AI 引導(dǎo)藥物并在實驗室中測試它們的方法時。
眾所周知,鮑曼不動桿菌很難根除,可引起肺炎、腦膜炎和傷口感染,所有這些都可能導(dǎo)致死亡。世界衛(wèi)生組織已將鮑曼不動桿菌確定為世界上最危險的耐抗生素細(xì)菌之一。但幾乎沒有什么治療選擇。
該論文的第一作者,麥克馬斯特大學(xué)生物醫(yī)學(xué)與生物化學(xué)系助理教授 Jonathan Stokes 說,「抗生素是一種獨特的藥物。一旦我們開始在臨床上使用它們,我們就會在藥物失效之前開始計時,因為細(xì)菌會迅速進(jìn)化以抵抗它們。我們需要強(qiáng)大的抗生素管道,需要快速且廉價地發(fā)現(xiàn)它們。這就是 AI 發(fā)揮關(guān)鍵作用的地方?!?/span>
SyntheMol 設(shè)計出 6 個結(jié)構(gòu)新穎且易于合成的抗生素分子
研究人員開發(fā)了生成模型,可以快速、廉價地獲取數(shù)百億個有希望的分子。
SyntheMol 使用蒙特卡洛樹搜索(MCTS),從包含 132,000 個分子片段的庫中提取數(shù)據(jù),這些片段像樂高積木一樣拼湊在一起,但本質(zhì)上卻截然不同。
然后,他們將這些分子片段與一組 13 個化學(xué)反應(yīng)進(jìn)行交叉引用,使其能夠識別 300 億個片段的雙向組合,從而設(shè)計出具有最有希望的抗菌特性的新分子。
圖示:SyntheMol 模型。(來源:論文)
研究訓(xùn)練 SyntheMol 來設(shè)計對鮑曼不動桿菌具有抗生素活性的分子,合成并通過實驗驗證了所生成的 58 個分子。
該模型設(shè)計的每個分子依次通過另一個經(jīng)過訓(xùn)練來預(yù)測毒性的人工智能模型。該過程產(chǎn)生了六種分子,它們對鮑曼不動桿菌具有有效的抗菌活性,而且無毒。
圖示:生成式 AI 用于抗生素發(fā)現(xiàn)。(來源:論文)
科學(xué)家們能夠進(jìn)一步測試六種化合物中的兩種對小鼠的毒性,因為其他四種不溶于水。他們測試的兩個似乎是安全的;下一步是在感染鮑曼不動桿菌的小鼠身上測試這些藥物,看看它們是否在活體中起作用。
難得一見的 10% 高成功率
張儒民博士認(rèn)為,該研究有至少如下幾個可資學(xué)習(xí)的亮點:
(1)作者首先實測了一萬多種化合物對鮑曼不動桿菌的抑菌活性,用這些可靠數(shù)據(jù)訓(xùn)練「活性預(yù)測」模型。這是非常必要的、扎扎實實的基本功。
(2)從頭就著眼于「易于合成、結(jié)構(gòu)新穎的小分子」,使用常見的 13 個化學(xué)反應(yīng)和 132,000 個小分子構(gòu)建塊,可以虛擬搭建高達(dá)近 300 億個易于合成的小分子。當(dāng)然,絕大多數(shù)化合物并不具有生物活性。
(3)用生成式人工智能 SyntheMol 模型,基于上述實測數(shù)據(jù)的「活性預(yù)測」建模,在短短八個半小時內(nèi)完成的 20,000 次迭代分子生成中,設(shè)計出近 3,000 款預(yù)期具有抗菌活性的候選分子(其中三分之一在頭 2,000 次迭代中即生成了)。
(4)最后遴選出 58 個新穎、多元、預(yù)測有高活性的分子,并在實驗室實際合成出來。其中 6 個分子有相當(dāng)好的廣譜抗菌活性,且有足夠低的耐藥幾率。這代表了難得一見的 10% 高成功率!
圖示:生成模型開發(fā)。(來源:論文)
張儒民博士補充道:「該研究也存在一定局限性,SyntheMol 模型還不能一步或寥寥幾步到位,快速優(yōu)化設(shè)計最后具備完整成藥性的、可推到人體臨床試驗的新穎藥物分子。AI 賦能制藥的科技革命尚未成功,藥業(yè)同仁仍需努力?!?/span>
研究人員也正在改進(jìn) SyntheMol 并擴(kuò)大其范圍。他們正在與其他研究小組合作,利用該模型來發(fā)現(xiàn)治療心臟病的藥物,并為實驗室研究創(chuàng)造新的熒光分子。