自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

超越AF2?Iambic、英偉達、加州理工學院開發(fā)多尺度深度生成模型,進行狀態(tài)特異性蛋白質-配體復合物結構預測

人工智能 新聞
NeuralPLexer 預測與酶工程和藥物發(fā)現(xiàn)中重要靶點的結構測定實驗相一致,其在蛋白質組規(guī)模上加速功能蛋白和小分子設計方面擁有巨大潛力。

由蛋白質和小分子配體形成的結合復合物無處不在,對生命至關重要。雖然最近科學家在蛋白質結構預測方面取得了進展,但現(xiàn)有算法無法系統(tǒng)地預測結合配體結構及其對蛋白質折疊的調節(jié)作用。

為了解決這種差異,AI 制藥公司 Iambic Therapeutics、英偉達(Nvidia Corporation)以及加州理工學院(California Institute of Technology)的研究人員提出了 NeuralPLexer,這是一種計算方法,可以僅使用蛋白質序列和配體分子圖輸入直接預測蛋白質-配體復合物結構。

NeuralPLexer 采用深度生成模型以原子分辨率對結合復合物的三維結構及其構象變化進行采樣。該模型基于擴散過程,該過程結合了基本的生物物理約束和多尺度幾何深度學習系統(tǒng),以分層方式迭代采樣殘留級接觸圖和所有重原子坐標。

NeuralPLexer 預測與酶工程和藥物發(fā)現(xiàn)中重要靶點的結構測定實驗相一致,其在蛋白質組規(guī)模上加速功能蛋白和小分子設計方面擁有巨大潛力。

該研究以「State-specific protein–ligand complex structure prediction with a multiscale deep generative model」為題,于 2024 年 2 月 12 日發(fā)布在《Nature Machine Intelligence》。

圖片

靜態(tài)蛋白質結構預測不足以支持藥物設計

深度學習在從一維氨基酸序列預測蛋白質結構方面取得了巨大進步。最先進的蛋白質結構預測網絡,例如 AlphaFold2 (AF2),采用基于蛋白質結構的進化、物理和幾何約束的預測管線。具體來說,從多重序列比對(MSA)或蛋白質語言模型(PLM)和專門的神經網絡中提取的進化約束,與基于序列的信息和幾何表示系統(tǒng)地結合,從而實現(xiàn)端到端的三維(3D)結構預測 。

雖然在預測蛋白質靜態(tài)結構方面取得了巨大成功,但蛋白質折疊問題的這種單一結構公式提供了有關蛋白質功能的不完整信息,并且還被發(fā)現(xiàn)不足以用于基于結構的藥物設計。

生成式深度學習是一種替代范式

然而,與受體構象的實質性變化相結合的蛋白質-配體復合物的計算模型,受到模擬緩慢蛋白質狀態(tài)轉變的高昂成本的阻礙。生成式深度學習的最新發(fā)展提供了一種替代范式,并且在理解復雜視覺和語言領域方面取得了實質性進展。

生成建模的兩個值得注意的策略包括(1)自回歸模型,在序列數(shù)據(jù)(例如自然語言和基因組學)的 Transformer 網絡中廣泛采用,基于順序過程;(2) 基于擴散的生成模型,利用隨機過程通過從先驗分布中采樣并使用神經網絡逐步逆轉噪聲過程來生成數(shù)據(jù)。

科學家已經證明,深度生成模型能夠產生具有經過實驗驗證的功能的從頭設計的蛋白質,包括用于蛋白質序列設計的語言模型和用于蛋白質主鏈生成的擴散模型。擴散模型可以有效地模擬蛋白質骨架之外的分子結構,特別是在分子對接和基于結構的藥物設計方面。

然而,目前為止,還沒有團隊開發(fā)出能夠以原子分辨率直接預測結合復雜結構且精度可與結構測定實驗相媲美的生成模型。

深度生成模型預測蛋白質-配體復雜結構

在最新的研究中,Iambic、英偉達、加州理工學院團隊介紹了 NeuralPLexer,這是一種計算系統(tǒng),它使用由生物物理歸納偏差提供的深度生成模型來預測蛋白質-配體復雜結構。該方法可以以從 PLM 獲得的輔助特征和從實驗解析的同源物或計算模型檢索的模板蛋白質結構為條件,直接生成給定蛋白質序列和配體分子圖輸入的結合復合物的結構集合。

圖片

圖示:NeuralPLexer 能夠準確預測蛋白質-配體復合物的結構和構象變化。(來源:論文)

預測管線和底層神經網絡架構都旨在反映生物分子復合物的多尺度層次結構。具體而言,NeuralPLexer 包括:

(1)基于圖的網絡,將單個小分子和氨基酸圖的原子級化學和幾何特征編碼為張量表示,通過受物理啟發(fā)的網絡架構實現(xiàn),該網絡架構經過百萬級分子構象和生物活性數(shù)據(jù)庫的訓練;

(2)接觸預測模塊(CPM),在最近的視覺語言模型和折疊預測網絡的推動下,使用基于注意力的網絡生成殘留尺度的分子間距離分布、粗粒度接觸圖和相關的配對表示;

(3)等變結構去噪模塊 (ESDM),用于生成以原子尺度和殘留尺度網絡的輸出為條件的結合復雜原子結構,使用等變的結構化去噪擴散過程,并保留蛋白質和配體分子的手性約束。

在對蛋白質-配體盲對接進行評估時,與 PDBBind2020 基準上性能最佳的現(xiàn)有方法相比,NeuralPLexer 將預測成功率提高了高達 78%。在針對挑戰(zhàn)性目標的配體結合位點設計中,NeuralPLexer 僅使用計算生成的截短支架即可有效恢復高達 45% 的結合位點結構。

與現(xiàn)有的基于物理的方法相比,這代表了成功率的質的提高。此外,NeuralPLexer 在選擇性預測受誘導擬合結合或構象選擇影響的蛋白質結構方面比現(xiàn)有方法表現(xiàn)出系統(tǒng)優(yōu)勢;在兩個具有大結構可塑性的配體結合蛋白基準數(shù)據(jù)集上,NeuralPLexer 優(yōu)于最先進的蛋白質結構預測算法 AF2,最高的模板建模得分 (TM-score)(平均 0.906)以及配體結合后發(fā)生重大構象變化的結構域的準確性提高了 11-13%。

NeuralPLexer 模擬配體結合和蛋白質結構變化的多功能能力可以快速表征構象景觀,從而促進更好地理解控制蛋白質功能的分子機制,從而有助于在蛋白質組規(guī)模上識別治療干預和蛋白質工程的非常規(guī)靶點。

結語

作為一種數(shù)據(jù)驅動的方法,NeuralPLexer 具有通用性,并且可以通過整合更好的實驗和生物信息數(shù)據(jù)來持續(xù)改進。來自更廣泛社區(qū)的訓練和基準數(shù)據(jù)集的管理的改進,可能能夠對沒有實驗確定的同源物蛋白質家族進行更系統(tǒng)的分析,并將該方法擴展到更具挑戰(zhàn)性的系統(tǒng),例如翻譯后修飾和多態(tài)大型異聚蛋白質復合物。

該研究為探索這些方向提供了通用的計算框架,為快速準確的蛋白質-配體復合物結構預測鋪平了道路,從而促進結構生物學、藥物發(fā)現(xiàn)和蛋白質工程領域的進步。

論文鏈接:https://www.nature.com/articles/s42256-024-00792-z 

責任編輯:張燕妮 來源: 機器之心
相關推薦

2023-03-03 14:00:00

模型深度學習

2023-07-13 12:53:02

FrameDiffAI

2023-04-24 08:29:29

人工智能機器學習

2021-07-24 10:21:46

模型人工智能深度學習

2023-09-16 13:48:57

AI數(shù)據(jù)

2024-06-18 14:57:29

2016-12-23 11:31:52

麻省理工學院深度學習計算機預測未來

2010-02-25 14:16:58

開源餐廳

2022-10-21 08:23:27

物聯(lián)網醫(yī)療保健

2021-03-26 13:07:23

人工智能機器學習技術

2015-07-02 10:08:14

漏洞漏洞自動修復

2023-07-06 16:59:56

英特爾

2017-09-04 11:47:56

華為

2023-07-06 13:23:49

2022-10-08 12:38:23

模型開源

2020-04-30 09:18:34

麻省理工無人機系統(tǒng)

2022-11-02 13:41:46

2023-07-25 12:50:50

2024-06-19 12:54:24

2017-09-04 17:00:46

點贊
收藏

51CTO技術棧公眾號