DeepMind Alpha家族新成員:AlphaProteo蛋白質(zhì)設計成功率破紀錄
像 AlphaFold 這樣的蛋白質(zhì)結(jié)構(gòu)預測工具,已經(jīng)幫助我們深入了解了蛋白質(zhì)如何相互作用從而發(fā)揮其功能,但這些工具無法創(chuàng)建新的蛋白質(zhì)來直接控制這些相互作用。
現(xiàn)在,Google DeepMind 團隊推出了一種用于設計「與目標分子結(jié)合更緊密」的新型蛋白質(zhì)的 AI 系統(tǒng) AlphaProteo。
在測試的 7 種靶蛋白上,AlphaProteo 的實驗成功率更高,在濕實驗室中測試中,9% 到 88% 候選分子成功結(jié)合,這比其他方法高出 5 到 100 倍。而且,比現(xiàn)有最佳方法的結(jié)合親和力高出 3 到 300 倍。
僅需一輪中等通量篩選且無需進一步優(yōu)化,AlphaProteo 便可生成適用于多種應用的「即用型」結(jié)合劑。它可以幫助科學家更好地了解生物系統(tǒng)如何運作,節(jié)省研究時間,推進藥物設計等等。
該團隊于 2024 年 9 月 5 日上線了最新論文《De novo design of high-affinity protein binders with AlphaProteo》。
論文鏈接:https://storage.googleapis.com/deepmind-media/DeepMind.com/Blog/alphaproteo-generates-novel-proteins-for-biology-and-health-research/Protein_Design_White_Paper_2024.pdf
從細胞生長到免疫反應,身體中的每個生物過程都依賴于稱為蛋白質(zhì)的分子之間的相互作用。好比鑰匙開鎖一樣,一種蛋白質(zhì)可以與另一種蛋白質(zhì)結(jié)合,幫助調(diào)節(jié)關鍵的細胞過程。
蛋白質(zhì)-蛋白質(zhì)相互作用是蛋白質(zhì)功能的一個基本方面,蛋白質(zhì)結(jié)合蛋白是治療、診斷和生物醫(yī)學研究的基本組成部分。
傳統(tǒng)上,抗體、納米抗體和其他支架(如 DARPins)通過免疫或定向進化開發(fā)成針對各種靶標的結(jié)合物。不過,實驗選擇無法控制目標表位,而且對于常規(guī)研究應用來說往往過于費力。
不使用天然蛋白質(zhì)作為起點,從頭計算設計結(jié)合物可以靶向預先指定的表位,并生成比抗體更小、更熱穩(wěn)定且更易于表達的結(jié)合物。
AlphaProteo 蛋白質(zhì)設計系統(tǒng)
近期,基于深度學習的模型在生物分子結(jié)構(gòu)預測和蛋白質(zhì)設計方面取得了重大進展。這推動了關鍵科學和社會挑戰(zhàn)的進展,包括蛋白質(zhì)-蛋白質(zhì)相互作用的預測和設計。
現(xiàn)在無需高通量篩選即可獲得針對某些靶標的計算設計結(jié)合物。在某些情況下,無需進行實驗優(yōu)化即可實現(xiàn)高結(jié)合親和力,例如對于小肽或無序靶標。
然而,針對凸表位或極性表位的成功率仍然很低,初始設計的親和力通常很差,許多靶標仍然難以處理。
在最新的論文中,DeepMind 團隊介紹了 AlphaProteo 蛋白質(zhì)設計系統(tǒng),并表明它可以設計從頭蛋白質(zhì)結(jié)合蛋白,該系統(tǒng)具有以下優(yōu)勢:
1、高成功率:通過篩選數(shù)十種設計候選物可以獲得穩(wěn)定、高表達和特異性的結(jié)合物,從而無需使用高通量方法。
2、高親和力:對于除一個目標之外的每個測試目標,最佳結(jié)合劑具有亞納摩爾或低納摩爾結(jié)合親和力(KD),從而最大限度地減少了下游親和力優(yōu)化所需的勞動力。
3、整體優(yōu)勢:使用單一設計方法,無需復雜的人工干預,即可成功獲得針對一系列具有不同結(jié)構(gòu)和生化特性的靶標的結(jié)合劑。
圖示:AlphaProteo 概述。(來源:論文)
了解蛋白質(zhì)相互結(jié)合的復雜方式
能夠與靶蛋白緊密結(jié)合的蛋白質(zhì)結(jié)合劑很難設計。傳統(tǒng)方法耗時巨大,需要多輪大量的實驗室工作。在創(chuàng)建結(jié)合劑后,它們還需要進行大量額外的實驗從而優(yōu)化結(jié)合親和性。
AlphaProteo 經(jīng)過蛋白質(zhì)數(shù)據(jù)庫 (PDB) 中的大量蛋白質(zhì)數(shù)據(jù)和 AlphaFold 中的 1 億多條預測結(jié)構(gòu)的訓練,已經(jīng)了解了分子相互結(jié)合的無數(shù)方式。給定目標分子的結(jié)構(gòu)和該分子上的一組首選結(jié)合位置,AlphaProteo 會生成一個候選蛋白質(zhì),該蛋白質(zhì)在這些位置與目標結(jié)合。
視頻1:預測的蛋白質(zhì)結(jié)合物結(jié)構(gòu)與靶蛋白相互作用的圖示。藍色部分是 AlphaProteo 生成的預測蛋白質(zhì)結(jié)合物結(jié)構(gòu),旨在與靶蛋白結(jié)合。黃色部分是靶蛋白,具體來說是 SARS-CoV-2 刺突受體結(jié)合域。(來源:DeepMind 官網(wǎng))
在重要的蛋白質(zhì)結(jié)合靶點上取得成功
為了測試 AlphaProteo,研究人員設計了針對各種靶蛋白的結(jié)合劑,包括兩種與感染有關的病毒蛋白 BHRF1 和 SARS-CoV-2 刺突蛋白受體結(jié)合域 SC2RBD,以及五種與癌癥、炎癥和自身免疫性疾病有關的蛋白 IL-7Rɑ、PD-L1、TrkA、IL-17A 和 VEGF-A。
AlphaProteo 系統(tǒng)具有極具競爭力的結(jié)合成功率和一流的結(jié)合強度。對于七個靶點,AlphaProteo 在計算機模擬中生成候選蛋白,這些蛋白在實驗測試時與目標蛋白緊密結(jié)合。
圖示:AlphaProteo 為其生成成功結(jié)合劑的七種靶蛋白的預測結(jié)構(gòu)圖。藍色表示在濕實驗室中測試的結(jié)合劑示例,黃色是蛋白質(zhì)靶點,深黃色突出顯示的是預期的結(jié)合區(qū)域。(來源:論文)
對于一個特定靶標,即病毒蛋白 BHRF1,在 Google DeepMind Wet Lab 中進行測試時,88% 候選分子成功結(jié)合。根據(jù)測試的靶標,AlphaProteo 結(jié)合劑的結(jié)合力平均比現(xiàn)有最佳設計方法強 10 倍。
對于另一個靶標 TrkA,新結(jié)合劑甚至比經(jīng)過多輪實驗優(yōu)化的針對該靶標的最佳先前設計結(jié)合劑更強。
圖示:與其他設計方法相比,AlphaProteo 針對七種目標蛋白的實驗體外成功率。成功率越高,意味著需要測試的設計越少,才能找到成功的結(jié)合體。(來源:論文)
圖示:與其他設計方法相比,AlphaProteo 的設計在未進行實驗優(yōu)化的情況下對七種目標蛋白的最佳親和力。親和力越低,意味著結(jié)合蛋白與目標蛋白的結(jié)合越緊密。(來源:論文)
對多種蛋白質(zhì)的驗證結(jié)果
研究人員除了在其濕實驗室中進行計算機驗證和測試 AlphaProteo 之外,還聘請了 Francis Crick 研究所的 Peter Cherepanov、Katie Bentley 和 David LV Bauer 研究小組來驗證其蛋白質(zhì)結(jié)合劑。
在不同的實驗中,他們深入研究了一些更強的 SC2RBD 和 VEGF-A 結(jié)合劑。
研究小組證實,這些結(jié)合劑的結(jié)合相互作用確實與 AlphaProteo 所預測的相似。此外,研究小組還證實了這些結(jié)合劑具有有用的生物學功能。例如,一些 SC2RBD 結(jié)合劑被證明可以防止 SARS-CoV-2 及其某些變體感染細胞。
AlphaProteo 的性能表明,它可以大大減少涉及廣泛應用的蛋白質(zhì)結(jié)合劑的初始實驗所需的時間。
然而,該人工智能系統(tǒng)有局限性,因為它無法針對第 8 個靶點 TNFɑ(一種與類風濕性關節(jié)炎等自身免疫性疾病相關的蛋白質(zhì))設計成功的結(jié)合物。研究人員選擇 TNFɑ 來挑戰(zhàn) AlphaProteo,因為計算分析表明設計結(jié)合物非常困難。
接下來,該團隊將繼續(xù)改進和擴展 AlphaProteo 的功能,最終目標是解決這些具有挑戰(zhàn)性的靶點。實現(xiàn)強結(jié)合通常只是設計可能對實際應用有用的蛋白質(zhì)的第一步,在研發(fā)過程中還有更多的生物工程障礙需要克服。
開發(fā)更全面的蛋白質(zhì)設計產(chǎn)品
蛋白質(zhì)設計是一項快速發(fā)展的技術,在各個領域都具有巨大的科學進步潛力,從了解導致疾病的因素,到加速病毒爆發(fā)的診斷測試開發(fā),支持更可持續(xù)的制造過程,甚至清除環(huán)境中的污染物。
未來,DeepMind 將與科學界合作,利用 AlphaProteo 解決有影響力的生物學問題并了解其局限性。他們還一直在 Isomorphic Labs 探索其藥物設計應用,并對未來的發(fā)展感到興奮。
該團隊將不斷提高 AlphaProteo 算法的成功率和親和力,擴大它可以解決的設計問題范圍,并與機器學習、結(jié)構(gòu)生物學、生物化學和其他學科的研究人員合作,為社區(qū)開發(fā)負責任、更全面的蛋白質(zhì)設計產(chǎn)品。
相信 AlphaProteo 將為許多生物應用開辟新的解決方案,例如控制細胞信號傳導,成像蛋白質(zhì)、細胞和組織,賦予各種效應系統(tǒng)目標特異性等等。