斯坦福大學(xué)研究人員利用AI加快新冠藥物發(fā)現(xiàn)
隨著COVID-19疫情不斷威脅全球民眾的生命安全與日常生活,人們開始高度重視這一疾病的預(yù)防與治療。以往人用藥物在美國(guó)食品藥監(jiān)局(FDA)的批準(zhǔn)流程往往需要耗費(fèi)數(shù)億美元,且需要數(shù)月甚至數(shù)年的臨床試驗(yàn)周期。但是,也許治療COVID-19的特效藥就藏在FDA方面已經(jīng)批準(zhǔn)的超過7800種人用藥物當(dāng)中。為了驗(yàn)證這一猜想,全球數(shù)百名研究人員開始投入不懈努力。
在這樣一個(gè)時(shí)間節(jié)點(diǎn)之下,人工智能挺身而出擔(dān)當(dāng)重任,嘗試用AI藥物發(fā)現(xiàn)的方式為抗疫工作帶來新的希望。在今年全美最具發(fā)展前景的50家人工智能企業(yè)當(dāng)中,Atomwise、Genesis Therapeutics、Recursion Pharmaceuticals以及twoXAR等AI藥物發(fā)現(xiàn)廠商榜上有名。來自英國(guó)的Benevolent.ai等企業(yè)也開始在國(guó)際上推動(dòng)AI藥物發(fā)現(xiàn)的普及。這些公司早在COVID-19疫情爆發(fā)之前就邁出了自己的探索腳步,希望使用AI方法發(fā)現(xiàn)現(xiàn)有藥物能否治療多種疾病。
從事這方面研究的AI從業(yè)者也在快速增加。為此,我們與斯坦福大學(xué)人類中心AI研究所著名生物工程學(xué)教授兼副主任Russ Altman博士進(jìn)行了交流。Altman的實(shí)驗(yàn)室重點(diǎn)研究人類遺傳變異對(duì)藥物反應(yīng)造成的影響。面對(duì)此次氣勢(shì)洶洶的COVID-19疫情,他和同事們迅速調(diào)整了工作重心。盡管傳統(tǒng)臨床試驗(yàn)可能需要數(shù)年時(shí)間,但Altman和他的團(tuán)隊(duì)在幾周之內(nèi)就發(fā)現(xiàn)了一種有助于對(duì)抗COVID-19的藥物,其間采用的正是斯坦福大學(xué)研究科學(xué)家Stefano Rensi所倡導(dǎo)的方法。盡管這種新方法不可能百試百靈,但他的團(tuán)隊(duì)確實(shí)在AI技術(shù)的助力下投身于這場(chǎng)全球性的戰(zhàn)役并快速取得成果。
“阻斷”蛋白質(zhì)并抗擊病毒

疾病控制與預(yù)防中心(CDC)發(fā)布的圖片,揭示出冠狀病毒表現(xiàn)出的超微結(jié)構(gòu)。
過去幾個(gè)月以來,“病毒”已經(jīng)成為全球范圍內(nèi)的熱點(diǎn)議題。病毒是一種無法自我復(fù)制的亞顯微介質(zhì),只能依賴于健康的宿主細(xì)胞才能保持活動(dòng)。正常的人類細(xì)胞中包含6000到7000個(gè)蛋白質(zhì)分子。COVID-19病毒被稱為SARS-CoV-2,它會(huì)帶著6種蛋白質(zhì)大分子進(jìn)入人體細(xì)胞,這些在分子在這里被進(jìn)一步處理為29種功能性蛋白。接下來,這些蛋白質(zhì)開始控制完整細(xì)胞,并由病毒指揮細(xì)胞從正常完成人體功能轉(zhuǎn)為單純生成更多SARS-CoV-2拷貝。最終,宿主細(xì)胞中將充滿SARS-CoV-2后代,并在進(jìn)一步裂解之后感染其他更多健康的宿主細(xì)胞。
治療這種病毒的一種可行方法,就是阻斷病毒蛋白的作用。如果科學(xué)家們能夠找到一種干擾病毒控制細(xì)胞能力的方法,即有望阻止這種疾病的發(fā)生。另一種方法就是阻斷某些“幫助”病毒發(fā)揮作用的人類蛋白質(zhì)。但是,要找到并阻斷這些特定蛋白質(zhì)(即「靶標(biāo)」)、發(fā)現(xiàn)具有阻斷作用的藥物以及驗(yàn)證是否切實(shí)發(fā)揮了阻斷效果,無疑是一項(xiàng)艱巨的工作。在Altman的實(shí)驗(yàn)室中,他們運(yùn)用AI技術(shù)通過三步走戰(zhàn)略就此展開探索。
步驟1:通過自然語(yǔ)言處理(NLP)明確方向
第一步是使用AI技術(shù)查看與COVID-19相關(guān)的數(shù)千篇研究論文。對(duì)人類而言,閱讀此類論文需要長(zhǎng)時(shí)間的正規(guī)生物學(xué)專業(yè)學(xué)習(xí)。但機(jī)器完全能夠在自然語(yǔ)言處理的支持下無縫遍歷這些學(xué)術(shù)文獻(xiàn)。斯坦福大學(xué)的機(jī)器學(xué)習(xí)算法掃描了數(shù)千篇與烈性傳染病相關(guān)的論文,包括MERS、HIV以及SARS等,并從中尋找與COVID-19之間的相似之處。其工作原理類似于搜索引擎,能夠以圖形方式映射文獻(xiàn)中的術(shù)語(yǔ)并配合NLP算法進(jìn)行鏈接整合,幫助Altman和他的團(tuán)隊(duì)快速發(fā)現(xiàn)TMPRSS2這一“可疑”蛋白作為潛在靶標(biāo)。

使用自然語(yǔ)言處理將COVID-19相關(guān)疾病的學(xué)術(shù)文獻(xiàn)轉(zhuǎn)換為圖形化模型。
Altman解釋道,“TMPRSS2是一種人類蛋白質(zhì),可幫助COVID-19進(jìn)入人體細(xì)胞。”下圖所示,為TMPRSS2如何幫助COVID-19與ACE2結(jié)合以進(jìn)入人體細(xì)胞。

TMPRSS2幫助COVID-19與ACE2結(jié)合以進(jìn)入人體細(xì)胞。
步驟2:使用有監(jiān)督機(jī)器學(xué)習(xí)投射3D結(jié)構(gòu)
下一步則是了解靶標(biāo)蛋白質(zhì)的“外觀”。遺憾的是,目前世界上還沒有現(xiàn)成的蛋白質(zhì)形狀數(shù)據(jù)庫(kù)。蛋白質(zhì)會(huì)以多種方式進(jìn)行彎曲與折疊,明確并理解其獨(dú)特構(gòu)型往往極度復(fù)雜。要在實(shí)驗(yàn)室中確定蛋白質(zhì)形狀,研究人員往往需要耗費(fèi)數(shù)月甚至數(shù)年時(shí)間。但是,機(jī)器學(xué)習(xí)技術(shù)足以生成接近精確蛋白質(zhì)形狀的表示,Altman實(shí)驗(yàn)室也正在以此作為突破口。Altmann提到,“這在本質(zhì)上是一種有監(jiān)督機(jī)器學(xué)習(xí)問題,相當(dāng)于給定一個(gè)序列,并對(duì)其呈現(xiàn)出的3D結(jié)構(gòu)做出預(yù)測(cè)。目前此類預(yù)測(cè)算法已經(jīng)可以在網(wǎng)上輕松獲取。”

為TMPRSS2蛋白質(zhì)生成3D模型。
步驟3:尋找用于阻斷蛋白質(zhì)的藥物
最后,Altman實(shí)驗(yàn)室還需要尋找一種能夠阻斷目標(biāo)蛋白質(zhì)功能的藥物。只要阻斷蛋白質(zhì)功能,他們就能阻止COVID-19的進(jìn)一步感染。直觀地看,藥物阻斷蛋白質(zhì)的方式高度依賴于其幾何形狀與物理性質(zhì)。換言之,這種阻斷類藥物就像一把鑰匙,能夠?qū)⒌鞍踪|(zhì)功能徹底關(guān)閉。

阻斷類藥物就像一把鑰匙,能夠?qū)⒌鞍踪|(zhì)功能徹底關(guān)閉。
他們首先繪制出可能“匹配”TMPRSS2蛋白質(zhì)結(jié)構(gòu)的潛在藥物,然后將其與已經(jīng)獲得FDA批準(zhǔn)的備選藥物(見下圖)進(jìn)行比對(duì),并最終確定Argatroban似乎很有希望。更重要的是,Argatroban是FDA批準(zhǔn)生產(chǎn)的在售藥物,因此只要療效確切,人們很快就可以將其投入COVID-19治療。

圖中所示,為可能“匹配(具有高親和力)”TMPRSS2蛋白質(zhì)的潛在藥物及其監(jiān)管狀態(tài)。
AI藥物發(fā)現(xiàn)將給我們帶來怎樣的影響?
這一切還僅僅只是開始。目前,全球數(shù)十家實(shí)驗(yàn)室及企業(yè)正在研究如何利用AI技術(shù)加快藥物發(fā)現(xiàn)。除了解決當(dāng)前最迫切的COVID-19抗疫需求之外,這種新方法也有望在抗擊罕見病方面發(fā)揮作用,幫助制藥企業(yè)省下新藥研發(fā)所帶來的數(shù)億甚至數(shù)十億美元成本。例如,如果AI技術(shù)能夠幫助人們發(fā)現(xiàn)可確切治療鐮狀細(xì)胞性貧血的現(xiàn)成藥物,那將是對(duì)世界的一大杰出貢獻(xiàn)。用Altman的話說,“如果能夠切實(shí)降低藥物發(fā)現(xiàn)成本并匹配稅收優(yōu)惠,那么新療法的黃金時(shí)代將就此拉開棄。”
Altman還提醒我們,成功的企業(yè)必須“將AI技術(shù)與強(qiáng)大的生物學(xué)、化學(xué)以及AI團(tuán)隊(duì)緊密結(jié)合起來。如果單純強(qiáng)調(diào)AI部分,而忽視了其他傳統(tǒng)學(xué)科的因素,則根本不可能帶來理想的成果。”換言之,只有組織起涵蓋生物學(xué)家、化學(xué)家以及計(jì)算機(jī)科學(xué)家的跨學(xué)科團(tuán)隊(duì),我們才能組織起具備強(qiáng)大藥物發(fā)現(xiàn)能力的新興力量。疫情的持續(xù)蔓延讓我們必須快速行動(dòng)起來。而且除了COVID-19之外,我們也要時(shí)刻提醒自己,每一天都有上百萬罕見病患者仍在遭受病痛的折磨。而AI技術(shù),將成為攻克這些頑疾的有力武器。