純AI研發(fā)新藥登Nature,效率提升3倍,臨床實(shí)驗(yàn)療效拔群
完全由AI研發(fā)的藥物馬上將要上市了?!
由AI制藥公司Insilico Medicine開發(fā)的治療肺部纖維化的藥物TNIK已經(jīng)進(jìn)入二期臨床試驗(yàn)。
研究團(tuán)隊(duì)的在Nature子刊上發(fā)表了最新的研究成果。
論文地址:https://www.nature.com/articles/s41587-024-02143-0#Sec14
論文介紹了名為INS018_055的藥物研發(fā)的整個(gè)歷程。這是Insilico Medicine的利用他們開發(fā)的AI平臺PHARMA.AI發(fā)現(xiàn)的一種候選藥物,用于應(yīng)對一種罕見,但是能夠引發(fā)肺部纖維化,致死率很高的疾病。
這個(gè)研發(fā)過程開創(chuàng)了生成式人工智能在藥物發(fā)現(xiàn)領(lǐng)域的先例。
該藥物是世界首個(gè)利用生物AI發(fā)現(xiàn)靶點(diǎn)并確定優(yōu)先次序,同時(shí)利用化學(xué)AI生成分子的藥物。
而發(fā)現(xiàn)這種藥物的平臺Pharma.AI,包含了多個(gè)數(shù)百萬個(gè)數(shù)據(jù)樣本上訓(xùn)練出來的多個(gè)AI模型,用于完成一系列任務(wù)。
其中一個(gè)PandaOmics 可以快速識別對疾病療效起重要作用的靶點(diǎn),并確定其優(yōu)先次序。
另一個(gè)工具是Chemistry42引擎,它利用深度學(xué)習(xí)技術(shù),可以快速設(shè)計(jì)出針對PandaOmics所識別的蛋白質(zhì)的新的潛在藥物化合物。
傳統(tǒng)的藥物開發(fā)通常是一條「非常漫長但也非常危險(xiǎn)的道路」,需要數(shù)十年的臨床前細(xì)胞、組織、動物模型和人體臨床試驗(yàn),耗資數(shù)十億美元,失敗率超過90%。
據(jù)而根據(jù)Insilico估算,如果采用傳統(tǒng)的藥物發(fā)現(xiàn)方法,和INS018_055相似的新藥需要花費(fèi)4億多美元,時(shí)間可能長達(dá)6年。
但利用生成式AI,該公司僅用兩年半的時(shí)間就完成了臨床試驗(yàn)的第一階段,而成本僅為原來的1/3。
AI藥物平臺開發(fā)新藥,效率提高3倍
特發(fā)性肺纖維化(IPF)是一種侵襲性間質(zhì)性肺病,死亡率很高。
而目前和IPF的潛在藥物靶點(diǎn)未能轉(zhuǎn)化為臨床層面的有效療法。
研究人員采用預(yù)測性人工智能(AI)方法,將TRAF2-與NCK相互作用激酶(TNIK)確定為抗纖維化靶點(diǎn)。
再進(jìn)一步利用人工智能驅(qū)動的方法,生成了一種小分子TNIK抑制劑 INS018_055,它通過口服、吸入或局部給藥,在體內(nèi)不同器官中表現(xiàn)出理想的類藥物特性和抗纖維化活性。
而且INS018_055除具有抗纖維化特性外,還具有抗炎作用,這已在多項(xiàng)體內(nèi)研究中得到驗(yàn)證。
一項(xiàng)隨機(jī)、雙盲、安慰劑對照的 I 期臨床試驗(yàn)(NCT05154240)驗(yàn)證了 INS018_055的安全性、耐受性和藥代動力學(xué),78名健康人參加了該試驗(yàn)。
在中國進(jìn)行的另一項(xiàng) I 期臨床試驗(yàn)(CTR20221542)也證明了該藥物具有可比的安全性和藥代動力學(xué)特征。
從目標(biāo)發(fā)現(xiàn)到臨床前候選藥物提名,整個(gè)流程在大約18個(gè)月內(nèi)完成,展示了生成式人工智能驅(qū)動藥物發(fā)現(xiàn)的能力。
治療靶點(diǎn)的確定是包括纖維化在內(nèi)的所有疾病的藥物研發(fā)過程中至關(guān)重要的一步。在藥物開發(fā)的早期階段選擇錯(cuò)誤的靶點(diǎn)可能會導(dǎo)致藥物發(fā)現(xiàn)項(xiàng)目成本高昂,并往往在多年后的二期試驗(yàn)中以失敗告終。
因此,大型制藥公司可能會表現(xiàn)出規(guī)避風(fēng)險(xiǎn)的態(tài)度,從而降低對有潛在價(jià)值的靶點(diǎn)和治療策略進(jìn)行投資的意愿。
盡管開發(fā)精確的數(shù)據(jù)驅(qū)動藥物靶點(diǎn)發(fā)現(xiàn)方法對臨床試驗(yàn)的成功有著至關(guān)重要的影響,但這項(xiàng)任務(wù)仍存在公認(rèn)的局限性,如數(shù)據(jù)復(fù)雜性和批量效應(yīng)。
最近,人工智能驅(qū)動的方法已在胚胎-胎兒轉(zhuǎn)化7 和肌肉衰老方面證明了發(fā)現(xiàn)候選靶點(diǎn)的有效性。
應(yīng)用于多組學(xué)數(shù)據(jù)的高級通路分析和人工智能算法即使在先前證據(jù)稀少的情況下也能發(fā)現(xiàn)靶點(diǎn)和生物標(biāo)記物。
IPF是一種逐漸進(jìn)展且通常致死的疾病,組織學(xué)特征為成纖維細(xì)胞增殖和大量細(xì)胞外基質(zhì)沉積。
IPF 最常見于60歲以上的患者,據(jù)報(bào)道,其在美國的估計(jì)發(fā)病率為每10萬人年6.8例。
由于發(fā)病率不斷上升,治療IPF患者的費(fèi)用給醫(yī)療系統(tǒng)造成了沉重負(fù)擔(dān),并成為全球日益嚴(yán)重的公共衛(wèi)生問題。
在未經(jīng)治療的患者中,IPF 的臨床病程極不穩(wěn)定,中位生存期為2到3年。
研發(fā)流程
研究人員的人工智能生成平臺發(fā)現(xiàn)TNIK抑制是一種有效的抗纖維化策略,并協(xié)助開發(fā)了一種高度特異性的TNIK抑制劑INS018_055。
在這里,使用PandaOmics 這一商用靶點(diǎn)發(fā)現(xiàn)平臺,利用包括生成預(yù)訓(xùn)練轉(zhuǎn)換器在內(nèi)的多種人工智能引擎,進(jìn)行纖維化的靶點(diǎn)識別。
研究人員將從 IPF 患者組織樣本中提取的多組學(xué)數(shù)據(jù)集列表作為計(jì)算管道的基礎(chǔ)(圖 1a,步驟 1)。
這個(gè)流程結(jié)合了幾種不同但互補(bǔ)的計(jì)算方法,所有方法的輸出結(jié)果(按最有希望的靶點(diǎn)排序的基因列表)相似,但輸入數(shù)據(jù)不同。
除多組學(xué)數(shù)據(jù)集外,研究人員還采用了依賴生物網(wǎng)絡(luò)分析和科學(xué)文獻(xiàn)文本數(shù)據(jù)的方法(圖 1a,步驟 2),并對節(jié)點(diǎn)度偏差進(jìn)行了控制。
這些數(shù)據(jù)類型有助于將從omics中推斷出的目標(biāo)假設(shè)與先前的證據(jù)(包括臨床試驗(yàn)、出版物和撥款申請)結(jié)合起來。
文本數(shù)據(jù)具有時(shí)間性,使 PandaOmics 不僅能捕捉趨勢,甚至還能預(yù)測未來(圖 1a,步驟 3)。
與 Open Targets43 或 NewDrugTargets44 等其他靶點(diǎn)發(fā)現(xiàn)方法不同,研究人員的方法是為搜索多種疾病和老齡化的靶點(diǎn)而設(shè)計(jì)并經(jīng)過驗(yàn)證的。
因此,研究人員開發(fā)了一種時(shí)間機(jī)器方法,利用某個(gè)時(shí)間點(diǎn)之前發(fā)布的數(shù)據(jù)訓(xùn)練計(jì)算模型,并通過模型預(yù)測該時(shí)間點(diǎn)之后制藥業(yè)關(guān)注的靶點(diǎn)的能力來驗(yàn)證模型輸出結(jié)果。
研究人員應(yīng)用了幾種不同的人工智能驅(qū)動的靶點(diǎn)發(fā)現(xiàn)理念,包括異質(zhì)圖上的隨機(jī)漫步和負(fù)矩陣因式分解(補(bǔ)充視頻 1)。
研究人員的平臺在綜合應(yīng)用分?jǐn)?shù)構(gòu)成和過濾器(包括蛋白質(zhì)家族等疾病診斷特性、小分子或治療性抗體的可及性、新穎性和晶體結(jié)構(gòu)可用性等)后生成了一份目標(biāo)排序列表。
為了生成纖維化的目標(biāo)假設(shè),研究人員對纖維化相關(guān)數(shù)據(jù)集采用了 「蛋白質(zhì)和受體激酶 」方案。
它包括反映疾病機(jī)制網(wǎng)絡(luò)成分的分?jǐn)?shù),以及基于轉(zhuǎn)錄因子富集的因果推斷(補(bǔ)充信息 1)。在下游處理步驟中啟用了蛋白質(zhì)類別(僅限蛋白質(zhì)和受體激酶)、新穎性和小分子藥物篩選器(圖 1a,步驟 4)。
使用 「蛋白和受體激酶 」方法,TNIK被確定為五大候選靶點(diǎn)中的第一位,其網(wǎng)絡(luò)鄰域、因果推斷、通路、相互作用組群落、表達(dá)、異質(zhì)圖步行和矩陣因式分解得分值相對較高(圖 1a,步驟 5,圖 1b)。
TNIK 與纖維化驅(qū)動通路相關(guān),包括 WNT45,46、TGF-β46,47、Hippo(是相關(guān)蛋白(YAP)-具有 PDZ 結(jié)合基調(diào)(TAZ)的轉(zhuǎn)錄輔激活因子)、JNK和核因子(NF)-κB信號轉(zhuǎn)導(dǎo)。
不過,TNIK尚未作為IPF的治療靶點(diǎn)進(jìn)行研究,因此被人工智能算法選中。
雖然酪氨酸激酶抑制劑如寧替尼、伊馬替尼和尼洛替尼已在 IPF 中進(jìn)行了測試,但絲氨酸-蘇氨酸激酶(如 TNIK)在 IPF中的作用在很大程度上仍未得到探討(圖 1c)。
由于纖維化可影響任何器官,并且是工業(yè)化國家高達(dá) 45% 的死亡原因51,研究人員假設(shè)抑制 TNIK 可為多種可能與纖維化有關(guān)的病理提供治療益處。
與這一假設(shè)一致的是,TNIK 被獨(dú)立預(yù)測為與多種衰老特征相關(guān)的疾病靶點(diǎn)15,并且是衰老和/或高脂飲食喂養(yǎng)小鼠的脂質(zhì)代謝調(diào)節(jié)劑52。這些發(fā)現(xiàn)支持了研究人員人工智能驅(qū)動管道的假設(shè)。
接下來,研究人員對 PandaOmics 分?jǐn)?shù)進(jìn)行了透明度分析。
交互組群落透明度顯示,TNIK抑制與多個(gè)已知對纖維化進(jìn)展很重要的生物過程有關(guān),如局灶粘附信號轉(zhuǎn)導(dǎo)、肌成纖維細(xì)胞分化和間質(zhì)細(xì)胞遷移(擴(kuò)展數(shù)據(jù)圖2a)。
因果推理透明度顯示,TNIK 與 TGFB1、FGR、FLT1、KDR 等 IPF 相關(guān)基因密切相關(guān)(下圖 2b)。
最后,利用人工智能驅(qū)動的新通路重建工具,研究人員發(fā)現(xiàn) TNIK 激活了以前描述的與 IPF 相關(guān)的通路。這些基因集受到下游轉(zhuǎn)錄因子的調(diào)控,包括 TCF-LEF、SMAD、NF-κB 和 TEAD 家族(下圖 2c)。
研究人員合成了這種化合物,并在多種鼠類和大鼠纖維化模型中證明了它的選擇性抗纖維化活性。
研究人員報(bào)告的I期臨床試驗(yàn)數(shù)據(jù)強(qiáng)調(diào)了研究人員的小分子抑制劑的安全性和耐受性。從目標(biāo)發(fā)現(xiàn)到臨床前候選化合物提名,這一綜合方法在大約18個(gè)月的時(shí)間內(nèi)完成,展示了研究人員的生成式人工智能驅(qū)動藥物發(fā)現(xiàn)管道的能力。
人工智能設(shè)計(jì)的 TNIK 抑制劑
為了鑒定TNIK抑制劑,研究人員利用了現(xiàn)有的TNIK激酶結(jié)構(gòu)域晶體結(jié)構(gòu)56 和 Chemistry42 基于結(jié)構(gòu)的藥物設(shè)計(jì) AI 工作流程(圖 1a,步驟 6)。
由于使用ATP競爭者是靶向激酶的成熟策略 ,研究人員選擇 ATP 結(jié)合位點(diǎn)作為化合物生成的口袋。
人工智能驅(qū)動的平臺被配置為生成能與 TNIK 鉸鏈區(qū)的 Cys108-NH 形成氫鍵的小分子結(jié)構(gòu)。
除了活性位點(diǎn)外,瞄準(zhǔn)保留較少的鄰近異生口袋(如靠近守門殘基的疏水后腔)也能使先導(dǎo)化合物獲得更好的選擇性。
因此,研究人員采用了一個(gè)額外的疏水藥理點(diǎn),優(yōu)先考慮具有疏水功能的結(jié)構(gòu),以深入占據(jù)由 Met105、Leu73、Leu103、Ala52 和 Val104 形成的后腔。
根據(jù)合成的易得性、新穎性和藥物化學(xué)特性篩選出的化合物被合成出來,并使用放射性酶測定法進(jìn)行測試(圖 1a,步驟 7)。
第一輪篩選發(fā)現(xiàn)了一系列具有納摩爾級結(jié)合親和力的TNIK抑制劑。
然而,主要先導(dǎo)化合物的體外吸收、分布、代謝和排泄分析表明,它們在人和小鼠肝臟微粒體中的清除率很高,細(xì)胞色素 p450(CYP)抑制作用的半最大抑制濃度(IC50)小于 10 μM,動力學(xué)溶解度小于 2 μM。
先導(dǎo)物優(yōu)化階段優(yōu)先考慮改善這類化合物的吸收、分布、代謝和排泄情況,最終產(chǎn)生了INS018_055(WO2022179528A1)。
INS018_055 的羧基氧與鉸鏈區(qū)內(nèi)的 Cys108-NH 形成氫橋(圖 2a)。
酰胺NH與近端咪唑中的氮之間的氫鍵作用穩(wěn)定了平面構(gòu)象。
此外,該咪唑的NH可以與守門員Met105的側(cè)鏈形成氫鍵,因?yàn)镹H與硫之間的距離約為 3.2 ?,適合形成氫鍵。
第二個(gè)咪唑?qū)Ψ交渡涞胶蟠?,將異丙基投射?Asn158 和 Gln157。對氟苯基不僅被適當(dāng)?shù)厝菁{在后腔中,而且還與 Met105 的 C-S-C 共面(從 S 到環(huán)的最近 C 的距離為 3.8 ?)。
此前已報(bào)道了兩種早期 TNIK 抑制劑 NCB-0846 和 4-甲氧基-3-(2-(3-甲氧基-4-嗎啉基苯基氨基)吡啶-4-基)苯腈(化合物 9)與目標(biāo)物復(fù)合物的 X 射線結(jié)構(gòu)。
這些化合物與 ATP 結(jié)合位點(diǎn)結(jié)合,并通過兩個(gè)氫鍵與鉸鏈區(qū) Cys108 的骨架相互作用(圖 2a,b)。晶體結(jié)構(gòu)顯示,守門員 Met105 的側(cè)鏈覆蓋了后袋入口,因此這些化合物不包含能夠轉(zhuǎn)移該殘基的功能。
與NCB-0846不同的是,化合物9的氰基通過靠近空腔的水分子與 Phe172 的骨架相互作用,并與 Met105 接觸。
相比之下,INS018_055 被預(yù)測會深入占據(jù)后袋,在已知的 TNIK 抑制劑中形成一種獨(dú)特的相互作用。為了評估 INS018_055 的結(jié)合親和力,研究人員進(jìn)行了表面等離子共振試驗(yàn)。與其他兩種已知的 TNIK 抑制劑相比,INS018_055 顯示出了強(qiáng)大的親和力(Kd 值為 4.32 nM)。
INS018_055 的選擇性
接下來,研究人員使用KinaseProfiler面板來評估μM INS018_055的激酶選擇性。
蛋白激酶(不包括 ATM 和 DNA-PK)的活性以輻射測量的形式進(jìn)行評估,而脂質(zhì)激酶以及 ATM、DNA-PK 和 ATR-ATRIP(共濟(jì)失調(diào)毛細(xì)血管擴(kuò)張癥突變和 Rad3 相關(guān);ATR-互作蛋白)則通過均勻時(shí)間分辨熒光法進(jìn)行評估。
隨后,進(jìn)一步評估了42個(gè)熱門激酶,以確定INS018_055的IC50。
研究人員的劑量依賴性研究顯示,TNIK是受抑制作用最強(qiáng)的靶點(diǎn),其IC50為31nM。
值得注意的是,大多數(shù)在納摩爾(<1 μM)濃度的INS018_055中達(dá)到IC50的激酶已被報(bào)道用于調(diào)節(jié)纖維化驅(qū)動過程,如ALK4、TGFBR1和DDR1。
這些結(jié)果表明,研究人員的先導(dǎo)化合物在納摩爾濃度下對抑制TNIK具有選擇性,并對靶向纖維化相關(guān)激酶具有更廣泛的親和力。
一項(xiàng)已發(fā)表的使用50個(gè)激酶面板對NCB-0846進(jìn)行的選擇性檢測顯示,有8個(gè)激酶的IC50 小于 100 nM56。
INS018_055 可抑制其中6種激酶,其IC50值大大高于該濃度。
雖然很難直接比較不同研究得出的數(shù)據(jù)(盡管兩種檢測方法都使用 ATP 濃度的Km值),但這些觀察結(jié)果表明INS018_055具有更高的選擇性(至少在已報(bào)道的激酶中是如此),這與其不同的結(jié)合模式(尤其是占據(jù) TNIK 后袋)有關(guān)。
INS018_055 的 0 期和 I 期臨床試驗(yàn)測試
研究人員在健康參與者中開展了一項(xiàng)0期單微劑量研究(ACTRN12621001541897),以評估INS018_055的藥代動力學(xué)(PK),結(jié)果表明靜脈注射100微克的耐受性良好。
隨后,研究人員啟動了一項(xiàng)隨機(jī)、雙盲、安慰劑對照的 I 期臨床試驗(yàn)(NCT05154240),在 78 名健康志愿者中評估 INS018_055 的安全性和耐受性(首要目標(biāo))以及 PK(次要目標(biāo))。
試驗(yàn)的A部分是單次遞增劑量給藥(SAD)研究,40 名參與者按 3:1 的比例隨機(jī)分配,在第 1 天按順序劑量(10、30、60、90、120 毫克)接受 INS018_055 或安慰劑。
為了在飲食影響的背景下評估安全性和耐受性,在接受 90 毫克治療的組群中,重復(fù)了標(biāo)準(zhǔn)高脂餐的安全性和PK評估。
B部分是一項(xiàng)多劑量遞增給藥(MAD)研究,24名健康參與者按3:1的比例隨機(jī)分配,每天按順序劑量(30、60、120毫克)服用INS015_055或安慰劑,連續(xù)服用7天。
SAD和MAD試驗(yàn)的PK概況
在SAD試驗(yàn)中,空腹個(gè)體的INS018_055血漿濃度隨時(shí)間的變化曲線顯示,在快速吸收階段,INS018_055濃度達(dá)到峰值,達(dá)到最大濃度所需的中位時(shí)間(Tmax)值為服藥后1.00至1.53h,隨后以多相方式下降,幾何平均消除半衰期(t1/2)值為7.42至9.74h。
在所有劑量中,INS018_055的水平直到72小時(shí)的最后一個(gè)采樣點(diǎn)仍可檢測到,但接受30毫克劑量的組群除外,而INS018_055在服藥后48小時(shí)仍可檢測到。
總體而言,INS018_055的幾何平均峰值(Cmax)和總暴露量(曲線下面積(AUC)0-t)以及跨時(shí)間的總暴露量(從零到無窮大的AUC(AUC0-inf))隨劑量成比例增加(補(bǔ)充信息9),但90毫克劑量的Cmax除外,與60毫克劑量的Cmax相似。
與空腹情況(中位數(shù)Tmax為1.01小時(shí))相比,服用90毫克的組群中,進(jìn)食情況下INS018_055的血漿吸收率較低(中位數(shù)Tmax為3.00小時(shí))。
在進(jìn)食條件下,總幾何Cmax和平均AUC值(Cmax 為 169 納克/毫升-1,AUC0-t 和AUC0-inf為1390和1400小時(shí)×納克/毫升-1)低于空腹條件下(Cmax為270納克/毫升-1,AUC0-t和AUC0-inf為1620和1630小時(shí)×納克/毫升-1)。