AlphaFold 3輕松應(yīng)對(duì)核酸、脂類(lèi)分子?科學(xué)家迫不及待地更新了評(píng)測(cè)
「如果這可以重現(xiàn)的話(huà),這就是我們所知的世界末日!功能建模的新時(shí)代已經(jīng)開(kāi)始?!箽W洲分子生物學(xué)實(shí)驗(yàn)室(EMBL)的科學(xué)家 Jan Kosinski 發(fā)推文表示。他在 AlphaFold 3 發(fā)布后,立刻用它做了一系列簡(jiǎn)單的測(cè)試,并把相關(guān)結(jié)果發(fā)在了 X 上。
「我取出了一個(gè)結(jié)構(gòu)未知的轉(zhuǎn)錄因子,將其折疊起來(lái),將其識(shí)別序列嵌入更長(zhǎng)的 DNA 中。AlphaFold 3 準(zhǔn)確定位了轉(zhuǎn)錄因子?!筀osinski 解釋道。
他使用的轉(zhuǎn)錄因子:https://jaspar2020.genereg.net/matrix/MA0027.2/
使用的 DNA 序列:CAGGATCCTAATTATGGATCCTGTGTATCTTCAGT
他用的模型是:https://oc.embl.de/index.php/s/SsDKcS06P1xewAV
他說(shuō):「一旦 AlphaFold 3 的開(kāi)源副本可用并且運(yùn)行良好,我們也許能夠通過(guò)計(jì)算來(lái)預(yù)測(cè)所有轉(zhuǎn)錄因子的序列特異性。我認(rèn)為那會(huì)很大,對(duì)吧?」
同時(shí),嚴(yán)謹(jǐn)?shù)?Kosinski 呼吁網(wǎng)友:「但如果有人檢查我是否沒(méi)有混淆,是否與其他轉(zhuǎn)錄因子一致,以及分?jǐn)?shù)是否可以用于區(qū)分特定和非特定序列,我會(huì)很高興。」
Kosinski 還做了其他實(shí)驗(yàn)。
「還有一個(gè),也許沒(méi)有訓(xùn)練偏差。應(yīng)該特異性結(jié)合啟動(dòng)子區(qū)域 ATTTTAGTCGCGCCTAAAAT 并且它再次出現(xiàn)!左為晶體結(jié)構(gòu),右為 AlphaFold 3 模型。啟動(dòng)子為紅色。」他發(fā)文解釋道。
「我們還不知道是否如此,但如果這種序列特異性推廣到 CRISPR、鋅指結(jié)構(gòu)、TALEN、限制性核酸酶——可以為 AlphaFold 3 所有者帶來(lái)多少收入?」他在推文里調(diào)侃道。
第二天 Kosinski 又用限制性?xún)?nèi)切酶做了相關(guān)測(cè)試。
「它『不能』推廣到我手中的限制性核酸酶。識(shí)別序列為青色,切割位點(diǎn)為紅色?!顾f(shuō),「但請(qǐng)注意:只有兩個(gè)示例和長(zhǎng) DNA,有人可以嘗試精確長(zhǎng)度的序列并比較特定和非特定序列?!?/span>
「AlphaFold 3 無(wú)法正確預(yù)測(cè)限制性核酸酶 BamHI 的序列,盡管有 5 種結(jié)構(gòu)可用,其中 4 種帶有 DNA?!顾l(fā)推文說(shuō),「左邊是模型,右邊是晶體結(jié)構(gòu)。鑒于其中一些結(jié)構(gòu)可能包含在訓(xùn)練和模板數(shù)據(jù)庫(kù)中,這表明訓(xùn)練集中結(jié)構(gòu)的存在并不能保證準(zhǔn)確的預(yù)測(cè)。」
BamHI:https://uniprot.org/uniprotkb/P23940/entry#struct
洛桑聯(lián)邦理工學(xué)院(EPFL)的 Martin Pacesa 評(píng)論道:「可能是因?yàn)閬?lái)自 MSA 的噪音!如果有太多 RE 同源物識(shí)別非常不同的目標(biāo)序列,它可能會(huì)迷失在共同進(jìn)化噪聲中?!?/span>
Kosinski 對(duì) Pacesa 的觀點(diǎn)表示肯定:「是的,你可能是對(duì)的,REases 在它們的 MSA 中通常很少有相似的序列……或者當(dāng)我在碩士期間研究它們時(shí),它們就這樣做了。」
「它『識(shí)別』了什么?」網(wǎng)友 Evgenii 問(wèn)道。
「CAAGCTTG,它只是綁定了另一個(gè)回文序列(像回文序列這樣的 REases,原始序列 GGATCC 也是一個(gè)回文序列)?!筀osinski 回復(fù)道,「我嘗試對(duì)序列進(jìn)行洗牌,但它仍然找到并綁定了另一個(gè)不完美的回文序列(GCACGC)。我想我們需要一個(gè)更好的『背景誘餌序列』」
「有趣的!AAGCTT 那是 HindIII。根據(jù)您迄今為止的經(jīng)驗(yàn),AlphaFold 3 如何處理較長(zhǎng)的 dsDNA 片段?」維也納大學(xué) Max Perutz 實(shí)驗(yàn)室的 Pim Huis in 't Veld 發(fā)文評(píng)論說(shuō)。
「之前那這個(gè)起作用的原因是它搜索任何回文序列,因?yàn)檫@是相似的二聚體所結(jié)合的嗎?有時(shí)它是否會(huì)尋找與訓(xùn)練模型中類(lèi)似的一維 DNA 模式(例如回文、不匹配)? 」法國(guó) CNRS Orléans 的 Marcin J. Suskiewicz 發(fā)文評(píng)論道。
「也許會(huì)有一個(gè)合理的解釋?zhuān) 筀osinski 說(shuō)道。
帕拉茨基大學(xué)(Univerzita Palackého)的理論物理化學(xué)家、化學(xué)和生物信息學(xué)家 Karel Krápník Berka 則使用 AlphaFold 3 對(duì)膜上的脂質(zhì)分子進(jìn)行了研究。
「AlphaFold 3 還可用于預(yù)測(cè)膜位置?!顾l(fā)文表示,「這是 CYP2E1 與油酸 (OLA) 的示例。這是與我 2013 年的 MD 膜模型和來(lái)自納米圓盤(pán)的冷凍電鏡進(jìn)行對(duì)比?!?/span>
Kosinski 做了相關(guān)測(cè)試并跟帖道:「使用這種技巧在類(lèi)脂膜雙層內(nèi)建模的候選新型大麻素受體,添加油酸(OLA)作為配體?!?/span>
后續(xù)成果,ScienceAI 還會(huì)持續(xù)跟進(jìn)。