自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

深度學(xué)習(xí)精確預(yù)測RNA,需訓(xùn)練18種已知結(jié)構(gòu):研究登上Science封面

新聞 深度學(xué)習(xí)
目前,使用人工智能預(yù)測化合物分子結(jié)構(gòu)是一個火熱的研究課題,DeepMind 蛋白質(zhì)結(jié)構(gòu)預(yù)測工具 AlphaFold2 證明了這一點。

 [[419963]]

我們距離精確預(yù)測 DNA 結(jié)構(gòu)還遠嗎?

目前,使用人工智能預(yù)測化合物分子結(jié)構(gòu)是一個火熱的研究課題,DeepMind 蛋白質(zhì)結(jié)構(gòu)預(yù)測工具 AlphaFold2 證明了這一點。但應(yīng)看到,實現(xiàn)分子結(jié)構(gòu)準確預(yù)測的背后需要龐大的數(shù)據(jù)集。斯坦福大學(xué)的一項研究打破了這一限制,他們提出的機器學(xué)習(xí)方法僅使用很少的數(shù)據(jù)即實現(xiàn)了準確的 RNA 結(jié)構(gòu)預(yù)測。

確定生物分子的 3D 形狀是現(xiàn)代生物學(xué)和醫(yī)學(xué)發(fā)現(xiàn)中最困難的問題之一。許多公司和研究機構(gòu)花費數(shù)百萬美元來確定分子結(jié)構(gòu),卻也常常無果。

來自斯坦福大學(xué)的研究團隊利用機器學(xué)習(xí)的方法解決了這個難題。在計算機科學(xué)系副教授 Ron Dror 的指導(dǎo)下,斯坦福大學(xué)博士生 Stephan Eismann 和 Raphael Townshend 巧妙地使用機器學(xué)習(xí)技術(shù)開發(fā)了一種通過計算預(yù)測生物分子準確結(jié)構(gòu)的方法。并且即使僅從少數(shù)已知結(jié)構(gòu)中學(xué)習(xí),他們的方法也能成功,使其適用于結(jié)構(gòu)最難通過實驗確定的分子類型。

8 月 27 日,該團隊與斯坦福大學(xué)生物化學(xué)系副教授 Rhiju Das 合作的研究論文在《Science》上發(fā)表并登上封面。

深度學(xué)習(xí)精確預(yù)測RNA,需訓(xùn)練18種已知結(jié)構(gòu):研究登上Science封面

論文地址:http://science.sciencemag.org/content/373/6558/1047

在此之前,去年 12 月該團隊的一篇研究論文已經(jīng)登上了生物醫(yī)學(xué)期刊《Proteins》。

深度學(xué)習(xí)精確預(yù)測RNA,需訓(xùn)練18種已知結(jié)構(gòu):研究登上Science封面

論文地址:https://onlinelibrary.wiley.com/doi/10.1002/prot.26033

在《Proteins》的論文中,研究團隊介紹說:該研究建立的神經(jīng)網(wǎng)絡(luò)架構(gòu)從包含數(shù)萬個原子的分子結(jié)構(gòu)中進行端到端的學(xué)習(xí),其中涉及基于點的原子表示、旋轉(zhuǎn)和平移的等變性、局部卷積和分層子采樣操作。

兩篇論文的主要作者 Townshend 說:「結(jié)構(gòu)生物學(xué)是對分子形狀的研究,結(jié)構(gòu)決定功能?!乖搱F隊設(shè)計的算法不僅可以預(yù)測準確的分子結(jié)構(gòu),還能夠解釋不同分子的工作原理,該方法將適用于基礎(chǔ)生物學(xué)研究、藥物研發(fā)等。具體來講,團隊成員 Eismann 以蛋白質(zhì)舉例說明:「蛋白質(zhì)是執(zhí)行各種功能的分子機器。為了執(zhí)行它們的功能,蛋白質(zhì)通常會與其他蛋白質(zhì)結(jié)合。如果已知一對蛋白質(zhì)與疾病有關(guān),并且知道它們在三維條件下如何相互作用,醫(yī)學(xué)上就可以嘗試用一種藥物非常具體地針對這種相互作用?!?/p>

該研究的方法已經(jīng)在蛋白質(zhì)復(fù)合物和 RNA 分子方面取得了成功。正如研究團隊成員 Dror 所說:「機器學(xué)習(xí)近來取得的大多數(shù)進展都需要大量數(shù)據(jù)進行訓(xùn)練。而該研究的方法在訓(xùn)練數(shù)據(jù)很少的情況下取得成功的事實意味著:相關(guān)方法可以解決許多數(shù)據(jù)稀缺的領(lǐng)域中未解決的問題」,因此該方法可能具有巨大潛力。

使用少量數(shù)據(jù)實現(xiàn) RNA 準確結(jié)構(gòu)預(yù)測

RNA 分子的 3D 結(jié)構(gòu)對 RNA 分子發(fā)揮自身功能至關(guān)重要,在藥物發(fā)現(xiàn)中也很有意義。然而,已知的 RNA 結(jié)構(gòu)很少,并且通過計算來預(yù)測 RNA 結(jié)構(gòu)極具挑戰(zhàn)性。

而斯坦福大學(xué)的這項研究使用機器學(xué)習(xí)(ML)的方法,只使用 18 種已知的 RNA 結(jié)構(gòu)進行訓(xùn)練,就能夠識別出準確的結(jié)構(gòu)模型,同時無需這些結(jié)構(gòu)模型的定義特性。通過這種機器學(xué)習(xí)方法得到的評分函數(shù)——原子旋轉(zhuǎn)等變評分器(Atomic Rotationally Equivariant Scorer, ARES)顯著優(yōu)于以往方法。

下圖為訓(xùn)練集中的 18 種 RNA 結(jié)構(gòu)圖示。

深度學(xué)習(xí)精確預(yù)測RNA,需訓(xùn)練18種已知結(jié)構(gòu):研究登上Science封面

具體地,為了訓(xùn)練 ARES,研究者使用了 1994 年至 2006 年之間已發(fā)表的 18 個 RNA 分子,并利用 Rosetta FARFAR2 采樣方法生成了每個 RNA 的 1000 個結(jié)構(gòu)模型,同時沒有使用任何已知結(jié)構(gòu)。接著,他們優(yōu)化了 ARES 神經(jīng)網(wǎng)絡(luò)的參數(shù),使其輸出盡可能匹配每個模型對應(yīng)結(jié)構(gòu)的均方根誤差(RMSD)。

下圖 1 為 ARES 網(wǎng)絡(luò),其中 A 表示:僅給出原子坐標和元素類型,ARES 即可預(yù)測結(jié)構(gòu)模型的準確率;B 表示利用 ARES 的 RNA 結(jié)構(gòu)預(yù)測;C 表示包含 18 種已有小型 RNA 結(jié)構(gòu)的訓(xùn)練集;D 表示包含新的、更大 RNA 結(jié)構(gòu)的基準集。

深度學(xué)習(xí)精確預(yù)測RNA,需訓(xùn)練18種已知結(jié)構(gòu):研究登上Science封面

下圖 2 展示了 ARES 顯著優(yōu)于以往識別準確結(jié)構(gòu)模型的評分函數(shù)。A 表示評分最佳結(jié)構(gòu)模型的 RMSD;B 表示 10 個評分最佳結(jié)構(gòu)模型中最低的 RMSD;C 表示無限接近評分最佳結(jié)構(gòu)模型的排名;D 表示 2007 年以來評分最佳結(jié)構(gòu)模型的 RMSD。

深度學(xué)習(xí)精確預(yù)測RNA,需訓(xùn)練18種已知結(jié)構(gòu):研究登上Science封面

ARES 在社區(qū)范圍內(nèi)的 Blind RNA 結(jié)構(gòu)預(yù)測挑戰(zhàn)賽「RNA Puzzles」中實現(xiàn)了 SOTA 結(jié)果。如下圖 3 所示,A 表示 ARES 與其他方法的 Blind 預(yù)測準確率結(jié)果對比;B 表示 ARES 預(yù)測的晶體結(jié)構(gòu);C 表示其他方法實現(xiàn)的最佳晶體結(jié)構(gòu)預(yù)測。

深度學(xué)習(xí)精確預(yù)測RNA,需訓(xùn)練18種已知結(jié)構(gòu):研究登上Science封面

此外,ARES 還能學(xué)習(xí)識別事先沒有明確說明的 RNA 結(jié)構(gòu)的關(guān)鍵特征。下圖 4A 表示 ARES 學(xué)習(xí)螺旋寬度以實現(xiàn)最優(yōu)的堿基配對;4B 表示學(xué)習(xí)識別關(guān)鍵的 RNA 特征。

深度學(xué)習(xí)精確預(yù)測RNA,需訓(xùn)練18種已知結(jié)構(gòu):研究登上Science封面

就其優(yōu)勢而言,斯坦福大學(xué)的方法可以基于少量數(shù)據(jù)進行有效學(xué)習(xí),克服了標準深度神經(jīng)網(wǎng)絡(luò)的主要限制。并且該方法僅使用原子坐標作為輸入,不包含特定的 RNA 信息,因此適用于解決結(jié)構(gòu)生物學(xué)、化學(xué)、材料科學(xué)等領(lǐng)域的各種問題。

作者簡介

[[419965]]

共同一作 Raphael Townshend 是分子和藥物設(shè)計 AI 初創(chuàng)公司 Atomic AI 的 CEO。目前,他在斯坦福 AI 實驗室攻讀博士,研究興趣包括機器學(xué)習(xí)、結(jié)構(gòu)生物學(xué)、高性能計算和計算機視覺。

[[419966]]

通訊作者之一 Ron Dror 是斯坦福大學(xué)計算機科學(xué)系副教授,也是斯坦福 AI 實驗室所屬一個研究小組的負責人,專注于使用計算機技術(shù)解決生物學(xué)和藥物發(fā)現(xiàn)的基礎(chǔ)問題。作為高性能計算、機器學(xué)習(xí)、圖像分析、結(jié)構(gòu)生物學(xué)和藥物設(shè)計等領(lǐng)域的專家,他還教授計算機生物學(xué)和機器學(xué)習(xí),并為技術(shù)和制藥企業(yè)提供咨詢。

 

責任編輯:張燕妮 來源: 機器之心Pro
相關(guān)推薦

2019-08-19 09:03:57

人工智能機器學(xué)習(xí)技術(shù)

2021-12-20 10:07:35

AI 數(shù)據(jù)人工智能

2024-11-15 13:42:25

2022-09-04 19:22:46

開發(fā)科技

2023-11-26 17:32:18

深度學(xué)習(xí)AI

2022-12-09 13:54:49

編程AI

2021-06-22 15:20:53

機器人人工智能技術(shù)

2022-03-17 17:55:08

深度學(xué)習(xí)人工智能Nature

2021-12-09 10:33:54

量子模型互聯(lián)網(wǎng)

2021-10-09 15:24:14

無人機AI技術(shù)

2024-02-02 21:39:04

AI模型

2020-11-17 14:53:54

騰訊 蛋白質(zhì)AI

2022-09-22 15:23:27

3D打印技術(shù)

2023-02-25 21:57:09

ChatGPTAI

2021-11-24 17:48:30

深度學(xué)習(xí)風(fēng)險預(yù)測

2022-12-27 07:50:34

python深度學(xué)習(xí)DeepDream

2021-06-17 13:42:40

AI 數(shù)據(jù)機器學(xué)習(xí)

2022-02-11 15:16:54

AI機器人技術(shù)

2017-07-06 13:18:37

深度學(xué)習(xí)應(yīng)用問題及趨勢

2021-09-08 05:34:34

乳腺癌人工智能AI
點贊
收藏

51CTO技術(shù)棧公眾號