自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

AI助力繪制生物多樣性圖改善藥物發(fā)現(xiàn)

人工智能
當(dāng)涉及到對過去40億年來地球上進(jìn)化的所有蛋白質(zhì)和酶進(jìn)行編目時(shí),人類知識幾乎沒有觸及表面。這就是為什么一家名為Basecamp Research的公司正在將圖形和人工智能技術(shù)結(jié)合起來,以擴(kuò)大人類知識的范圍并加速藥物發(fā)現(xiàn)。

當(dāng)涉及到對過去40億年來地球上進(jìn)化的所有蛋白質(zhì)和酶進(jìn)行編目時(shí),人類知識幾乎沒有觸及表面。這就是為什么一家名為Basecamp Research的公司正在將圖形和人工智能技術(shù)結(jié)合起來,以擴(kuò)大人類知識的范圍并加速藥物發(fā)現(xiàn)。

Basecamp Research由Glen Gowers和Oliver Vince于2019年創(chuàng)立,旨在加速藥物研究中數(shù)據(jù)驅(qū)動(dòng)的突破。兩位牛津大學(xué)博士生物學(xué)家對將環(huán)境數(shù)據(jù)引入實(shí)驗(yàn)室以促進(jìn)藥物發(fā)現(xiàn)方面缺乏進(jìn)展感到沮喪,因此他們決定成立一家公司來解決這個(gè)問題。

這家英國私營公司努力的核心是一個(gè)知識圖譜,旨在作為自然世界的數(shù)字孿生。BaseGraph運(yùn)行在Neo4j圖形數(shù)據(jù)庫上,包含55億個(gè)生物關(guān)系,是世界上最大的此類數(shù)據(jù)庫。該公司表示,它收集的數(shù)據(jù)比所有可比的公共數(shù)據(jù)庫多10倍,并對其進(jìn)行了結(jié)構(gòu)化,以最大限度地利用其中的背景、多樣性和生物信號。

Neo4j的首席技術(shù)官Philip Rathle表示,許多制藥公司都使用Neo4j進(jìn)行藥物發(fā)現(xiàn)。但BaseGraph的獨(dú)特之處在于,它還記錄了它們存在的環(huán)境條件,如溫度、濕度、土壤化學(xué)、pH值、土壤礦物質(zhì)含量等,這對于理解酶、蛋白質(zhì)和完整的生物體至關(guān)重要。

Rathle說:“據(jù)我所知,他們是唯一認(rèn)識到地球上所有生命中只有一小部分(比如0.01%)被編目的方式可用于發(fā)現(xiàn)新藥的人。”“他們正在將生態(tài)系統(tǒng)中的數(shù)據(jù)放入一個(gè)圖表中,將其與微生物學(xué)聯(lián)系起來,然后他們的客戶——從事藥物開發(fā)的公司——利用這些信息更快地開發(fā)出更好的藥物。”

環(huán)境數(shù)據(jù)

環(huán)境數(shù)據(jù)對于充分了解蛋白質(zhì)和酶在不同環(huán)境中的行為以及最終它們對藥物開發(fā)的價(jià)值至關(guān)重要。

例如,Rathle說,如果實(shí)驗(yàn)室環(huán)境中的ph值相對于自然環(huán)境下降了1%,它可能會(huì)導(dǎo)致蛋白質(zhì)以完全不同的方式表現(xiàn)。例如,鐵的存在可以區(qū)分生物相互作用是否發(fā)生。

為了收集這些數(shù)據(jù),Basecamp Research與第三方科學(xué)家合作,他們進(jìn)入現(xiàn)場收集這些數(shù)據(jù)。他們收集的數(shù)據(jù)來自全球一些最偏遠(yuǎn)的地方,如亞馬遜雨林和南極洲的冰凍沙漠(該公司的名字Basecamp來自Goers和Vince在冰蓋上生活時(shí)進(jìn)行的DNA測序?qū)嵉乜疾欤?/span>

當(dāng)Basecamp從一些數(shù)據(jù)中獲利時(shí),該公司已承諾將部分收益交給國家公園和其他保護(hù)土地的實(shí)體。該公司表示,確保其現(xiàn)場供應(yīng)鏈數(shù)據(jù)的完整性至關(guān)重要,維護(hù)地球上酶、蛋白質(zhì)和生物生存和進(jìn)化的野生環(huán)境也是如此。

55億邊緣和計(jì)數(shù)

BaseGraph包含三種類型的數(shù)據(jù),包括:環(huán)境、地質(zhì)和化學(xué)數(shù)據(jù);微生態(tài)學(xué)、宏基因組學(xué)和基因組學(xué);以及深度學(xué)習(xí)衍生的功能和結(jié)構(gòu)蛋白質(zhì)特征。

所有這些數(shù)據(jù)都加載到BaseGraph中,BaseGraph擁有55億個(gè)生物關(guān)系,已經(jīng)是世界上最大的生物數(shù)據(jù)圖。該公司表示,隨著新數(shù)據(jù)的出現(xiàn),它正以每四周5億個(gè)新數(shù)據(jù)的速度擴(kuò)張。

在BaseCamp經(jīng)過一段時(shí)間的技術(shù)探索后,決定使用圖形數(shù)據(jù)庫。根據(jù)Neo4j在YouTube上發(fā)布的一份演示文稿,Basecamp Research的數(shù)據(jù)工程團(tuán)隊(duì)負(fù)責(zé)人Saif Ur-Rehman說:“我的第一反應(yīng)是‘把所有東西都放在表格里,然后加入’。”

然而,他們很快就遇到了標(biāo)準(zhǔn)數(shù)據(jù)庫技術(shù)的極限。Basecamp的首席技術(shù)官Phil Lorenz在Neo4j網(wǎng)站上的一篇報(bào)道中說:“生命是一個(gè)網(wǎng)絡(luò),而不是一個(gè)列表。”

在選擇了Neo4j(市場上使用最頻繁、最完善的圖形數(shù)據(jù)庫之一)后,Basecamp Research團(tuán)隊(duì)開始對他們的數(shù)據(jù)進(jìn)行建模。他們使用通過Neo4j圖形數(shù)據(jù)科學(xué)(GDS)庫提供的圖形嵌入來表示蛋白質(zhì)“不僅通過它們的序列,而且結(jié)合了基本的上下文信息,可以顯示這些蛋白質(zhì)將如何相互作用、行為和最終表現(xiàn),”Neo4j在其報(bào)告中說。

Basecamp客戶可以通過這種方式存儲連接數(shù)據(jù),查詢圖表并發(fā)現(xiàn)隱藏的關(guān)系,該公司稱之為“微生物暗物質(zhì)”,指的是未被探索的微生物的廣闊空間。

輸入AI

這已經(jīng)帶來了回報(bào)。根據(jù)Neo4j的說法,研究人員發(fā)現(xiàn)了30倍以上的大絲氨酸重組酶(LSR),這為通過基因編輯創(chuàng)造新療法開辟了潛力。

另一個(gè)成功來自化學(xué)制造業(yè),一家價(jià)值160億美元的公司能夠利用Neo4j圖算法和BaseGraph在短短一個(gè)月內(nèi)優(yōu)化一種特定的酶,這是該公司兩年前進(jìn)行的工作。

Basecamp Research還將人工智能技術(shù)與圖形數(shù)據(jù)庫相結(jié)合,以推動(dòng)更多的發(fā)現(xiàn)。它正在使用圖形數(shù)據(jù)庫中建立的已知交互來訓(xùn)練大型語言模型(LLM),這使其能夠生成藥物開發(fā)的潛在候選者。

該公司發(fā)表了一篇關(guān)于ZymCTRL或酶控制的論文,這是一種基于酶序列訓(xùn)練的模型,可以根據(jù)用戶需求產(chǎn)生活性酶。它還發(fā)表了關(guān)于大型復(fù)雜蛋白質(zhì)結(jié)構(gòu)模型BaseFold和蛋白質(zhì)功能模型HiFi NN的論文。

在《GEN生物技術(shù)》雜志上,Vince、Gowers和Sian McGibbon寫道,Basecamp Research已經(jīng)開始采用一種新模型,該模型能夠在不損害倫理的情況下,從自然界中持續(xù)生成研究所需的數(shù)據(jù)。

他們寫道:“人工智能在生物技術(shù)中的出現(xiàn)為該行業(yè)帶來了分水嶺時(shí)刻?!薄案哔|(zhì)量訓(xùn)練數(shù)據(jù)的有限可用性已經(jīng)減緩了創(chuàng)新的步伐。生物技術(shù)中新興的大數(shù)據(jù)時(shí)代為生物經(jīng)濟(jì)中利益相關(guān)者的商業(yè)利益、發(fā)展目標(biāo)和可持續(xù)發(fā)展目標(biāo)提供了一個(gè)自然的機(jī)會(huì)。只有發(fā)展基于可持續(xù)伙伴關(guān)系的數(shù)據(jù)供應(yīng)鏈,積極與生物多樣性提供者協(xié)調(diào)激勵(lì)措施并分享利益,才能滿足對大量高質(zhì)量遺傳數(shù)據(jù)用于訓(xùn)練大型模型的日益增長的需求?!?/span>

責(zé)任編輯:華軒 來源: Ai時(shí)代前沿
相關(guān)推薦

2020-08-11 23:19:08

人工智能生物多樣性A

2020-11-04 10:29:42

數(shù)據(jù)分析工作多樣性大數(shù)據(jù)

2009-12-22 09:56:36

2022-05-29 07:31:14

加密密碼數(shù)據(jù)安全

2013-08-22 13:44:30

Linux桌面GNOME桌面

2024-06-24 15:57:40

2014-04-16 13:24:42

2015-07-13 13:35:01

2021-04-26 09:41:41

數(shù)字化

2020-03-12 10:24:37

大數(shù)據(jù)技術(shù)人工智能

2017-03-16 13:28:25

VR人工智能 API

2020-07-15 07:33:18

物聯(lián)網(wǎng)大數(shù)據(jù)IOT

2022-04-28 19:43:05

計(jì)算

2021-10-23 22:48:19

華為HPC

2020-12-16 08:20:59

數(shù)據(jù)多樣性數(shù)據(jù)大數(shù)據(jù)

2013-02-18 10:39:53

OperaWebkit瀏覽器

2014-10-16 17:27:14

2021-01-14 10:04:29

人工智能AI機(jī)器學(xué)習(xí)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號