火山引擎助力深勢(shì)科技發(fā)布行業(yè)首個(gè)三維分子預(yù)訓(xùn)練模型Uni-Mol
新藥物的不斷出現(xiàn),一定程度上提高了人類生存質(zhì)量和平均壽命。藥物設(shè)計(jì)領(lǐng)域,由于藥物分子有千萬(wàn)種組合方式,結(jié)構(gòu)又多樣,候選藥物的化學(xué)空間變得很大。
如何才能加速藥物的設(shè)計(jì)?成立于2018年的深勢(shì)科技,致力于運(yùn)用人工智能和分子模擬算法,結(jié)合先進(jìn)計(jì)算手段求解這一重要科學(xué)問題。
分子模擬算法的挑戰(zhàn)
深勢(shì)科技是 “AI for Science”科學(xué)研究范式的踐行者,為人類文明最基礎(chǔ)的生物醫(yī)藥、能源、材料和信息科學(xué)與工程研究打造新一代微尺度工業(yè)設(shè)計(jì)和仿真平臺(tái)。
這家高新技術(shù)企業(yè)具有強(qiáng)大的科研與產(chǎn)業(yè)落地能力。例如在醫(yī)藥領(lǐng)域,深勢(shì)科技通過Hermite Uni-FEP、Uni-Fold、RiD等模塊,將自由能微擾理論、分子動(dòng)力學(xué)、增強(qiáng)采樣算法與高性能計(jì)算相結(jié)合,精準(zhǔn)預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu)及構(gòu)象變化,并以化學(xué)精度高效評(píng)估蛋白與配體的結(jié)合自由能,為藥物研發(fā)人員提供高效精準(zhǔn)的理論指導(dǎo),提升藥物設(shè)計(jì)與優(yōu)化效率。
由于分子模擬算法對(duì)算力等資源呈線性依賴,深勢(shì)科技在底層資源調(diào)度、算法優(yōu)化等方面遇到了以下挑戰(zhàn):
- 計(jì)算任務(wù)數(shù)量多,波動(dòng)大,需要底層平臺(tái)提供靈活高效的彈性調(diào)度能力;
- 大模型,大內(nèi)存訓(xùn)練;
- 海量非結(jié)構(gòu)化文件數(shù)據(jù)讀??;
深勢(shì)科技選擇與火山引擎合作,獲取高效、可靠、靈活的高性能計(jì)算服務(wù)。
行業(yè)首個(gè)三維分子預(yù)訓(xùn)練模型
火山引擎為深勢(shì)科技提供了基于GPU加速的科學(xué)計(jì)算解決方案,可以根據(jù)業(yè)務(wù)流量自動(dòng)彈性擴(kuò)容,以及自動(dòng)采集各節(jié)點(diǎn)健康狀態(tài)并制定相應(yīng)自愈策略,實(shí)現(xiàn)智能運(yùn)維。比如說,當(dāng)遇到節(jié)點(diǎn)不可用時(shí),該方案能夠替換和重新調(diào)度節(jié)點(diǎn)上的容器,保障業(yè)務(wù)平穩(wěn)健康運(yùn)行。
科學(xué)計(jì)算解決方案依托火山引擎的云基礎(chǔ)產(chǎn)品,提供可彈性伸縮的加速計(jì)算服務(wù)器GPU,掛載高性能的文件服務(wù)集群以及超高并發(fā)吞吐的并行文件存儲(chǔ),并搭配專為AI和科學(xué)計(jì)算等高性能計(jì)算場(chǎng)景設(shè)計(jì)的機(jī)器學(xué)習(xí)平臺(tái),賦能深勢(shì)科技專注于核心業(yè)務(wù)發(fā)展。
深勢(shì)科技相關(guān)負(fù)責(zé)人表示:“使用科學(xué)計(jì)算解決方案后,我們可以專注于構(gòu)建應(yīng)用本身,無(wú)需直接購(gòu)買和管理底層服務(wù)器等基礎(chǔ)設(shè)施,有效降低了IT維護(hù)成本?!?/span>
火山引擎科學(xué)計(jì)算解決方案有力的保障了深勢(shì)科技的研發(fā)進(jìn)度。近日,深勢(shì)科技發(fā)布了首個(gè)三維分子預(yù)訓(xùn)練模型 Uni-Mol (https://github.com/dptech-corp/Uni-Mol)。
Uni-Mol框架示意圖
Uni-Mol直接將分子三維結(jié)構(gòu)作為模型輸入,而非采用一維序列或二維圖結(jié)構(gòu)。從三維信息出發(fā)的表征學(xué)習(xí)讓
Uni-Mol 在幾乎所有與藥物分子和蛋白口袋相關(guān)的下游任務(wù)上都超越了 SOTA(state of the art),也讓 Uni-Mol 得以能夠直接完成分子構(gòu)象生成、蛋白-配體結(jié)合構(gòu)象預(yù)測(cè)等三維構(gòu)象生成相關(guān)的任務(wù),并超越現(xiàn)有解決方案。
未來,深勢(shì)科技還會(huì)基于火山引擎平臺(tái)推出一系列蛋白質(zhì)自由能、絕對(duì)自由能的計(jì)算功能,為行業(yè)帶來革新性的先進(jìn)生產(chǎn)力工具,加速藥物等設(shè)計(jì)的發(fā)展。