AlphaFold 3引不滿!服務(wù)器被黑,全世界科學(xué)家競相破解
不久前,AlphaFold3橫空出世,直接登上了Nature頭版。
新的架構(gòu)、前所未有的預(yù)測精度和準確率,再次震撼了整個學(xué)術(shù)界。
然而,與AlphaFold2不同,這個新一代的超強模型卻沒有開源。
取而代之的是,谷歌DeepMind推出了一個免費研究平臺「AlphaFold Server」,供全球科學(xué)家使用。
服務(wù)地址:https://gdm-alphafold.corp.google.com/welcome
網(wǎng)站操作簡單,只需點擊幾下,就可以利用AlphaFold3在10分鐘內(nèi)得到預(yù)測結(jié)果。
但是服務(wù)有每日的次數(shù)限制,且只能用于非商業(yè)研究。同時,相比于開源的AlphaFold2來說,這種使用方式缺失了很多自由度,讓一些研究人員覺得差點意思。
——這么做其實無可厚非,畢竟DeepMind也是要盈利的,它的子公司Isomorphic Labs已經(jīng)開始用AlphaFold3來開發(fā)藥物了。
谷歌DeepMind希望能在促進科學(xué)進步,以及保護自身商業(yè)利益上找到平衡。
科學(xué)家們感到失望
正所謂,由儉入奢易,由奢入儉難。
谷歌的AlphaFold3在5月9號登上Nature頭版,而僅僅兩天之后的5月11日,加州大學(xué)舊金山分校(University of California,San Francisco)的計算結(jié)構(gòu)生物學(xué)家Stephanie Wankowicz,和其他九位科學(xué)家共同撰寫了一封致Nature的公開信:
公開信地址:https://zenodo.org/records/11206103
信中指出:谷歌DeepMind的這種做法不符合科學(xué)進步的原則,科學(xué)進步依賴于社區(qū)評估、使用和建立現(xiàn)有工作的能力。
此后,有600多名研究人員簽署了這封公開信。
公開信的合著者、計算結(jié)構(gòu)生物學(xué)家Roland Dunbrack,曾對AlphaFold3的論文進行了同行評審,他對DeepMind沒有發(fā)布代碼感到失望。
「我想要可下載的代碼,如果我們可以自由使用AlphaFold3,新的研究成果就會誕生?!?/span>
其他科學(xué)家怎么說:
AlphaFold是一項千載難逢的突破,對生物科學(xué)產(chǎn)生了巨大影響。我認為它的作者最終會獲得諾貝爾獎,因為他們解決了一個70多年來一直無法破解的巨大問題。我基本上每天都在工作中使用它,指導(dǎo)藥物發(fā)現(xiàn)和實驗上有用的HBV聚合酶的工程設(shè)計。
最新版本的AlphaFold3比以前更強大。它已經(jīng)在我的實驗室中揭示了HBV RNA最初如何與聚合酶結(jié)合的結(jié)構(gòu)。不幸的是,他們更改了此版本的使用許可,限制了其用于藥物發(fā)現(xiàn)。
繞過DeepMind,自己破解
在遭到公開信打臉的兩天后,5月13日,DeepMind改頭換面,宣布將在六個月內(nèi),開放AlphaFold3的代碼和模型權(quán)重供學(xué)術(shù)使用。
并且,AlphaFold3服務(wù)的每日使用次數(shù)限制也上調(diào)為20次。
但科學(xué)家們似乎不太買賬,畢竟有了商業(yè)競爭的考量,誰知道你拿出來的是不是閹割版,而且還要等上半年之久。
對于這個未來的版本,科學(xué)家們尤其質(zhì)疑其預(yù)測蛋白質(zhì)結(jié)構(gòu)與潛在藥物分子或配體的能力。
Dunbrack表示,「我不認為他們會給我們做任何配體的能力,而AlQuraishi團隊正在開發(fā)的OpenFold3模型就不會做這種閹割,也不會對商業(yè)用途有任何限制?!?/span>
Mohammed AlQuraishi是哥倫比亞大學(xué)的計算生物學(xué)家,他的「OpenFold」團隊已經(jīng)開始編寫AlphaFold3的開源版本,他們希望今年完成。
AlQuraishi團隊此前開發(fā)了大名鼎鼎的OpenFold,作為AlphaFold2的開源重新實現(xiàn),它的效率要高得多,并且得到的結(jié)果也差不多。
「如果這種對我們進行藥物發(fā)現(xiàn)和關(guān)系到人類健康的重要能力封閉在少數(shù)人手里,那將是糟糕的?!?/span>
科學(xué)家們追求AlphaFold3的開源版本還有其他原因,其一就是能夠重新訓(xùn)練模型,以更好地模擬蛋白質(zhì)和潛在藥物之間的相互作用。
AlQuraishi團隊的OpenFold就使用了與DeepMind相同的公開數(shù)據(jù)集進行訓(xùn)練。
而對于許多制藥公司來說,他們可以利用自己的專有數(shù)據(jù)重新訓(xùn)練,以提高模型的性能。
雖然但是,「Talk is cheap. Show me the code」。GitHub上的「開源AlphaFold3」早已經(jīng)開搞了!
項目地址:https://github.com/lucidrains/alphafold3-pytorch
這是由舊金山的獨立軟件工程師Phil Wang發(fā)起的眾包工作。
大家有興趣還可以看看倉庫中的其他項目,這位大佬已經(jīng)開發(fā)了幾十個AI模型的開源版本,包括著名的Dall-E 2。
此外,西雅圖華盛頓大學(xué)的計算生物物理學(xué)家David Baker,也帶領(lǐng)團隊開發(fā)了名為RoseTTAFold-All-Atom的開源蛋白質(zhì)和化學(xué)預(yù)測模型,盡管暫時還打不過AlphaFold3。
AlphaFold3服務(wù)器被黑
盡管Wang表示自己的三人團隊能在一個月內(nèi)完成描述AlphaFold3模型的代碼。
但最耗時也是最貴的步驟顯然是模型的訓(xùn)練(AlQuraishi:「代碼是5%的努力」)。
MIT的進化生物學(xué)家Sergey Ovchinnikov估計,像DeepMind那樣訓(xùn)練AlphaFold3可能需要花費超過100萬美元的云計算資源,盡管有可能在不影響性能的情況下偷工減料以降低成本。
AlphaFold3的完全開源版本,將使研究人員能夠更好地了解模型的工作原理并擴展其功能。
——在等待的日子里,已經(jīng)有一些科學(xué)家在嘗試攻擊AlphaFold3服務(wù)器來獲取一些信息。
Ovchinnikov說,「網(wǎng)上已經(jīng)有一些黑客攻擊,為了獲得嵌入細胞膜的蛋白質(zhì)(與脂肪分子相互作用)的更準確的模型。另一次服務(wù)器黑客攻擊揭示了一種蛋白質(zhì)采用的另一種形狀?!?/span>
AlQuraishi希望,開發(fā)AlphaFold3開源版本的推動力將成為一個「警示故事」,提醒學(xué)者們依賴DeepMind等科技公司開發(fā)和分發(fā)AlphaFold等工具的危險。
「他們這樣做很好,但我們不應(yīng)該依賴它,我們需要建立一個公共部門和自己的基礎(chǔ)設(shè)施。」
網(wǎng)友怎么說?
有網(wǎng)友認為,安全問題是谷歌DeepMind選擇不開源的一個重要考量,也許AlphaFold3能幫助制造針對特定人群的生物武器。
我認為令人擔(dān)憂的是,有人可以用它制造超級朊病毒,或者設(shè)計一種非常有效的毒素(使用模型藥物發(fā)現(xiàn)部分的能力)
對此,有網(wǎng)友表示反對:「擔(dān)心我們可以制造出一種將接管一切的超級微生物,這是狂妄自大。」
我在科學(xué)中學(xué)到的一件事是,我們太傲慢了,認為我們可以設(shè)計一種超級疾病?,F(xiàn)實情況是,微生物世界已經(jīng)充滿敵意,幾乎每一種致命的生物都已經(jīng)進化了。你定制設(shè)計的任何東西都可能在離開實驗室的那一刻就死了。或者更有可能的是,被干掉并被吃掉。
也有網(wǎng)友似乎玩起了「絕命毒師」:
我一直認為,如果人工智能最終能以某種方式,一步一步地指導(dǎo)你如何只用家居用品來制作這樣的東西,那將是瘋狂的。
想象一下,讓一個人工智能幫你制作氯胺酮,它告訴你去買一大袋鹽、果凍、3個鈦螺絲、一杯橙汁、一些石膏......然后給你一個非常非常長的步驟,把它們變成氯胺酮。過程可能非常乏味,并且需要做很多工作......但是,如果這在技術(shù)上是可行的呢?
——據(jù)說,有機化學(xué)是史上單人戰(zhàn)斗力的巔峰,有了知識的力量,沃爾瑪在你眼中就是武器庫。
不過,人類對知識和未知的渴望是擋不住的,我們拭目以待即可。