AI卷翻科研!DeepMind 36頁報告:全球?qū)嶒炇冶弧窤I科學(xué)家」指數(shù)級接管
過去兩年,AI主打用戶增長,成功實現(xiàn)了大眾化普及。畢竟,拉新才是商業(yè)王道。
然而,如今AI日常的應(yīng)用已經(jīng)快卷到天花板了。對于世界上絕大多數(shù)人的普通查詢,許多LLM都能給出相當(dāng)不錯的回答。
速度、流暢性已經(jīng)足夠滿足絕大多數(shù)用戶的需求。即便再優(yōu)化,提升空間也有限——畢竟這類問題的技術(shù)難度不高。
或許,未來真正值得關(guān)注的是科學(xué)和工程領(lǐng)域。
OpenAI科學(xué)家Jason Wei最近發(fā)帖預(yù)測:在接下來的一年內(nèi),AI的關(guān)注重點可能會從日常使用轉(zhuǎn)向科學(xué)領(lǐng)域。
他認(rèn)為,未來五年,AI關(guān)注的重點將轉(zhuǎn)向硬核領(lǐng)域——用AI加速科學(xué)和工程。因為這才是真正推動技術(shù)進(jìn)步的引擎。
普通用戶的簡單問題,改進(jìn)空間已經(jīng)不大了。
但每個科學(xué)前沿領(lǐng)域都有巨大的改進(jìn)空間,而AI正好可以發(fā)力,去致力于解決那些能推動科技飛躍的「1%的頂尖問題」。
AI不僅有回答這些問題的潛力,還能激發(fā)人們?nèi)ニ伎几蟮奶魬?zhàn)。
而且,AI的進(jìn)展還能加速AI本身的研究,幫助自己變得更強。AI的進(jìn)步是復(fù)利的,可謂是正反饋之王。
說白了,未來五年就是「AI科學(xué)家」、「AI工程師」的時代。
DeepMind最近發(fā)的一篇論文也暗示了這一趨勢:全球各地的實驗室里,科學(xué)家們對AI的使用正以指數(shù)級增長。
報告地址:https://storage.googleapis.com/deepmind-media/DeepMind.com/Assets/Docs/a-new-golden-age-of-discovery_nov-2024.pdf
AI加速科學(xué)創(chuàng)新發(fā)現(xiàn)的黃金時代
如今,每三位博士后研究員中就有一位使用大語言模型來協(xié)助完成文獻(xiàn)綜述、編程和文章撰寫等工作。
今年的諾貝爾化學(xué)獎也出乎了所有人的意料,頒發(fā)給了AlphaFold 2的發(fā)明人Demis Hassabis和John Jumper。同時,這也啟發(fā)了大量科學(xué)家將AI應(yīng)用到自己的科學(xué)領(lǐng)域中,以求得更多的創(chuàng)新性發(fā)現(xiàn)。
過去半世紀(jì),科學(xué)家人數(shù)猛增,僅美國就翻了七倍多,但科技帶來的社會進(jìn)步卻放緩了。
原因之一是,現(xiàn)代科學(xué)家面臨的規(guī)模和復(fù)雜性挑戰(zhàn)越來越棘手。
不過,深度學(xué)習(xí)擅長搞定這種復(fù)雜局面,還能大幅壓縮科學(xué)發(fā)現(xiàn)的時間成本。
比如,傳統(tǒng)X射線晶體學(xué)花幾年、燒10萬美元搞定一個蛋白質(zhì)結(jié)構(gòu),而AlphaFold直接免費給你2億種預(yù)測,秒殺傳統(tǒng)方法。
五大機遇
對于在不同科學(xué)研究階段難以突破研究瓶頸的科學(xué)家們來講,把握住使用AI的關(guān)鍵機遇,或許就能促進(jìn)誕生強有力的新發(fā)現(xiàn)。
五個能夠利用AI來促進(jìn)科研的機遇
1. 知識——改變科學(xué)家獲取和傳遞知識的方式
科學(xué)家要想推動新發(fā)現(xiàn),必須掌握一套日益專業(yè)化且指數(shù)增長的知識體系。
這種「知識負(fù)擔(dān)」讓顛覆性發(fā)現(xiàn)越來越倚重年長科學(xué)家和頂尖大學(xué)的跨學(xué)科團隊,同時也導(dǎo)致小團隊獨立撰寫論文的比例持續(xù)下滑。
而且,大多數(shù)科學(xué)成果仍以晦澀難懂、英語為主的論文形式分享,限制了政策制定者、企業(yè)和公眾的關(guān)注與興趣。
如今,科學(xué)家和公眾都能借助LLM破局。
例如,有團隊用谷歌Gemini一天內(nèi)從20萬篇論文中提煉出相關(guān)見解;普通人也可用LLM輕松摘要和問答,獲取專業(yè)學(xué)術(shù)知識,瞬間拉近與前沿科學(xué)的距離。
2. 數(shù)據(jù)——生成、提取和標(biāo)注大型科學(xué)數(shù)據(jù)集
盡管我們處于數(shù)據(jù)爆炸時代,許多自然和社會領(lǐng)域中,科學(xué)數(shù)據(jù)卻嚴(yán)重匱乏,如土壤、深海、大氣層和非正式經(jīng)濟。
AI正助力改變這一現(xiàn)狀。它能減少在DNA測序、檢測樣本中具體細(xì)胞類型或捕捉動物聲音時可能發(fā)生的噪聲和錯誤。
科學(xué)家們還可以利用LLM越來越強的多模態(tài)能力,從科學(xué)出版物、檔案文件以及視頻圖像等資源中提取非結(jié)構(gòu)化的科學(xué)數(shù)據(jù),并將其轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù)集,以做后續(xù)研究。
AI還可以幫助為科學(xué)數(shù)據(jù)添加科學(xué)家所需的輔助信息。例如,至少三分之一的微生物蛋白質(zhì)在執(zhí)行功能中的細(xì)節(jié)未能被可靠地注釋。
經(jīng)過可靠性評估驗證的AI模型也可以作為新的合成科學(xué)數(shù)據(jù)的來源。例如,AlphaProteo蛋白質(zhì)設(shè)計模型是在AlphaFold 2中超過1億個AI生成的蛋白質(zhì)結(jié)構(gòu)以及蛋白質(zhì)數(shù)據(jù)庫中的實驗結(jié)構(gòu)上進(jìn)行訓(xùn)練的。
3. 實驗——模擬、加速并指導(dǎo)復(fù)雜實驗
科學(xué)實驗常因成本高昂、復(fù)雜且耗時難以執(zhí)行。還有一些實驗因為研究人員無法獲得所需的設(shè)施、人力或?qū)嶒灢牧隙鵁o法進(jìn)行。
核聚變就是一個典型例子。它有望提供一種幾乎無限、無排放的能源來源,并可能支持諸如海水淡化等高能耗的創(chuàng)新性大規(guī)模應(yīng)用。但控制等離子體所需的托卡馬克反應(yīng)堆復(fù)雜昂貴。ITER原型從2013年建造,預(yù)計2030年代中期才開始實驗。
AI可通過模擬加速實驗進(jìn)程。
一種方法是利用強化學(xué)習(xí)智能體來對物理系統(tǒng)進(jìn)行模擬。例如,研究者與洛桑聯(lián)邦理工合作,用強化學(xué)習(xí)控制托卡馬克等離子體形狀,這一方法還可用于粒子加速器、望遠(yuǎn)鏡等設(shè)施。
在不同學(xué)科中,利用AI模擬實驗的方式可能各不相同,但一個共同點是,這些模擬通常用于指導(dǎo)和優(yōu)化現(xiàn)實實驗,而非完全替代它們。
以基因研究為例,普通人平均有9000多個錯義變異,大多無害,但少數(shù)會致病?,F(xiàn)實中,僅能逐個測試蛋白質(zhì)的影響。而AlphaMissense能快速分類7100萬潛在變異中的89%,幫助科學(xué)家聚焦高風(fēng)險變異,加速疾病研究。
AlphaMissense對所有可能的7100萬個錯義變體的致病性的預(yù)測
4. 模型——建模復(fù)雜系統(tǒng)及其組件之間的相互作用
1960年,諾貝爾獎得主物理學(xué)家Eugene Wigner感嘆數(shù)學(xué)方程在模擬自然現(xiàn)象(如行星運動)中「出乎意料的有效性」。
但面對生物學(xué)、經(jīng)濟學(xué)、天氣等復(fù)雜系統(tǒng),傳統(tǒng)方程模型漸顯乏力,因為這些系統(tǒng)充滿動態(tài)性、隨機性,還常伴涌現(xiàn)和混沌,難以預(yù)測和控制。這些方程能提供非常有用但并不完美的近似,且運行這些方法也需要高昂的計算成本。
AI卻能從復(fù)雜數(shù)據(jù)中挖掘規(guī)律。例如,谷歌的深度學(xué)習(xí)系統(tǒng)能快速預(yù)測未來10天天氣,速度與準(zhǔn)確性雙殺傳統(tǒng)數(shù)值模型。
同時,AI還能幫減緩氣候問題,如用AI預(yù)測潮濕區(qū)域的出現(xiàn)時間和位置,幫助飛行員避開會加劇全球變暖的凝結(jié)尾跡。
即便AI十分強大,它更多是豐富而非取代傳統(tǒng)的復(fù)雜系統(tǒng)建模。
例如,基于智能體的建模通過模擬個體行為者(如企業(yè)和消費者)之間的交互,來理解這些交互如何影響更大、更復(fù)雜的系統(tǒng)(如社會經(jīng)濟)。
在傳統(tǒng)方法中,科學(xué)家需要事先規(guī)定這些智能體的行為方式。
如今,科學(xué)家可以利用大語言模型創(chuàng)建更靈活的生成式智能體,這些智能體能夠進(jìn)行溝通和行動,例如搜索信息或購買,同時還能對這些行動進(jìn)行推理和記憶。
科學(xué)家還可以利用強化學(xué)習(xí)研究這些智能體如何在更動態(tài)的模擬中學(xué)習(xí)和調(diào)整其行為,例如對于新的能源價格或疫情響應(yīng)政策的反應(yīng)。
5. 解決方案——為大規(guī)模搜索空間問題提出解決方案
很多重要的科學(xué)問題都伴隨著許多幾乎無法理解的潛在解決方案。
比如,生物學(xué)家和化學(xué)家需要確定分子(如蛋白質(zhì))的結(jié)構(gòu)、特性和功能,才能設(shè)計出用作抗體藥物、降解塑料的酶或新型材料的一些新分子。
然而,要設(shè)計一種小分子藥物,科學(xué)家需要面對超過10^60種潛在選擇;要設(shè)計一種由400種標(biāo)準(zhǔn)氨基酸組成的蛋白質(zhì),則需要面對20^400種選擇。
這種大規(guī)模搜索空間不僅限于分子,還廣泛存在于許多科學(xué)問題中,比如尋找數(shù)學(xué)問題的最佳證明、計算機芯片的最佳設(shè)計架構(gòu)等。
傳統(tǒng)上,科學(xué)家依賴直覺、試錯法、迭代或暴力計算的某種組合來尋找最佳分子、證明或算法。然而,這些方法難以充分遍歷龐大的搜索空間,從而無法發(fā)現(xiàn)更優(yōu)的解決方案。
如今,AI能夠更好地探索這些龐大的搜索空間,同時更快地聚焦于最有可能可行且有效的解決方案。
今年7月,AlphaProof和AlphaGeometry2成功解決了國際數(shù)學(xué)奧林匹克競賽中六道題目中的四道。它們利用Gemini大語言模型架構(gòu),為給定的數(shù)學(xué)問題生成大量潛在解決方案,并結(jié)合基于數(shù)學(xué)邏輯的系統(tǒng),迭代地實現(xiàn)接近最可能正確的候選解決方案。
AI科學(xué)家還是AI賦能的科學(xué)家?
即便AI系統(tǒng)的能力在不斷提升,其最大的邊際效益依舊會源于將其應(yīng)用在能夠突顯其相對優(yōu)勢的場景之中。
比如快速從海量數(shù)據(jù)集中快速提取信息的能力,以及幫助解決科學(xué)進(jìn)步中的真正瓶頸問題;而非企圖讓人類科學(xué)家已擅長的任務(wù)實現(xiàn)自動化。
隨著AI推動科學(xué)變得更經(jīng)濟高效,社會對于科學(xué)和科學(xué)家的需求也會隨之增加。
和其他行業(yè)不同,科學(xué)的需求幾乎是無限的,而科技也并不會降低對科學(xué)家的需求。新的進(jìn)展總會在科學(xué)的版圖上開拓出全新的、難以預(yù)測的領(lǐng)域,AI亦是如此。
正如司馬賀所設(shè)想的那樣,AI系統(tǒng)自身也是科學(xué)研究的對象,科學(xué)家會在評估和闡釋其科學(xué)能力以及開發(fā)新型人類-AI 科學(xué)系統(tǒng)方面起到主導(dǎo)作用。
關(guān)鍵要素
這一部分,文章深入探討了實現(xiàn)「AI for Science」的幾個關(guān)鍵因素,并將其歸納為一個「AI for Science生產(chǎn)函數(shù)」的模型。
模型展示了如何利用AI推動科學(xué)研究和創(chuàng)新的不同階段以及需要關(guān)注的核心內(nèi)容。
從科學(xué)研究的問題選擇(Problem selection)、模型評估(Evaluations)開始,通過計算資源(Compute)和數(shù)據(jù)(Data)這些基礎(chǔ)設(shè)施的支持,在開展研究過程中注重組織模式設(shè)計(Organizational design)和跨學(xué)科(Interdisciplinarity),形成成果,并最終通過采納(Adoption)將研究成果轉(zhuǎn)化為實際影響。底部的合作(Partnerships)、安全與責(zé)任(Safety & responsibility)貫穿始終,確保整個流程高效且符合道德規(guī)范。
雖然很多要素看起來直觀,但DeepMind的論文揭示了一些在實踐中重要的經(jīng)驗教訓(xùn)。
1. 問題選擇
科學(xué)進(jìn)步的關(guān)鍵是找到真正值得解決的問題。
在DeepMind,科學(xué)團隊通常會先評估一個研究問題是否足夠重要,是否值得投入大量時間和資源。
DeepMind的CEO Demis Hassabis提出過一個思維模型:將整個科學(xué)視為一棵知識之樹。
那么,最重要的是找到樹的根——像蛋白質(zhì)結(jié)構(gòu)預(yù)測、量子化學(xué)這些基礎(chǔ)性的「根源問題」,它們一旦得到解決,就能開枝散葉,解鎖全新的研究和應(yīng)用。
而在這些問題當(dāng)中,要判斷AI是否能帶來增益,我們需要尋找具備特定特征的問題,例如巨大的組合搜索空間、大量數(shù)據(jù),以及可用于衡量性能的明確目標(biāo)函數(shù)。
許多最近的突破,就來自于重要科學(xué)問題和成熟AI方法的碰撞。
例如,DeepMind在核聚變研究的進(jìn)展就得益于新發(fā)布的強化學(xué)習(xí)算法——最大后驗策略優(yōu)化(maximum a posteriori policy optimization)。
選對問題很重要,但問題的難度也得剛好。一個適合AI的問題,通常是能夠產(chǎn)生中間結(jié)果的問題。
如果問題太難,就沒法產(chǎn)生足夠的反饋推動進(jìn)展。要做到這一點,需要靠需要直覺與實驗的結(jié)合。
2. 模型評估
科學(xué)AI研究中,模型的評估方法也很重要。
科學(xué)家常常通過基準(zhǔn)測試、指標(biāo)和競賽等評估方法來評估AI模型的科學(xué)能力。
如果設(shè)計得當(dāng),這些評估方法不僅可以用來跟蹤進(jìn)展,還能激發(fā)方法創(chuàng)新,激活研究人員對科學(xué)問題的興趣。
不同的情況需要不同的評估方法。
比如,DeepMind的天氣預(yù)測團隊最初用基于幾個關(guān)鍵變量(如地表溫度)的「進(jìn)展指標(biāo)」來提升模型表現(xiàn)。
當(dāng)模型達(dá)到一定性能水平時,他們采用了一個更全面的評估方法,其中包括1300多個指標(biāo)。這些指標(biāo)的設(shè)計受歐洲中期天氣預(yù)報中心(ECMWF)評價評分卡啟發(fā)。
團隊也發(fā)現(xiàn)AI模型有時會在某些指標(biāo)上「作弊」,比如「雙重懲罰」問題——「模糊」預(yù)測(如預(yù)測降雨在較大地理區(qū)域內(nèi)發(fā)生)比「精準(zhǔn)」預(yù)測(如預(yù)測暴風(fēng)雨的位置略微偏離實際位置)受到的懲罰更少。
為進(jìn)一步驗證,團隊還評估了模型在下游任務(wù)中的實用性,例如預(yù)測氣旋路徑的能力,以及表征可能導(dǎo)致洪水的「大氣河流」(集中濕氣的狹窄帶)的強度。
最具影響力的科學(xué)AI評估方法通常是社區(qū)主導(dǎo)的,比如蛋白質(zhì)結(jié)構(gòu)預(yù)測競賽(CASP)。
該競賽自1994年由John Moult教授和Krzysztof Fidelis教授發(fā)起,每兩年舉行一次。CASP的目標(biāo)是通過測試各參賽團隊的蛋白質(zhì)結(jié)構(gòu)預(yù)測方法的準(zhǔn)確性,推動相關(guān)領(lǐng)域的技術(shù)創(chuàng)新,并加深對蛋白質(zhì)折疊和結(jié)構(gòu)的理解。
不過,這也帶來了基準(zhǔn)可能「泄露」到AI模型訓(xùn)練數(shù)據(jù)中的風(fēng)險,讓模型「作弊」,從而降低基準(zhǔn)用于跟蹤模型進(jìn)展的效用。
「作弊」問題暫時沒有完美的解決方案,但至少需要定期更新基準(zhǔn),鼓勵更開放的第三方評估和競賽。
3. 計算資源
計算資源是AI和科學(xué)發(fā)展的核心引擎,但也是節(jié)能減排的焦點之一。
AI實驗室和政策制定者需要從長遠(yuǎn)視角平衡模型需求與效率提升。
比如,蛋白質(zhì)設(shè)計模型小巧高效,而大語言模型訓(xùn)練時計算密集,但微調(diào)和推理時所需計算量則比較少;通過優(yōu)化數(shù)據(jù)或?qū)⒋竽P汀刚麴s」成小模型,也可以進(jìn)一步降低計算成本。
同時,也需要對比AI與其他科學(xué)方法的資源消耗。
例如,AI驅(qū)動的天氣預(yù)測模型盡管訓(xùn)練耗費資源,但整體效率可能優(yōu)于傳統(tǒng)方法。實證數(shù)據(jù)的持續(xù)跟蹤可以幫助明確這些趨勢,并為未來計算需求的規(guī)劃提供依據(jù)。
此外,計算戰(zhàn)略不應(yīng)僅關(guān)注芯片供應(yīng)的充足性,更需優(yōu)先建設(shè)關(guān)鍵基礎(chǔ)設(shè)施和提升工程技能,以保障資源訪問和系統(tǒng)可靠性。然而,學(xué)術(shù)界和公共研究機構(gòu)在這些方面往往資源不足,需要更多支持。
4. 數(shù)據(jù)
像計算資源一樣,數(shù)據(jù)是科學(xué)AI發(fā)展的基礎(chǔ)設(shè)施,需要持續(xù)開發(fā)、維護(hù)和更新。
人們常著眼于政策制定者推動的新數(shù)據(jù)集創(chuàng)建。
例如,2012年奧巴馬政府啟動的材料項目繪制了無機晶體圖譜,為DeepMind最近的GNoME項目預(yù)測220萬種新材料提供了數(shù)據(jù)支持。
但許多科學(xué)AI突破往往來自更有機的數(shù)據(jù)涌現(xiàn),這些數(shù)據(jù)得益于有遠(yuǎn)見的個人或小團隊的努力。
像當(dāng)時Broad研究所的Daniel MacArthur領(lǐng)導(dǎo)開發(fā)的gnomAD遺傳變異數(shù)據(jù)集,為DeepMind的AlphaMissense項目提供了基礎(chǔ)。
還有,數(shù)學(xué)工具Lean最初由Leonardo de Moura開發(fā),如今已成AI數(shù)學(xué)模型(如AlphaProof)的重要訓(xùn)練資源。
這些案例說明,除了自上而下的戰(zhàn)略規(guī)劃,還需要激勵研究者在數(shù)據(jù)收集、整理和共享中扮演更積極的角色。
當(dāng)前,許多濕實驗室的實驗數(shù)據(jù)因缺乏資金支持而被丟棄;而蛋白質(zhì)數(shù)據(jù)銀行(PDB)的高質(zhì)量數(shù)據(jù)則受益于期刊要求和專業(yè)數(shù)據(jù)整理員制定的統(tǒng)一標(biāo)準(zhǔn)。相比之下,基因組數(shù)據(jù)的整理因標(biāo)準(zhǔn)不一,則常需額外整合和清洗。
此外,還有許多高質(zhì)量數(shù)據(jù)集完全未被利用,比如因許可限制無法公開的生物多樣性數(shù)據(jù),或幾十年核聚變實驗的歷史數(shù)據(jù)。這些瓶頸無論是由于缺乏資源、時間,還是由于數(shù)據(jù)禁運期,都會阻礙AI在科學(xué)領(lǐng)域的潛力釋放。
5. 組織模式設(shè)計
學(xué)術(shù)界偏自下而上,工業(yè)界偏自上而下,但頂尖實驗室往往能找到二者間的平衡。
像貝爾實驗室和施樂帕洛阿爾托研究中心的黃金年代,就以自由探索的研究模式著稱。這也為DeepMind的創(chuàng)立提供了靈感。
最近,一批新興科學(xué)機構(gòu)試圖從這些例子中汲取經(jīng)驗,復(fù)刻這種研究模式。它們希望推動更多高風(fēng)險、高回報的研究,削減官僚主義,為科學(xué)家提供更好的激勵。
這些機構(gòu)致力于解決一些科學(xué)中規(guī)模過大、學(xué)術(shù)界無法承擔(dān),但在工業(yè)界又不夠盈利的問題,例如擴展Lean證明助手,這一工具對AI數(shù)學(xué)研究至關(guān)重要。
這些機構(gòu)的核心目標(biāo)在于,將自上而下的協(xié)調(diào)與對科學(xué)家自下而上的賦能相結(jié)合。既不能完全依賴科學(xué)家自由發(fā)揮(可能導(dǎo)致效率低下或研究方向分散),也不能強行控制每一步(會扼殺創(chuàng)造力)。
理想狀態(tài)下,機構(gòu)為科學(xué)家提供清晰的目標(biāo)、資源和支持,但具體的研究方法和過程由科學(xué)家自己主導(dǎo)。
找到這種平衡不僅能吸引頂尖研究領(lǐng)導(dǎo)者,也是成功的關(guān)鍵。Demis Hassabis稱之為協(xié)調(diào)尖端研究的核心秘訣。
這種平衡同樣適用于具體項目。比如在DeepMind,研究常在「探索」?fàn)顟B(tài)(團隊尋找新想法)和「利用」?fàn)顟B(tài)(團隊專注于工程和性能擴展)兩種模式間切換。
掌握模式切換時機和調(diào)整團隊節(jié)奏,是一門藝術(shù)。
6. 跨學(xué)科
跨學(xué)科合作是破解科學(xué)難題的鑰匙,卻常被學(xué)科壁壘卡住。
科學(xué)AI的研究往往需要多學(xué)科起步,但真正的突破來自跨學(xué)科的深度融合。這不僅是把人湊在一起,而是讓團隊共同開發(fā)共享的方法和思想。
比如,DeepMind的Ithaca項目用AI修復(fù)受損的古希臘銘文。為了成功,AI研究負(fù)責(zé)人要鉆研銘文學(xué),而銘文學(xué)家也需要理解AI模型,因為直覺對這一工作至關(guān)重要。
培養(yǎng)這種團隊動態(tài)需要正確的激勵機制。團隊能做到這一點,靠的是專注于解決問題,而不是搶論文署名——這也是AlphaFold 2成功的關(guān)鍵。
這種專注在工業(yè)實驗室更易實現(xiàn),也凸顯了長期公共研究資金的重要性——它需要擺脫對發(fā)表壓力的過度依賴。
為了實現(xiàn)真正的跨學(xué)科合作,組織還需要為能夠幫助融合學(xué)科的人創(chuàng)造角色和職業(yè)路徑。
在DeepMind,研究工程師推動研究與工程的良性循環(huán),項目經(jīng)理加強團隊協(xié)作并連接不同項目。DeepMind還優(yōu)先招募擅長發(fā)現(xiàn)學(xué)科交叉的人,并鼓勵科學(xué)家和工程師定期更換項目。
關(guān)鍵是打造一種文化——好奇心驅(qū)動、尊重差異、敢于爭論。經(jīng)濟歷史學(xué)家Joel Mokyr稱這種文化為「爭議性」(contestability):不同背景的研究者能公開探討,彼此批評又共同進(jìn)步。
這種文化的實踐可以通過定期舉辦跨學(xué)科研討會、開放討論平臺以及鼓勵團隊內(nèi)外互動來實現(xiàn)。
這段修復(fù)的銘文(IG I3 4B)記錄了一項與雅典衛(wèi)城相關(guān)的法令,時間可追溯至公元前485年至484年
7. 采用
科學(xué)AI工具如AlphaFold既專業(yè)化又通用:它們專注少量任務(wù),卻服務(wù)廣泛科學(xué)界,從研究疾病到改進(jìn)漁業(yè)。
然而,科學(xué)進(jìn)展轉(zhuǎn)化為實際應(yīng)用并不簡單。例如,疾病的病原理論(germ-theory)從提出到被廣泛接受經(jīng)歷了漫長的時間,而科學(xué)突破所催生的下游產(chǎn)品(如新型抗生素)也常常由于缺乏合適的市場激勵而未能得到充分開發(fā)。
為了促進(jìn)模型的落地應(yīng)用,我們在科學(xué)家采用與商業(yè)目標(biāo)、安全風(fēng)險等因素之間尋找平衡,并設(shè)立了一個專門的影響力加速器(Impact Accelerator),以推動研究的落地應(yīng)用,并鼓勵社會公益方向的合作。
要讓科學(xué)家更容易用上新工具,集成流程必須簡單。
在AlphaFold 2開發(fā)中,我們不僅開源代碼,還聯(lián)合EMBL-EBI創(chuàng)建數(shù)據(jù)庫,供計算資源有限的科學(xué)家輕松查詢2億種蛋白質(zhì)結(jié)構(gòu)。
AlphaFold 3進(jìn)一步擴展了功能,但預(yù)測需求激增。為此,我們推出AlphaFold Server,科學(xué)家可按需生成結(jié)構(gòu)。
同時,科學(xué)界還自發(fā)開發(fā)工具如ColabFold,顯示對多樣化需求的重視及培養(yǎng)科學(xué)界計算能力的重要性。
迄今為止,來自全球190多個國家的超過200萬用戶已訪問AlphaFold蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫,瀏覽了700多萬個結(jié)構(gòu)
科學(xué)家信任AI模型,才會用它。推廣關(guān)鍵在于明確模型的用途和局限。
比如,在AlphaFold開發(fā)中,我們設(shè)計了不確定性指標(biāo),通過直觀可視化展示模型對預(yù)測的信心,并與EMBL-EBI合作推出培訓(xùn)模塊,指導(dǎo)如何解讀置信度并用實際案例強化信任。
類似地,Med-Gemini系統(tǒng)在健康問答上表現(xiàn)優(yōu)異。它通過生成多條推理鏈評估答案分歧計算不確定性。當(dāng)不確定性高時,自動調(diào)用網(wǎng)絡(luò)搜索整合最新信息。
這種方法既提升了可靠性,也讓科學(xué)家對決策過程一目了然,信任倍增。
Med-Gemini-3D能夠為CT掃描生成報告,這比標(biāo)準(zhǔn)X光成像復(fù)雜得多。在此示例中,Med-Gemini-3D的報告正確地包含了原始放射科醫(yī)生報告中遺漏的一處病變(用綠色標(biāo)出)
8. 合作
科學(xué)AI離不開多領(lǐng)域協(xié)作,公共和私營部門的合作尤為關(guān)鍵。
從數(shù)據(jù)集創(chuàng)建到成果共享,這種合作貫穿項目全程。
比如,AI模型設(shè)計的新材料是否可行,需要資深材料科學(xué)家的評估;DeepMind設(shè)計的抗SARS-CoV-2蛋白質(zhì),能否如預(yù)期結(jié)合目標(biāo),也需與克里克研究所合作進(jìn)行濕實驗驗證。甚至在數(shù)學(xué)領(lǐng)域,F(xiàn)unSearch解決Cap Set問題,也得益于數(shù)學(xué)家Jordan Ellenberg的專業(yè)指導(dǎo)。
鑒于工業(yè)實驗室在推動AI發(fā)展中的核心作用,以及對豐富領(lǐng)域知識的需求,公共與私營部門的合作在推動科學(xué)AI前沿發(fā)展方面的重要性將日益凸顯。為此,必須加大對公私合作的支持,比如為大學(xué)和研究機構(gòu)與企業(yè)的聯(lián)合團隊提供更多資金。
但合作不簡單。各方需盡早就目標(biāo)和關(guān)鍵問題達(dá)成一致:研究成果歸屬、是否發(fā)表論文、數(shù)據(jù)和模型是否開源、適用的許可協(xié)議等,都可能引發(fā)爭議。這些分歧通常反映了雙方不同的激勵,但成功合作往往建立在清晰的價值互換之上。
比如,AlphaFold蛋白質(zhì)數(shù)據(jù)庫能覆蓋200萬用戶,正是因為結(jié)合了我們的AI模型與EMBL-EBI的生物數(shù)據(jù)管理專長。這種優(yōu)勢互補式合作,不僅高效,還能讓AI潛力最大化。