未來五年AI如何改變各學(xué)科?從LLM到AI蛋白設(shè)計、醫(yī)療保健......
五年前(2019 年 1 月),《Nature Machine Intelligence》創(chuàng)刊。當(dāng)然,就人工智能(AI)而言,五年前似乎是一個不同的時代。
1 月 24 日,Nature Machine Intelligence 雜志在《Anniversary AI reflections》(周年人工智能反思)專題中,再次聯(lián)系并采訪了近期在期刊發(fā)表評論和觀點文章的作者,請他們從各自所在領(lǐng)域中舉例說明人工智能如何改變科學(xué)過程。
想知道,他們對人工智能領(lǐng)域的哪些其他主題感到興奮、驚訝或擔(dān)憂,以及他們對 2024 年以及未來五年的人工智能的希望和期望是什么。一個反復(fù)出現(xiàn)的主題是大型語言模型和生成人工智能的持續(xù)發(fā)展、它們對科學(xué)過程的變革性影響以及對倫理影響的擔(dān)憂。
引人注目的是,這些作者強調(diào)了人工智能如何徹底改變了各個學(xué)科;例如,正如西班牙赫羅納大學(xué)(University of Girona)Noelia Ferruz 提到的,蛋白質(zhì)設(shè)計和工程領(lǐng)域。但他們也討論了 LLM 的最新發(fā)展,例如 ChatGPT 和生成人工智能,如何改變了整個研究工作流程,包括科學(xué)寫作過程、編碼和頭腦風(fēng)暴。
此外,他們預(yù)測,鑒于 LLM 和生成式人工智能的持續(xù)發(fā)展,未來五年將帶來進一步的實質(zhì)性變化,例如連接到物理世界的個性化模型和人工智能代理框架。正如有作者強調(diào)的那樣,這些變化無疑會帶來進一步的道德挑戰(zhàn)。
赫羅納大學(xué) Noelia Ferruz:專注于 AI 蛋白設(shè)計
你的觀點是關(guān)于什么的?
我們的文章回顧了大語言模型(LLM)在蛋白質(zhì)研究領(lǐng)域的應(yīng)用,特別關(guān)注 Transformer 架構(gòu)及其各種訓(xùn)練技術(shù)。我們密切關(guān)注生成 LLM 在蛋白質(zhì)設(shè)計中的實施和使用,并討論了它們在未來幾年的潛力。
論文鏈接:https://www.nature.com/articles/s42256-022-00499-z
該領(lǐng)域是如何發(fā)展的?
人工智能正在快速發(fā)展,在過去的一年里我們見證了令人難以置信的進步。擴散模型在生成圖像方面取得了前所未有的成功,2022 年末,OpenAI 發(fā)布了 ChatGPT,展示了在文本生成方面的卓越性能。
這些進步也影響了蛋白質(zhì)設(shè)計領(lǐng)域,近幾個月發(fā)布了幾種蛋白質(zhì)擴散模型,促進了對傳統(tǒng)上具有挑戰(zhàn)性的設(shè)計案例的重新思考。
人工智能的哪些發(fā)展最令您驚訝或興奮?
我發(fā)現(xiàn)生成基礎(chǔ)模型的功能非常令人驚訝,例如能夠生成文本(ChatGPT、Bard)和圖像(DALL·E 2、Stable Diffusion)的模型。最近,結(jié)合多種數(shù)據(jù)類型來訓(xùn)練多模態(tài) LLM(MLLM)引發(fā)了新一輪的興奮浪潮,一些 MLLM 已經(jīng)集成了文本和圖像,例如 GPT-4、Kosmos-1 或 GATO,其他一些甚至已經(jīng)嵌入到機器人框架中,例如 PaLM-E。這些智能體的初步表現(xiàn)暗示它們可能是邁向通用智能的第一步。
盡管這些進展仍需要應(yīng)用于蛋白質(zhì)設(shè)計領(lǐng)域,但蛋白質(zhì)固有的多模態(tài)和可用于自監(jiān)督學(xué)習(xí)的未標(biāo)記數(shù)據(jù)量表明這一應(yīng)用是可行的,它可能使我們更接近實現(xiàn)具有可控特性的蛋白質(zhì)設(shè)計。
您能舉出人工智能如何改變科學(xué)過程的例子嗎?
ChatGPT 等生成模型徹底改變了科學(xué)寫作,引發(fā)了人們的疑問:如何將這些工具整合到我們的教育系統(tǒng)中,以及我們?nèi)绾螜z測科學(xué)評論和出版中的不當(dāng)行為。在蛋白質(zhì)的特定背景下,研究領(lǐng)域在過去三年中經(jīng)歷了徹底的轉(zhuǎn)變,從基于物理的方法轉(zhuǎn)向人工智能引導(dǎo)的工具。
現(xiàn)在,我們不僅可以解決傳統(tǒng)的蛋白質(zhì)設(shè)計問題,而且我們也有豐富的方法來生成結(jié)構(gòu)或序列,或者圍繞給定的支架定義兩者。這些人工智能模型在實驗室環(huán)境中表現(xiàn)出顯著提高的性能,減少了時間要求并提高了傳統(tǒng)上具有挑戰(zhàn)性的蛋白質(zhì)設(shè)計任務(wù)的成功率。我們現(xiàn)在可以設(shè)計幾年前超乎想象的蛋白質(zhì)系統(tǒng)。
您對 2024 年以及未來 5 年的人工智能有何希望或期望?
我對各個人工智能領(lǐng)域的快速進步感到樂觀,包括文本和圖像生成、機器人技術(shù)和多任務(wù)自主代理。這些進展將很快擴大對蛋白質(zhì)設(shè)計領(lǐng)域的影響。
在接下來的五年中,大型智能代理將會出現(xiàn),無縫集成到機器人平臺中。這些代理將有能力半自主地設(shè)計序列、分析序列并不斷完善其設(shè)計,同時根據(jù)反饋提高其能力。這有望顯著縮短工程周期并創(chuàng)建高效的設(shè)計。我相信,這項變革性技術(shù)將通過功能性蛋白質(zhì)的定制開發(fā)來徹底改變眾多行業(yè),從而降低各種生物技術(shù)過程的成本,并為新的環(huán)保方法鋪平道路。
更多作者信息
Yiyu Shi,圣母大學(xué)
醫(yī)療保健領(lǐng)域的人工智能和機器學(xué)習(xí)存在可持續(xù)性問題,并討論了有助于解決這些問題的當(dāng)前和未來的各種算法和系統(tǒng)創(chuàng)新。
論文鏈接:https://www.nature.com/articles/s42256-023-00670-0
Diana Mincu,Google Research
研究了研究管道中各部分的改進——數(shù)據(jù)集、工具和實踐、問題制定、結(jié)果,一直到臨床部署。
論文鏈接:https://www.nature.com/articles/s42256-022-00559-4
Marinka Zitnik,哈佛醫(yī)學(xué)院
探討了使用圖來融合不同的數(shù)據(jù)模態(tài),并以靈活和通用的方式利用跨模態(tài)依賴關(guān)系。
論文鏈接:https://www.nature.com/articles/s42256-023-00624-6
Nandana Sengupta,印度理工學(xué)院
探討了人工智能技術(shù)與國家在 Global South 背景下交叉的一些具體方式。評論了立法行動的緩慢步伐與公共行政中算法的不斷結(jié)合,以及迫切需要對這些地區(qū)的算法偏見和公眾態(tài)度進行更多的量化實證研究。
論文鏈接:https://www.nature.com/articles/s42256-023-00621-9
Sebastian Porsdam Mann,牛津大學(xué)
討論了與生成式人工智能的使用有關(guān)的各種倫理問題,突出了對其產(chǎn)出的道德責(zé)任的不對稱。
論文鏈接:https://www.nature.com/articles/s42256-023-00653-1
Payel Das,IBM Research
強調(diào)了將「數(shù)據(jù)工作」作為人工智能研究的主流和不可或缺的組成部分進行實踐缺乏激勵和認(rèn)可。通過提供示例并分享我們自己作為人工智能研究人員的經(jīng)驗,討論了當(dāng)前過度強調(diào)建模和算法工作的文化和務(wù)實因素。提出了改變現(xiàn)狀的建議,將數(shù)據(jù)工作重新定義為技術(shù)上嚴(yán)格的,并將其整合到模型創(chuàng)新中。
論文鏈接:https://www.nature.com/articles/s42256-023-00673-x
Francesco Stella,代爾夫特理工大學(xué)
我們證明了像 GPT-4 這樣的 LLM 可以在概念和技術(shù)層面上指導(dǎo)機器人的設(shè)計過程,并提出了人類與人工智能的協(xié)同設(shè)計策略。然后討論了社會影響,強調(diào)了跨學(xué)科研究的機會,同時注意有關(guān)社區(qū)偏見、知識產(chǎn)權(quán)和認(rèn)知任務(wù)自動化的問題。
論文鏈接:https://www.nature.com/articles/s42256-023-00669-7