自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

Nature:科研人員最愛AI工具大盤點(diǎn)!從推理到編程,哪款才是最佳助手?

人工智能 新聞
本文介紹了當(dāng)前最受科研人員青睞的AI模型,推理出色的o3-mini、全能型DeepSeek-R1、科研常用的Llama、編程利器Claude 3.5 Sonnet和開源明星Olmo 2,它們各有優(yōu)劣,為科研人員提供了多樣選擇。

幾乎每周都有新的、令人影響深刻的AI工具發(fā)布,研究人員紛紛踴躍嘗試。

從復(fù)雜的數(shù)學(xué)問題求解,到醫(yī)學(xué)診斷中的精準(zhǔn)分析,再到代碼編寫與論文創(chuàng)作,AI工具展現(xiàn)了巨大的潛力。

但市面上令人眼花繚亂的AI模型,究竟哪一款才是讓科研工作者效率起飛的「夢中情模」,能助力科研突破,帶來事半功倍的效果呢?

在這里,研究人員與《自然》雜志分享了他們當(dāng)下最青睞的模型。

o3-mini:推理小能手

提到LLM,就不得不提OpenAI。2022年,OpenAI推出了聊天機(jī)器人ChatGPT。

科學(xué)家們主要將ChatGPT用于查找信息或作為寫作助手,如起草摘要等。而在去年,OpenAI又發(fā)布了一系列更先進(jìn)的模型,其中o3-mini就是一款非常出色的推理模型。

o3-mini是一款速度很快的推理模型,并且面向注冊用戶免費(fèi)開放。它經(jīng)過訓(xùn)練,會(huì)以逐步推理的方式回答問題。

這種「思維鏈」旨在模擬人類推理過程,幫它在科學(xué)和數(shù)學(xué)領(lǐng)域突破了嚴(yán)苛的基準(zhǔn)測試。o3-mini擅長處理技術(shù)任務(wù),如解決編程問題和重新格式化數(shù)據(jù)。

牛津大學(xué)數(shù)學(xué)家兼AI研究人員Simon Frieder表示,在解析陌生數(shù)學(xué)證明等任務(wù)上,o3-mini表現(xiàn)非常出色。

不過,他也提到,o3-mini仍然無法與數(shù)學(xué)家媲美。但不可否認(rèn)的是,o3-mini為科研人員在處理一些復(fù)雜問題時(shí)提供了有力的幫助。

OpenAI近期還推出了「深度研究」功能,允許一些付費(fèi)訂閱用戶從數(shù)百個(gè)網(wǎng)站上綜合信息并添加引用,生成報(bào)告,進(jìn)行文獻(xiàn)綜述。

舊金山初創(chuàng)公司FutureHouse的化學(xué)家兼AI專家Andrew White表示:「這些模型在組合使用時(shí)效果更佳?!?/span>

圖片

DeepSeek:全能「潛力股」

DeepSeek-R1也是一款備受矚目的模型。它的能力與OpenAI的o1相當(dāng),但通過API使用的成本卻低得多。這對于許多科研團(tuán)隊(duì)來說,是一個(gè)很有吸引力的優(yōu)勢。

DeepSeek-R1是開源權(quán)重模型,雖然其訓(xùn)練數(shù)據(jù)尚未公布,但任何人都可以下載基礎(chǔ)模型,并根據(jù)自己的研究項(xiàng)目進(jìn)行定制。

香港中文大學(xué)(深圳)的計(jì)算機(jī)科學(xué)家Benyou Wang等人正在開發(fā)可以在單機(jī)上運(yùn)行或訓(xùn)練的版本,讓更多學(xué)者能用到這個(gè)強(qiáng)大的模型。

和o1一樣,DeepSeek-R1的強(qiáng)項(xiàng)是解決數(shù)學(xué)問題和編寫代碼。同時(shí),它在提出假設(shè)等任務(wù)上也表現(xiàn)不錯(cuò)。這是因?yàn)镈eepSeek選擇公布模型的「思考過程」,使得研究人員能夠更好地完善后續(xù)問題,提高模型的輸出質(zhì)量。

這種透明度在醫(yī)學(xué)診斷領(lǐng)域也可能發(fā)揮巨大作用。Benyou Wang正在利用該模型的推理能力開展實(shí)驗(yàn),致力于構(gòu)建從患者評估到診斷和治療建議的清晰路徑。

圖片

然而,DeepSeek-R1也并非完美無缺。該模型的「思考過程」似乎特別長,這降低了它的運(yùn)行速度,在查找信息或頭腦風(fēng)暴方面實(shí)用性欠佳。

與競爭對手相比,DeepSeek在防范模型生成有害內(nèi)容方面所采取的措施似乎也較少。一些研究人員認(rèn)為這種開源且功能強(qiáng)大的模型對于科研發(fā)展有著重要意義,而另一些人則對此持謹(jǐn)慎態(tài)度。

Llama:科研老伙計(jì)

Llama是Meta AI于2023年發(fā)布的一組開源權(quán)重模型,長期以來一直是科研界常用的LLM。僅通過開源科學(xué)平臺(tái)Hugging Face,Llama各個(gè)版本下載量就已超過6億次。

Llama之所以受到科研界的歡迎,很大程度上是因?yàn)樗梢员幌螺d并在此基礎(chǔ)上進(jìn)行開發(fā)。在處理受保護(hù)的數(shù)據(jù)時(shí),能在個(gè)人或機(jī)構(gòu)的服務(wù)器上運(yùn)行至關(guān)重要,可以避免敏感信息反饋給其他用戶或開發(fā)者。

圖片

研究人員基于Llama模型開發(fā)出了能預(yù)測材料晶體結(jié)構(gòu)的大語言模型,還利用它來模擬量子計(jì)算機(jī)的輸出結(jié)果。

北卡羅來納大學(xué)教堂山分校的ML科學(xué)家Tianlong Chen表示,Llama很適合用于模擬量子計(jì)算機(jī),因?yàn)橄鄬θ菀讓ζ溥M(jìn)行調(diào)整,讓它理解專業(yè)的量子語言。

不過,Llama也有一些小缺點(diǎn)。比如需要用戶申請?jiān)L問權(quán)限,這對一些人來說有點(diǎn)麻煩。

因此,其他開源模型,如西雅圖Allen人工智能研究所開發(fā)的OLMo,以及阿里云開發(fā)的Qwen,現(xiàn)在常常成為科研中的首選。DeepSeek V3如今也是有力的競爭者。

Claude:編程利器

在硅谷,很多人對Claude 3.5 Sonnet的編程能力贊不絕口。

Claude 3.5 Sonnet由總部位于舊金山的AI公司Anthropic開發(fā),它不僅可以編寫代碼,還能解讀圖表等視覺信息。此外,它還有一種模式,允許其遠(yuǎn)程操作用戶的計(jì)算機(jī)。

Claude的寫作風(fēng)格也備受贊譽(yù)。一些LLM(如ChatGPT)在去除技術(shù)語言時(shí),可能也會(huì)誤刪關(guān)鍵信息。而Claude在潤色文本的同時(shí),更擅長保留原意。

因此,在撰寫科研基金申請或?yàn)榇a添加解釋性注釋時(shí),Claude可能是更好的選擇。

圖片

在一項(xiàng)基于數(shù)據(jù)驅(qū)動(dòng)的科學(xué)任務(wù)的基準(zhǔn)測試中,Claude 3.5 Sonnet在編程挑戰(zhàn)方面表現(xiàn)出色,這些任務(wù)的數(shù)據(jù)取自生物信息學(xué)和計(jì)算化學(xué)等領(lǐng)域的真實(shí)論文。

雖然Claude 3.5 Sonnet作為在線聊天機(jī)器人可以免費(fèi)使用,但和OpenAI的模型一樣,研究人員只能通過付費(fèi)API,才能實(shí)現(xiàn)完整集成。

隨著更便宜的開源模型越來越強(qiáng)大,人們可能會(huì)更傾向于使用開源模型。

Olmo:開源新星

對于想要深入了解內(nèi)部運(yùn)行機(jī)制的研究人員來說,Olmo 2是一個(gè)非常不錯(cuò)的選擇。

Olmo 2是目前性能最出色的開源模型之一,它還附帶算法的訓(xùn)練數(shù)據(jù),以及用于訓(xùn)練和評估模型的代碼。

研究Olmo 2這樣的模型能讓研究人員將偏差來源追溯到訓(xùn)練數(shù)據(jù)上,同時(shí)通過更好地理解算法如何得出輸出結(jié)果,來提高效率。

圖片

目前,開源模型的門檻是需要一定的專業(yè)知識(shí)才能運(yùn)行,但隨著免費(fèi)實(shí)踐課程的增加,進(jìn)入門檻正在逐漸降低。

如果法院判定使用受版權(quán)保護(hù)的內(nèi)容來訓(xùn)練模型屬于違法行為,那么像Olmo 2這樣基于允許重復(fù)使用和修改的數(shù)據(jù)集所訓(xùn)練的模型,可能是唯一可以安全使用的模型。

責(zé)任編輯:張燕妮 來源: 新智元
相關(guān)推薦

2015-09-11 09:28:52

桌面環(huán)境發(fā)行版Linux

2015-09-28 10:28:28

國外桌面瀏覽器盤點(diǎn)

2022-02-23 09:39:47

Julia編程語言科學(xué)

2021-03-17 14:56:01

VRAR虛擬現(xiàn)實(shí)技術(shù)

2024-09-27 17:06:13

2023-08-22 10:13:53

模塊工具JavaScrip

2024-06-04 22:04:39

2023-03-15 23:59:13

前端構(gòu)建工具

2020-01-09 10:01:55

電腦搜索引擎工具

2018-07-18 12:54:40

微軟WindowsWindows 10

2015-07-08 10:37:42

頂級編程標(biāo)配軟件

2025-02-11 12:35:12

2022-02-21 09:25:57

VR研究Nature

2013-11-21 10:36:31

iOS APP開發(fā)工具

2024-01-02 00:16:59

生成式AI人工智能

2021-08-14 23:00:37

安卓iOS手機(jī)

2024-08-12 08:41:40

2019-10-14 15:19:56

AI 數(shù)據(jù)人工智能

2024-04-22 15:00:00

AIAI輔助編程工具開發(fā)

2024-07-01 13:51:58

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號