自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

忘掉GPT-5!OpenAI推出全新AI模型系列o1,聲稱性能達(dá)到博士級(jí)

人工智能
OpenAI發(fā)布全新o1系列AI模型,取代此前的GPT系列,旨在解決復(fù)雜的科學(xué)、醫(yī)療和技術(shù)問題。

自從OpenAI于2023年3月推出其強(qiáng)大的專有大型語言模型GPT-4 —— 即 18 個(gè)月前 —— 以來,用戶和開發(fā)者們一直在猜測,這家在硅谷及全球掀起GenAI熱潮的公司何時(shí)會(huì)推出下一個(gè)版本,預(yù)計(jì)將命名為GPT-5。

然而,事實(shí)證明,GPT系列暫時(shí)被一整個(gè)全新模型家族所超越。

今天,經(jīng)過數(shù)月的報(bào)道和傳聞,尤其是在最近幾天愈加激烈的討論后,OpenAI 宣布推出其“o1” AI模型家族,首批包含兩個(gè)模型:o1-preview和o1-mini。公司表示,這些模型旨在“推理復(fù)雜任務(wù)并解決比GPT系列更難的問題”。

這兩個(gè)模型現(xiàn)已向ChatGPT Plus用戶開放,但最初限制為每周o1-preview只能發(fā)送30條消息,o1-mini則為50條。

然而,OpenAI 也提醒用戶:“作為一個(gè)早期模型,它還沒有許多使 ChatGPT 實(shí)用的功能,例如通過網(wǎng)絡(luò)瀏覽信息和上傳文件及圖片。在許多常見情況下,GPT-4o 在短期內(nèi)仍然更為強(qiáng)大?!?/p>

的確,我們在最初的測試中嘗試讓其為這篇文章生成圖片時(shí)發(fā)現(xiàn)它無法完成。在 OpenAI 的 API 平臺(tái)網(wǎng)站上,公司明確表示,這個(gè)模型家族在測試階段僅支持“文本內(nèi)容,暫不支持圖片”。

o1系列在GPT模型上的優(yōu)勢

OpenAI 聲稱其新的 o1 系列特別適合于在科學(xué)、醫(yī)療保健和技術(shù)等領(lǐng)域處理復(fù)雜問題的用戶。

OpenAI 設(shè)想這些模型將被廣泛應(yīng)用,從幫助物理學(xué)家為量子光學(xué)生成數(shù)學(xué)公式,到協(xié)助醫(yī)療研究人員為細(xì)胞測序數(shù)據(jù)做標(biāo)注。

開發(fā)者也會(huì)發(fā)現(xiàn) o1-mini 模型在構(gòu)建和執(zhí)行多步驟工作流、調(diào)試代碼以及高效解決編程挑戰(zhàn)方面頗具成效。

o1-preview的表現(xiàn)達(dá)到博士生水平

o1-preview 模型旨在通過花更多時(shí)間思考和優(yōu)化響應(yīng)來處理挑戰(zhàn)性任務(wù),類似于人類面對(duì)復(fù)雜問題時(shí)的應(yīng)對(duì)方式。

在測試中,這種方法使該模型在物理學(xué)、化學(xué)和生物學(xué)等領(lǐng)域的表現(xiàn)接近博士生水平。

此外,o1-preview 模型在編程方面表現(xiàn)優(yōu)異,在 Codeforces 編程比賽中排名第 89 百分位,展現(xiàn)了其處理多步驟工作流、調(diào)試復(fù)雜代碼和生成準(zhǔn)確解決方案的能力。

在國際數(shù)學(xué)奧林匹克競賽 (IMO) 預(yù)選考試等基準(zhǔn)測試中,o1-preview 展示了其卓越能力,成功解決了 83% 的問題,顯著超越其前任 GPT-4o 僅 13% 的成功率。

它已經(jīng)向ChatGPT的Plus和Team用戶開放使用,Enterprise和Edu用戶將在下周獲得訪問權(quán)限。該模型也通過OpenAI API提供給符合API使用第5層級(jí)的開發(fā)者,盡管最初會(huì)有速率限制。

o1-mini功能較弱但便宜80%

與o1-preview同時(shí),OpenAI還推出了o1-mini模型,這是一個(gè)更精簡的版本,旨在提供更快且更便宜的推理能力。

雖然o1-mini主要針對(duì)編程和STEM任務(wù)進(jìn)行了優(yōu)化,但它在數(shù)學(xué)和編程領(lǐng)域依然表現(xiàn)出色。

在IMO數(shù)學(xué)基準(zhǔn)測試中,o1-mini得分為70%,幾乎與o1-preview的74%持平,同時(shí)推理成本顯著降低。在編碼評(píng)估中,它也表現(xiàn)出色,在Codeforces上獲得了1650的Elo評(píng)分,位于前86%的程序員之列。

與o1-preview相比,o1-mini的價(jià)格便宜了80%,它主要面向那些需要推理能力但不需要o1-preview模型所具備的廣泛知識(shí)的開發(fā)者和研究人員。

這一具有成本效益的解決方案也將向ChatGPT Plus、Team、Enterprise和Edu用戶開放,未來還計(jì)劃向ChatGPT Free用戶擴(kuò)展使用權(quán)限。

安全性和保障增強(qiáng)

為了遵守OpenAI對(duì)安全性的承諾,這兩個(gè)模型都采用了一種新的安全訓(xùn)練方法,以增強(qiáng)它們遵循安全和對(duì)齊準(zhǔn)則的能力。

OpenAI指出,o1-preview在其最嚴(yán)苛的越獄測試之一中得分達(dá)到了84分,相較于GPT-4o的22分有了顯著提升。能夠在上下文中推理安全規(guī)則,使這些模型更好地處理不安全的提示,避免生成不適當(dāng)?shù)膬?nèi)容。

作為更廣泛安全努力的一部分,OpenAI已與美國和英國的AI安全研究所達(dá)成協(xié)議。

這些合作包括為研究版本的o1模型提供早期訪問權(quán)限,以幫助評(píng)估和測試未來的AI系統(tǒng)。

OpenAI的安全工作還包括全面的內(nèi)部治理,并與聯(lián)邦政府合作,通過定期測試、紅隊(duì)測試以及公司安全與保障委員會(huì)的董事會(huì)層級(jí)監(jiān)督來加強(qiáng)安全性。

OpenAI的o1系列未來展望

盡管o1-preview和o1-mini模型在推理和問題解決方面已經(jīng)是強(qiáng)大的工具,OpenAI承認(rèn)這只是一個(gè)開始。

公司計(jì)劃定期更新和改進(jìn)這些模型,包括增加API版本當(dāng)前尚不支持的功能,如瀏覽、文件和圖像上傳以及函數(shù)調(diào)用。

展望未來,OpenAI將繼續(xù)開發(fā)其GPT和o1系列,進(jìn)一步擴(kuò)展AI在各個(gè)領(lǐng)域的能力。用戶可以期待不斷的進(jìn)步,因?yàn)楣局铝τ谔岣哌@些模型在不同應(yīng)用中的實(shí)用性和可訪問性。

責(zé)任編輯:龐桂玉 來源: 企業(yè)網(wǎng)D1Net
相關(guān)推薦

2024-09-24 11:01:03

2024-09-13 09:26:17

2024-09-13 10:14:36

2025-04-07 07:18:48

2024-04-25 13:57:20

Llama 3OpenAIAI

2024-09-25 09:30:16

2024-10-05 00:00:00

2023-06-08 07:58:29

2024-12-06 14:17:41

2025-02-10 01:00:00

OpenAIGPT-5GPT-4.5

2024-12-05 10:16:14

2024-11-07 15:40:00

2024-09-13 10:06:21

2024-12-09 11:06:31

2025-02-03 14:17:27

2024-01-18 12:30:03

2025-01-02 13:00:00

2024-05-15 17:34:15

2024-04-01 00:50:00

吳恩達(dá)智能體

2025-04-09 11:01:19

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)