自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<bdo id="6klw6"><button id="6klw6"></button></bdo>

^{<sub id="6klw6"></sub>}

<cite id="6klw6"></cite>

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫

賬號(hào)設(shè)置退出

忘掉GPT-5！OpenAI推出全新AI模型系列o1，聲稱性能達(dá)到博士級(jí)

作者：Carl Franzen 2024-09-13 12:34:54

OpenAI發(fā)布全新o1系列AI模型，取代此前的GPT系列，旨在解決復(fù)雜的科學(xué)、醫(yī)療和技術(shù)問題。

自從OpenAI于2023年3月推出其強(qiáng)大的專有大型語言模型GPT-4 —— 即 18 個(gè)月前 —— 以來，用戶和開發(fā)者們一直在猜測，這家在硅谷及全球掀起GenAI熱潮的公司何時(shí)會(huì)推出下一個(gè)版本，預(yù)計(jì)將命名為GPT-5。

然而，事實(shí)證明，GPT系列暫時(shí)被一整個(gè)全新模型家族所超越。

今天，經(jīng)過數(shù)月的報(bào)道和傳聞，尤其是在最近幾天愈加激烈的討論后，OpenAI 宣布推出其“o1” AI模型家族，首批包含兩個(gè)模型：o1-preview和o1-mini。公司表示，這些模型旨在“推理復(fù)雜任務(wù)并解決比GPT系列更難的問題”。

這兩個(gè)模型現(xiàn)已向ChatGPT Plus用戶開放，但最初限制為每周o1-preview只能發(fā)送30條消息，o1-mini則為50條。

然而，OpenAI 也提醒用戶：“作為一個(gè)早期模型，它還沒有許多使 ChatGPT 實(shí)用的功能，例如通過網(wǎng)絡(luò)瀏覽信息和上傳文件及圖片。在許多常見情況下，GPT-4o 在短期內(nèi)仍然更為強(qiáng)大?！?/p>

的確，我們在最初的測試中嘗試讓其為這篇文章生成圖片時(shí)發(fā)現(xiàn)它無法完成。在 OpenAI 的 API 平臺(tái)網(wǎng)站上，公司明確表示，這個(gè)模型家族在測試階段僅支持“文本內(nèi)容，暫不支持圖片”。

o1系列在GPT模型上的優(yōu)勢

OpenAI 聲稱其新的 o1 系列特別適合于在科學(xué)、醫(yī)療保健和技術(shù)等領(lǐng)域處理復(fù)雜問題的用戶。

OpenAI 設(shè)想這些模型將被廣泛應(yīng)用，從幫助物理學(xué)家為量子光學(xué)生成數(shù)學(xué)公式，到協(xié)助醫(yī)療研究人員為細(xì)胞測序數(shù)據(jù)做標(biāo)注。

開發(fā)者也會(huì)發(fā)現(xiàn) o1-mini 模型在構(gòu)建和執(zhí)行多步驟工作流、調(diào)試代碼以及高效解決編程挑戰(zhàn)方面頗具成效。

o1-preview的表現(xiàn)達(dá)到博士生水平

o1-preview 模型旨在通過花更多時(shí)間思考和優(yōu)化響應(yīng)來處理挑戰(zhàn)性任務(wù)，類似于人類面對(duì)復(fù)雜問題時(shí)的應(yīng)對(duì)方式。

在測試中，這種方法使該模型在物理學(xué)、化學(xué)和生物學(xué)等領(lǐng)域的表現(xiàn)接近博士生水平。

此外，o1-preview 模型在編程方面表現(xiàn)優(yōu)異，在 Codeforces 編程比賽中排名第 89 百分位，展現(xiàn)了其處理多步驟工作流、調(diào)試復(fù)雜代碼和生成準(zhǔn)確解決方案的能力。

在國際數(shù)學(xué)奧林匹克競賽 (IMO) 預(yù)選考試等基準(zhǔn)測試中，o1-preview 展示了其卓越能力，成功解決了 83% 的問題，顯著超越其前任 GPT-4o 僅 13% 的成功率。

它已經(jīng)向ChatGPT的Plus和Team用戶開放使用，Enterprise和Edu用戶將在下周獲得訪問權(quán)限。該模型也通過OpenAI API提供給符合API使用第5層級(jí)的開發(fā)者，盡管最初會(huì)有速率限制。

o1-mini功能較弱但便宜80%

與o1-preview同時(shí)，OpenAI還推出了o1-mini模型，這是一個(gè)更精簡的版本，旨在提供更快且更便宜的推理能力。

雖然o1-mini主要針對(duì)編程和STEM任務(wù)進(jìn)行了優(yōu)化，但它在數(shù)學(xué)和編程領(lǐng)域依然表現(xiàn)出色。

在IMO數(shù)學(xué)基準(zhǔn)測試中，o1-mini得分為70%，幾乎與o1-preview的74%持平，同時(shí)推理成本顯著降低。在編碼評(píng)估中，它也表現(xiàn)出色，在Codeforces上獲得了1650的Elo評(píng)分，位于前86%的程序員之列。

與o1-preview相比，o1-mini的價(jià)格便宜了80%，它主要面向那些需要推理能力但不需要o1-preview模型所具備的廣泛知識(shí)的開發(fā)者和研究人員。

這一具有成本效益的解決方案也將向ChatGPT Plus、Team、Enterprise和Edu用戶開放，未來還計(jì)劃向ChatGPT Free用戶擴(kuò)展使用權(quán)限。

安全性和保障增強(qiáng)

為了遵守OpenAI對(duì)安全性的承諾，這兩個(gè)模型都采用了一種新的安全訓(xùn)練方法，以增強(qiáng)它們遵循安全和對(duì)齊準(zhǔn)則的能力。

OpenAI指出，o1-preview在其最嚴(yán)苛的越獄測試之一中得分達(dá)到了84分，相較于GPT-4o的22分有了顯著提升。能夠在上下文中推理安全規(guī)則，使這些模型更好地處理不安全的提示，避免生成不適當(dāng)?shù)膬?nèi)容。

作為更廣泛安全努力的一部分，OpenAI已與美國和英國的AI安全研究所達(dá)成協(xié)議。

這些合作包括為研究版本的o1模型提供早期訪問權(quán)限，以幫助評(píng)估和測試未來的AI系統(tǒng)。

OpenAI的安全工作還包括全面的內(nèi)部治理，并與聯(lián)邦政府合作，通過定期測試、紅隊(duì)測試以及公司安全與保障委員會(huì)的董事會(huì)層級(jí)監(jiān)督來加強(qiáng)安全性。

OpenAI的o1系列未來展望

盡管o1-preview和o1-mini模型在推理和問題解決方面已經(jīng)是強(qiáng)大的工具，OpenAI承認(rèn)這只是一個(gè)開始。

公司計(jì)劃定期更新和改進(jìn)這些模型，包括增加API版本當(dāng)前尚不支持的功能，如瀏覽、文件和圖像上傳以及函數(shù)調(diào)用。

展望未來，OpenAI將繼續(xù)開發(fā)其GPT和o1系列，進(jìn)一步擴(kuò)展AI在各個(gè)領(lǐng)域的能力。用戶可以期待不斷的進(jìn)步，因?yàn)楣局铝τ谔岣哌@些模型在不同應(yīng)用中的實(shí)用性和可訪問性。

責(zé)任編輯：龐桂玉來源：企業(yè)網(wǎng)D1Net

OpenAI AI模型

點(diǎn)贊

51CTO技術(shù)棧公眾號(hào)

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營

<style id="ypktm"></style>