自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

OpenAI滿血版o1劇透:數(shù)學(xué)代碼能力再破天花板,已開(kāi)啟測(cè)試評(píng)估

人工智能
OpenAI在官網(wǎng)商業(yè)化頻道下,對(duì)滿血版o1來(lái)了一波提前劇透。視頻截圖中,滿血版o1和GPT-4o、o1-preview(預(yù)覽版)同臺(tái)競(jìng)技,且在數(shù)學(xué)/編碼上遙遙領(lǐng)先。

“性能遠(yuǎn)超o1預(yù)覽版,滿血版o1即將推出”。

OpenAI在官網(wǎng)商業(yè)化頻道下,對(duì)滿血版o1來(lái)了一波提前劇透。

視頻截圖中,滿血版o1和GPT-4o、o1-preview(預(yù)覽版)同臺(tái)競(jìng)技,且在數(shù)學(xué)/編碼上遙遙領(lǐng)先。

經(jīng)透露,OpenAI將同步發(fā)布GPT系列和o1系列,且正在對(duì)滿血版o1進(jìn)行基準(zhǔn)測(cè)試和運(yùn)行評(píng)估。

此外,官方計(jì)劃在未來(lái)幾個(gè)月內(nèi)為o1系列模型添加更多功能,例如網(wǎng)頁(yè)瀏覽、文件和圖像上傳等,并支持ChatGPT自動(dòng)選擇合適模型。

不過(guò)掃到最后,網(wǎng)友們卻發(fā)現(xiàn)了一個(gè)華點(diǎn):

啥?在PhD級(jí)別的科學(xué)任務(wù)上,滿血版o1竟打不過(guò)o1-preview?

對(duì)于這點(diǎn),我們不妨從OpenAI首席產(chǎn)品官最近的采訪中找找答案,剛好他也談到了o1模型——

滿血版o1即將推出

OpenAI于上月無(wú)預(yù)警發(fā)布了傳說(shuō)中的“草莓”模型:o1系列。

它是OpenAI首個(gè)經(jīng)過(guò)強(qiáng)化學(xué)習(xí)訓(xùn)練的模型,在輸出回答之前,會(huì)再產(chǎn)生一個(gè)很長(zhǎng)的思維鏈,以此增強(qiáng)模型的能力。

o1系列一共3檔,滿血版因過(guò)于強(qiáng)大至今仍未公布。

  • o1(滿血版):新的大模型天花板,專(zhuān)注于深度思考和邏輯推理
  • o1-preiview:o1的早期預(yù)覽版本,在數(shù)學(xué)、編碼能力上相比GPT-4o大幅提升
  • o1-mini:速度更快、性價(jià)比更高,適用于需要推理和無(wú)需廣泛世界知識(shí)的任務(wù)

不過(guò)就在最近,關(guān)于o1模型的更多消息釋出——

OpenAI員工在一場(chǎng)研討會(huì)中詳細(xì)介紹了o1-preview模型的最新案例,并提到滿血版o1即將發(fā)布。

一開(kāi)始,OpenAI產(chǎn)品營(yíng)銷(xiāo)團(tuán)隊(duì)的Victoria Chernova確認(rèn),公司將同步開(kāi)發(fā)和發(fā)布GPT和o1兩個(gè)系列的模型,因?yàn)樗鼈兏髯陨瞄L(zhǎng)解決不同的問(wèn)題。

這就像OpenAI官方一直提到的“范式轉(zhuǎn)變”,GPT系列側(cè)重于預(yù)測(cè)性回答,模式為“提問(wèn)-回答”,而o1系列在回答前加入了更多思考。

Victoria Chernova也提到,很多客戶實(shí)際上在同時(shí)使用GPT和o1兩個(gè)系列的模型,包括OpenAI內(nèi)部也是如此。

接下來(lái),解決方案工程團(tuán)隊(duì)的Joe Casson分享了o1模型的幾個(gè)最新應(yīng)用:戰(zhàn)略制定、代碼編寫(xiě),研究分析。

在第一個(gè)案例中,他演示了如何用o1-preview分析巴黎或其他歐洲城市,以決定下一個(gè)市場(chǎng)開(kāi)拓地。

過(guò)程中需要模型考慮市場(chǎng)潛力、市場(chǎng)進(jìn)入策略、人才招聘等多個(gè)方面,最終生成了一份包含執(zhí)行摘要和電子郵件的報(bào)告。

然后他分享了如何用o1-mini從零創(chuàng)建一個(gè)帶有Node.js后端和React前端的Web應(yīng)用程序。

他還提到,o1-mini可以幫助開(kāi)發(fā)者連接到Azure數(shù)據(jù)庫(kù)等外部服務(wù)。

最后,他展示了如何用o1-preview幫助制定一份狗狗的最佳飲食計(jì)劃等。

在展示分享中,他們也提到了人們目前對(duì)o1模型的一些“吐槽”:比如o1-preview非多模態(tài),上下文窗口長(zhǎng)度也比GPT-4o更短……

對(duì)此,OpenAI計(jì)劃在未來(lái)幾個(gè)月內(nèi)為o1系列模型添加更多功能,包括網(wǎng)頁(yè)瀏覽、文件和圖像上傳等,并支持ChatGPT自動(dòng)選擇合適的模型。

OpenAI首席產(chǎn)品官談o1模型

除了上述研討會(huì),最近還有一場(chǎng)對(duì)OpenAI首席產(chǎn)品官Kevin Weil的采訪。

其中談到,目前o1推理模型僅處于GPT-2級(jí)別,因此它將很快改進(jìn)。

另外他還分享了在OpenAI與其他公司構(gòu)建產(chǎn)品的不同之處。

最大區(qū)別在于,技術(shù)基礎(chǔ)是不固定的。

以前在我工作過(guò)的幾乎所有地方,在擁有固定的技術(shù)基礎(chǔ)之前,都在試圖弄清楚如何利用它來(lái)構(gòu)建最好的產(chǎn)品。

而回到一開(kāi)始的問(wèn)題,為什么在PhD級(jí)別的科學(xué)任務(wù)上,滿血版o1竟打不過(guò)o1-preview?

也許在于哪怕是細(xì)微差距,兩者的構(gòu)建方式也是如此不同。

至于這0.3的差距到底有多大,也許即將公布的測(cè)試結(jié)果將為我們進(jìn)一步揭曉。

參考鏈接:[1]https://openai.com/business/solving-complex-problems-with-openai-o1-models/。
[2]https://x.com/rohanpaul_ai/status/1847682643166650761。

責(zé)任編輯:姜華 來(lái)源: 量子位
相關(guān)推薦

2024-11-04 09:00:00

2025-01-21 09:00:00

2024-12-06 11:44:48

Pro模式AI人工智能

2021-12-20 07:03:54

秒殺系統(tǒng)擴(kuò)容

2024-10-05 15:30:00

LLM模型推理

2019-01-17 05:14:07

深度學(xué)習(xí)人工智能AI

2023-03-09 13:56:00

商業(yè)分析模型Revnue

2024-11-25 15:50:00

模型訓(xùn)練

2015-08-27 09:16:53

2024-09-24 11:01:03

2024-05-08 13:41:31

OpenAIA/B測(cè)試

2018-08-22 10:32:00

大數(shù)據(jù)

2021-11-01 07:11:03

程序員職場(chǎng)公司

2024-09-19 17:44:04

2024-11-07 15:40:00

2024-12-30 11:00:00

OpenAI模型論文

2024-12-06 08:23:40

2025-03-07 08:30:00

2025-01-21 13:15:15

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)