自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問(wèn)答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

AI.x社區(qū)

登錄/注冊(cè)
51CTO

中國(guó)優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺(tái)

51CTO學(xué)堂

IT職業(yè)在線教育平臺(tái)

OpenAI揭示o3的推理過(guò)程，以彌合與DeepSeek-R1的差距原創(chuàng)

51CTO內(nèi)容精選

發(fā)布于 2025-2-18 08:12

瀏覽

0收藏

OpenAI公司推出o3-mini推理模型，展示了更詳細(xì)的思維鏈軌跡，并希望以更透明的方式彌合與顯示其全部思維鏈的DeepSeek-R1的競(jìng)爭(zhēng)差距。

生成式人工智能開發(fā)商OpenAI公司首席執(zhí)行官Sam Altman最近在?Reddit AMA??問(wèn)答活動(dòng)中承認(rèn)，該公司在開源軟件研究方面站在了“歷史錯(cuò)誤的一邊”。

OpenAI揭示o3的推理過(guò)程，以彌合與DeepSeek-R1的差距-AI.x社區(qū)

盡管OpenAI公司尚未發(fā)布其開源模型，但已經(jīng)邁出了提高透明度的第一步。正如該公司在其?X帳號(hào)??上所宣布的那樣，其最新的推理模型o3-mini現(xiàn)在展示了其思維鏈（CoT）跟蹤的更詳細(xì)版本。

OpenAI揭示o3的推理過(guò)程，以彌合與DeepSeek-R1的差距-AI.x社區(qū)

此前，OpenAI公司的推理模型僅展示了CoT的高級(jí)概述，這使得開發(fā)人員難以理解模型的推理邏輯并對(duì)提示進(jìn)行相應(yīng)的調(diào)整。

OpenAI公司隱藏了CoT以防止競(jìng)爭(zhēng)對(duì)手利用這一技術(shù)來(lái)訓(xùn)練他們自己的模型。但是，在展示所有CoT令牌的DeepSeek-R1模型發(fā)布之后，OpenAI在保持其競(jìng)爭(zhēng)優(yōu)勢(shì)方面面臨著嚴(yán)峻挑戰(zhàn)。

OpenAI公司最近進(jìn)行的更改展示了CoT的更詳細(xì)版本，但并沒(méi)有揭示原始的推理令牌，這讓OpenAI公司在增強(qiáng)透明度和保護(hù)其核心競(jìng)爭(zhēng)力（如果有的話）之間取得了巧妙的平衡。

OpenAI揭示o3的推理過(guò)程，以彌合與DeepSeek-R1的差距-AI.x社區(qū)

以下是展示思維鏈非常重要的原因。在本文作者之前的?對(duì)比實(shí)驗(yàn)??中，發(fā)現(xiàn)OpenAI公司的o1模型在處理來(lái)自網(wǎng)絡(luò)的噪聲數(shù)據(jù)時(shí)略優(yōu)于DeepSeek-R1。然而，由于o1沒(méi)有揭示其思維鏈，因此很難對(duì)其錯(cuò)誤進(jìn)行故障排除（而且當(dāng)這兩個(gè)模型不是解決簡(jiǎn)單問(wèn)題時(shí)，它們都會(huì)出現(xiàn)錯(cuò)誤）。另一方面，DeepSeek-R1的透明度使其成為現(xiàn)實(shí)應(yīng)用中更好的整體模型。

例如，在一個(gè)失敗的實(shí)驗(yàn)中，DeepSeek-R1的CoT幫助開發(fā)人員發(fā)現(xiàn)問(wèn)題不在于模型本身，而在于獲取數(shù)據(jù)的檢索組件（這種問(wèn)題在實(shí)際應(yīng)用中經(jīng)常發(fā)生）。另一方面，o1只給出了一個(gè)錯(cuò)誤的答案和一個(gè)模糊的推理鏈。

OpenAI揭示o3的推理過(guò)程，以彌合與DeepSeek-R1的差距-AI.x社區(qū)

本文作者對(duì)o3-mini進(jìn)行了一項(xiàng)測(cè)試，他向這一模型提供了包含2024年至2025年歷史股票價(jià)格數(shù)據(jù)的文件，并向它提出了需要推理和數(shù)據(jù)分析的問(wèn)題（由于ChatGPT o3-mini不支持文件附件上傳，因此只能將內(nèi)容粘貼到提示中）。這項(xiàng)測(cè)試旨在計(jì)算每月在Magnificent 7股票上投資140美元的投資組合的價(jià)值。該文件包含從雅虎財(cái)經(jīng)獲取的繁雜數(shù)據(jù)。這些數(shù)據(jù)包含純文本和HTML元素，其中涵蓋了“Mag 7”股票和非“Mag 7”股票。

測(cè)試結(jié)果表明，這種新提供的詳盡的CoT極具價(jià)值。它可以跟蹤模型推理過(guò)程，其中包括哪些股票是“Mag 7”股票，哪些股票在文件中，哪些應(yīng)該被忽略，以及如何在這些股票之間合理分配投資，以及如何在每個(gè)月初準(zhǔn)確地獲取每個(gè)股票的價(jià)值數(shù)據(jù)等。該模型提供了詳細(xì)的答案，不僅詳細(xì)闡述了整個(gè)推理過(guò)程，還明確指出了投資組合的最終價(jià)值。

OpenAI揭示o3的推理過(guò)程，以彌合與DeepSeek-R1的差距-AI.x社區(qū)

DeepSeek-R1在開放性、價(jià)格和透明度方面具有OpenAI公司的推理模型無(wú)法比擬的三大優(yōu)勢(shì)。OpenAI通過(guò)發(fā)布o(jì)3-mini在一定程度上縮小了差距。

o3-mini的成本極具競(jìng)爭(zhēng)力，輸出每百萬(wàn)令牌僅需4.40美元，遠(yuǎn)低于o1的60美元，與此同時(shí)，它在多個(gè)推理基準(zhǔn)測(cè)試中的表現(xiàn)還優(yōu)于o1。相比之下，DeepSeek-R1在美國(guó)供應(yīng)商的運(yùn)行成本約為每百萬(wàn)令牌7至8美元。（值得注意的是，雖然DeepSeek在其服務(wù)器上運(yùn)行的R1服務(wù)以每百萬(wàn)令牌2.19美元的優(yōu)惠價(jià)格提供，但許多組織因地域限制而無(wú)法使用。）

更改之后的CoT輸出也將幫助OpenAI公司在透明度方面取得顯著進(jìn)展。但隨著越來(lái)越多的云計(jì)算服務(wù)提供商將其集成到他們的產(chǎn)品中，模型構(gòu)建者也在此基礎(chǔ)上創(chuàng)建衍生品，DeepSeek-R1正迅速成為推理模型的標(biāo)準(zhǔn)。然而，OpenAI公司是否會(huì)改變其保持模型封閉的政策仍有待觀察。

原文標(biāo)題：??OpenAI reveals o3’s reasoning process to bridge gap with DeepSeek-R1??，作者：Ben Dickson

?著作權(quán)歸作者所有，如需轉(zhuǎn)載，請(qǐng)注明出處，否則將追究法律責(zé)任

標(biāo)簽

贊

收藏

回復(fù)

舉報(bào)

社區(qū)頭條

回復(fù)

相關(guān)推薦

語(yǔ)言模型的神秘面紗：小學(xué)數(shù)學(xué)與隱含推理過(guò)程

sbf_2000 ? 1917瀏覽 ? 0回復(fù)
解密o1推理過(guò)程！DeepSeek-R1-Lite預(yù)覽版上線

kede96 ? 2727瀏覽 ? 0回復(fù)
大推理模型DeepSeek-R1深度解讀：成本降低95%，推動(dòng)語(yǔ)言模型推理效率新高度

風(fēng)云2002_1 ? 1.1w瀏覽 ? 0回復(fù)
DeepSeek-AI 發(fā)布 DeepSeek-R1-Zero 和 DeepSeek-R1

Halo咯咯 ? 3388瀏覽 ? 0回復(fù)
OpenAI o3-mini 干翻了 DeepSeek R1？

PyTorch研習(xí)社 ? 1764瀏覽 ? 0回復(fù)
DeepSeek-R1：通過(guò)強(qiáng)化學(xué)習(xí)激發(fā)大語(yǔ)言模型的推理潛能

柏企閱文 ? 3880瀏覽 ? 0回復(fù)
DeepSeek R1 Vs OpenAI o1！全球頂級(jí)推理模型訓(xùn)練技術(shù)對(duì)比大解密！

51CTO技術(shù)棧 ? 4688瀏覽 ? 0回復(fù)
圖文詳解：帶你讀懂 DeepSeek-R1 的核心原理

Baihai_IDP ? 4382瀏覽 ? 0回復(fù)
帶你一文讀懂爆火的 DeepSeek-R1 新模型技術(shù)，為何震動(dòng)了全球 AI 圈

玄姐聊AGI ? 6525瀏覽 ? 1回復(fù)
如何利用 DeepSeek-R1 本地部署強(qiáng)大的推理模型：從 ChatGPT 風(fēng)格界面到 API 集成

Halo咯咯 ? 2753瀏覽 ? 0回復(fù)
DeepSeek-R1、o3-mini能解奧數(shù)題卻算不了多位數(shù)乘法？

輕薄滴假象 ? 1777瀏覽 ? 0回復(fù)
大模型對(duì)決：DeepSeek R1與o3-mini

丟翅膀的魚 ? 1911瀏覽 ? 0回復(fù)
AI領(lǐng)域的“新王”誕生! 馬斯克發(fā)布Grok 3，趕超OpenAI o1和Deepseek R1！

AI博物院 ? 1521瀏覽 ? 0回復(fù)
Grok 3 與 DeepSeek-R1 是怎么學(xué)會(huì)思考的？

機(jī)器學(xué)習(xí)與數(shù)學(xué) ? 2865瀏覽 ? 0回復(fù)
沖，DeepSeek-R1/V3推理系統(tǒng)架構(gòu)設(shè)計(jì)被開源了！

PaperAgent ? 1709瀏覽 ? 0回復(fù)
Vision-R1：多模態(tài)領(lǐng)域的DeepSeek R1-Zero，7B參數(shù)比肩OpenAI O1

Syrupup ? 1699瀏覽 ? 0回復(fù)
Deepseek-R1，論文番外篇!

NLP前沿1 ? 920瀏覽 ? 0回復(fù)
最先進(jìn)推理模型！ OpenAI 推出o3 和 o4-mini模型

51CTO內(nèi)容精選 ? 556瀏覽 ? 0回復(fù)
DianJin-R1：金融領(lǐng)域推理增強(qiáng)大模型，全面超越DeepSeek-R1

靈度智能 ? 277瀏覽 ? 0回復(fù)

51CTO內(nèi)容精選

這個(gè)用戶很懶，還沒(méi)有個(gè)人簡(jiǎn)介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

OpenUI：從構(gòu)思到UI僅需數(shù)秒 8h前發(fā)布
MCP安全噩夢(mèng)終結(jié)者：Agent框架如何重構(gòu)AI防護(hù)新范式？? 1天前發(fā)布

熱門推薦

模型上下文協(xié)議（MCP）開發(fā)實(shí)戰(zhàn)——構(gòu)建LangChain代理客戶端 0回復(fù)

大半精銳盡出！o1下線！滿血o3之后，模型本身就是Manus，最大賣點(diǎn)：替代人干真活！ 1回復(fù)

王炸！MCP 架構(gòu)設(shè)計(jì)深度剖析 & 使用 Spring AI + MCP 四步教你實(shí)現(xiàn) Agent 智能體開發(fā) 0回復(fù)

Dify從入門到高階系列二：手把手教學(xué)！超詳細(xì)的Dify知識(shí)庫(kù)配置全攻略 0回復(fù)

Crawl4AI：GitHub榜首40K星標(biāo)！LLM專屬極速開源爬蟲神器 0回復(fù)

上一篇：大模型前綴緩存技術(shù)，有望將服務(wù)成本降低90%

下一篇：一文說(shuō)清楚分布式思維狀態(tài)：由事件驅(qū)動(dòng)的多智能體系統(tǒng)

社區(qū)精華內(nèi)容

目錄

<sub id="u9uny"></sub>