自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<samp id="ojndo"><option id="ojndo"><dfn id="ojndo"></dfn></option></samp>

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫

賬號(hào)設(shè)置退出

OpenAI揭示o3的推理過程，以彌合與DeepSeek-R1的差距

作者：李睿 2025-02-18 08:15:03

OpenAI公司推出o3-mini推理模型，展示了更詳細(xì)的思維鏈軌跡，并希望以更透明的方式彌合與顯示其全部思維鏈的DeepSeek-R1的競(jìng)爭(zhēng)差距。

譯者 | 李睿

審校 | 重樓

生成式人工智能開發(fā)商OpenAI公司首席執(zhí)行官Sam Altman最近在Reddit AMA問答活動(dòng)中承認(rèn)，該公司在開源軟件研究方面站在了“歷史錯(cuò)誤的一邊”。

盡管OpenAI公司尚未發(fā)布其開源模型，但已經(jīng)邁出了提高透明度的第一步。正如該公司在其X帳號(hào)上所宣布的那樣，其最新的推理模型o3-mini現(xiàn)在展示了其思維鏈（CoT）跟蹤的更詳細(xì)版本。

此前，OpenAI公司的推理模型僅展示了CoT的高級(jí)概述，這使得開發(fā)人員難以理解模型的推理邏輯并對(duì)提示進(jìn)行相應(yīng)的調(diào)整。

OpenAI公司隱藏了CoT以防止競(jìng)爭(zhēng)對(duì)手利用這一技術(shù)來訓(xùn)練他們自己的模型。但是，在展示所有CoT令牌的DeepSeek-R1模型發(fā)布之后，OpenAI在保持其競(jìng)爭(zhēng)優(yōu)勢(shì)方面面臨著嚴(yán)峻挑戰(zhàn)。

OpenAI公司最近進(jìn)行的更改展示了CoT的更詳細(xì)版本，但并沒有揭示原始的推理令牌，這讓OpenAI公司在增強(qiáng)透明度和保護(hù)其核心競(jìng)爭(zhēng)力（如果有的話）之間取得了巧妙的平衡。

以下是展示思維鏈非常重要的原因。在本文作者之前的對(duì)比實(shí)驗(yàn)中，發(fā)現(xiàn)OpenAI公司的o1模型在處理來自網(wǎng)絡(luò)的噪聲數(shù)據(jù)時(shí)略優(yōu)于DeepSeek-R1。然而，由于o1沒有揭示其思維鏈，因此很難對(duì)其錯(cuò)誤進(jìn)行故障排除（而且當(dāng)這兩個(gè)模型不是解決簡(jiǎn)單問題時(shí)，它們都會(huì)出現(xiàn)錯(cuò)誤）。另一方面，DeepSeek-R1的透明度使其成為現(xiàn)實(shí)應(yīng)用中更好的整體模型。

例如，在一個(gè)失敗的實(shí)驗(yàn)中，DeepSeek-R1的CoT幫助開發(fā)人員發(fā)現(xiàn)問題不在于模型本身，而在于獲取數(shù)據(jù)的檢索組件（這種問題在實(shí)際應(yīng)用中經(jīng)常發(fā)生）。另一方面，o1只給出了一個(gè)錯(cuò)誤的答案和一個(gè)模糊的推理鏈。

本文作者對(duì)o3-mini進(jìn)行了一項(xiàng)測(cè)試，他向這一模型提供了包含2024年至2025年歷史股票價(jià)格數(shù)據(jù)的文件，并向它提出了需要推理和數(shù)據(jù)分析的問題（由于ChatGPT o3-mini不支持文件附件上傳，因此只能將內(nèi)容粘貼到提示中）。這項(xiàng)測(cè)試旨在計(jì)算每月在Magnificent 7股票上投資140美元的投資組合的價(jià)值。該文件包含從雅虎財(cái)經(jīng)獲取的繁雜數(shù)據(jù)。這些數(shù)據(jù)包含純文本和HTML元素，其中涵蓋了“Mag 7”股票和非“Mag 7”股票。

測(cè)試結(jié)果表明，這種新提供的詳盡的CoT極具價(jià)值。它可以跟蹤模型推理過程，其中包括哪些股票是“Mag 7”股票，哪些股票在文件中，哪些應(yīng)該被忽略，以及如何在這些股票之間合理分配投資，以及如何在每個(gè)月初準(zhǔn)確地獲取每個(gè)股票的價(jià)值數(shù)據(jù)等。該模型提供了詳細(xì)的答案，不僅詳細(xì)闡述了整個(gè)推理過程，還明確指出了投資組合的最終價(jià)值。

DeepSeek-R1在開放性、價(jià)格和透明度方面具有OpenAI公司的推理模型無法比擬的三大優(yōu)勢(shì)。OpenAI通過發(fā)布o(jì)3-mini在一定程度上縮小了差距。

o3-mini的成本極具競(jìng)爭(zhēng)力，輸出每百萬令牌僅需4.40美元，遠(yuǎn)低于o1的60美元，與此同時(shí)，它在多個(gè)推理基準(zhǔn)測(cè)試中的表現(xiàn)還優(yōu)于o1。相比之下，DeepSeek-R1在美國(guó)供應(yīng)商的運(yùn)行成本約為每百萬令牌7至8美元。（值得注意的是，雖然DeepSeek在其服務(wù)器上運(yùn)行的R1服務(wù)以每百萬令牌2.19美元的優(yōu)惠價(jià)格提供，但許多組織因地域限制而無法使用。）

更改之后的CoT輸出也將幫助OpenAI公司在透明度方面取得顯著進(jìn)展。但隨著越來越多的云計(jì)算服務(wù)提供商將其集成到他們的產(chǎn)品中，模型構(gòu)建者也在此基礎(chǔ)上創(chuàng)建衍生品，DeepSeek-R1正迅速成為推理模型的標(biāo)準(zhǔn)。然而，OpenAI公司是否會(huì)改變其保持模型封閉的政策仍有待觀察。

原文標(biāo)題：OpenAI reveals o3’s reasoning process to bridge gap with DeepSeek-R1，作者：Ben Dickson

責(zé)任編輯：姜華來源： 51CTO內(nèi)容精選

o3-mini OpenAI DeepSeek

點(diǎn)贊

51CTO技術(shù)棧公眾號(hào)

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營(yíng)

<u id="z737x"><samp id="z737x"></samp></u>

<thead id="z737x"></thead>

<ruby id="z737x"><label id="z737x"><i id="z737x"></i></label></ruby>