自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<ruby id="z8hef"></ruby>

<sub id="z8hef"></sub>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考華為認證廠商認證 IT技術(shù)PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺

51CTO學堂

IT職業(yè)在線教育平臺

AI新思考：“浴火重生”的草莓模型原創(chuàng)

發(fā)布于 2024-9-13 11:33

瀏覽

0收藏

“這個模型肯定比我更擅長解決 AP 數(shù)學考試，而且我在大學時輔修數(shù)學，”O(jiān)penAI 的首席研究官鮑勃·麥格魯（Bob McGrew）告訴我。他說，OpenAI 還根據(jù)國際數(shù)學奧林匹克競賽的資格考試對 o1 進行了測試，雖然 GPT-4o 只正確解決了 13% 的問題，但 o1 的得分為 83%。

OpenAI發(fā)布名為o1新模型，這是全新“推理”模型系列中的第一個，這些模型經(jīng)過訓練可以比人類更快地回答更復雜的問題。它與o1-mini一起發(fā)布，o1-mini是一個更小而且較為便宜的版本。這實際上就是之前炒作的神秘版本“草莓模型”。

o1與以前的模型相比，它在編寫代碼和解決多步驟問題方面做得更加的出色。但它也比GPT-4o的帶來更多的費用。o1目前處于預覽版本的狀態(tài)。

今天開始，ChatGPT Plus和團隊用戶可以訪問o1-preview和o1-mini，企業(yè)用戶和研究類別的用戶將在下周初獲得訪問權(quán)限。OpenAI 表示它計劃為 ChatGPT 的所有免費用戶提供o1-mini 訪問權(quán)限，但尚未確定發(fā)布日期。

商業(yè)使用的收費還是非常昂貴，使用傳統(tǒng)的API調(diào)用，o1-preview每100萬個輸入Token收費15美元，每100 個輸出令牌收費60美元。相比之下，GPT-4o的成本為每100萬個輸入Token收費5美元，每 100萬個輸出Token收費15美元。

1.背后的意義

o1在針對問題做出響應(yīng)之前花更多時間思考問題，就像一個人一樣。通過培訓，他們學會完善自己的思維過程，嘗試不同的策略，并認識自身錯誤。在披露的測試中，它在數(shù)學和編碼方面表現(xiàn)出色。在國際數(shù)學奧林匹克競賽（IMO）的資格考試中，GPT-4o僅正確解決了13%的問題，而推理模型得分為83%。它的編碼能力在比賽中得到了評估，并在Codeforces 比賽中達到了第89個百分位。

AI新思考：“浴火重生”的草莓模型-AI.x社區(qū)

作為早期模型，它還不具備使 ChatGPT有用的許多功能，例如瀏覽網(wǎng)頁以獲取信息以及上傳文件和圖像。對于許多常見情況，GPT-4o在短期內(nèi)會更有能力。然而在復雜的推理領(lǐng)域，這是一個重大進步，代表了AI能力的新突破。因此OpenAI將計數(shù)器重置回1并將此系列命名為OpenAI o1。

2.適用場景

o1比較適合科學、編碼、數(shù)學和類似領(lǐng)域的復雜問題，這些增強的推理功能可能特別有用。例如，醫(yī)療保健研究人員可以使用它來注釋細胞測序數(shù)據(jù)，物理學家可以使用它來生成量子光學所需的復雜數(shù)學公式，所有領(lǐng)域的開發(fā)人員都可以使用它來構(gòu)建和執(zhí)行多步驟工作流程。

除了考試和學術(shù)基準之外，OpenAI還評估人類對o1-preview與GPT-4o在更多廣泛領(lǐng)域中的對比。在這項評估中，人類對來自o1-preview和GPT-4o 的提示進行了匿名投票以便于選出他們更喜歡哪種模型。O1-Preview在數(shù)據(jù)分析、編碼和數(shù)學等推理密集型類別中比 GPT-4O更受歡迎。但是在某些自然語言任務(wù)中，o1-preview不是首選，這表明它并不適合所有用例。

AI新思考：“浴火重生”的草莓模型-AI.x社區(qū)

本文轉(zhuǎn)載自 ??魯班模錘??，作者：龐德公

?著作權(quán)歸作者所有，如需轉(zhuǎn)載，請注明出處，否則將追究法律責任

標簽

贊

收藏

回復

舉報

回復

相關(guān)推薦

無限重生圖片樣式，999次也沒問題！

Aceryt ? 2349瀏覽 ? 0回復
對 AI 產(chǎn)品定價模式的新思考：基于人數(shù) or 工作量？

Baihai_IDP ? 2378瀏覽 ? 0回復
【智匯金秋創(chuàng)造季】智匯成海，致敬開發(fā)者的“超級碼力”！

AI.x社區(qū)官方賬號 ? 33.0w瀏覽 ? 148回復
OpenAI 的秘密武器：草莓和獵戶座

丟翅膀的魚 ? 1743瀏覽 ? 0回復
Kaggle大模型競賽優(yōu)勝方案總結(jié)與思考

arnoldzhw ? 2960瀏覽 ? 0回復
再談大模型向量，由向量檢索引起的思考

AI探索時代 ? 1772瀏覽 ? 0回復
谷歌AI發(fā)布Gemini 2.0 Flash：比Gemini 1.5 Pro快2倍的新AI模型

Halo咯咯 ? 5622瀏覽 ? 0回復
AI 賦能深度思考：從六頂思考帽到智能體實踐

ermulong ? 2847瀏覽 ? 0回復
Kimi思考模型k1.5是怎么練成的？細節(jié)曝光

PaperAgent ? 2833瀏覽 ? 0回復
Gemini 2.0：針對代理時代的新AI模型

Halo咯咯 ? 2167瀏覽 ? 0回復
帶你一文讀懂爆火的 DeepSeek-R1 新模型技術(shù)，為何震動了全球 AI 圈

玄姐聊AGI ? 6527瀏覽 ? 1回復
讓模型像人一樣思考

zhcs333 ? 1659瀏覽 ? 0回復
代理AI是AI發(fā)展的新前沿

51CTO內(nèi)容精選 ? 1540瀏覽 ? 0回復
工具調(diào)用×大模型思考=超級智能體：ReAct 策略如何改變AI能力

九歌AI大模型 ? 1597瀏覽 ? 0回復
從大模型到智能體AI，邁向通用人工智能的新征程

十一月雨_55 ? 1357瀏覽 ? 0回復
AI浪潮下，對DeepSeek發(fā)展的哲學新思考

51CTO內(nèi)容精選 ? 1202瀏覽 ? 0回復
萬字長文深度剖析基于 MCP 實現(xiàn) AI 應(yīng)用架構(gòu)設(shè)計新范式的落地實踐

玄姐聊AGI ? 2597瀏覽 ? 0回復
AI犬種識別革命：像專家一樣思考的形態(tài)特征解碼器

51CTO內(nèi)容精選 ? 802瀏覽 ? 0回復
OpenAI 最強推理模型 o3 / o4-mini 震撼發(fā)布！AI 從此能“看圖思考”？

AI博物院 ? 626瀏覽 ? 0回復

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

學會LLM思維：語料質(zhì)量的自評估 8天前發(fā)布
扒一扒最近較火的MCP 2025-04-10 06:28:30發(fā)布

熱門推薦

大半精銳盡出！o1下線！滿血o3之后，模型本身就是Manus，最大賣點：替代人干真活！ 1回復

王炸！MCP 架構(gòu)設(shè)計深度剖析 & 使用 Spring AI + MCP 四步教你實現(xiàn) Agent 智能體開發(fā) 0回復

Dify從入門到高階系列二：手把手教學！超詳細的Dify知識庫配置全攻略 0回復

Crawl4AI：GitHub榜首40K星標！LLM專屬極速開源爬蟲神器 0回復

只需5分鐘，教你用Python搭建MCP Server 0回復

上一篇：優(yōu)雅談大模型：LangChain Vs. LlamaIndex

下一篇： WordLlama：在消費級GPU上奔跑的“瘦子”

社區(qū)精華內(nèi)容

目錄

<sub id="kgnru"><p id="kgnru"></p></sub>