自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<blockquote id="0u9ku"><dfn id="0u9ku"></dfn></blockquote>

^{<blockquote id="0u9ku"></blockquote>}

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認證廠商認證 IT技術(shù)PMP項目管理免費題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺

51CTO學(xué)堂

IT職業(yè)在線教育平臺

OpenAI o3-mini 干翻了 DeepSeek R1？

PyTorch研習(xí)社

發(fā)布于 2025-2-3 22:13

瀏覽

0收藏

整個過年期間，AI 圈的頭條都被被 DeepSeek 霸占了。2 月 1 日，OpenAI 終于按捺不住，推出了全新的推理模型系列 o3-mini。這個系列不僅首次對免費用戶開放了推理模型，還將成本降低了多達 15 倍（相比之前的 o1 系列）。

OpenAI 還表示，這是其推理模型系列中最新且最具成本效益的模型：

OpenAI o3-mini 干翻了 DeepSeek R1？-AI.x社區(qū)

最近，AI 社區(qū)非常熱衷于將 DeepSeek R1 與其他推理模型進行對比。

尤其是經(jīng)典的編程挑戰(zhàn)——模擬彈跳球：“Write a Python script that makes a ball bounce within a certain shape. Let the shape rotate slowly and ensure the ball stays within the shape.”（編寫一個Python腳本，使一個球在某個形狀內(nèi)彈跳。讓這個形狀緩慢旋轉(zhuǎn)，并確保球保持在形狀內(nèi)。）

這個，相當于一個碰撞檢測算法，需要模型識別何時兩個物體（例如球和形狀的邊緣）發(fā)生碰撞。寫得不好的算法可能會導(dǎo)致明顯的物理錯誤。

隨著 DeepSeek R1 在國外持續(xù)發(fā)酵，微軟、NVIDIA、亞馬遜等美國云計算平臺紛紛爭相采用 R1，而 R1 在這一任務(wù)上也壓倒了 OpenAI 的 o1-pro。

從 Claude 3.5 Sonnet 和谷歌 Gemini 1.5 Pro 生成的結(jié)果來看，DeepSeek 旗下的開源模型確實在性能上領(lǐng)先了一個層次以上。

OpenAI o3-mini 干翻了 DeepSeek R1？-AI.x社區(qū)

然而，隨著 o3-mini 的發(fā)布，輿論似乎一夜之間發(fā)生了變化，因為一篇文章宣稱 OpenAI 的 o3-mini 已經(jīng)超越了 DeepSeek R1。目前，這篇文章已吸引了近 400 萬網(wǎng)友的關(guān)注。

OpenAI o3-mini 干翻了 DeepSeek R1？-AI.x社區(qū)

開發(fā)者使用的提示是：“write a Python program that shows a ball bouncing inside a spinning hexagon. The ball should be affected by gravity and friction, and it must bounce off the rotating walls realistically.”（編寫一個Python程序，展示一個球在旋轉(zhuǎn)的六邊形內(nèi)彈跳。球應(yīng)受重力和摩擦力的影響，并且必須真實地從旋轉(zhuǎn)的墻壁反彈。）

這意味著 o3-mini 和 DeepSeek R1 都被要求編寫一個 Python 程序，使得球在旋轉(zhuǎn)的六邊形內(nèi)彈跳，且小球在彈跳過程中需要受到重力和摩擦力的影響。最終的結(jié)果如下：

OpenAI o3-mini 干翻了 DeepSeek R1？-AI.x社區(qū)

在結(jié)果方面，o3-mini 展現(xiàn)了更好的碰撞和彈跳效果。從重力和摩擦力的理解上看，DeepSeek R1 版本中的小球似乎與牛頓定律相悖，完全忽略了重力。

這并非個別情況。hyperbolic_labs 的聯(lián)合創(chuàng)始人金宇晨（Yuchen Jin）曾經(jīng)指出過這個問題。他將提示“write a python script of a ball bouncing inside a tesseract”（編寫一個Python腳本，模擬一個球在四維超立方體內(nèi)部彈跳）輸入到 DeepSeek R1 和o3-mini 中。

四維超立方體的每個頂點相鄰四條邊，每條邊連接兩個立方體。四維空間中的幾何形狀超出了人類的直觀感知，因此當我們聽到這些描述時，可能很難想象四維超立方體的樣子。

o3-mini 不僅展示了一個穩(wěn)定的幾何結(jié)構(gòu)，而且小球在四維空間內(nèi)彈跳的軌跡也非常靈活，給人一種撞擊立方體側(cè)面的沖擊感。

OpenAI o3-mini 干翻了 DeepSeek R1？-AI.x社區(qū)

根據(jù)金宇晨的說法，他嘗試了多次，每次使用 DeepSeek R1 的結(jié)果都不如 o3-mini 的一次嘗試。例如，這次嘗試的結(jié)果只是留下了一個靜止的小球。

OpenAI o3-mini 干翻了 DeepSeek R1？-AI.x社區(qū)

在 Pass@1 測試中，這次 DeepSeek R1 展示了小球和幾何框架，甚至小球的顏色也發(fā)生了變化。不幸的是，它將四維超立方體簡化為三維空間坐標。

? OpenAI o3-mini 干翻了 DeepSeek R1？-AI.x社區(qū) 圖片 ?

本文轉(zhuǎn)載自 ??PyTorch研習(xí)社??，作者：南七無名式

標簽

贊

收藏

回復(fù)

舉報

回復(fù)

相關(guān)推薦

o1的風(fēng)又吹到多模態(tài)，直接吹翻了GPT-4o-mini

PaperAgent ? 2062瀏覽 ? 0回復(fù)
DeepSeek R1橫空出世，超越OpenAI o1，教你用Ollama跑起來

小虎哦哦 ? 1.4w瀏覽 ? 0回復(fù)
基于 DeepSeek R1 和 Ollama 開發(fā) RAG 系統(tǒng)

玄姐聊AGI ? 3333瀏覽 ? 0回復(fù)
部署滿血DeepSeek R1的避坑指南-vLLM 0.7.1

NLP工作站 ? 6256瀏覽 ? 0回復(fù)
DeepSeek R1 Vs OpenAI o1！全球頂級推理模型訓(xùn)練技術(shù)對比大解密！

51CTO技術(shù)棧 ? 4688瀏覽 ? 0回復(fù)
DeepSeek-R1、o3-mini能解奧數(shù)題卻算不了多位數(shù)乘法？

輕薄滴假象 ? 1777瀏覽 ? 0回復(fù)
DeepSeek又開源R1部署最佳實踐！

探索AGI ? 1716瀏覽 ? 0回復(fù)
OpenAI揭示o3的推理過程，以彌合與DeepSeek-R1的差距

51CTO內(nèi)容精選 ? 1651瀏覽 ? 0回復(fù)
大模型對決：DeepSeek R1與o3-mini

丟翅膀的魚 ? 1911瀏覽 ? 0回復(fù)
OpenAI將開源 o3-mini，或適合手機大模型

Aceryt ? 1595瀏覽 ? 0回復(fù)
馬斯克發(fā)布Grok 3，趕超OpenAI o1和Deepseek R1！

AI博物院 ? 1521瀏覽 ? 0回復(fù)
DeepSeek R1 全系列模型部署指南

芝士AI吃魚 ? 6917瀏覽 ? 0回復(fù)
白嫖資源訓(xùn)練 DeepSeek R1 推理模型

AIGC前沿技術(shù)追蹤 ? 3162瀏覽 ? 0回復(fù)
白話DeepSeek R1的GRPO強化學(xué)習(xí)算法：原理、圖解、視頻

后向傳播 ? 2597瀏覽 ? 0回復(fù)
綜述：DeepSeek Infra/V1/MoE/V2/V3/R1 & 開源關(guān)鍵技術(shù)

amei2000go ? 3842瀏覽 ? 0回復(fù)
Vision-R1：多模態(tài)領(lǐng)域的DeepSeek R1-Zero，7B參數(shù)比肩OpenAI O1

Syrupup ? 1698瀏覽 ? 0回復(fù)
M3芯片+Ollama本地部署DeepSeek R1：小白也能玩轉(zhuǎn)AI推理

zhishan15 ? 1445瀏覽 ? 0回復(fù)
DeepSeek R1 & R2 技術(shù)原理

ceesoft ? 1906瀏覽 ? 0回復(fù)
OpenAI 推出o3 和 o4-mini模型

51CTO內(nèi)容精選 ? 556瀏覽 ? 0回復(fù)

PyTorch研習(xí)社

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

NodeRAG：以圖結(jié)構(gòu)革新檢索增強生成 3天前發(fā)布
從零到一構(gòu)建Agent系統(tǒng)：四大模塊 + 框架生態(tài)詳解 3天前發(fā)布

熱門推薦

從零到一構(gòu)建Agent系統(tǒng)：四大模塊 + 框架生態(tài)詳解 0回復(fù)

大半精銳盡出！o1下線！滿血o3之后，模型本身就是Manus，最大賣點：替代人干真活！ 1回復(fù)

王炸！MCP 架構(gòu)設(shè)計深度剖析 & 使用 Spring AI + MCP 四步教你實現(xiàn) Agent 智能體開發(fā) 0回復(fù)

Dify從入門到高階系列二：手把手教學(xué)！超詳細的Dify知識庫配置全攻略 0回復(fù)

Crawl4AI：GitHub榜首40K星標！LLM專屬極速開源爬蟲神器 0回復(fù)

上一篇： RAG從入門到精通系列：基礎(chǔ)RAG

下一篇： Unsloth：僅需7GB顯存就能訓(xùn)練自己的DeepSeek-R1！

社區(qū)精華內(nèi)容

目錄

<meter id="4cuo3"><cite id="4cuo3"><option id="4cuo3"></option></cite></meter>

<sub id="4cuo3"><p id="4cuo3"></p></sub>

<sub id="4cuo3"></sub>

<sub id="4cuo3"><input id="4cuo3"></input></sub>