自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

OpenAI o3-mini 干翻了 DeepSeek R1?

發(fā)布于 2025-2-3 22:13
瀏覽
0收藏

整個過年期間,AI 圈的頭條都被被 DeepSeek 霸占了。2 月 1 日,OpenAI 終于按捺不住,推出了全新的推理模型系列 o3-mini。這個系列不僅首次對免費用戶開放了推理模型,還將成本降低了多達 15 倍(相比之前的 o1 系列)。

OpenAI 還表示,這是其推理模型系列中最新且最具成本效益的模型:

OpenAI o3-mini 干翻了 DeepSeek R1?-AI.x社區(qū)

最近,AI 社區(qū)非常熱衷于將 DeepSeek R1 與其他推理模型進行對比。

尤其是經(jīng)典的編程挑戰(zhàn)——模擬彈跳球:“Write a Python script that makes a ball bounce within a certain shape. Let the shape rotate slowly and ensure the ball stays within the shape.”(編寫一個Python腳本,使一個球在某個形狀內(nèi)彈跳。讓這個形狀緩慢旋轉(zhuǎn),并確保球保持在形狀內(nèi)。)

這個,相當于一個碰撞檢測算法,需要模型識別何時兩個物體(例如球和形狀的邊緣)發(fā)生碰撞。寫得不好的算法可能會導(dǎo)致明顯的物理錯誤。

隨著 DeepSeek R1 在國外持續(xù)發(fā)酵,微軟、NVIDIA、亞馬遜等美國云計算平臺紛紛爭相采用 R1,而 R1 在這一任務(wù)上也壓倒了 OpenAI 的 o1-pro。

從 Claude 3.5 Sonnet 和谷歌 Gemini 1.5 Pro 生成的結(jié)果來看,DeepSeek 旗下的開源模型確實在性能上領(lǐng)先了一個層次以上。

OpenAI o3-mini 干翻了 DeepSeek R1?-AI.x社區(qū)

然而,隨著 o3-mini 的發(fā)布,輿論似乎一夜之間發(fā)生了變化,因為一篇文章宣稱 OpenAI 的 o3-mini 已經(jīng)超越了 DeepSeek R1。目前,這篇文章已吸引了近 400 萬網(wǎng)友的關(guān)注。

OpenAI o3-mini 干翻了 DeepSeek R1?-AI.x社區(qū)

開發(fā)者使用的提示是:“write a Python program that shows a ball bouncing inside a spinning hexagon. The ball should be affected by gravity and friction, and it must bounce off the rotating walls realistically.”(編寫一個Python程序,展示一個球在旋轉(zhuǎn)的六邊形內(nèi)彈跳。球應(yīng)受重力和摩擦力的影響,并且必須真實地從旋轉(zhuǎn)的墻壁反彈。)

這意味著 o3-mini 和 DeepSeek R1 都被要求編寫一個 Python 程序,使得球在旋轉(zhuǎn)的六邊形內(nèi)彈跳,且小球在彈跳過程中需要受到重力和摩擦力的影響。最終的結(jié)果如下:

OpenAI o3-mini 干翻了 DeepSeek R1?-AI.x社區(qū)

在結(jié)果方面,o3-mini 展現(xiàn)了更好的碰撞和彈跳效果。從重力和摩擦力的理解上看,DeepSeek R1 版本中的小球似乎與牛頓定律相悖,完全忽略了重力。

這并非個別情況。hyperbolic_labs 的聯(lián)合創(chuàng)始人金宇晨(Yuchen Jin)曾經(jīng)指出過這個問題。他將提示“write a python script of a ball bouncing inside a tesseract”(編寫一個Python腳本,模擬一個球在四維超立方體內(nèi)部彈跳)輸入到 DeepSeek R1 和o3-mini 中。

四維超立方體的每個頂點相鄰四條邊,每條邊連接兩個立方體。四維空間中的幾何形狀超出了人類的直觀感知,因此當我們聽到這些描述時,可能很難想象四維超立方體的樣子。

o3-mini 不僅展示了一個穩(wěn)定的幾何結(jié)構(gòu),而且小球在四維空間內(nèi)彈跳的軌跡也非常靈活,給人一種撞擊立方體側(cè)面的沖擊感。

OpenAI o3-mini 干翻了 DeepSeek R1?-AI.x社區(qū)

根據(jù)金宇晨的說法,他嘗試了多次,每次使用 DeepSeek R1 的結(jié)果都不如 o3-mini 的一次嘗試。例如,這次嘗試的結(jié)果只是留下了一個靜止的小球。

OpenAI o3-mini 干翻了 DeepSeek R1?-AI.x社區(qū)

在 Pass@1 測試中,這次 DeepSeek R1 展示了小球和幾何框架,甚至小球的顏色也發(fā)生了變化。不幸的是,它將四維超立方體簡化為三維空間坐標。

? OpenAI o3-mini 干翻了 DeepSeek R1?-AI.x社區(qū) 圖片 ?

本文轉(zhuǎn)載自 ??PyTorch研習(xí)社??,作者: 南七無名式

收藏
回復(fù)
舉報
回復(fù)
相關(guān)推薦