游戲結(jié)束了?OpenAI可能已經(jīng)突破,跨過起飛的最后臨界閾值
剛剛,X 上的一則帖子爆火,瀏覽量達到 30 多萬。
該推文涉及引領 AI 潮流的 OpenAI。內(nèi)容顯示「OpenAI 遞歸式自我改進目前在一個盒子里,準確的說是在一個無法破解的盒子!」
我們不難看出,帖子內(nèi)容突出了 OpenAI 的發(fā)展態(tài)勢,AI可以自我改進,并且很難有人短期內(nèi)破解。還有一則帖子表示:
「OpenAI 可能已經(jīng)獲得了突破,并最終跨越了臨界點,達到一個起飛狀態(tài) —— 即智能達到了可以自我遞歸改進的程度,o4 或 o5 將能夠自動化 AI 研發(fā)并完成其余工作。
像 o1 這樣的模型的大部分意義不在于部署它,而在于為下一個模型生成訓練數(shù)據(jù)。o1 解決的每一個問題現(xiàn)在都是 o3 的訓練數(shù)據(jù)點。
實際上我們有點驚訝于 OpenAI 竟然費心的部署了 o1-pro,而不是將其保持私密并投資計算資源進行更多的 o3 訓練等。這顯然與 Anthropic 和 Claude-3.6-opus 的開發(fā)不同,這個模型沒有研發(fā)失敗,只是 Anthropic 選擇將其保持私密,并將其蒸餾成一個小而便宜但很智能的 Claude-3.6-sonnet。
如果你想知道為什么 OpenAI 的人突然在 X 上變得幾乎是狂喜地樂觀,認真觀察從原始 4o 模型到 o3 的改進可能就是原因。
這就像觀看 AlphaGo 的 Elo 曲線:它只是不斷 up……up……up……
這給我們一種感覺,他們已經(jīng)獲得突破,終于跨越了臨界點,即從僅僅是尖端 AI 工作(其他機構(gòu)將在幾年內(nèi)才能復制),到起飛(破解智能),以至于 o4 或 o5 將能夠自動化 AI 研發(fā)并完成其余工作?!?/span>
在這條推文下,大家的討論格外熱烈。
有人表示「如果這是真的,如果模型不需要人類進行訓練,那么《黑客帝國》的結(jié)果就不再有效了?!?/span>
「我一直是這么想的,OpenAI 沒有向公眾發(fā)布他們最新的優(yōu)秀模型,他們總是在內(nèi)部領先 1 或 2 代,因為這為他們提供了開發(fā)優(yōu)勢?!?/span>
「也許最可怕的不是上述觀點是否正確,而是我們無法判斷他是否錯誤?!?/span>
就連 OpenAI 研究員 Jason Wei 也跑到評論區(qū)發(fā)言:魔法,就是當一個不可阻擋的強化學習(RL)優(yōu)化算法,在充足的計算資源驅(qū)動下,遇到一個無法被攻破的強化學習環(huán)境時,奇跡就發(fā)生了。
Andrej Karpathy 也發(fā)表了自己的觀點:魔法就是當優(yōu)化技巧破解了那個環(huán)境時,就會出現(xiàn)。