突發(fā)!o3-mini思維鏈公開,卻被曝光全是「作假」,奧特曼現(xiàn)身解釋網(wǎng)友炸鍋
OpenAI,真的被DeepSeek逼急了!
活久見,就在剛剛,OpenAI把o3-mini的「思維鏈」公開了。
比如問「怎么今天不是星期五啊??」?
在展示出來的CoT中,o3-mini一步步思考,這個(gè)問題應(yīng)該是用戶在搞幽默,覺得本周應(yīng)該快結(jié)束了,結(jié)果還沒結(jié)束。因此,自己需要給一個(gè)聰明機(jī)智的回答。
然后它用Zeller公式計(jì)算后發(fā)現(xiàn),2025年2月6日的確是星期四,即使閏年的特殊情況也是如此。
最終,它回答說:今天的確是周四不是周五,日歷就是這么定的。然后提供了一番情緒價(jià)值,鼓勵(lì)用戶說:再忍忍,只差一天啦!
不過,機(jī)智的大神們很快就發(fā)現(xiàn)了「華點(diǎn)」——這是「真的CoT」嗎?
沒多久,就破案了!
先是OpenAI研究員Noam Brown發(fā)文表示,這次放出來的并不是模型原始的CoT。
隨后,Tibor Blaho也發(fā)現(xiàn)——所謂的CoT,無非就是個(gè)「總結(jié)器」而已。(手動(dòng)狗頭)
對(duì)此,奧特曼解釋道,我們正努力整理原始的CoT提升可讀性,并在必要時(shí)提供翻譯,盡量保持原始內(nèi)容的忠實(shí)度。
他放出了四個(gè)emoji,讓o3-mini在思維鏈中展示了一把推理過程
堅(jiān)決不讓競(jìng)爭(zhēng)對(duì)手看到CoT的具體過程,OpenAI的防備心實(shí)在是有些重啊。
OpenAI研究員:看到CoT實(shí)時(shí)演示,是「啊哈時(shí)刻」
OpenAI研究員Noam Brown表示,在o1-preview發(fā)布前,自己向他人介紹草莓時(shí),看到CoT的實(shí)時(shí)演示,通常是他們的「啊哈時(shí)刻」。
他們清楚地意識(shí)到,這將是一件大事。
對(duì)于全新的o3-mini CoT,Noam Brown放出了自己的獨(dú)家玩法:
你正在玩井字棋,使用 O。到目前為止,X 已經(jīng)在左上角和右下角落子,而你在中間位置落子。最優(yōu)的下一個(gè)動(dòng)作是什么?請(qǐng)只回答你的動(dòng)作,并畫出棋盤。
Noam Brown表示,o3-mini是目前第一個(gè)能持續(xù)正確回答井字棋問題的模型。
好笑的是,他承認(rèn)CoT其實(shí)有些不穩(wěn)定,但可以看到,它最終還是把這個(gè)問題給想明白了。
有人指出,OpenAI遮遮掩掩地放出這個(gè)高仿CoT,其實(shí)比什么都不放還要糟。
因?yàn)檎鎸?shí)的CoT可以充當(dāng)prompt的調(diào)試器,幫我們引導(dǎo)模型;而總結(jié)性的CoT會(huì)造成混淆,引入錯(cuò)誤,讓調(diào)試變得更加困難。
而DeepSeek R1最酷的一點(diǎn),就是暴露了模型的CoT如何影響提示的效果。
而且,總結(jié)版的CoT顯示得很慢。如果是原始的o3-mini,應(yīng)該在推理中有更快的生成速度。
有人也橫向?qū)Ρ攘薕penAI和DeepSeek的CoT,表示前者看起來實(shí)在太專業(yè)了,相比之下,還是DeepSeek的產(chǎn)品更自然。
防止被「蒸餾」?
OpenAI這波植入CoT總結(jié)器的做法,著實(shí)是被DeepSeek R1強(qiáng)勢(shì)崛起嚇到了。
o3-mini發(fā)布當(dāng)天,OpenAI在Reddit開啟AMA在線問答中,網(wǎng)友曾提問,「我們能看到模型思考的所有token嗎」?
當(dāng)時(shí),奧特曼回復(fù)道,「我們很快就會(huì)展示一個(gè)更有幫助、更詳細(xì)的版本」。
緊接著,OpenAI首席產(chǎn)品官Kevin Weil提前暗示了,是否展示所有內(nèi)容還有待確定。
「我們知道用戶(至少是高級(jí)用戶)想要看到這些,所以O(shè)penAI會(huì)找到一個(gè)合適的平衡點(diǎn)?!?/span>
如今,當(dāng)所有人終于見到了奧特曼所謂的「留到最后的好東西」,感受到的只有失望。
畢竟,DeepSeek早已這樣做了,而且還是完整的原始CoT!
對(duì)此,OpenAI發(fā)言人表示,「為了提高清晰度和安全性,我們?cè)黾恿艘粋€(gè)額外的后處理步驟,其中模型審查原始思維鏈,移除任何不安全的內(nèi)容,然后簡(jiǎn)化任何復(fù)雜的思想?!?/span>
「此外,這個(gè)后處理步驟使非英語用戶能夠以他們的母語接收思維鏈,創(chuàng)造一個(gè)更易于訪問和友好的體驗(yàn)。」
話雖委婉,但知道的人都明白OpenAI針對(duì)的是誰。