自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

突發(fā)!o3-mini思維鏈公開,卻被曝光全是「作假」,奧特曼現(xiàn)身解釋網(wǎng)友炸鍋

人工智能 新聞
OpenAI實(shí)屬急了,剛剛官宣公開o3-mini思維鏈。令人意想不到的是,CoT竟不是原生的,奧特曼現(xiàn)身解釋,全網(wǎng)炸鍋了。

OpenAI,真的被DeepSeek逼急了!

活久見,就在剛剛,OpenAI把o3-mini的「思維鏈」公開了。

比如問「怎么今天不是星期五啊??」?

在展示出來的CoT中,o3-mini一步步思考,這個(gè)問題應(yīng)該是用戶在搞幽默,覺得本周應(yīng)該快結(jié)束了,結(jié)果還沒結(jié)束。因此,自己需要給一個(gè)聰明機(jī)智的回答。

然后它用Zeller公式計(jì)算后發(fā)現(xiàn),2025年2月6日的確是星期四,即使閏年的特殊情況也是如此。

最終,它回答說:今天的確是周四不是周五,日歷就是這么定的。然后提供了一番情緒價(jià)值,鼓勵(lì)用戶說:再忍忍,只差一天啦!

不過,機(jī)智的大神們很快就發(fā)現(xiàn)了「華點(diǎn)」——這是「真的CoT」嗎?

沒多久,就破案了!

先是OpenAI研究員Noam Brown發(fā)文表示,這次放出來的并不是模型原始的CoT。

隨后,Tibor Blaho也發(fā)現(xiàn)——所謂的CoT,無非就是個(gè)「總結(jié)器」而已。(手動(dòng)狗頭)

對(duì)此,奧特曼解釋道,我們正努力整理原始的CoT提升可讀性,并在必要時(shí)提供翻譯,盡量保持原始內(nèi)容的忠實(shí)度。

他放出了四個(gè)emoji,讓o3-mini在思維鏈中展示了一把推理過程

堅(jiān)決不讓競(jìng)爭(zhēng)對(duì)手看到CoT的具體過程,OpenAI的防備心實(shí)在是有些重啊。

OpenAI研究員:看到CoT實(shí)時(shí)演示,是「啊哈時(shí)刻」

OpenAI研究員Noam Brown表示,在o1-preview發(fā)布前,自己向他人介紹草莓時(shí),看到CoT的實(shí)時(shí)演示,通常是他們的「啊哈時(shí)刻」。

他們清楚地意識(shí)到,這將是一件大事。

對(duì)于全新的o3-mini CoT,Noam Brown放出了自己的獨(dú)家玩法:

你正在玩井字棋,使用 O。到目前為止,X 已經(jīng)在左上角和右下角落子,而你在中間位置落子。最優(yōu)的下一個(gè)動(dòng)作是什么?請(qǐng)只回答你的動(dòng)作,并畫出棋盤。

Noam Brown表示,o3-mini是目前第一個(gè)能持續(xù)正確回答井字棋問題的模型。

好笑的是,他承認(rèn)CoT其實(shí)有些不穩(wěn)定,但可以看到,它最終還是把這個(gè)問題給想明白了。

有人指出,OpenAI遮遮掩掩地放出這個(gè)高仿CoT,其實(shí)比什么都不放還要糟。

因?yàn)檎鎸?shí)的CoT可以充當(dāng)prompt的調(diào)試器,幫我們引導(dǎo)模型;而總結(jié)性的CoT會(huì)造成混淆,引入錯(cuò)誤,讓調(diào)試變得更加困難。

而DeepSeek R1最酷的一點(diǎn),就是暴露了模型的CoT如何影響提示的效果。

而且,總結(jié)版的CoT顯示得很慢。如果是原始的o3-mini,應(yīng)該在推理中有更快的生成速度。

有人也橫向?qū)Ρ攘薕penAI和DeepSeek的CoT,表示前者看起來實(shí)在太專業(yè)了,相比之下,還是DeepSeek的產(chǎn)品更自然。

防止被「蒸餾」?

OpenAI這波植入CoT總結(jié)器的做法,著實(shí)是被DeepSeek R1強(qiáng)勢(shì)崛起嚇到了。

o3-mini發(fā)布當(dāng)天,OpenAI在Reddit開啟AMA在線問答中,網(wǎng)友曾提問,「我們能看到模型思考的所有token嗎」?

當(dāng)時(shí),奧特曼回復(fù)道,「我們很快就會(huì)展示一個(gè)更有幫助、更詳細(xì)的版本」。

緊接著,OpenAI首席產(chǎn)品官Kevin Weil提前暗示了,是否展示所有內(nèi)容還有待確定。

「我們知道用戶(至少是高級(jí)用戶)想要看到這些,所以O(shè)penAI會(huì)找到一個(gè)合適的平衡點(diǎn)?!?/span>

如今,當(dāng)所有人終于見到了奧特曼所謂的「留到最后的好東西」,感受到的只有失望。

畢竟,DeepSeek早已這樣做了,而且還是完整的原始CoT!

對(duì)此,OpenAI發(fā)言人表示,「為了提高清晰度和安全性,我們?cè)黾恿艘粋€(gè)額外的后處理步驟,其中模型審查原始思維鏈,移除任何不安全的內(nèi)容,然后簡(jiǎn)化任何復(fù)雜的思想?!?/span>

「此外,這個(gè)后處理步驟使非英語用戶能夠以他們的母語接收思維鏈,創(chuàng)造一個(gè)更易于訪問和友好的體驗(yàn)。」

話雖委婉,但知道的人都明白OpenAI針對(duì)的是誰。

責(zé)任編輯:張燕妮 來源: 新智元
相關(guān)推薦

2025-02-08 17:00:11

2025-02-07 09:05:36

2025-01-20 08:45:00

AGI模型AI

2024-12-24 16:15:04

2025-02-03 00:15:00

DeepSeek?o3-mini?資源

2020-07-15 15:52:07

QQ騰訊賬號(hào)

2025-01-20 19:52:50

2025-02-18 09:00:00

2025-02-10 00:00:01

2025-02-03 14:06:32

2011-02-22 20:58:03

2025-02-17 08:12:00

AI模型生成

2025-03-13 09:12:35

2025-02-03 12:38:28

2025-02-14 10:47:40

2025-03-04 10:15:00

2025-02-08 11:44:03

2025-03-13 06:34:49

2024-12-23 15:00:00

模型數(shù)據(jù)訓(xùn)練

2025-04-21 16:25:58

OpenAI測(cè)試模型
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)