自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

OpenAI突然公開(kāi)o3思維鏈!網(wǎng)友:讓我們謝謝DeepSeek

人工智能
o3-mini思考過(guò)程還蠻有邏輯,從不同種類的“內(nèi)心敘事”、可解釋性和實(shí)用價(jià)值等方面分析,表示展現(xiàn)完整的CoT過(guò)程程似乎有助于“扎根”社會(huì)的理解并促進(jìn)更好的認(rèn)知實(shí)踐,但現(xiàn)實(shí)更為復(fù)雜,畢竟AI大模型和人類的認(rèn)知還沒(méi)有完全對(duì)齊。

剛剛,OpenAI把o3-mini的推理思維鏈公開(kāi)了。

從今日起,免費(fèi)用戶和付費(fèi)用戶都可以看到模型的思維過(guò)程,OpenAI終于Open一回。

圖片圖片

評(píng)論區(qū)網(wǎng)友紛紛:讓我們謝謝DeepSeek。

圖片圖片

在官方展示的栗子中,可以看到o3-mini的內(nèi)心戲不少,還會(huì)模仿用戶提問(wèn)使用表情包。

用戶的提問(wèn)是“為什么今天不是星期五圖片

o3-mini認(rèn)為這是一個(gè)幽默的評(píng)論,并認(rèn)為自己也應(yīng)該給出機(jī)智的回答,使用蔡勒公式計(jì)算當(dāng)天確實(shí)不是星期五后,對(duì)閏年的特殊情況做了二次檢查。

最后回答的中,調(diào)侃了是日歷規(guī)定今天是星期四,并安慰用戶“忍耐一下,明天就離周未更近了!”

圖片圖片

那么作為“同行”,DeepSeek-R1如何評(píng)價(jià)o3-mini的思維過(guò)程呢?

圖片圖片

在這個(gè)案例中,AI聲稱使用了蔡勒公式但沒(méi)有給出計(jì)算過(guò)程的現(xiàn)象引起了很多人警覺(jué)。

不少用戶懷疑這仍然是事后對(duì)AI思維過(guò)程的再總結(jié),而不是原始數(shù)據(jù)。

圖片圖片

實(shí)際上在最近的“回應(yīng)一切”活動(dòng)中,OpenAI首席產(chǎn)品官Kevin Weil也暗示了這點(diǎn):

……展示完整思想鏈會(huì)被競(jìng)爭(zhēng)對(duì)手蒸餾,但我們也知道人們(至少是資深用戶)想要它,因此我們會(huì)找到正確的方法來(lái)平衡它?!?/p>

圖片圖片

對(duì)此,開(kāi)發(fā)者M(jìn)ckay Wrigley補(bǔ)充了一個(gè)觀點(diǎn):“我擔(dān)心經(jīng)過(guò)總結(jié)的思維鏈實(shí)際上比沒(méi)有思維鏈更差”。

真正的思維鏈相當(dāng)于prompt的調(diào)試器,有助于我們引導(dǎo)矯正模型。

經(jīng)過(guò)總結(jié)的思維鏈增加了迷惑性并且可能額外添加錯(cuò)誤,讓模型難以被調(diào)試。

圖片圖片

但不管怎么說(shuō),既然公開(kāi)了,現(xiàn)在免費(fèi)用戶也能一窺o3-mini的CoT,大家還是敞開(kāi)玩了起來(lái)。

o3-mini思維鏈?zhǔn)着鷮?shí)測(cè)

OpenAI多模態(tài)Agent的研究員,首先亮出了自己的玩耍方法,讓o3-mini玩井字棋游戲——就是在3*3格子上用O和X連線那個(gè)。

輸入Prompt:

你正在玩井字棋,你是O。到目前為止,X已經(jīng)在左上角和右下角玩過(guò),你已經(jīng)在中間玩過(guò)。下一步的最優(yōu)策略是什么?只用你的答案和棋盤圖回答。

然后o3-mini就開(kāi)始噼里啪啦思考。

圖片圖片

這位OpenAI員工非常直言不諱,表示o3-mini是第一個(gè)回答這個(gè)游戲的大模型。

But還有一句,“雖然o3-mini的CoT過(guò)程有點(diǎn)不靠譜,但你看右邊的圖,結(jié)尾它的弄清楚了的”。笑不活了,這里必須要送上一個(gè)手動(dòng)狗頭。

圖片圖片

然后是每個(gè)大模型都逃不過(guò)的經(jīng)典測(cè)試題:數(shù)strawberry里面的“r”的數(shù)量。

但網(wǎng)友已經(jīng)和模型一樣進(jìn)階了,問(wèn)的不是strawberry里面到底有幾個(gè)某字母,而是:

為啥AI大模型,數(shù)strawberry里面有幾個(gè)“r”,它就那么費(fèi)勁呢???

我們認(rèn)真觀摩了它的思考過(guò)程,o3-mini承認(rèn)“乍一看,計(jì)算strawberry中‘r’的數(shù)量對(duì)人類來(lái)說(shuō)似乎是一個(gè)微不足道的任務(wù),但對(duì)于許多AI語(yǔ)言模型來(lái)說(shuō),這可能是一個(gè)驚人的挑戰(zhàn)”。

然后它從四個(gè)角度來(lái)思考和推理這個(gè)現(xiàn)象發(fā)生的原因,分別是:

  • 用自然語(yǔ)言而不是算法訓(xùn)練
  • Tokenization問(wèn)題
  • 迭代推理的缺失
  • 對(duì)模式識(shí)別的依賴

8秒過(guò)后,o3-mini給出總結(jié):

因?yàn)锳I大模型本質(zhì)上不是為精確、分步驟的算法操作而設(shè)計(jì)的,它們的設(shè)計(jì)和訓(xùn)練更多地側(cè)重于根據(jù)上下文預(yù)測(cè)和生成文本,而不是執(zhí)行精確的算術(shù)或系統(tǒng)計(jì)數(shù)。

當(dāng)然,o3-mini也不是萬(wàn)能的。

推特有網(wǎng)友表示,他探問(wèn)了o3關(guān)于私有CoT的事情,但聽(tīng)君一番思考推理,如聽(tīng)一番思考推理,沒(méi)有絲毫進(jìn)展。

最開(kāi)始,o3-mini思考過(guò)程還蠻有邏輯,從不同種類的“內(nèi)心敘事”、可解釋性和實(shí)用價(jià)值等方面分析,表示展現(xiàn)完整的CoT過(guò)程程似乎有助于“扎根”社會(huì)的理解并促進(jìn)更好的認(rèn)知實(shí)踐,但現(xiàn)實(shí)更為復(fù)雜,畢竟AI大模型和人類的認(rèn)知還沒(méi)有完全對(duì)齊。

圖片圖片

但隨著網(wǎng)友的追問(wèn),o3-mini的思維鏈就崩了(?),急得他團(tuán)團(tuán)轉(zhuǎn),中間一度打開(kāi)DeepSeek-R1來(lái)幫忙。

他放上了整整12張圖,顯示最后o3-mini思維了半天,給出了一個(gè)令人心碎的回答:

對(duì)不起吼,但我真的幫不了你一點(diǎn)。

圖片圖片

除此之外,還有網(wǎng)友提出了質(zhì)疑,覺(jué)得OpenAI公開(kāi)的不是o3-mini原始的CoT。

有幾個(gè)原因,其中一個(gè)是它(CoT過(guò)程)真的顯示得很慢。

而如果是原始的o3-mini非???,講道理推理的生成速度應(yīng)該比現(xiàn)在呈現(xiàn)的快得多。

他繼續(xù)羅列自己之所以懷疑的證據(jù),比如同一個(gè)問(wèn)題,o3-mini-high只有1384個(gè)字符,而o1-preview生成了16577個(gè)字符。

“這只有兩種可能,一是o3-mini-high比o1-preview高效得多;二是o3-mini的CoT不是原始版本?!?/p>

圖片圖片

One More Thing

想對(duì)上面這位推特網(wǎng)友說(shuō),Bingo!

根據(jù)TechCrunch消息,OpenAI發(fā)言人確認(rèn)了這次公開(kāi)的不是原始思維鏈,并且給出兩個(gè)理由:

  • 對(duì)原始思維鏈做后處理,可以消除任何不安全的內(nèi)容,并簡(jiǎn)化任何復(fù)雜的想法。
  • 使非英語(yǔ)用戶獲得母語(yǔ)的思想鏈,有更友好的體驗(yàn)。

這樣一來(lái),最近被大量吐槽的o3-mini使用中文思考的問(wèn)題,也就不存在了。

圖片圖片

參考鏈接:
[1]https://techcrunch.com/2025/02/06/openai-now-reveals-more-of-its-o3-mini-models-thought-process/[2]https://x.com/polynoamial/status/1887628222042677387[3]https://x.com/pigeon__s/status/1887619637099249884[4]https://x.com/thegenioo/status/1887617601016385840[5]https://x.com/ryunuck/status/1887527365435105593

責(zé)任編輯:武曉燕 來(lái)源: 量子位
相關(guān)推薦

2025-02-08 17:00:11

2025-02-07 11:20:50

2024-12-24 16:15:04

2025-02-18 08:15:03

2025-03-10 08:10:00

AI研究安全

2025-04-23 08:30:05

2025-04-17 06:10:57

2025-04-18 11:18:51

2025-04-17 08:59:59

2025-04-21 16:25:58

OpenAI測(cè)試模型

2025-01-23 14:53:15

2021-11-08 17:03:13

IO模型

2025-04-21 08:22:25

2025-04-07 05:00:00

2025-04-21 09:27:00

2025-02-07 12:27:09

2024-12-23 07:40:00

AI模型數(shù)學(xué)

2025-04-17 07:23:10

2024-09-18 09:17:00

OpenAI模型開(kāi)源

2024-09-14 12:51:04

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)