自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

o1滿血版泄露!奧數(shù)題圖片推理手拿把掐,奧特曼上線劇透o2

人工智能 新聞
有網(wǎng)友發(fā)現(xiàn),OpenAI已經(jīng)在ChatGPT官網(wǎng)上部署了完整版o1,大家伙兒還都能卡bug直接用!

o1滿血版泄露了!

沒想到,OpenAI還擱那兒“今年一定”呢,不少網(wǎng)友已經(jīng)率先上手體驗(yàn)到了(doge)。

事情是醬嬸的:有網(wǎng)友發(fā)現(xiàn),OpenAI已經(jīng)在ChatGPT官網(wǎng)上部署了完整版o1,大家伙兒還都能卡bug直接用!

圖片

最初發(fā)現(xiàn)此事的網(wǎng)友,測試確認(rèn)泄露模型具有奧特曼所說的圖像推理能力

圖片

△圖源:??@legit_rumors

而日志也顯示該模型就是o1本模。

圖片

于是,趕在OpenAI出手修復(fù)之前,網(wǎng)友們抓緊大玩特玩了一波——

滿血o1到底有多牛

和已經(jīng)發(fā)布的o1-preview、o1-mini最直觀的不同是,泄露出來的o1支持上傳附件。

這也就意味著,終于能測測o1的多模態(tài)能力了。

網(wǎng)友們也不說廢話,直接上強(qiáng)度,普特南數(shù)學(xué)競賽的證明題截圖一貼,甩給滿血o1。

對正整數(shù)n,有fn(x)=cos(x)cos(2x)cos(3x)…cos(nx)。找出最小的n,使得|fn‘’(0)|>2023。

圖片

思考了18秒之后,o1給出答案:18。

圖片

答案正確:

圖片

再來一道更復(fù)雜的,雖然在識圖上遇到了一點(diǎn)小問題,但還是穩(wěn)穩(wěn)做對了。

圖片
圖片

在如此驚艷表現(xiàn)之下,似乎正確識別人類史上首張黑洞照片也不算什么了(doge)。

圖片

不過嘛,也不是沒有翻車案例。比如,讓大模型數(shù)數(shù)圖里有多少個三角形。

圖片

ID為anagh的??網(wǎng)友,給泄露模型和GPT-4o做了個同屏對比:

4o速度很快,給出了錯誤答案19。

而滿血o1花了1分39秒,狂刷一堆token……給出了不同的錯誤答案:29。

正確答案是24。

這個bug現(xiàn)在已經(jīng)修復(fù)了。不過,有意思的是,這次模型泄露,持續(xù)了整整3個小時。

不小心還是故意的?

有網(wǎng)友犀利地點(diǎn)出,這事兒看上去不是“不小心”,而是“精心策劃”:

目的是讓人們對即將發(fā)布的模型有一個預(yù)期。

圖片

不少網(wǎng)友贊同這樣的觀點(diǎn):

奧特曼的目的是測試和炒作。

圖片

而由于一切看上去已經(jīng)部署就緒,甚至有人猜測,o1完整版的正式上線時間就在未來一周之內(nèi)。

圖片

值得注意的是,就在這次泄露事件之后,奧特曼馬上在??上開始了自己的表演:

圖片

好家伙,都已經(jīng)吹上o2的風(fēng)了(還假裝上錯號……)。

圖片

至于為什么是這個時間……

那不得趕在Anthropic發(fā)布Claude Haiku 3.5之前搞點(diǎn)事嘛(doge)。

圖片

責(zé)任編輯:張燕妮 來源: 量子位
相關(guān)推薦

2024-12-06 08:36:31

2024-10-22 18:05:59

2024-10-05 12:00:00

2024-12-06 11:44:48

Pro模式AI人工智能

2024-09-24 11:01:03

2024-11-07 15:40:00

2024-11-25 08:30:00

2024-09-29 13:07:16

2024-09-23 16:00:00

AI模型測評

2024-09-19 13:32:24

2025-01-21 13:15:15

2024-12-06 08:23:40

2025-01-21 08:00:00

2025-01-21 09:00:00

2024-12-17 08:40:00

AI模型測試

2024-12-23 00:43:19

2025-01-13 12:30:58

2024-11-25 15:50:00

模型訓(xùn)練
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號