自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

o3智商高達157?每13333人中才有一個這么高,網(wǎng)友:編碼分數(shù)無意義

人工智能 新聞
從韋氏智商測試來看,如果 o3 的 IQ 真這么高,則稱得上非常優(yōu)秀。

OpenAI o3 的智商(IQ)竟然已經(jīng)這么高了嗎?

今天,Reddit 上一則熱帖宣稱「OpenAI o3 的 IQ 估計為 157」,并放出了一張數(shù)據(jù)圖。

圖片

這意味著什么呢?人類中的 0.0075% 才能達到這個智商水平。更具體地說,每 13,333 個人中才出來一個這么高智商的。

對比之下,GPT-4o 的 IQ 為 115、o1 preview 為 123、o1 為 135、o1 pro 為 139、o3 mini 為 141。

圖片

同樣更具體地講,GPT-4o 每 6 人中有一個、o1 preview 是每 16 人、o1 是每 93 人、o1 pro 是每 200 人、o3 mini 是每 333 人。

圖片

這些 IQ 是如何計算出來的呢?疑似原作者表示,他根據(jù) Codeforces 編碼評級來粗略地估計 IQ,并假設(shè)報名時競爭程序員排名前 15%,最后得出 GPT-4o、o1 preview、o1、o1 pro、o3 mini 和 o3 的 IQ 以及在人類中的排名。

圖片圖源:X@i_dg23

此前還有人整理了 GPT-4o 與 o1 preview、o1、o3 在 2024 年 AIME 數(shù)學競賽題目測試(AIME 2024)中的結(jié)果,從 13.4 到如今的 96.7,七個月的時間,數(shù)學能力實現(xiàn)了飛躍式提升。


圖片圖源:X@zbgoodwin

僅從以上數(shù)據(jù)來看,AI 大模型的進步速度著實令人震驚。不過,畢竟開局一張圖,o3 的 IQ 真的如表格中那么高嗎?

有人找到了「Tracking AI」中 o1 在挪威門薩智商測試(Mensa Norway)IQ 測試中的結(jié)果(為 133,與上面表格中估計的 135 相差不大),一定程度上驗證了 o3 估計智商的可靠性。

圖片圖源:X@facundo_fagalde

圖片圖源:https://www.trackingai.org/home

因此,未來等 o3 正式發(fā)布以后,它的挪威門薩智商測試結(jié)果將更加值得期待。

圖片圖源:X@AILeaksAndNews

o3 IQ 如此之高,瞬間引爆了大家伙的評論熱情。

網(wǎng)友熱評

有網(wǎng)友直呼:「這張圖是我見過最愚蠢的東西之一,這些數(shù)據(jù)根本不能代表智商。他們用編碼表現(xiàn)的 z 分數(shù)代表智商。但編碼不是智商測試,尤其是對于參加編碼測試的 LLM 來說,它們對所有在互聯(lián)網(wǎng)上分享的代碼具有完美的數(shù)字記憶。o3 甚至無法解答我 6 歲和 8 歲的孩子可以解答的問題。」

圖片

也就是說,如果 LLM 針對編碼測試進行訓練,那么用編碼表現(xiàn)分數(shù)代表智商是毫無意義的。

但另一位網(wǎng)友表示:「并非如此,這是一種基于相關(guān)性的『轉(zhuǎn)換』,但首先相關(guān)性有點弱,其次它轉(zhuǎn)化為機器智能的效果尚不明確,即人工智能模型可能擅長編碼,但在其他領(lǐng)域卻不行。」

圖片

網(wǎng)友指出:「IQ 本身就是用來評估人類的指標。它評估與智力相關(guān)的特定技能,并理所當然地認為人類應(yīng)該擁有許多其他特征。而這張圖通過考慮人工智能可以擅長的單一指標來假設(shè)廣義智能,他們甚至沒有使用智商測試來得出這個結(jié)論,而是根據(jù)與智商相關(guān)的指標來推斷?!?/span>

圖片

總的來說,人們對于所謂的「o3 智商高達 157」并不認可?;蛟S,這又是一場炒作吧。

圖片

參考鏈接:https://www.reddit.com/r/singularity/comments/1hkxmi6/o3s_estimated_iq_is_157/

責任編輯:張燕妮 來源: 機器之心
相關(guān)推薦

2024-12-24 12:19:45

2020-07-27 15:24:22

戴爾

2015-09-14 09:34:37

Docker本地開發(fā)開發(fā)環(huán)境

2013-04-24 10:04:35

Windows 8.1

2009-03-26 22:54:33

IBM院士Sun

2021-08-13 16:11:08

機器人AI人工智能

2020-12-30 05:33:30

Java網(wǎng)絡(luò)數(shù)據(jù)

2024-12-23 07:30:00

OpenAIo3-mini人工智能

2020-08-12 08:35:34

華為阿里加班

2020-07-08 16:10:42

do{}while(0代碼語言

2025-04-21 09:27:00

2025-02-07 09:05:36

2009-01-27 22:36:42

云計算高可用性災(zāi)難恢復(fù)

2018-06-25 17:05:09

區(qū)塊鏈數(shù)字貨幣比特幣

2025-04-21 08:22:25

2024-09-19 20:21:28

2024-06-07 16:41:48

2018-09-17 14:10:58

馬云技術(shù)健康

2023-06-20 07:48:21

2022-06-07 07:38:43

威士忌氣味測試
點贊
收藏

51CTO技術(shù)棧公眾號