ChatGPT 被逼急了,連夜上線 o3-mini,并且還免費......
也許是迫于 DeepSeek 的壓力,open ai 的負(fù)責(zé)人 薩姆·奧爾特曼,連發(fā)多個 Twitter(現(xiàn)在是 X) 推出了新的模型 o3-mini,并且包含三個版本:low、medium 和 high,分別針對不同的性能和資源需求優(yōu)化。
圖片
現(xiàn)在,只要大家打開 chatgpt 的官網(wǎng),就可以看到大大的 o3-mini 的宣傳海報:
圖片
圖片
雖然 o3-mini 的具體性能還沒有經(jīng)過廣泛的實戰(zhàn)驗證,但是一些第三方的初步評測已經(jīng)流出。
尤其是發(fā)布 幾個小時后,加州大學(xué)的一位 AI 博士就對包括 o3-mini 在內(nèi)的多款大語言模型進(jìn)行了測試,評測指標(biāo)包括 Accuracy(準(zhǔn)確率) 和 Calibration Error(校準(zhǔn)誤差)
圖片
根據(jù)評測結(jié)果可以看到,在他的評測中 o3-mini (high) 模型的 準(zhǔn)確率為 13.0% 為全場最高。(PS:不過最高才 13% 是不是有點過于低了?)
這個結(jié)果一出來,open ai 的負(fù)責(zé)人薩姆·奧爾特曼就立刻轉(zhuǎn)發(fā)了該 Twitter,并帶上了一個 Sunday 沒有太看懂的話:“我們很快就需要再做另一場測試了......”。Sunday 猜測或許是 “很快還會推出新的模型?所以需要再做新的測試?”
圖片
不過,無論如何。DeepSeek 的爆火和 o3-mini 的快速跟進(jìn),都表示 大語言模型的競爭已經(jīng)進(jìn)入了一個全新的階段。
Sunday 認(rèn)為,這對于我們開發(fā)者而言,絕對是 有益的! 因為這將代表著 獨立開發(fā)者、個人公司、超級個體 將會擁有更多強大的工具和資源!