奧特曼曬“草莓”引熱議,神秘新模型現(xiàn)身競技場,網(wǎng)友第一波實測來了
OpenAI神秘新模型,真的藏不住了!
先是有匿名聊天機器人現(xiàn)身lmsys競技場,聲稱自己是GPT-4系列模型一部分,吊足了大家的胃口。
圖片
隨后奧特曼又發(fā)了一個浮想聯(lián)翩的推文,正是他花園里的草莓照片,并配文:i love summer in the garden。
上個月OpenAI正好被曝正在開發(fā)新一代基礎模型“草莓”,前身據(jù)說是之前神秘兮兮的Q*。
圖片
不知是有意還是無意,但感覺就是有意,網(wǎng)友們就當奧特曼變相承認了。(Doge)
這就是對草莓計劃的引用!發(fā)布時間就是在夏天。(美國的秋天從9月22日開始)
圖片
就在剛剛,ChatGPT官方推文開始走起了“”的隊形,更顯得“有理有據(jù)”了。
圖片
新模型現(xiàn)身競技場,網(wǎng)友第一波實測
最早在昨天下午,有網(wǎng)友發(fā)現(xiàn)lmsys競技場上多了個匿名新模型anonymous-chatbot。
圖片
之前很多包括OpenAI在內(nèi)很多科技公司都會發(fā)布前會進行一波測試。再加上它自稱是GPT-4模型系列一部分。
所以不少人懷疑OpenAI新模型要來了,也許就是草莓計劃或者Q*。
圖片
圖片
網(wǎng)友進行了第一波實測。
圖片
像「9.11和9.9哪個大」這個“難題”也沒有挑戰(zhàn)成功。
圖片
而讓它倒著寫單詞,同樣也沒回答出來。
圖片
誒不過,說草莓這個單詞有多少個r倒是答對了。
圖片
還有河流“難題”,也直接輕松解決,而不像之前其他大模型回答得過于復雜。
如果一個人和一只狗要過河,但有個船只能承載一個人和一只動物,請問怎么過去?
圖片
最早在今年5月,OpenAI就被爆出正在開發(fā)“草莓”項目。
據(jù)今年7月路透社消息稱,多個內(nèi)部人士透露,這個項目會讓公司的AI系統(tǒng)不僅能生成查詢的答案,而且能夠提前規(guī)劃,自主可靠地瀏覽互聯(lián)網(wǎng),從而執(zhí)行OpenAI 所稱的“深度研究”(deep research)。
比如通過CUA(一種計算機代理)的幫助來自動瀏覽網(wǎng)頁,該代理可以根據(jù)發(fā)現(xiàn)內(nèi)容采取行動。
這也是迄今一眾AI模型尚未解決的問題和難點。
草莓計劃前身是Q*
在眾多猜測中,草莓項目的前身極有可能是Q*。
去年11月,Q*首次被曝出,被認為過于強大,可能是通往AGI或超級智能的關鍵一步。
它被指具有這些特性,比如在數(shù)學和推理能力方面有很大的提升,突破了人類數(shù)據(jù)的限制,可以自己生產(chǎn)巨量訓練數(shù)據(jù),有自主學習和自我改進的能力等等。
在草莓項目正式被曝光的前幾天,OpenAI科學家Noam Brown發(fā)了一條推特,感慨OpenAI總是會堅定地在重大研究方向上持續(xù)押注。
而這位科學家去年才跳槽到OpenAI,主要負責研究模型推理能力,之前一直被認為在研究Q*。
圖片
最新曝光顯示,“草莓”使用的推理方法和2022年斯坦福發(fā)表的一種方法相似。
當時他們提出了一個自學推理(Self-Taught Reasoner,簡稱STaR)的方法。今年,斯坦福團隊又基于STaR,提出了一種名為Quiet-STaR的推理方式,也就是Q*了
知情人士表示,OpenAI希望通過該項目大幅提升AI模型的推理能力,“草莓”已經(jīng)在非常大的數(shù)據(jù)集上完成預訓練,并使用了一種專門的處理方法,比如post-training等。
另外,內(nèi)部之前也有過一次神秘模型的測試,當時數(shù)學測試成績超過90%,不過也沒法確認是否是Q*。
對此,OpenAI并沒有直接回應。聲明中表示:
We want our AI models to see and understand the world more like we do. Continuous research into new AI capabilities is a common practice in the industry, with a shared belief that these systems will improve in reasoning over time.
(我們希望我們的AI模型能像我們一樣看待和理解世界。對新的人工智能能力的持續(xù)研究是該行業(yè)的常見做法,人們普遍認為這些系統(tǒng)隨著時間的推移在推理方面會有所改進。)
不過確實要說的是,距離OpenAI發(fā)布上一個重要基礎模型,也就是GPT-4,已經(jīng)過去了近17個月的時間。差不多一年半了,也該來新一代模型了。
結果奧特曼現(xiàn)在又發(fā)一些云里霧里的推文。網(wǎng)友大開腦洞:
如圖所示這張圖有五個草莓,但第五個還沒有熟。而草莓成熟的時間在4-6周內(nèi),說明GPT-5也將在那時候發(fā)布。
圖片
好好好,我信了。
參考鏈接:
[1]https://x.com/apples_jimmy/status/1821047312673890694
[2]https://x.com/flowersslop/status/1821054928275533900
[3]https://x.com/sama/status/1821207141635780938