OpenAI智能體新線索曝光!網(wǎng)友:新ChatGPT時刻要來了
沒錯,OpenAI的智能體時代真的要來了!
據(jù)大名鼎鼎的“情報員”光頭哥爆料,OpenAI在MAC版ChatGPT桌面應(yīng)用中隱藏了啟用/禁用智能體的選項。
從截圖來看,確實是傳聞已久、代號為“Operator(操作員)”的辣個:
而且這則爆料也得到了日常關(guān)注蘋果方面消息的博主@M1的再次佐證:
Operator正在內(nèi)測中,即將上線MAC版ChatGPT桌面應(yīng)用……
根據(jù)介紹,Operator能夠接管用戶PC,直接代替人類自主執(zhí)行一系列操作(如編碼開發(fā)應(yīng)用、訂餐,做攻略等等)。
與此同時,OpenAI智能體和其他競爭對手(如Anthropic、谷歌智能體),以及人類選手的跑分對比也曝光了。
先劃個重點,在幾個評估智能體執(zhí)行自動化任務(wù)水平的基準(zhǔn)測試中,OpenAI這邊均戰(zhàn)勝了Claude智能體。
網(wǎng)友們紛紛激動表示,看起來離發(fā)布已經(jīng)很近了,或許又會是下一個ChatGPT時刻。
而Windows用戶則開啟了刷屏模式,請不要僅限于Mac、請不要僅限于Mac、請不要僅限于Mac……(OpenAI你聽到了嗎)
多個基準(zhǔn)跑分超過Claude智能體
從光頭哥的另一條推文里,我們看到了OpenAI智能體和其他競品的詳細(xì)對比。
相關(guān)數(shù)據(jù)來自O(shè)penAI網(wǎng)站,具體為圖中標(biāo)黃部分。
單拉出來看,在OSWorld這個專為多模態(tài)Agent設(shè)置的基準(zhǔn)測試中,OpenAI CUA(據(jù)推測可能是驅(qū)動Operator的AI模型)得分為38.1%,領(lǐng)先于Anthropic的Computer use功能,但還不及人類自己操作的一半水平。
類似情況也在WebArena(CMU發(fā)布的基于Web環(huán)境的基準(zhǔn)測試)上演。
不過,在WebVoyager(由騰訊AI Lab發(fā)布的多模態(tài)網(wǎng)絡(luò)Agent基準(zhǔn)測試)則稍有反轉(zhuǎn),OpenAI CUA取得了87%的好成績,不僅一如既往地領(lǐng)先Anthropic,還以小幅優(yōu)勢超過了人類(85.3%)。
從一些具體任務(wù)的完成通過率來看,有輔助的Operator表現(xiàn)好過完全自主操作,不過偶爾還是比不上帶視覺能力的GPT-4o。
有網(wǎng)友據(jù)此提問Operator是否不如GPT-4o,對此另有熱心網(wǎng)友指出了二者區(qū)別:
一個是自主操作,一個是教你做事。
另外,對二者安全性的評估如下,GPT-4o在拒絕非法宣傳、極端活動討論等方面均為100%,而Operator在越獄(Jailbreaks)、進(jìn)行非法活動以及禁止的金融活動方面沒有達(dá)到100%。
需要提醒的是,在光頭哥看來,以上跑分也可能只是占位符,具體真實性無法保證。(先來個免責(zé)聲明)
2025:OpenAI重點布局Agent
事實上,Operator這款智能體早在去年11月就有相關(guān)爆料。
當(dāng)時彭博社聲稱,OpenAI將在明年1月推出它,來替用戶自動執(zhí)行任務(wù)。
而現(xiàn)在,也算是進(jìn)一步佐證了之前的消息。
甚至就在去年底,OpenAI CEO奧特曼也在新年目標(biāo)中,明晃晃地將Agent排在前列。
而Flag立完后,OpenAI剛一開年也是馬不停蹄地開始了相關(guān)動作。
上周,OpenAI就為ChatGPT推出了新功能「Tasks」,讓AI有了執(zhí)行力,可以替你完成各種任務(wù)。
無論是一次性提醒還是重復(fù)執(zhí)行的動作,告訴ChatGPT你需要什么以及何時需要,它會自動幫你處理。
整體看起來有點偏向日程提醒,更像Agent的初級階段。
合理推測,Operator將在此基礎(chǔ)上有更多、更強(qiáng)的能力表現(xiàn)。
話說,從國內(nèi)外科技企業(yè)對Agent的新追逐來看,今年Agent絕對有好戲看!
據(jù)市場研究公司Markets and Markets的分析,AI Agent的市場規(guī)模至2030年有望達(dá)到471億美元。
如此吸引下,再加上已經(jīng)成熟的大模型技術(shù),Agent火爆2025簡直不言而喻。
甚至就在今年的CES上,英偉達(dá)CEO黃仁勛也對Agent大加贊賞:
未來公司IT部門將成為Agent人力資源部門……(為公司改進(jìn)大量Agents,從而為各部門提供新支持)
此番言論下,了解AI Agent技術(shù)也被開發(fā)者們提上了2025學(xué)習(xí)日程。
好嘛,不管是企業(yè)還是個人,接下來大家都得卷Agent了(doge)。