自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項目管理免費題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設(shè)置退出

OpenAI智能體新線索曝光！網(wǎng)友：新ChatGPT時刻要來了

作者：量子位 2025-01-21 12:44:50

人工智能新聞

據(jù)大名鼎鼎的“情報員”光頭哥爆料，OpenAI在MAC版ChatGPT桌面應(yīng)用中隱藏了啟用/禁用智能體的選項。

沒錯，OpenAI的智能體時代真的要來了！

據(jù)大名鼎鼎的“情報員”光頭哥爆料，OpenAI在MAC版ChatGPT桌面應(yīng)用中隱藏了啟用/禁用智能體的選項。

從截圖來看，確實是傳聞已久、代號為“Operator（操作員）”的辣個：

而且這則爆料也得到了日常關(guān)注蘋果方面消息的博主@M1的再次佐證：

Operator正在內(nèi)測中，即將上線MAC版ChatGPT桌面應(yīng)用……

根據(jù)介紹，Operator能夠接管用戶PC，直接代替人類自主執(zhí)行一系列操作（如編碼開發(fā)應(yīng)用、訂餐，做攻略等等）。

與此同時，OpenAI智能體和其他競爭對手（如Anthropic、谷歌智能體），以及人類選手的跑分對比也曝光了。

先劃個重點，在幾個評估智能體執(zhí)行自動化任務(wù)水平的基準(zhǔn)測試中，OpenAI這邊均戰(zhàn)勝了Claude智能體。

網(wǎng)友們紛紛激動表示，看起來離發(fā)布已經(jīng)很近了，或許又會是下一個ChatGPT時刻。

而Windows用戶則開啟了刷屏模式，請不要僅限于Mac、請不要僅限于Mac、請不要僅限于Mac……（OpenAI你聽到了嗎）

多個基準(zhǔn)跑分超過Claude智能體

從光頭哥的另一條推文里，我們看到了OpenAI智能體和其他競品的詳細(xì)對比。

相關(guān)數(shù)據(jù)來自O(shè)penAI網(wǎng)站，具體為圖中標(biāo)黃部分。

單拉出來看，在OSWorld這個專為多模態(tài)Agent設(shè)置的基準(zhǔn)測試中，OpenAI CUA（據(jù)推測可能是驅(qū)動Operator的AI模型）得分為38.1%，領(lǐng)先于Anthropic的Computer use功能，但還不及人類自己操作的一半水平。

類似情況也在WebArena（CMU發(fā)布的基于Web環(huán)境的基準(zhǔn)測試）上演。

不過，在WebVoyager（由騰訊AI Lab發(fā)布的多模態(tài)網(wǎng)絡(luò)Agent基準(zhǔn)測試）則稍有反轉(zhuǎn)，OpenAI CUA取得了87%的好成績，不僅一如既往地領(lǐng)先Anthropic，還以小幅優(yōu)勢超過了人類（85.3%）。

從一些具體任務(wù)的完成通過率來看，有輔助的Operator表現(xiàn)好過完全自主操作，不過偶爾還是比不上帶視覺能力的GPT-4o。

有網(wǎng)友據(jù)此提問Operator是否不如GPT-4o，對此另有熱心網(wǎng)友指出了二者區(qū)別：

一個是自主操作，一個是教你做事。

另外，對二者安全性的評估如下，GPT-4o在拒絕非法宣傳、極端活動討論等方面均為100%，而Operator在越獄（Jailbreaks）、進(jìn)行非法活動以及禁止的金融活動方面沒有達(dá)到100%。

需要提醒的是，在光頭哥看來，以上跑分也可能只是占位符，具體真實性無法保證。（先來個免責(zé)聲明）

2025：OpenAI重點布局Agent

事實上，Operator這款智能體早在去年11月就有相關(guān)爆料。

當(dāng)時彭博社聲稱，OpenAI將在明年1月推出它，來替用戶自動執(zhí)行任務(wù)。

而現(xiàn)在，也算是進(jìn)一步佐證了之前的消息。

甚至就在去年底，OpenAI CEO奧特曼也在新年目標(biāo)中，明晃晃地將Agent排在前列。

而Flag立完后，OpenAI剛一開年也是馬不停蹄地開始了相關(guān)動作。

上周，OpenAI就為ChatGPT推出了新功能「Tasks」，讓AI有了執(zhí)行力，可以替你完成各種任務(wù)。

無論是一次性提醒還是重復(fù)執(zhí)行的動作，告訴ChatGPT你需要什么以及何時需要，它會自動幫你處理。

整體看起來有點偏向日程提醒，更像Agent的初級階段。

合理推測，Operator將在此基礎(chǔ)上有更多、更強(qiáng)的能力表現(xiàn)。

話說，從國內(nèi)外科技企業(yè)對Agent的新追逐來看，今年Agent絕對有好戲看！

據(jù)市場研究公司Markets and Markets的分析，AI Agent的市場規(guī)模至2030年有望達(dá)到471億美元。

如此吸引下，再加上已經(jīng)成熟的大模型技術(shù)，Agent火爆2025簡直不言而喻。

甚至就在今年的CES上，英偉達(dá)CEO黃仁勛也對Agent大加贊賞：

未來公司IT部門將成為Agent人力資源部門……（為公司改進(jìn)大量Agents，從而為各部門提供新支持）

此番言論下，了解AI Agent技術(shù)也被開發(fā)者們提上了2025學(xué)習(xí)日程。

好嘛，不管是企業(yè)還是個人，接下來大家都得卷Agent了(doge）。

責(zé)任編輯：張燕妮來源：量子位

模型 AI 訓(xùn)練

51CTO技術(shù)棧公眾號

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營

<sub id="tlgi6"></sub>

<em id="tlgi6"><rt id="tlgi6"></rt></em>