OpenAI發(fā)布智能體Operator:月費(fèi)200美元,具備模擬人類操作行為的能力
2025年1月24日,美國人工智能公司OpenAI宣布,其最新智能體“Operator”已向部分用戶開放試用。這款智能體能夠自主完成諸如采購雜貨、提交費(fèi)用報(bào)表等任務(wù),旨在通過自動(dòng)化操作提升用戶在日常生活和工作中的效率。
Operator屬于新一代AI智能體,具備模擬人類操作行為的能力。它可以通過內(nèi)置瀏覽器訪問互聯(lián)網(wǎng),完成點(diǎn)擊、滾動(dòng)頁面和輸入信息等操作。其潛在應(yīng)用場景廣泛,包括預(yù)訂餐廳、遷移公司數(shù)據(jù)等。
目前,Operator以“研究預(yù)覽版”的形式向美國的ChatGPT Pro訂閱用戶開放,表明該產(chǎn)品仍處于測試和優(yōu)化階段。ChatGPT Pro的訂閱費(fèi)用為每月200美元。OpenAI首席運(yùn)營官布拉德·萊特卡普(Brad Lightcap)表示,Operator旨在通過自動(dòng)化處理常見任務(wù),為用戶節(jié)省時(shí)間。他強(qiáng)調(diào),家庭和職場中的自動(dòng)化應(yīng)用具有“巨大的潛力”,但目前OpenAI希望Operator能夠首先服務(wù)于最活躍的用戶,這些用戶更能理解并接受產(chǎn)品仍處于研發(fā)預(yù)覽階段的特性。萊特卡普認(rèn)為,這代表著人與計(jì)算機(jī)交互方式的一次根本性變革,衡量成功的關(guān)鍵在于其實(shí)際的實(shí)用價(jià)值。
OpenAI還宣布與Instacart、Uber、eBay、Priceline、OpenTable和Etsy等科技公司展開合作,通過Operator主頁為用戶提供更便捷的訪問途徑,快速引導(dǎo)他們至這些公司的網(wǎng)頁。不過,這些合作并未涉及任何財(cái)務(wù)層面的合作關(guān)系。
Operator的推出標(biāo)志著OpenAI正式進(jìn)入競爭激烈的AI智能體市場。隨著技術(shù)的不斷進(jìn)步,包括微軟、Salesforce和Workday在內(nèi)的多家商業(yè)軟件巨頭也推出了各自的AI智能體,這些智能體能夠完成撰寫報(bào)告、聯(lián)系潛在客戶、篩選求職者等多種任務(wù)。近期,谷歌與AI初創(chuàng)企業(yè)Anthropic相繼推出了與OpenAI智能體Operator類似的產(chǎn)品,這些AI智能體同樣具備瀏覽網(wǎng)頁并與頁面上的菜單、按鈕進(jìn)行交互的能力。
在這些競爭者中,用戶規(guī)模成為一項(xiàng)重要的競爭優(yōu)勢。ChatGPT每周活躍用戶高達(dá)3億,OpenAI去年秋季還宣布其付費(fèi)企業(yè)客戶數(shù)量已突破100萬。這一龐大的用戶基礎(chǔ)為Operator觸及更廣泛的用戶群體提供了顯著優(yōu)勢,相較于部分競爭對(duì)手,這無疑是其核心競爭力之一。不過,OpenAI并未披露訂閱其ChatGPT Pro套餐的具體用戶數(shù)量。
Operator采用了OpenAI最新的AI模型——“計(jì)算機(jī)使用助手”(Computer-Using Agent,簡稱CUA)。該模型融合了GPT-4o的視覺能力和“高級(jí)推理”功能。在過去一年中,公司對(duì)模型的圖像識(shí)別和推理能力取得了顯著進(jìn)展。CUA經(jīng)過特別訓(xùn)練,能夠與網(wǎng)頁上的文本、按鈕及菜單實(shí)現(xiàn)高效交互,為用戶提供更智能化的操作體驗(yàn)。
盡管AI智能體承諾能夠通過執(zhí)行任務(wù)為用戶節(jié)省時(shí)間、提升效率,但其普及仍然面臨諸多挑戰(zhàn)。目前,大多數(shù)用戶尚未在日常生活中廣泛應(yīng)用這些智能體。例如,蘋果去年秋季在iPhone操作系統(tǒng)中推出了AI助手Apple Intelligence,但至今尚未成為完成日常任務(wù)的主要工具。即便是在企業(yè)場景中,大多數(shù)AI智能體也僅處于測試階段或有限應(yīng)用狀態(tài),以降低數(shù)據(jù)泄露和網(wǎng)絡(luò)安全風(fēng)險(xiǎn)。
針對(duì)這一現(xiàn)狀,萊特卡普表示,OpenAI未來可能會(huì)為企業(yè)客戶引入更多控制和保護(hù)措施,但目前的重點(diǎn)是優(yōu)化首批用戶的體驗(yàn)。他強(qiáng)調(diào),Operator已內(nèi)置隱私、安全及控制功能,這些功能能夠確保智能體嚴(yán)格遵循編程指令,同時(shí)最重要的是,讓用戶始終保持對(duì)AI的絕對(duì)掌控權(quán)。
OpenAI指出,Operator可能面臨的濫用風(fēng)險(xiǎn)包括:被用于設(shè)計(jì)欺騙用戶的網(wǎng)站、用戶試圖欺騙AI智能體,以及“提示注入”攻擊。這些攻擊可能引導(dǎo)用戶向惡意網(wǎng)站泄露敏感信息或發(fā)送資金。為應(yīng)對(duì)這些風(fēng)險(xiǎn),Operator配備了名為“接管模式”的功能。在需要輸入支付信息或登錄憑據(jù)時(shí),該功能要求用戶手動(dòng)完成操作。OpenAI表示,在執(zhí)行高風(fēng)險(xiǎn)任務(wù)(如發(fā)送電子郵件)之前,Operator會(huì)主動(dòng)請求用戶確認(rèn)。此外,Operator不會(huì)參與銀行交易或工作申請決策等敏感領(lǐng)域。OpenAI進(jìn)一步強(qiáng)調(diào),Operator在執(zhí)行任務(wù)時(shí),不會(huì)利用用戶此前與ChatGPT共享的數(shù)據(jù),從而保護(hù)用戶隱私。
對(duì)于合作方而言,通過Operator實(shí)現(xiàn)其服務(wù)的便捷訪問,使得它們能夠借助AI智能體的潛力,同時(shí)利用OpenAI龐大的用戶基礎(chǔ),而無需獨(dú)立開發(fā)類似技術(shù)。Instacart首席產(chǎn)品官丹尼爾·丹克(Daniel Danker)明確表示:“我們無意自行開發(fā)AI智能體。”與此同時(shí),Uber首席產(chǎn)品官薩欽·坎薩爾(Sachin Kansal)表示,與OpenAI的合作“為我們提供了引導(dǎo)產(chǎn)品開發(fā)方向的機(jī)會(huì)”。
盡管Operator目前仍存在一些功能限制,但OpenAI在花費(fèi)大量時(shí)間確保產(chǎn)品質(zhì)量后,認(rèn)為Operator已具備有限發(fā)布的條件。