自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

Agent不會(huì)在2025爆發(fā) 原創(chuàng)

發(fā)布于 2025-4-7 13:17
瀏覽
0收藏

作者 | 云昭

大模型已經(jīng)在聚光燈下狂奔了28個(gè)月,時(shí)至今日,Agent已經(jīng)被成為了包括黃仁勛、奧特曼、李彥宏、周鴻祎、吳泳銘等一眾科技大佬在內(nèi)備受期待的2025爆發(fā)品。

可正如不久前“朱嘯虎不太看好機(jī)器人賽道”一般,Agent賽道同樣也存在著一場(chǎng)泡沫之下的非共識(shí)。

1.巨頭爭(zhēng)相較量,市場(chǎng)異常冷談

我們先從企業(yè)內(nèi)部的Agent來(lái)看下。

進(jìn)入去年下半年以來(lái),大洋兩岸的軟件巨頭對(duì)AI Agent的投入越發(fā)顯得激進(jìn)。2024年9月,全球SaaS巨頭Salesforce發(fā)布了“數(shù)字員工平臺(tái)”Agentforce,創(chuàng)始人Benioff異常激進(jìn)地押注Agent,甚至對(duì)銷售團(tuán)隊(duì)下達(dá)了“死命令”:銷售人員必須在每一筆訂單中將Agentforce打包賣(mài)給客戶。12月,Benioff更是揚(yáng)言要再招2000名銷售為這款產(chǎn)品繼續(xù)拓寬市場(chǎng)。

微軟緊隨其后,首席執(zhí)行官Nadella在去年10月一口氣發(fā)布了10款A(yù)gent,用于企業(yè)銷售、運(yùn)營(yíng)和服務(wù),加劇了SaaS行業(yè)的Agent之爭(zhēng)。副總裁Bryan當(dāng)時(shí)更是表示:這些Agent可以被視為AI時(shí)代真正的應(yīng)用程序。

像Salesforce和微軟的巨頭對(duì)Agent的態(tài)度尚且如此,更不用說(shuō)尋求轉(zhuǎn)型突破的中小企業(yè)。

但投入是一回事,市場(chǎng)買(mǎi)不買(mǎi)單則是另外一回事。據(jù)一些已經(jīng)測(cè)試過(guò)Agentforce的客戶反饋,目前依舊沒(méi)有大規(guī)模使用該技術(shù),原因在于這款產(chǎn)品還不夠成熟,尚存在準(zhǔn)確性等問(wèn)題。另一位客戶則表示,對(duì)于任何一款新軟件,他們通常需要12到18個(gè)月才能從試用過(guò)渡到在關(guān)鍵業(yè)務(wù)系統(tǒng)中運(yùn)行。

此外,拋卻客戶因?yàn)樾阅軉?wèn)題而導(dǎo)致的冷淡態(tài)度不說(shuō),事實(shí)上老板本身為Agent付費(fèi)的意愿也要打一個(gè)大大的問(wèn)號(hào)。如今的Agent很難直接減少人工,更多還是為個(gè)人生產(chǎn)力服務(wù)的,但付費(fèi)的卻成了企業(yè)決策者,讓老板為員工購(gòu)買(mǎi)生產(chǎn)力這件事本身就像是個(gè)悖論。

在收費(fèi)這一點(diǎn)上,國(guó)內(nèi)的釘釘則比較克制,雖然開(kāi)放了Agent功能的產(chǎn)品,但依舊供企業(yè)免費(fèi)使用。

2.逃不開(kāi)的C端套殼爭(zhēng)議

B端Agent難以破圈,那么C端的呢?的確近兩年有不少出圈的C端或D端(developer)的Agent應(yīng)用,Manus和Devin都在此列。不過(guò)可惜的是,短期爆火之后很快就消失在大眾視野之外。

在外界看來(lái),Devin和Manus的市場(chǎng)教育意義更大些。Devin帶火了AI編程賽道,而Manus則證明了一種通用Agent實(shí)現(xiàn)的方式:多Agent模式,同時(shí)讓Anthropic去年提出的用于AI應(yīng)用開(kāi)發(fā)的模型上下文協(xié)議MCP再次出圈。

幾天前,51CTO采訪了多位在負(fù)責(zé)AI產(chǎn)品開(kāi)發(fā)的一線負(fù)責(zé)人,他們更多還是把目光投向了大模型廠商內(nèi)部推出的Agent。在他們看來(lái),OpenAI今年年初推出的兩款A(yù)gent堪稱業(yè)內(nèi)樣板,更能代表業(yè)界Agent發(fā)展的現(xiàn)狀。這兩款分別是Operator,DeepResearch。

這兩款分別代表了兩個(gè)方向——前者代表了Computer use,在自動(dòng)化、負(fù)責(zé)真實(shí)世界執(zhí)行,而后者則為Knowledge research打了個(gè)好樣,旨在智能化、負(fù)責(zé)異步信息的推理。

這其實(shí)也是OpenAI打造Agent的路線圖:前者執(zhí)行、后者思考,結(jié)合起來(lái)實(shí)現(xiàn) OpenAI 對(duì) Agent 的定位:獨(dú)立執(zhí)行復(fù)雜任務(wù)。

一些圈內(nèi)創(chuàng)業(yè)者、投資人表示,許多Agent不過(guò)是公式化套了GPTs的殼,補(bǔ)上了一些交互設(shè)計(jì),預(yù)設(shè)了一些開(kāi)放接口作為tools。這些看起來(lái)像個(gè)“產(chǎn)品”,但實(shí)際上并不具備真正解決問(wèn)題的能力。

“現(xiàn)在市面上個(gè)人搭建的Agent,或許勉強(qiáng)能用,但能完成任務(wù)的復(fù)雜度和可控性都極為有限,遠(yuǎn)不如大模型廠商直接提供的場(chǎng)景化產(chǎn)品好用?!?/p>

3.Agent是未來(lái),但還遠(yuǎn)不夠成熟

Agent本身定位是完成復(fù)雜任務(wù),但現(xiàn)下看,先從簡(jiǎn)單場(chǎng)景開(kāi)始,也是無(wú)奈之舉。專注于AI應(yīng)用開(kāi)發(fā)的開(kāi)源框架提供商LangChain的一份調(diào)查報(bào)告顯示:人們?cè)陂L(zhǎng)耗時(shí)任務(wù)中對(duì)AI Agent有較大需求,但同時(shí),用戶對(duì)AI Agent普遍存在“完成質(zhì)量”或“可靠性”方面的擔(dān)憂,AI Agent在復(fù)雜場(chǎng)景中并不一定能夠持續(xù)保持響應(yīng)和問(wèn)題解決路徑的準(zhǔn)確性,因此有一半以上的受訪者在實(shí)際使用中會(huì)為AI Agent補(bǔ)充跟蹤和觀察的控件。

上個(gè)月 Perplexity 首席執(zhí)行官 Aravind 在采訪中表示:“目前任何人聲稱 2025 年的Agents可以完全投入使用,都應(yīng)該持懷疑態(tài)度。但我們正在嘗試找出一些可以率先落地的簡(jiǎn)單場(chǎng)景,比如讓用戶購(gòu)買(mǎi)商品時(shí)無(wú)需手動(dòng)輸入信用卡信息和收貨地址等。這類簡(jiǎn)單的工作流程。”

當(dāng)然Agent不成熟還在于應(yīng)用控制的生態(tài)上并不完善。比如Aravind就指出,目前沒(méi)有其他方式能讓 AI 代理同時(shí)控制多個(gè)應(yīng)用,尤其是在 iOS 上,甚至無(wú)法訪問(wèn)其他應(yīng)用,這是蘋(píng)果生態(tài)的限制。而我們不想受制于蘋(píng)果的規(guī)則,所以需要尋找一個(gè)變通的方法。在短期內(nèi),瀏覽器是一個(gè)非常好的解決方案。

更關(guān)鍵的是,拋卻一些營(yíng)銷意味頗重、令人印象深刻的Demo演示,Agent的準(zhǔn)確性還遠(yuǎn)未能適合用于生產(chǎn)環(huán)境。

即便強(qiáng)如OpenAI 的 Operator,其計(jì)算機(jī)使用和網(wǎng)絡(luò)瀏覽器的準(zhǔn)確性也只達(dá)到了30%到50%,但仍然低于人類能力的70%以上。

Agent不會(huì)在2025爆發(fā)-AI.x社區(qū)圖源:OpenAI

同樣,Claude 的AI代理計(jì)算機(jī)界面(ACI)的性能僅相當(dāng)于人類表現(xiàn)的14%。

下面這張來(lái)自TheAgentFactory的圖表顯示了AI Agent在成本、步驟和成功率方面的現(xiàn)狀。注意成功率大約只有20%。這些數(shù)據(jù)是當(dāng)前情況的嚴(yán)峻現(xiàn)實(shí)。

Agent不會(huì)在2025爆發(fā)-AI.x社區(qū)來(lái)源:TheAgentFactory

除此之外,在安全性方面也有一些明顯的漏洞,比如一些研究表明,Agent在進(jìn)行網(wǎng)絡(luò)瀏覽時(shí)容易受到惡意彈窗的攻擊等等。

最后就是Agent的開(kāi)發(fā)成本問(wèn)題。比如:假如市面上一些Agent需要使用操作系統(tǒng)的圖形用戶界面作為API,這樣每個(gè)Agent集成的開(kāi)銷太大;又或者在回答復(fù)雜問(wèn)題和從多個(gè)文檔中綜合信息時(shí)同樣也面臨著不小的挑戰(zhàn),這也是OpenAI 將 DeepResearch為什么定價(jià)如此昂貴的原因之一。

4.2025,Agent局部爆發(fā)有可能嗎

從上面可以看出,現(xiàn)在Agent依舊處于早期炒作與探索階段。國(guó)內(nèi)我們看到有一些不錯(cuò)的產(chǎn)品形態(tài),比如阿里推出的夸克“超級(jí)框”,阿里智能信息事業(yè)群總裁吳嘉表示,“超級(jí)框”不是ChatBot或搜索,而是直接交付結(jié)果的“超級(jí)Agent”——用戶在“框”中表達(dá)意圖,AI會(huì)調(diào)用工具與方法來(lái)幫你寫(xiě)一份工作報(bào)告、旅游計(jì)劃,或是一份就醫(yī)指南。

不過(guò)國(guó)內(nèi)大廠對(duì)于Agent的推動(dòng)顯然更為克制。據(jù)悉目前夸克方面暫未嘗試重投入,因此在Agent模式上,暫時(shí)處于阿里自有工具調(diào)用的早期形式,未接入增加更多算力耗費(fèi)與技術(shù)復(fù)雜性的中間調(diào)優(yōu)與反饋。

再比如,我們了解到字節(jié)跳動(dòng)Dev Infra團(tuán)隊(duì)內(nèi)部已開(kāi)發(fā)出一款功能類似Manus的智能體產(chǎn)品,名為Dev Agent,主要通過(guò)集成內(nèi)網(wǎng)知識(shí)庫(kù)與多種內(nèi)部工具實(shí)現(xiàn)調(diào)研、開(kāi)發(fā)、數(shù)據(jù)分析等任務(wù)。不過(guò),Dev Agent是一款實(shí)驗(yàn)性質(zhì)的內(nèi)部工具,僅面向開(kāi)發(fā)部門(mén)內(nèi)測(cè)使用。

而在大模型六小虎中,智譜對(duì)于Agent的方面走得更激進(jìn)一些,積累許多前沿的Agent研究成果。就在剛剛過(guò)去的3月底,智譜在中關(guān)村論壇上發(fā)布了深度研究與操作能力并重的AutoGLM沉思,尤其在瀏覽器的使用,手機(jī)和電腦在內(nèi)的工具使用能力全面的處于領(lǐng)先地位。

不過(guò),問(wèn)題的癥結(jié)在于,Agent能力的提升本身依賴于大模型的進(jìn)化。Agent的可行領(lǐng)域?qū)?huì)是垂直領(lǐng)域而非通用。

MetaGPT核心貢獻(xiàn)者徐宗澤認(rèn)為通用Agent大概率是一個(gè)偽命題。知乎直答產(chǎn)品負(fù)責(zé)人馬奎則在采訪中表示「通用模型+專用 Agent」會(huì)是更可行的方案。

一位AI Infra創(chuàng)始人認(rèn)為,Agent目前的瓶頸有三點(diǎn):一在某些非垂直領(lǐng)域,Agent 的模型本身做得還不夠好,對(duì)于與物理世界的交互,雖然在分析方面表現(xiàn)還不錯(cuò),但實(shí)際的交互能力還需要進(jìn)一步提升;其二,算力成本相對(duì)較高,這導(dǎo)致有些應(yīng)用其實(shí)很難實(shí)現(xiàn),因?yàn)槌杀竞怂悴贿^(guò)來(lái)。第三個(gè)問(wèn)題是不同場(chǎng)景之間的壁壘,主要是數(shù)據(jù)集的問(wèn)題。因?yàn)楸旧頂?shù)據(jù)是私有的。只有把這些數(shù)據(jù)全部打通,才能用 Agent 的方式把它們整合起來(lái),為你提供所需的服務(wù),但這方面客戶的意愿度并不高。

不過(guò)他同時(shí)釋放了Agent在局部范圍內(nèi)的樂(lè)觀信號(hào)。首先,在技術(shù)可靠性方面,即使在物理世界的交互上表現(xiàn)不夠好,或者數(shù)學(xué)運(yùn)算還不夠精準(zhǔn),但在語(yǔ)言推理方面已經(jīng)可以做得很好了。它可以輔助一些Action,比如幫你制作 PPT,或者自媒體的內(nèi)容生成等已經(jīng)可以落地,這是已經(jīng)突破的部分。

其次,成本在持下降。DeepSeek的出現(xiàn)讓大模型的ROI得到了很大的提升。許多算力公司都在持續(xù)對(duì)它進(jìn)行優(yōu)化,包括內(nèi)存優(yōu)化、成本優(yōu)化、硬件優(yōu)化、模型優(yōu)化,讓 token 成本持續(xù)下降。而且,這些事實(shí)上都可以用更低精度或者更便宜的方式去提供解決方案,讓產(chǎn)品真正落地,成本核算得過(guò)去,就能真正實(shí)現(xiàn)應(yīng)用。

第三,場(chǎng)景方面。不同垂直領(lǐng)域擁有大量私有數(shù)據(jù)的公司,可以開(kāi)發(fā)出特定領(lǐng)域的語(yǔ)言模型,以及不同領(lǐng)域的Agent。

5.寫(xiě)在最后:Agent注定是場(chǎng)馬拉松

就如同微軟、Salesforce一樣,很多企業(yè)都認(rèn)為轉(zhuǎn)型Agent是一個(gè)不可逆的趨勢(shì),同時(shí)Agent也會(huì)帶來(lái)不同的運(yùn)營(yíng)和價(jià)值創(chuàng)造的方式。

然而,正如前文所說(shuō),面對(duì)全球數(shù)百家聲稱提供“AI Agent”的供應(yīng)商,現(xiàn)在無(wú)論是在供應(yīng)側(cè)側(cè)還是使用側(cè)都存在相當(dāng)程度的炒作。我們需要從長(zhǎng)遠(yuǎn)的角度去看待Agent的演進(jìn),它是一場(chǎng)馬拉松,而非短跑沖刺。

技術(shù)可靠性、研發(fā)與使用成本、安全問(wèn)題、數(shù)據(jù)隱私等問(wèn)題都如同這場(chǎng)馬拉松上需要攻克的關(guān)隘,也不止是“創(chuàng)建一個(gè)可自動(dòng)化的任務(wù)列表并測(cè)試Agent是否可以完成基準(zhǔn)任務(wù)”僅此而已,Agent距離創(chuàng)造實(shí)際的生產(chǎn)價(jià)值,還有很長(zhǎng)的路要走。

可喜的是,隨著國(guó)內(nèi)外各大科技企業(yè)的投入,Agent成熟的路徑已然清晰起來(lái):大模型是能力基座,以O(shè)perator的執(zhí)行和以DeepResearch為代表的復(fù)雜推理依舊將是今年的主旋律。

參考來(lái)源:

??https://cobusgreyling.medium.com/why-the-focus-has-shifted-from-ai-agents-to-agentic-workflows-51e4078d03c2??

??https://hub.baai.ac.cn/view/40485??

??https://fund.eastmoney.com/a/202503263356649497.html??

本文轉(zhuǎn)載自??51CTO技術(shù)棧??,作者:云昭

?著作權(quán)歸作者所有,如需轉(zhuǎn)載,請(qǐng)注明出處,否則將追究法律責(zé)任
標(biāo)簽
收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦
社區(qū)精華內(nèi)容

目錄