“谷歌版MCP”來(lái)了!開(kāi)源A2A,不同廠(chǎng)商Agent也能協(xié)作
剛剛,“谷歌版MCP”來(lái)了!
谷歌推出A2A協(xié)議,即Agent2Agent,能讓AI Agent在不同生態(tài)系統(tǒng)間安全協(xié)作,而無(wú)需考慮框架或供應(yīng)商。
不同平臺(tái)構(gòu)建的AI Agent之間可以進(jìn)行通信、發(fā)現(xiàn)彼此的能力、協(xié)商任務(wù)并開(kāi)展協(xié)作,企業(yè)可通過(guò)專(zhuān)業(yè)Agent團(tuán)隊(duì)處理復(fù)雜工作流。
重點(diǎn):開(kāi)源的。
圖片
話(huà)不多說(shuō),先來(lái)看一個(gè)展示。
借助A2A協(xié)議,招聘這件事兒還能這么玩:
在谷歌Agentspace統(tǒng)一界面中,招聘經(jīng)理可以向自己的Agent下達(dá)任務(wù),讓其尋找與職位描述、工作地點(diǎn)和技能要求相匹配的候選人。
然后,該Agent立馬與其它專(zhuān)業(yè)Agent展開(kāi)交互,尋找潛在候選人。
用戶(hù)會(huì)收到推薦人選,之后可指示自己的Agent安排進(jìn)一步的面試,面試環(huán)節(jié)結(jié)束后,還可以啟用另一個(gè)Agent來(lái)協(xié)助進(jìn)行背調(diào)。
總結(jié)來(lái)說(shuō),A2A遵循五大設(shè)計(jì)原則:
1)發(fā)揮Agent的能力:專(zhuān)注于讓Agent以自然非結(jié)構(gòu)化的模式進(jìn)行協(xié)作,即使它們之間沒(méi)有共享內(nèi)存/工具/上下文信息,致力于實(shí)現(xiàn)真正的Agent多場(chǎng)景,不會(huì)將某個(gè)Agent局限為一種“工具”。
2)基于現(xiàn)有標(biāo)準(zhǔn)構(gòu)建:該協(xié)議是在包括HTTP、SSE、JSON-RPC等現(xiàn)有常用標(biāo)準(zhǔn)基礎(chǔ)上構(gòu)建的,更容易與企業(yè)日常使用的現(xiàn)有信息技術(shù)堆棧相集成。
3)默認(rèn)安全:支持企業(yè)級(jí)身份驗(yàn)證和授權(quán),在推出時(shí)其安全性符合OpenAPI級(jí)別的認(rèn)證標(biāo)準(zhǔn)。
4)持長(zhǎng)時(shí)間運(yùn)行的任務(wù):各種場(chǎng)景A2A都能應(yīng)對(duì),包括從快速完成的任務(wù),到那些可能需數(shù)小時(shí)甚至數(shù)天才能完成的深入研究任務(wù)。整個(gè)過(guò)程中,A2A可為用戶(hù)提供實(shí)時(shí)反饋、通知以及狀態(tài)更新。
5)模態(tài)無(wú)關(guān):支持包括音頻、視頻等在內(nèi)的各種模態(tài)。
據(jù)了解,A2A已經(jīng)得到了包括Atlassian、Box、Cohere、Intuit、Langchain、埃森哲、BCG、Capgemini、Cognizant等在內(nèi)的50多家技術(shù)合作伙伴和服務(wù)提供商的支持。
圖片
擁有四大能力
一張圖來(lái)看A2A如何工作。
圖片
“客戶(hù)端”Agent與“遠(yuǎn)程”Agent之間進(jìn)行通信,客戶(hù)端Agent負(fù)責(zé)制定和傳達(dá)任務(wù),遠(yuǎn)程Agent則負(fù)責(zé)執(zhí)行這些任務(wù),或是提供正確信息,或是采取正確行動(dòng)。
這種交互涉及到幾個(gè)關(guān)鍵能力。
首先是能力發(fā)現(xiàn),Agent可以使用JSON格式的“Agent Card”來(lái)展示自身的能力。因此,客戶(hù)端Agent能夠識(shí)別出最適合執(zhí)行某項(xiàng)任務(wù)的Agent,利用A2A協(xié)議與遠(yuǎn)程Agent進(jìn)行通信。
其次是任務(wù)管理,客戶(hù)端Agent與遠(yuǎn)程Agent之間的通信以任務(wù)完成為導(dǎo)向,Agent協(xié)同工作滿(mǎn)足終端用戶(hù)的請(qǐng)求。
此“任務(wù)”對(duì)象由協(xié)議定義,并且具有一個(gè)生命周期。它可以立即完成,或者對(duì)于長(zhǎng)時(shí)間運(yùn)行的任務(wù),每個(gè)Agent可以相互通信,對(duì)任務(wù)完成的最新?tīng)顟B(tài)保持同步。任務(wù)的輸出稱(chēng)為“artifact(工件)”。
另外是協(xié)作,Agent之間可以相互發(fā)送消息,交流上下文信息、回復(fù)內(nèi)容、artifacts或用戶(hù)指令。
最后是用戶(hù)體驗(yàn)協(xié)商,每條消息都包含“部分”,這是一個(gè)完整的內(nèi)容片段,如生成的圖像。每個(gè)部分都有指定的內(nèi)容類(lèi)型,允許客戶(hù)端Agent和遠(yuǎn)程Agent協(xié)商所需的正確格式,并明確包括對(duì)用戶(hù)UI功能的協(xié)商,例如iframe、視頻、網(wǎng)頁(yè)表單等等。
除此之外,谷歌還解釋道,A2A是MCP的補(bǔ)充。
MCP為Agent提供了實(shí)用的工具和上下文背景信息,A2A協(xié)議解決客戶(hù)部署大規(guī)模多Agent系統(tǒng)時(shí)所發(fā)現(xiàn)的問(wèn)題。
關(guān)鍵是,企業(yè)能從一種標(biāo)準(zhǔn)化的方法中受益,管理他們?cè)诟鞣N平臺(tái)和云環(huán)境中的Agent。這種通用互操作性對(duì)于充分發(fā)揮協(xié)作型AI Agent的潛力至關(guān)重要。
A2A發(fā)布后網(wǎng)友們也將其與MCP進(jìn)行了比較,看下面這張圖就更明了了:
MCP有助于連接各種工具和資源,A2A則有助于A(yíng)gent之間進(jìn)行通信。
圖片
值得一提的是,谷歌DeepMind聯(lián)合創(chuàng)始人兼CEO哈薩比斯還專(zhuān)門(mén)發(fā)了一條推文稱(chēng):
MCP是一個(gè)出色的協(xié)議,并且它正迅速成為AI Agent時(shí)代的一項(xiàng)開(kāi)放標(biāo)準(zhǔn)。我們非常高興地宣布,我們將為自家的 Gemini模型和SDK提供對(duì)該協(xié)議的支持。期待能與MCP團(tuán)隊(duì)以及行業(yè)內(nèi)的其他各方進(jìn)一步共同開(kāi)發(fā)完善該協(xié)議。
圖片