MCP失寵?谷歌重磅開源A2A協(xié)議 實現(xiàn)智能體間的自由“對話” 原創(chuàng)
谷歌云正式宣布推出全新的開源協(xié)議Agent2Agent(A2A),旨在打破當前人工智能(AI)智能體之間的壁壘,實現(xiàn)不同廠商、不同框架構建的AI智能體之間的無縫協(xié)作與信息交換。這一舉措標志著AI領域邁向更加開放、高效和智能的新時代。
打破壁壘,實現(xiàn)智能體間的自由“對話”
隨著企業(yè)對自主AI智能體的部署日益增長,如何讓這些智能體在復雜的企業(yè)環(huán)境中協(xié)同工作,處理跨系統(tǒng)、跨應用的日?;驈碗s任務,成為了提升生產力的關鍵。然而,由于缺乏統(tǒng)一的標準,不同智能體之間往往難以有效溝通和協(xié)作,形成了一個個“信息孤島”。
作為一個開放協(xié)議,A2A為AI智能體之間的通信、安全信息交換和協(xié)同行動提供了一套標準化的方法。無論這些智能體是由哪家供應商開發(fā),采用何種底層技術,只要遵循A2A協(xié)議,就能實現(xiàn)真正的多智能體場景,擺脫了傳統(tǒng)上將智能體局限于單一“工具”的限制。
MCP(模型上下文協(xié)議)用于工具和資源連接:通過結構化輸入/輸出來連接代理與工具、API 和資源。MCP重點在于傳輸?shù)臄?shù)據(jù)類型和傳輸協(xié)議的優(yōu)化,去除function call的生態(tài)隔離;
A2A(代理間通信協(xié)議)用于代理協(xié)作:支持不同代理間的動態(tài)、多模態(tài)通信,無需共享記憶、資源或工具。A2A是model-level server級別的交流,重點在于multi-agent融合的算子結構,通過workflow或者鏈式化組合,以rules驅動multi-agent進行算子化。
Agent2Agent(A2A)旨在讓AI代理之間能夠通信、共享信息,并在多種企業(yè)平臺中協(xié)同操作。A2A補充了Anthropic的模型上下文協(xié)議(MCP),參考了Google在構建大規(guī)模代理系統(tǒng)中的經驗,專為解決企業(yè)部署多代理系統(tǒng)面臨的挑戰(zhàn)而設計。它使開發(fā)者能創(chuàng)建可與任何支持A2A的代理互聯(lián)的系統(tǒng),并為企業(yè)帶來標準化的代理管理方法,助力實現(xiàn)協(xié)作AI的巨大潛力。
按Google的說法,A2A協(xié)議與MCP是互補而不替代關系,A2A負責解決Agent間的通信問題,MCP解決的是Agent與工具間的通信問題。
五大核心設計原則,打造強大可靠的互操作性基礎
A2A協(xié)議在設計之初就秉持了五大關鍵原則,以確保其能夠適應未來復雜多變的AI應用場景:
- 擁抱智能體能力 (Embrace agentic capabilities):A2A側重于使智能體能夠以其自然的、非結構化的方式進行協(xié)作,即使它們不共享內存、工具和上下文也能高效工作。
- 構建于現(xiàn)有標準之上 (Build on existing standards):該協(xié)議基于HTTP、SSE和JSON-RPC等流行的現(xiàn)有標準構建,這大大降低了企業(yè)將其集成到現(xiàn)有IT架構中的難度。
- 默認安全 (Secure by default):A2A在設計上就支持企業(yè)級的身份驗證和授權,其安全性與OpenAPI的身份驗證方案相當。
- 支持長期任務 (Support for long-running tasks):A2A具有高度的靈活性,可以支持從快速任務到需要數(shù)小時甚至數(shù)天才能完成的深度研究等各種場景。在整個過程中,A2A可以向用戶提供實時的反饋、通知和狀態(tài)更新。
- 模態(tài)無關 (Modality agnostic):考慮到智能世界不僅限于文本,A2A還支持包括音頻和視頻流在內的多種模態(tài)。
A2A工作原理
A2A的工作原理是通過促進客戶端Agent和遠程Agent之間的通信來實現(xiàn)的。客戶端Agent負責制定和傳達任務,而遠程Agent則根據(jù)這些任務采取行動,以提供正確的信息或執(zhí)行相應的操作。在這個過程中,A2A協(xié)議有以下幾個關鍵能力。
首先,Agent可以通過“Agent卡”來宣傳它們的能力。這些“Agent卡”是以JSON格式存在的,它們能夠讓客戶端Agent識別出哪個遠程Agent最適合執(zhí)行特定的任務。一旦確定了合適的遠程Agent,客戶端Agent就可以利用A2A協(xié)議與之進行通信,將任務分配給它。
然后,任務管理是A2A協(xié)議中的一個重要環(huán)節(jié)。客戶端和遠程Agent之間的通信都是圍繞完成任務展開的。協(xié)議定義了一個“任務”對象,這個對象具有自己的生命周期。
對于一些簡單的任務,可能可以立即完成;而對于一些復雜的、長期的任務,Agent們可以相互溝通,以保持對任務完成狀態(tài)的同步。當任務完成時,其輸出被稱為“工件”。
最后,A2A還具備用戶體驗協(xié)商的功能。每條消息都包含“部分”,這些部分是完整的內容片段,例如,生成的圖像。
每個部分都有指定的內容類型,這使得客戶端和遠程Agent能夠協(xié)商所需的正確格式,并且明確包括用戶界面能力的協(xié)商,比如iframe、視頻、網絡表單等。這樣,A2A就能夠根據(jù)用戶的需求和設備的能力,提供最佳的用戶體驗。
A2A實現(xiàn)客戶端代理與遠程代理之間的任務通信:前者負責發(fā)起任務,后者負責執(zhí)行任務。核心能力包括:
- 能力發(fā)現(xiàn):通過 JSON 格式的“代理卡片”公開功能,便于選擇合適的代理協(xié)作。
- 任務管理:圍繞任務對象協(xié)作,支持即時或長時間運行任務,輸出結果稱為“工件”。
- 協(xié)作通信:代理可交換上下文、回復、工件及用戶指令等信息。
- 體驗協(xié)商:消息由多個“部分”組成,支持多種內容類型,便于適配用戶界面能。
A2A 的本質:
1??將 MCP 的核心原則(能力描述而非顯式指令)應用和擴展到了 AI 智能體 (Agent) 之間的交互。
2??關注點: 不僅僅是智能體如何使用“工具”,更是智能體之間如何相互發(fā)現(xiàn) (discovering each other)、理解彼此的能力,并自主協(xié)商如何協(xié)作 (how they collaborate)。
A2A的挑戰(zhàn):
1??狀態(tài)管理 : 在多智能體系統(tǒng)中保持狀態(tài)一致性、處理沖突和部分失敗很復雜。
2??推理成本 : 智能體每次協(xié)商交互都需要消耗計算資源、Token 和時間,在多智能體系統(tǒng)中成本會累積,需要高效的優(yōu)化策略。
3??安全性 : 智能體間交互引入了新的漏洞層面,需要強大的認證、授權、審計追蹤等機制,且不能破壞系統(tǒng)的靈活性。
4??構建難度: 目前用 MCP 和 A2A 構建規(guī)?;⒖煽康南到y(tǒng)仍具挑戰(zhàn)。
通過 A2A 協(xié)作,招聘軟件工程師的流程可大大簡化。在像 Agentspace 這樣統(tǒng)一的界面中,用戶(如招聘經理)可以指派自己的代理,根據(jù)職位描述、地點和技能要求尋找候選人。該代理會與其他專業(yè)代理協(xié)作,獲取合適人選。用戶收到推薦后,可進一步指示代理安排面試,從而簡化人才篩選流程。面試結束后,還可調用其他代理完成背景調查。這只是 AI 代理跨系統(tǒng)協(xié)作以招聘合格候選人的一個典型例子。
https://github.com/google/A2A
A2A協(xié)議的發(fā)布得到了超過50家技術合作伙伴和領先服務提供商的支持與貢獻。其中包括Atlassian、Box、Cohere、Intuit、Langchain、MongoDB、PayPal、Salesforce、SAP、ServiceNow、UKG和Workday等技術巨頭,以及Accenture、BCG、Capgemini、Deloitte、KPMG和PwC等知名咨詢公司。眾多合作伙伴紛紛表示,A2A協(xié)議將有助于推動AI在企業(yè)中的更廣泛應用,實現(xiàn)更高效、更智能的工作流程。
本文轉載自公眾號數(shù)字化助推器 作者:天涯咫尺TGH
原文鏈接:??https://mp.weixin.qq.com/s/Q4vUL7wfMDjcE_O_cf6BMQ??
