“谷歌版 MCP”來了!重磅開源 A2A 智能體交互新架構(gòu) 原創(chuàng)
谷歌推出了 A2A 協(xié)議,即 Agent-to-Agent,這項協(xié)議使得 AI Agent 智能體能夠在不同的生態(tài)系統(tǒng)中安全地進行協(xié)作,無需考慮框架或供應(yīng)商的差異。
不同平臺構(gòu)建的 AI Agent 智能體之間可以實現(xiàn)通信、發(fā)現(xiàn)彼此的能力、協(xié)商任務(wù)并開展合作,企業(yè)可以通過專業(yè)的智能體團隊處理復(fù)雜的工作流程。
重點:它是開源的。
Github 地址:https://github.com/google/A2A
不多說,讓我們先來看一個演示。
利用 A2A 協(xié)議,招聘流程可以如此高效:
在谷歌的 Agentspace 統(tǒng)一界面中,招聘經(jīng)理可以向自己的智能體下達任務(wù),讓其尋找與職位描述、工作地點和技能要求相匹配的候選人。
然后,該智能體立即與其他專業(yè)智能體展開互動,尋找潛在候選人。
用戶會收到推薦人選,之后可以指示自己的智能體安排進一步的面試,面試環(huán)節(jié)結(jié)束后,還可以啟動另一個智能體來協(xié)助進行背景調(diào)查。
MCP 架構(gòu)設(shè)計與 A2A 架構(gòu)設(shè)計區(qū)別與聯(lián)系剖析
盡管市面上的大語言模型(LLMs)種類繁多,但大家在使用時其實都是通過 API 來與大模型交互的。這些大模型的接口通常遵循一些通用的規(guī)范,比如: OpenAI 的標準。下面,我們就以 OpenAI 接口為例,來聊聊這些大模型都有哪些能力。
因此 Google 提出了一個新的 A2A(Agent-to-Agent) 協(xié)議概念。與此同時,MCP(Model Context Protocol) 也在逐步成為連接 LLM 與外部世界的標準。
那么,A2A 究竟是什么?它和 MCP 有什么不同?它們之間又是什么關(guān)系?對于我們 AI 學習者來說,理解這些協(xié)議對于把握 AI Agent 的發(fā)展方向至關(guān)重要。今天,就讓我們結(jié)合 Google 的官方發(fā)布的信息,一起來深入了解一下。
1、為什么我們需要協(xié)議?
首先,我們要明白協(xié)議的重要性。無論是人類社會還是計算機世界,標準化的協(xié)議都是實現(xiàn)高效溝通和協(xié)作的基礎(chǔ)。在 AI Agent 的世界里,協(xié)議主要解決兩大互聯(lián)領(lǐng)域的挑戰(zhàn):
第一、Agent 與 Tools(工具)的交互
Agent 需要調(diào)用外部 API、訪問數(shù)據(jù)庫、執(zhí)行代碼等。
第二、Agent 與 Agent(其他智能體或用戶)的交互
Agent 需要理解其他 Agent 的意圖、協(xié)同完成任務(wù)、與用戶進行自然的對話。
標準化的協(xié)議能夠大大降低不同系統(tǒng)、模型、框架之間集成的復(fù)雜度,促進整個生態(tài)的繁榮。
2、MCP:連接模型與世界的橋梁
在我們探索 A2A 之前,讓我們先回顧一下大家可能已經(jīng)熟悉的 MCP(Model Context Protocol)。
定義:MCP 是一個新興的開放標準,它的目的是將大語言模型(LLMs)與各種數(shù)據(jù)源、資源和工具連接起來。
核心作用:MCP 的核心作用是標準化模型與外部工具進行“函數(shù)調(diào)用”(Function Calling)等交互的方式。你可以把它想象成一個為大模型提供的標準化接口集,使大模型能夠識別可用的工具,并了解如何利用這些工具。
關(guān)注點:MCP 主要關(guān)注智能體(Agent)如何高效地利用結(jié)構(gòu)化的工具和數(shù)據(jù)來完成特定的任務(wù)。
3、A2A:開啟 Agent 間自然協(xié)作的大門
讓我們深入了解一下 A2A(Agent-to-Agent)協(xié)議。
定義:A2A 是一種應(yīng)用層協(xié)議,其設(shè)計目的是使智能體(Agent)能夠以一種自然的模態(tài)進行協(xié)作,類似于人與人之間的互動。
核心作用:A2A 專注于智能體之間的溝通與合作,以及智能體與用戶之間的互動。它旨在使智能體能夠像人類一樣交流,傳遞意圖、協(xié)商任務(wù)和共享信息。
關(guān)注點:A2A 的重點在于智能體作為“智能體”進行互動的能力,而不僅僅是作為工具的執(zhí)行者。
示例:
用戶與智能體的互動:用戶(或代表用戶的智能體)可以像與真人交談一樣對修理店智能體說:“給我看看左前輪的照片,似乎漏液了,這種情況多久了?” A2A 協(xié)議使得這種更自然、多輪次的對話式互動成為可能。
智能體之間的互動:修理店智能體在診斷出問題后,可能需要向零件供應(yīng)商智能體查詢某個零件的庫存和價格。這種智能體之間的協(xié)作同樣需要 A2A 協(xié)議來支持。
4、A2A 與 MCP 的關(guān)鍵區(qū)別
根據(jù)上述內(nèi)容,我們可以概括出 A2A 和 MCP 之間的主要區(qū)別:
關(guān)注點的差異:
MCP:側(cè)重于智能體(Agent)與工具/資源之間的交互,強調(diào)的是結(jié)構(gòu)化的調(diào)用和數(shù)據(jù)獲取。
A2A:側(cè)重于智能體與智能體/用戶之間的互動,強調(diào)的是更自然、更靈活的協(xié)作方式。
解決的問題的差異:
MCP:旨在解決如何讓大語言模型(LLM)或智能體以標準化的方式使用外部工具和數(shù)據(jù)的問題。
A2A:旨在解決如何使不同的智能體能夠像人類一樣相互理解和協(xié)作的問題。
5、相輔相成而非取而代之:A2A 與 MCP 的協(xié)同效應(yīng)
需要明確的是,A2A 與 MCP 并非相互排斥,而是相輔相成的關(guān)系。在構(gòu)建復(fù)雜的智能體(Agent)應(yīng)用時,這兩種協(xié)議往往會被同時采用。
下圖展示了一個典型的“智能體應(yīng)用”架構(gòu):
第一、核心智能體(可能包含子智能體)是基于智能體框架和大語言模型(LLM)構(gòu)建的。
第二、當智能體需要與外部的黑箱智能體(例如,Blackbox Agent 1, Blackbox Agent 2)進行協(xié)作溝通時,它會利用 A2A 協(xié)議。
第三、當智能體需要訪問結(jié)構(gòu)化的資源、工具或數(shù)據(jù)時(例如,通過一個集中的 MCP 服務(wù)器),它會遵循 MCP 協(xié)議。
第四、甚至外部智能體(比如 Blackbox Agent 2)也可能通過 MCP 獲取有關(guān)核心智能體的信息(如圖中的"Get agent card"操作)。
這個架構(gòu)清楚地表明,智能體既需要 MCP 來“使用工具、獲取資源”,也需要 A2A 來“與其他智能體對話、協(xié)作”。
6、對 AI 學習者來說意味著什么?
對于 AI 學習者而言,理解 A2A 和 MCP 的概念及其相互關(guān)系具有重要意義:
第一、掌握前沿趨勢:了解這些協(xié)議有助于我們把握 AI Agent 領(lǐng)域為實現(xiàn)更強的自主性和協(xié)作性所做的最新努力。
第二、系統(tǒng)設(shè)計視角:在規(guī)劃或設(shè)計未來的 AI 應(yīng)用時,能夠從協(xié)議層面思考如何集成不同的 Agent 和工具,從而構(gòu)建更為復(fù)雜的系統(tǒng)。
第三、技術(shù)選型參考:當面對不同的 Agent 框架或平臺時,可以關(guān)注它們是否支持或兼容類似 MCP 或 A2A 的協(xié)議,這可能會影響它們的互操作性和擴展性。
此外,谷歌已經(jīng)與超過 50 家技術(shù)合作伙伴(例如 Atlassian、Box、Salesforce、SAP 等)和服務(wù)提供商建立了合作關(guān)系。這表明了行業(yè)對這些協(xié)議的認可和采用,對于 AI 學習者來說,也意味著這些協(xié)議可能會成為未來職業(yè)發(fā)展中的關(guān)鍵技能。
7、總結(jié)
A2A 和 MCP 是推動 AI 智能體(Agent)實現(xiàn)更高級互操作性的兩個關(guān)鍵協(xié)議。MCP 專注于智能體與工具或資源的連接,標準化了函數(shù)調(diào)用過程;相對地,A2A 專注于智能體之間的自然協(xié)作和交流。這兩個協(xié)議相輔相成,共同構(gòu)成了未來復(fù)雜智能體應(yīng)用的基礎(chǔ)設(shè)施。
對于 AI 學習者來說,持續(xù)關(guān)注并理解這些協(xié)議的發(fā)展至關(guān)重要。這將幫助我們更好地掌握 AI 智能體技術(shù)的趨勢,參與創(chuàng)造下一代智能應(yīng)用程序。
本文轉(zhuǎn)載自公眾號玄姐聊AGI 作者:玄姐
原文鏈接:??https://mp.weixin.qq.com/s/af7cTCx0dr2cp_lEres_NQ??
