AI Agent大變天!谷歌開源A2A,一夜改變智能體交互 精華
昨晚,谷歌在Google Cloud Next 25大會上,開源了首個標(biāo)準(zhǔn)智能體交互協(xié)議——Agent2Agent Protocol(簡稱A2A)。
A2A將徹底打破系統(tǒng)孤島,對智能體的能力、跨平臺、執(zhí)行效率產(chǎn)生質(zhì)的改變,支持Atlassian、Box、Cohere、Intuit、Langchain、MongoDB、PayPal、Salesforce、SAP、ServiceNow、UKG和Workday等主流企業(yè)應(yīng)用平臺。
簡單來說,這個A2A交互協(xié)議有點當(dāng)年谷歌牽頭80多家企業(yè)搞安卓系統(tǒng)的味道,因為首批就有50多家著名企業(yè)加入。隨著加入的企業(yè)越來越多,會極大提升A2A的商業(yè)價值以及推動整個智能體生態(tài)的快速發(fā)展。
開源地址:https://github.com/google/A2A
在本次大會上Agent成為了重點,除了A2A之外,谷歌還效仿OpenAI開源了Agent開發(fā)套件ADK,內(nèi)部測試工具Agent Engine,新的Agent市場等。下面「AIGC開放社區(qū)」先為大家解讀A2A的重點內(nèi)容。
什么是A2A
A2A是一種開放協(xié)議,為Agent提供了一種標(biāo)準(zhǔn)的交互方式,使它們能夠相互協(xié)作,無論底層框架或供應(yīng)商是什么。
例如,一家大型電商公司使用了多種企業(yè)平臺和服務(wù)。Atlassian 用于團(tuán)隊項目管理,Box 用于文件存儲和共享,Salesforce 用于客戶關(guān)系管理,Workday 用于人力資源管理。
以前這些平臺上的Agent無法自由通信?,F(xiàn)在通過A2A協(xié)議,這些企業(yè)平臺可以安全、自由地自動化交互數(shù)據(jù)。
A2A案例展示
在與合作伙伴設(shè)計協(xié)議時,谷歌遵循了五個關(guān)鍵原則。第一,A2A專注于使Agent能夠在它們自然的、非結(jié)構(gòu)化的模式下進(jìn)行協(xié)作,即使它們不共享內(nèi)存、工具和上下文。谷歌正在啟用真正的多Agent場景,而不是限制Agent成為一個工具。
第二,該協(xié)議是基于現(xiàn)有的、流行的標(biāo)準(zhǔn)構(gòu)建的,包括HTTP、服務(wù)器端事件(SSE)、JSON-RPC等,這意味著它更容易與企業(yè)日常已經(jīng)使用的現(xiàn)有IT堆棧進(jìn)行集成。
例如,一家電商企業(yè)日常使用 HTTP 協(xié)議來處理網(wǎng)頁數(shù)據(jù)傳輸,利用 JSON - RPC 在前后端傳遞數(shù)據(jù)指令。引入 A2A 協(xié)議后,企業(yè)的訂單管理系統(tǒng)可以通過HTTP 與 A2A 協(xié)議對接,快速獲取相關(guān)智能Agent提供的物流數(shù)據(jù)更新,無需大費周章地重新搭建復(fù)雜的數(shù)據(jù)傳輸通道,能輕松融入現(xiàn)有的IT架構(gòu),讓各個系統(tǒng)協(xié)同工作更加順暢。
第三,A2A被設(shè)計為支持企業(yè)級的認(rèn)證和授權(quán),在推出時與OpenAPI的認(rèn)證方案具有對等性。這點還是很人性的不排斥OpenAI,使用A2A 協(xié)議能快速通過身份驗證,安全地獲取數(shù)據(jù),保障數(shù)據(jù)傳輸?shù)陌踩院秃弦?guī)性,防止數(shù)據(jù)泄露風(fēng)險。
第四,谷歌設(shè)計A2A使其具有靈活性,能夠支持從快速任務(wù)到可能需要數(shù)小時甚至數(shù)天(當(dāng)人類參與其中時)的深入研究等各種場景。在整個過程中,A2A可以向用戶提供實時反饋、通知和狀態(tài)更新。
以一家科研機(jī)構(gòu)為例,研究人員利用 A2A 協(xié)議下的Agent進(jìn)行新藥物研發(fā)相關(guān)研究。簡單的任務(wù)如快速檢索數(shù)據(jù)庫中已有的藥物分子結(jié)構(gòu)信息,幾秒內(nèi)就能完成并反饋給研究人員。但對于復(fù)雜任務(wù),像模擬新藥物分子在人體環(huán)境中的反應(yīng),可能需要數(shù)天時間。
在這期間,A2A 協(xié)議會不斷向研究人員推送模擬進(jìn)度,比如已經(jīng)完成了多少步驟、當(dāng)前遇到的問題等,讓研究人員隨時掌握情況,就像時刻有個助手在匯報工作進(jìn)展。
第五,Agent的世界不僅限于文本,所以,A2A支持各種模態(tài),包括音頻、圖像和視頻流。
A2A工作原理
A2A的工作原理是通過促進(jìn)客戶端Agent和遠(yuǎn)程Agent之間的通信來實現(xiàn)的??蛻舳薃gent負(fù)責(zé)制定和傳達(dá)任務(wù),而遠(yuǎn)程Agent則根據(jù)這些任務(wù)采取行動,以提供正確的信息或執(zhí)行相應(yīng)的操作。在這個過程中,A2A協(xié)議有以下幾個關(guān)鍵能力。
首先,Agent可以通過“Agent卡”來宣傳它們的能力。這些“Agent卡”是以JSON格式存在的,它們能夠讓客戶端Agent識別出哪個遠(yuǎn)程Agent最適合執(zhí)行特定的任務(wù)。
一旦確定了合適的遠(yuǎn)程Agent,客戶端Agent就可以利用A2A協(xié)議與之進(jìn)行通信,將任務(wù)分配給它。
然后,任務(wù)管理是A2A協(xié)議中的一個重要環(huán)節(jié)??蛻舳撕瓦h(yuǎn)程Agent之間的通信都是圍繞完成任務(wù)展開的。協(xié)議定義了一個“任務(wù)”對象,這個對象具有自己的生命周期。
對于一些簡單的任務(wù),可能可以立即完成;而對于一些復(fù)雜的、長期的任務(wù),Agent們可以相互溝通,以保持對任務(wù)完成狀態(tài)的同步。當(dāng)任務(wù)完成時,其輸出被稱為“工件”。
此外,A2A還支持Agent之間的協(xié)作。Agent們可以相互發(fā)送消息,這些消息可以包含上下文信息、回復(fù)、工件或者用戶指令。通過這種方式,Agent們能夠更好地協(xié)同工作,共同完成復(fù)雜的任務(wù)。
最后,A2A還具備用戶體驗協(xié)商的功能。每條消息都包含“部分”,這些部分是完整的內(nèi)容片段,例如,生成的圖像。
每個部分都有指定的內(nèi)容類型,這使得客戶端和遠(yuǎn)程Agent能夠協(xié)商所需的正確格式,并且明確包括用戶界面能力的協(xié)商,比如iframe、視頻、網(wǎng)絡(luò)表單等。這樣,A2A就能夠根據(jù)用戶的需求和設(shè)備的能力,提供最佳的用戶體驗。
哪些企業(yè)加入了A2A
其實最讓人驚訝的就是,A2A剛發(fā)布就獲得了大批著名企業(yè)的青睞和加入,包括埃森哲、波士頓咨詢集團(tuán)、凱捷、科尼、Salesforce、德勤、甲骨文、HCL科技、印孚瑟斯、KPMG、SAP、麥肯錫、普華永道等50多家日常大家能經(jīng)常聽到的企業(yè)。
首批加入A2A的企業(yè)
還有一些技術(shù)公司也加入了到了A2A協(xié)議中。例如,Atlassian以其強大的團(tuán)隊協(xié)作工具Jira和Confluence而聞名。通過加入A2A,Atlassian能夠使其工具與各種Agent無縫協(xié)作,從而進(jìn)一步提升團(tuán)隊的工作效率和協(xié)作能力。
Box是一家專注于企業(yè)級云存儲和內(nèi)容管理服務(wù)的公司,它提供的解決方案能夠幫助企業(yè)安全地存儲、共享和管理文件。通過A2A協(xié)議,Box可以使其服務(wù)與Agent相結(jié)合,實現(xiàn)更高效的內(nèi)容管理和自動化工作流程。
Intuit知名的財務(wù)軟件公司,QuickBooks和TurboTax,已經(jīng)被廣泛應(yīng)用于財務(wù)管理和稅務(wù)處理。通過A2A協(xié)議,Intuit可以使其軟件與Agent協(xié)作,實現(xiàn)更自動化的財務(wù)流程和更高效的稅務(wù)處理。
MongoDB是一家提供高性能、開源的NoSQL數(shù)據(jù)庫解決方案的公司,其數(shù)據(jù)庫廣泛應(yīng)用于現(xiàn)代應(yīng)用程序的數(shù)據(jù)存儲和管理。通過A2A協(xié)議,MongoDB可以使其數(shù)據(jù)庫服務(wù)與智能Agent相結(jié)合,實現(xiàn)更高效的數(shù)據(jù)管理和自動化數(shù)據(jù)處理。
其實看到這里大家應(yīng)該都清楚了,谷歌就是想統(tǒng)一Agent混亂的格局,打造全新的執(zhí)行、交互標(biāo)準(zhǔn),這個比前段時間的MCP要猛的多啊~
本文轉(zhuǎn)自 AIGC開放社區(qū) ,作者:AIGC開放社區(qū)
