剛剛!谷歌最強(qiáng)AI全家桶上線!自家主干網(wǎng)絡(luò)都要公開(kāi)對(duì)外用了!黃仁勛站臺(tái),最新TPU性能猛漲3600倍,提Agent通信新協(xié)議
原創(chuàng) 精選編輯|云昭
4月10凌晨,谷歌CEO皮查伊帶著一系列重磅的發(fā)布亮相拉斯維加斯Next2025,可謂從底層的TPU芯片到上層的Agent構(gòu)建,都有讓人眼前一亮的新品。
1.性能提升3600倍,專(zhuān)為推理而生的TPU
正式發(fā)布谷歌第七代 TPU Ironwood,它專(zhuān)為推理而設(shè)計(jì)。皮查伊介紹道,相較于第一代云 TPU ,Ironwood 性能提升了 3600 倍,效率提升了 29 倍。Ironwood 將于今年晚些時(shí)候上市。
圖片
谷歌作為唯一一家擁有超過(guò)十年經(jīng)驗(yàn)的超級(jí)計(jì)算公司,將很多尖端科技的研究都用于Ironwood的能力提升上中,主要特點(diǎn)包括:
- 在顯著提升性能的同時(shí),還注重能效,使AI工作負(fù)載能夠更經(jīng)濟(jì)地運(yùn)行。Ironwood的性能/瓦特比是我們?nèi)ツ晷嫉牡诹鶷PU——Trillium的兩倍,為每個(gè)瓦特提供更多的容量。其先進(jìn)的液體冷卻解決方案和優(yōu)化的芯片設(shè)計(jì)可以x做到可靠地保持標(biāo)準(zhǔn)空氣冷卻的兩倍性能。實(shí)際上,Ironwood比谷歌2018年的第一代TPU節(jié)能近30倍。
- 高帶寬內(nèi)存(HBM)容量大幅增加。Ironwood每個(gè)芯片提供192 GB,是Trillium的6倍,這使得處理更大的模型和數(shù)據(jù)集成為可能,減少了頻繁數(shù)據(jù)傳輸?shù)男枨蟛⑻岣吡诵阅堋?/li>
- 顯著提高的HBM帶寬,每個(gè)芯片達(dá)到7.2 TBps,是Trillium的4.5倍。這種高帶寬確保了快速的數(shù)據(jù)訪問(wèn),這對(duì)于現(xiàn)代AI中常見(jiàn)的內(nèi)存密集型工作負(fù)載至關(guān)重要。
- 增強(qiáng)的芯片間互連(ICI)帶寬。這已增加到1.2 Tbps雙向,是Trillium的1.5倍,使得芯片之間的通信更快,促進(jìn)了大規(guī)模分布式訓(xùn)練和推理的高效進(jìn)行。
圖片
對(duì)于谷歌云客戶,Ironwood根據(jù)AI工作負(fù)載需求提供兩種尺寸:256芯片配置和9,216芯片配置。當(dāng)擴(kuò)展到每個(gè)機(jī)架9,216個(gè)芯片,總計(jì)42.5 Exaflops時(shí),Ironwood支持的計(jì)算能力超過(guò)世界上最大的超級(jí)計(jì)算機(jī)——El Capitan的24倍。
Ironwood提供了大規(guī)模并行處理能力,這對(duì)于最苛刻的AI工作負(fù)載(如具有推理能力的超大尺寸密集型LLM或MoE模型)來(lái)說(shuō)是必要的。每個(gè)單獨(dú)的芯片峰值計(jì)算能力達(dá)到4,614 TFLOPS。Ironwood的內(nèi)存和網(wǎng)絡(luò)架構(gòu)確保了在如此大規(guī)模下始終有足夠的數(shù)據(jù)來(lái)支持峰值性能。
此外,Ironwood還具有增強(qiáng)的SparseCore,這是一種專(zhuān)門(mén)用于處理高級(jí)排名和推薦工作負(fù)載中常見(jiàn)的超大型嵌入的加速器。Ironwood中擴(kuò)展的SparseCore支持允許更廣泛的工作負(fù)載加速,包括超越傳統(tǒng)AI領(lǐng)域到金融和科學(xué)領(lǐng)域。
這還沒(méi)完,DeepMind還開(kāi)發(fā)了機(jī)器學(xué)習(xí)運(yùn)行時(shí)Pathways,能夠在多個(gè)TPU芯片上實(shí)現(xiàn)高效的分布式計(jì)算。谷歌云上的Pathways使得超越單個(gè)Ironwood機(jī)架成為可能,使成千上萬(wàn)的Ironwood芯片能夠組合在一起,以快速推進(jìn)生成式AI計(jì)算的前沿。
圖片
2.面向全球開(kāi)放谷歌自家的私有網(wǎng)絡(luò):云廣域網(wǎng)
緊接著,皮查伊秀出了谷歌引以為傲的全球基礎(chǔ)設(shè)施。眾所周知,谷歌的主干網(wǎng)絡(luò)在全球數(shù)一數(shù)二,以接近零延遲的速度全天候?yàn)槿驍?shù)十億用戶支持像Gmail、照片和搜索這樣出色的服務(wù),包括谷內(nèi)內(nèi)部也通過(guò)它來(lái)訓(xùn)練其最強(qiáng)大的模型Gemini。
這條主干網(wǎng)絡(luò)覆蓋了超過(guò)200個(gè)國(guó)家和地區(qū),由超過(guò)200萬(wàn)英里的光纖提供支持。
這里就很難想象,皮查伊甩出一個(gè)爆炸性的宣布:谷歌將向全球各地的所有谷歌云客戶企業(yè)開(kāi)放谷歌的全球私有網(wǎng)絡(luò),并將其稱(chēng)之為云廣域網(wǎng)(Cloud Wide Area Network,簡(jiǎn)稱(chēng)WAN)。
云廣域網(wǎng)利用谷歌的行星規(guī)模網(wǎng)絡(luò)。它針對(duì)應(yīng)用程序性能進(jìn)行了優(yōu)化,并提供超過(guò)40%的性能提升,同時(shí)將總擁有成本降低高達(dá)40%。像雀巢和花旗證券這樣的公司已經(jīng)在使用這個(gè)網(wǎng)絡(luò)來(lái)獲得更快、更可靠的解決方案。這次可以說(shuō)不管大小客戶,都可以使用谷歌自家的私有網(wǎng)絡(luò)了。
3.黃仁勛站臺(tái)谷歌:巨頭聯(lián)合搞事情
本次大會(huì)的另一個(gè)重磅亮點(diǎn)就是,谷歌與英偉達(dá)這兩大超級(jí)巨頭聯(lián)手打造的谷歌分布式云。
圖片
此前,我們就曾報(bào)道過(guò)谷歌云也使用英偉達(dá)的GPU的消息。而今天老黃直接親自站臺(tái)的宣傳,則是更加表明:通過(guò)谷歌分布式云平臺(tái),受到地緣監(jiān)管的區(qū)域同樣也可以使用到先進(jìn)的AI基建能力。
4.AgentSpace新功能三件套上線
本次大會(huì)上,谷歌還在 Google Agentspace 中推出了三項(xiàng)新功能,讓創(chuàng)建和采用代理變得更加輕松,分別是:unified search、Agent Gallery、無(wú)代碼的Agent Designer。
圖片
其中,unified search是指用戶可以從Chrome瀏覽器的搜索框中進(jìn)行統(tǒng)一代理搜索,旨在通過(guò)AgentSpace將谷歌的AI驅(qū)動(dòng)的多模態(tài)搜索能力帶給企業(yè),即這個(gè)搜索框可以找到任何形式的信息,無(wú)論是文本、圖像、網(wǎng)站、音頻還是視頻,而且具備谷歌搜索的搜索質(zhì)量。它的厲害之處就在于可以幫助打通企業(yè)內(nèi)部各部門(mén)的數(shù)據(jù)壁壘并將有利于企業(yè)構(gòu)建適用于全部團(tuán)隊(duì)與員工的企業(yè)知識(shí)圖譜,將分散的內(nèi)容轉(zhuǎn)化為可操作的知識(shí)。
從今天開(kāi)始預(yù)覽,AgentSpace已與Chrome企業(yè)版集成,員工可以直接從Chrome瀏覽器的搜索框中利用代理空間的“統(tǒng)一搜索”能力,在現(xiàn)有的工作流程中輕松且安全地找到信息、數(shù)據(jù)和資源。
其次,Agent的應(yīng)用和構(gòu)建也是業(yè)內(nèi)所關(guān)注的。Agent Gallery和Agent Designer就是谷歌為此推出新功能。
代理畫(huà)廊(Agent Gallery)目前通過(guò)允許名單提供,為員工提供了一個(gè)查看整個(gè)企業(yè)中可用代理的單一視圖,包括來(lái)自谷歌、內(nèi)部團(tuán)隊(duì)和合作伙伴的代理——使代理易于發(fā)現(xiàn)和使用??蛻艨梢赃x擇在谷歌云市場(chǎng)中由合作伙伴發(fā)布的代理,然后在“代理畫(huà)廊”中啟用它們。
而代理設(shè)計(jì)器(Agent Designer),目前處于預(yù)覽階段并通過(guò)允許名單提供,是一個(gè)無(wú)代碼界面,用于創(chuàng)建連接到企業(yè)數(shù)據(jù)源并自動(dòng)化或增強(qiáng)日常知識(shí)工作任務(wù)的自定義代理。即使是技術(shù)經(jīng)驗(yàn)有限的員工,也可以創(chuàng)建適合他們個(gè)人工作流程和需求的代理。
由于谷歌產(chǎn)品之間的深度集成,代理設(shè)計(jì)器還補(bǔ)充了Vertex AI代理構(gòu)建器中可用的更深入的、以開(kāi)發(fā)人員為中心的方法,而Vertex AI代理構(gòu)建器中構(gòu)建的代理可以發(fā)布到AgentSpace。
多提一嘴,除了專(zhuān)家代理,AgenSpace還支持一種新的代理與代理之間的開(kāi)放協(xié)議(Agent2Agent,A2A)協(xié)議,該協(xié)議旨在讓不同生態(tài)系統(tǒng)中的代理相互通信。
作為推動(dòng)這一行業(yè)計(jì)劃的首個(gè)超大規(guī)模云服務(wù)提供商,有理由相信這一協(xié)議對(duì)于支持多代理通信至關(guān)重要,因?yàn)樗鼮榇硖峁┝艘环N共同的語(yǔ)言——無(wú)論它們基于何種框架或供應(yīng)商構(gòu)建。這使得開(kāi)發(fā)人員可以選擇最適合他們需求的工具和框架。(是不是想到了MCP協(xié)議~)
5.One More Thing:Gemini 2.5 Flash將開(kāi)放
當(dāng)然,谷歌不久前剛剛發(fā)布了自己的最強(qiáng)推理模型Gemini2.5和Gemini 2.5 Flash,在大模型競(jìng)技排行榜Chatbot Arena中的“人類(lèi)最后的考試”中獲得最高分,這是最難的行業(yè)基準(zhǔn)之一,旨在捕捉人類(lèi)知識(shí)和推理的前沿。Gemini 2.5 Pro現(xiàn)在可以在Google AI Studio、Vertex AI和Gemini應(yīng)用程序中供所有人使用。
此外,值得一提的是,Gemini 2.5 Flash是谷歌目前內(nèi)置“思考”功能的低延遲、最具成本效益的模型,也即將在 AI Studio 和 GeminiApp中推出。