自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

剛剛!谷歌最強AI全家桶上線!自家主干網(wǎng)絡(luò)都要公開對外用了!黃仁勛站臺,最新TPU性能猛漲3600倍 原創(chuàng)

發(fā)布于 2025-4-10 06:15
瀏覽
0收藏

編輯|云昭

4月10凌晨,谷歌CEO皮查伊帶著一系列重磅的發(fā)布亮相拉斯維加斯Next2025,可謂從底層的TPU芯片到上層的Agent構(gòu)建,都有讓人眼前一亮的新品。??????????????????

1.性能提升3600倍,專為推理而生的TPU

正式發(fā)布谷歌第七代 TPU Ironwood,它專為推理而設(shè)計。皮查伊介紹道,相較于第一代云 TPU ,Ironwood 性能提升了 3600 倍,效率提升了 29 倍。Ironwood 將于今年晚些時候上市。

剛剛!谷歌最強AI全家桶上線!自家主干網(wǎng)絡(luò)都要公開對外用了!黃仁勛站臺,最新TPU性能猛漲3600倍-AI.x社區(qū)圖片

谷歌作為唯一一家擁有超過十年經(jīng)驗的超級計算公司,將很多尖端科技的研究都用于Ironwood的能力提升上中,主要特點包括:

  • 在顯著提升性能的同時,還注重能效,使AI工作負載能夠更經(jīng)濟地運行。Ironwood的性能/瓦特比是我們?nèi)ツ晷嫉牡诹鶷PU——Trillium的兩倍,為每個瓦特提供更多的容量。其先進的液體冷卻解決方案和優(yōu)化的芯片設(shè)計可以x做到可靠地保持標準空氣冷卻的兩倍性能。實際上,Ironwood比谷歌2018年的第一代TPU節(jié)能近30倍。
  • 高帶寬內(nèi)存(HBM)容量大幅增加。Ironwood每個芯片提供192 GB,是Trillium的6倍,這使得處理更大的模型和數(shù)據(jù)集成為可能,減少了頻繁數(shù)據(jù)傳輸?shù)男枨蟛⑻岣吡诵阅堋?/li>
  • 顯著提高的HBM帶寬,每個芯片達到7.2 TBps,是Trillium的4.5倍。這種高帶寬確保了快速的數(shù)據(jù)訪問,這對于現(xiàn)代AI中常見的內(nèi)存密集型工作負載至關(guān)重要。
  • 增強的芯片間互連(ICI)帶寬。這已增加到1.2 Tbps雙向,是Trillium的1.5倍,使得芯片之間的通信更快,促進了大規(guī)模分布式訓(xùn)練和推理的高效進行。

剛剛!谷歌最強AI全家桶上線!自家主干網(wǎng)絡(luò)都要公開對外用了!黃仁勛站臺,最新TPU性能猛漲3600倍-AI.x社區(qū)圖片

對于谷歌云客戶,Ironwood根據(jù)AI工作負載需求提供兩種尺寸:256芯片配置和9,216芯片配置。當擴展到每個機架9,216個芯片,總計42.5 Exaflops時,Ironwood支持的計算能力超過世界上最大的超級計算機——El Capitan的24倍。

Ironwood提供了大規(guī)模并行處理能力,這對于最苛刻的AI工作負載(如具有推理能力的超大尺寸密集型LLM或MoE模型)來說是必要的。每個單獨的芯片峰值計算能力達到4,614 TFLOPS。Ironwood的內(nèi)存和網(wǎng)絡(luò)架構(gòu)確保了在如此大規(guī)模下始終有足夠的數(shù)據(jù)來支持峰值性能。

此外,Ironwood還具有增強的SparseCore,這是一種專門用于處理高級排名和推薦工作負載中常見的超大型嵌入的加速器。Ironwood中擴展的SparseCore支持允許更廣泛的工作負載加速,包括超越傳統(tǒng)AI領(lǐng)域到金融和科學(xué)領(lǐng)域。

這還沒完,DeepMind還開發(fā)了機器學(xué)習(xí)運行時Pathways,能夠在多個TPU芯片上實現(xiàn)高效的分布式計算。谷歌云上的Pathways使得超越單個Ironwood機架成為可能,使成千上萬的Ironwood芯片能夠組合在一起,以快速推進生成式AI計算的前沿。

剛剛!谷歌最強AI全家桶上線!自家主干網(wǎng)絡(luò)都要公開對外用了!黃仁勛站臺,最新TPU性能猛漲3600倍-AI.x社區(qū)圖片

2.面向全球開放谷歌自家的私有網(wǎng)絡(luò):云廣域網(wǎng)

緊接著,皮查伊秀出了谷歌引以為傲的全球基礎(chǔ)設(shè)施。眾所周知,谷歌的主干網(wǎng)絡(luò)在全球數(shù)一數(shù)二,以接近零延遲的速度全天候為全球數(shù)十億用戶支持像Gmail、照片和搜索這樣出色的服務(wù),包括谷內(nèi)內(nèi)部也通過它來訓(xùn)練其最強大的模型Gemini。

這條主干網(wǎng)絡(luò)覆蓋了超過200個國家和地區(qū),由超過200萬英里的光纖提供支持。?

這里就很難想象,皮查伊甩出一個爆炸性的宣布:谷歌將向全球各地的所有谷歌云客戶企業(yè)開放谷歌的全球私有網(wǎng)絡(luò),并將其稱之為云廣域網(wǎng)(Cloud Wide Area Network,簡稱WAN)。

云廣域網(wǎng)利用谷歌的行星規(guī)模網(wǎng)絡(luò)。它針對應(yīng)用程序性能進行了優(yōu)化,并提供超過40%的性能提升,同時將總擁有成本降低高達40%。像雀巢和花旗證券這樣的公司已經(jīng)在使用這個網(wǎng)絡(luò)來獲得更快、更可靠的解決方案。這次可以說不管大小客戶,都可以使用谷歌自家的私有網(wǎng)絡(luò)了。

3.黃仁勛站臺谷歌:巨頭聯(lián)合搞事情

本次大會的另一個重磅亮點就是,谷歌與英偉達這兩大超級巨頭聯(lián)手打造的谷歌分布式云。

剛剛!谷歌最強AI全家桶上線!自家主干網(wǎng)絡(luò)都要公開對外用了!黃仁勛站臺,最新TPU性能猛漲3600倍-AI.x社區(qū)圖片

此前,我們就曾報道過谷歌云也使用英偉達的GPU的消息。而今天老黃直接親自站臺的宣傳,則是更加表明:通過谷歌分布式云平臺,受到地緣監(jiān)管的區(qū)域同樣也可以使用到先進的AI基建能力。

4.AgentSpace新功能三件套上線

本次大會上,谷歌還在 Google Agentspace 中推出了三項新功能,讓創(chuàng)建和采用代理變得更加輕松,分別是:unified search、Agent Gallery、無代碼的Agent Designer。???????

剛剛!谷歌最強AI全家桶上線!自家主干網(wǎng)絡(luò)都要公開對外用了!黃仁勛站臺,最新TPU性能猛漲3600倍-AI.x社區(qū)圖片

其中,unified search是指用戶可以從Chrome瀏覽器的搜索框中進行統(tǒng)一代理搜索,旨在通過AgentSpace將谷歌的AI驅(qū)動的多模態(tài)搜索能力帶給企業(yè),即這個搜索框可以找到任何形式的信息,無論是文本、圖像、網(wǎng)站、音頻還是視頻,而且具備谷歌搜索的搜索質(zhì)量。它的厲害之處就在于可以幫助打通企業(yè)內(nèi)部各部門的數(shù)據(jù)壁壘并將有利于企業(yè)構(gòu)建適用于全部團隊與員工的企業(yè)知識圖譜,將分散的內(nèi)容轉(zhuǎn)化為可操作的知識。

從今天開始預(yù)覽,AgentSpace已與Chrome企業(yè)版集成,員工可以直接從Chrome瀏覽器的搜索框中利用代理空間的“統(tǒng)一搜索”能力,在現(xiàn)有的工作流程中輕松且安全地找到信息、數(shù)據(jù)和資源。

其次,Agent的應(yīng)用和構(gòu)建也是業(yè)內(nèi)所關(guān)注的。Agent Gallery和Agent Designer就是谷歌為此推出新功能。?????

代理畫廊(Agent Gallery)目前通過允許名單提供,為員工提供了一個查看整個企業(yè)中可用代理的單一視圖,包括來自谷歌、內(nèi)部團隊和合作伙伴的代理——使代理易于發(fā)現(xiàn)和使用??蛻艨梢赃x擇在谷歌云市場中由合作伙伴發(fā)布的代理,然后在“代理畫廊”中啟用它們。

而代理設(shè)計器(Agent Designer),目前處于預(yù)覽階段并通過允許名單提供,是一個無代碼界面,用于創(chuàng)建連接到企業(yè)數(shù)據(jù)源并自動化或增強日常知識工作任務(wù)的自定義代理。即使是技術(shù)經(jīng)驗有限的員工,也可以創(chuàng)建適合他們個人工作流程和需求的代理。

由于谷歌產(chǎn)品之間的深度集成,代理設(shè)計器還補充了Vertex AI代理構(gòu)建器中可用的更深入的、以開發(fā)人員為中心的方法,而Vertex AI代理構(gòu)建器中構(gòu)建的代理可以發(fā)布到AgentSpace。

多提一嘴,除了專家代理,AgenSpace還支持一種新的代理與代理之間的開放協(xié)議(Agent2Agent,A2A)協(xié)議,該協(xié)議旨在讓不同生態(tài)系統(tǒng)中的代理相互通信。

作為推動這一行業(yè)計劃的首個超大規(guī)模云服務(wù)提供商,有理由相信這一協(xié)議對于支持多代理通信至關(guān)重要,因為它為代理提供了一種共同的語言——無論它們基于何種框架或供應(yīng)商構(gòu)建。這使得開發(fā)人員可以選擇最適合他們需求的工具和框架。(是不是想到了MCP協(xié)議~)

5.One More Thing:Gemini 2.5 Flash將開放

當然,谷歌不久前剛剛發(fā)布了自己的最強推理模型Gemini2.5和Gemini 2.5 Flash,在大模型競技排行榜Chatbot Arena中的“人類最后的考試”中獲得最高分,這是最難的行業(yè)基準之一,旨在捕捉人類知識和推理的前沿。Gemini 2.5 Pro現(xiàn)在可以在Google AI Studio、Vertex AI和Gemini應(yīng)用程序中供所有人使用。

此外,值得一提的是,Gemini 2.5 Flash是谷歌目前內(nèi)置“思考”功能的低延遲、最具成本效益的模型,也即將在 AI Studio 和 GeminiApp中推出。

本文轉(zhuǎn)載自??51CTO技術(shù)棧??,作者:云昭

?著作權(quán)歸作者所有,如需轉(zhuǎn)載,請注明出處,否則將追究法律責(zé)任
收藏
回復(fù)
舉報
回復(fù)
相關(guān)推薦