Next ’24 - 踏上云端新旅程?
作者 | Google Cloud CEO, Thomas Kurian
去年,全世界才開始想象生成式 AI 將為企業(yè)帶來怎樣的轉(zhuǎn)變,如今這些轉(zhuǎn)變正在逐步展開。 而 Google 一直遵循著相同的原則:打造人人都能受益的 AI 技術(shù),盡力為更多人帶來更美好的生活。
一個(gè)連接云端、由 AI 驅(qū)動(dòng)的 Agent 世界
借助我們豐富多樣的 AI 產(chǎn)品組合,比如基礎(chǔ)架構(gòu)、Gemini、多種模型與 Vertex AI 等,客戶與合作伙伴可以打造日漸精密的 AI Agent,用來服務(wù)客戶、支持員工和創(chuàng)造內(nèi)容等。
出色的客服 Agent 可以協(xié)助您的客戶通過包含web、移動(dòng)設(shè)備、呼叫中心及銷售點(diǎn)在內(nèi)的多種渠道,靈活運(yùn)用文本、語音等方式,讓您的企業(yè)與用戶的互動(dòng)更為順暢。
- 洲際酒店集團(tuán)將推出由生成式 AI 驅(qū)動(dòng)的旅行規(guī)劃功能,協(xié)助客戶輕松規(guī)劃下一趟度假行程。
- Target 正在優(yōu)化其 Target 應(yīng)用程序和 Target.com 上的優(yōu)惠和路邊取貨(curbside pickup)功能。
員工 Agent 可幫助所有員工提高工作效率,更好地協(xié)同工作。例如:
- Etsy 使用 Vertex AI 訓(xùn)練技術(shù)來優(yōu)化搜索建議與廣告模型,為買家提供更好的商品推薦,并提升銷售額。
- 巴西企業(yè) Dasa 協(xié)助醫(yī)生更快地偵測出檢測結(jié)果的相關(guān)發(fā)現(xiàn)。
創(chuàng)意 Agent 能成為您強(qiáng)大的設(shè)計(jì)師與制作團(tuán)隊(duì),與您一同進(jìn)行圖片與幻燈片的瀏覽和創(chuàng)作,并探索各種創(chuàng)意想法。我們提供強(qiáng)大的平臺(tái)與技術(shù)棧協(xié)助您打造創(chuàng)意 Agent。 例如:
- Canva 采用 Vertex AI 為其產(chǎn)品 Magic Design for Video 提供動(dòng)力,協(xié)助使用者在短短幾秒鐘內(nèi)制作出引人入勝的視頻。
- 家樂福使用 Vertex AI 開創(chuàng)營銷新方法,使他們能夠在數(shù)周而不是數(shù)月內(nèi)在不同社交網(wǎng)絡(luò)上創(chuàng)建動(dòng)態(tài)活動(dòng)。
以下是我們?cè)?Cloud Next ’24 大會(huì)上宣布的一系列產(chǎn)品創(chuàng)新,協(xié)助各種規(guī)模的組織在 AI 時(shí)代向前邁進(jìn)。
利用 AI 優(yōu)化的基礎(chǔ)架構(gòu)實(shí)現(xiàn)規(guī)模化
生成式 AI 需要強(qiáng)大的基礎(chǔ)架構(gòu)來加以支持,才可迅速推動(dòng)轉(zhuǎn)型。為了能支持各種技術(shù)需求層次的客戶,我們進(jìn)行了多項(xiàng)重要更新:
- A3 mega:我們與 NVIDIA 合作,使用 H100 GPU 開發(fā)的全新 GPU 實(shí)例現(xiàn)已正式推出,其帶寬為 A3 實(shí)例的兩倍,能支持要求最嚴(yán)苛的工作負(fù)載。此外,我們也同步推出 Confidential A3,客戶能夠在訓(xùn)練和推理過程中更進(jìn)一步保護(hù)敏感數(shù)據(jù),并確保 AI 工作負(fù)載的機(jī)密性和完整性。
- NVIDIA HGX B200 與 NVIDIA GB200 NVL72:Google Cloud 將于 2025 年初采用最新的 NVIDIA Blackwell 平臺(tái)晶片,并提供 HGX B200 和 GB200 兩種選項(xiàng)。 B200 專為主流模型的訓(xùn)練與服務(wù)而設(shè)計(jì),而 GB200 NVL72 則可為萬億參數(shù)規(guī)模的模型提供實(shí)時(shí)大語言模型推理和大規(guī)模訓(xùn)練。
- TPU v5p:我們宣布正式推出 TPU v5p,這是我們最強(qiáng)大、可拓展且最靈活的 AI 加速器,可用于訓(xùn)練和推理,且每個(gè) Pod 的計(jì)算能力是上一代的 4 倍。我們還宣布為 TPU v5p 提供 Google Kubernetes Engine (GKE) 支持;過去一年,在 GKE 上運(yùn)行的 GPU 和 TPU 使用量增長了 900% 以上。
- AI 優(yōu)化的存儲(chǔ)選項(xiàng):我們通過 Cloud Storage FUSE 和 Parallelstore 全新的緩存功能提升訓(xùn)練速度,這些功能可以將數(shù)據(jù)存儲(chǔ)更接近客戶的 TPU 或 GPU 。 我們也推出 Hyperdisk ML(預(yù)覽版),這是新一代塊儲(chǔ)存服務(wù),與常見的替代方案相比,其模型加載時(shí)間加速了 3.7 倍。
- 動(dòng)態(tài)負(fù)載調(diào)度(Dynamic Workload Scheduler):日歷模式可以協(xié)助并確保工作負(fù)載在指定時(shí)間開始執(zhí)行,而彈性啟動(dòng)模式可提供最佳的經(jīng)濟(jì)效益,協(xié)助客戶為復(fù)雜的訓(xùn)練與推理任務(wù)有效管理資源。
我們正致力于將 AI 帶到更接近數(shù)據(jù)生成與運(yùn)用的位置,包括邊緣、實(shí)體隔離(air-gapped)環(huán)境、Google 主權(quán)云和跨云環(huán)境。通過 Google Distributed Cloud(GDC),我們可以在任何地方啟用 AI,讓您可以選擇最符合組織特定需求的環(huán)境、配置與控制選項(xiàng)。
我們也宣布多項(xiàng) GDC 的新功能,包括:
- 在 GDC 上提供 NVIDIA GPUs:我們將為采用網(wǎng)絡(luò)互聯(lián)與物理隔離配置的兩種 GDC 提供 NVIDIA GPU,這兩種配置都將支持新的 GPU 實(shí)例,以高效運(yùn)行 AI 模型。
- 在 GDC 上提供 GKE 服務(wù):領(lǐng)先的 AI 公司在 Google Cloud 使用的 GKE 服務(wù) ,也將在 GDC 上提供。
- 支持 AI 模型:我們?cè)?GDC 中支持多種開放 AI 模型,包含 Gemma、Llama 等,為這些模型提供可在物理隔離與網(wǎng)絡(luò)互聯(lián)的環(huán)境中執(zhí)行。
- 在 GDC 上提供 Vector Search:我們也將在 GDC 引入 Vector Search 的強(qiáng)大功能,您可以在 GDC 上以極低的延遲對(duì)您的私人和敏感數(shù)據(jù)進(jìn)行搜索和信息檢索。
- 主權(quán)云(Sovereign Cloud):為符合最嚴(yán)格的監(jiān)管要求,我們提供采用完全物理隔離配置的 GDC。 這個(gè)產(chǎn)品能在本地操作并具備完整的存續(xù)能力(survivability),可由 Google 或您選擇的合作伙伴代管,您擁有完全的控制權(quán),并且在法規(guī)變更時(shí),我們也可以靈活反應(yīng),協(xié)助您快速應(yīng)對(duì)。
雖然并非所有工作負(fù)載都屬于 AI 工作負(fù)載,但您在云中運(yùn)行的每個(gè)工作負(fù)載都需要進(jìn)行優(yōu)化,且每個(gè)應(yīng)用都有獨(dú)特的技術(shù)需求。因此,我們推出全新的通用計(jì)算服務(wù),協(xié)助客戶獲得最佳性能、確保應(yīng)用程序之間的互通性,滿足可持續(xù)發(fā)展目標(biāo),同時(shí)降低成本。
- Google Axion:是我們專為數(shù)據(jù)中心設(shè)計(jì)的首個(gè) ARM? 架構(gòu) CPU,與當(dāng)前基于 x86 的同類實(shí)例相比,性能最多可提升 50%,能效最多可提升 60%。
- 我們的通用 VM 系列也將推出兩個(gè)全新的機(jī)器系列:N4 與 C4。C3 機(jī)器系列將推出原生裸機(jī)機(jī)器類型。 此外,我們也將正式推出 Hyperdisk Advanced Storage Pools,以及更多新的產(chǎn)品。我們也將 Vertex AI 上的生成式 AI 靜態(tài)存儲(chǔ)數(shù)據(jù)的數(shù)據(jù)駐留(data residency)服務(wù)范圍擴(kuò)展到 11 個(gè)新的國家和地區(qū),包擴(kuò)澳洲、巴西、芬蘭、香港、印度、以色列、意大利、波蘭 、西班牙、瑞士和臺(tái)灣。
- 此外,客戶現(xiàn)在使用 Gemini 1.0 Pro 和 Imagen 時(shí),可以將機(jī)器學(xué)習(xí)的操作限制在美國或歐盟境內(nèi)。
- 與去年我們宣布開始服務(wù)的其他 10 個(gè)國家和地區(qū)一樣,我們協(xié)助這些新開放的國家和地區(qū)的客戶控制其數(shù)據(jù)的存儲(chǔ)位置和訪問方式,讓客戶更能符合世界各地的監(jiān)管及安全要求。
利用 Vertex AI 創(chuàng)建 Agents
Google Cloud 在 Vertex AI 上提供超過 130 種第一方與第三方模型,我們正在擴(kuò)大對(duì)各種模型的訪問,為客戶提供更豐富的模型選擇:
- Gemini 1.5 Pro:Gemini 1.5 Pro 提供兩種大小的上下文窗口:128K token 與一百萬 token,目前在公開預(yù)覽版階段。 客戶現(xiàn)可以在單個(gè)數(shù)據(jù)流中處理大量信息,包含 1 小時(shí)的視頻、11 小時(shí)的音頻、超過 30,000 行的代碼,或 700,000 個(gè)以上的字詞。
- Claude 3:Anthropic 全新系列的先進(jìn)模型,現(xiàn)已在 Vertex AI 上向客戶開放使用。
- CodeGemma:Gemma 是先進(jìn)的輕量級(jí)開放模型系列,采用與創(chuàng)建 Gemini 模型相同的研究和技術(shù)而構(gòu)建。而 CodeGemma,一款 Gemma 全新微調(diào)、針對(duì)代碼生成與代碼輔助等編碼使用場景而設(shè)計(jì)的模型,現(xiàn)已在 Vertex AI 開放使用。
- Imagen 2:這是我們最先進(jìn)的文生圖技術(shù),具備多種圖像生成功能,協(xié)助企業(yè)打造符合品牌需求的定制化圖像。全新的文生圖功能讓營銷與創(chuàng)意團(tuán)隊(duì)能輕松生成例如 GIF 等動(dòng)圖,并且配備安全篩選與數(shù)字水印。 此外,我們也宣布推出高級(jí)照片編輯功能,包含圖像修復(fù)、圖像擴(kuò)展,以及其他更多功能。
- 數(shù)字水?。?/span>由 Google DeepMind 的 SynthID 技術(shù)提供支持,此功能現(xiàn)在起正式應(yīng)用于 Imagen 2 生成的 AI 圖像中。
當(dāng)客戶利用企業(yè)數(shù)據(jù)對(duì)模型進(jìn)行增強(qiáng)和Grounding時(shí),可以發(fā)揮模型最大功效并獲取更多價(jià)值。今天,我們用兩種方式加強(qiáng) Vertex AI 的Grounding能力,使其功能更加完善:
- Google 搜索:以 Google 搜索作為模型的信息來源,能結(jié)合 Google 最新基礎(chǔ)模型的強(qiáng)大功能,以及訪問最新、高質(zhì)量信息的能力,從而顯著提高響應(yīng)的完整性與準(zhǔn)確性。
- 你的數(shù)據(jù):運(yùn)用企業(yè)應(yīng)用程序,如 Workday 或 Salesforce 中的數(shù)據(jù)作為模型基礎(chǔ),并輕松連接 AlloyDB 和 BigQuery 等 Google 數(shù)據(jù)庫。
當(dāng)您選擇了合適的模型、加以 finetune 并 Grounding 后,Vertex 還可以協(xié)助您部署、管理和監(jiān)控模型。今天,我們宣布推出更多 MLOps 功能:
- Prompt 管理工具:這些工具讓您可以在內(nèi)置 Prompt 上進(jìn)行協(xié)作,附上備注和狀態(tài)、追蹤變更紀(jì)錄,以及比較不同 Prompt 的響應(yīng)質(zhì)量。
- 自動(dòng)并排比對(duì):Auto SxS 功能現(xiàn)已正式推出,它可以說明為何某個(gè)響應(yīng)優(yōu)于另一個(gè),并提供確定性分?jǐn)?shù),有助于使用者了解評(píng)估的準(zhǔn)確性。
- 快速評(píng)估功能:此功能現(xiàn)已推出預(yù)覽版,可協(xié)助客戶在迭代 Prompt 設(shè)計(jì)時(shí),運(yùn)用較小的數(shù)據(jù)集來快速評(píng)估模型。
最后,Vertex AI Agent Builder 集成了基礎(chǔ)模型、Google 搜索和其他開發(fā)者工具,使您可以輕松建構(gòu)和部署 Agent。 它提供了無代碼 Agent 生成器控制臺(tái)的便利性,以及強(qiáng)大的聯(lián)結(jié)、編排與增強(qiáng)功能,使用 Vertex AI Agent Builder,您現(xiàn)在可以利用 Google 搜索和您組織的數(shù)據(jù)快速創(chuàng)建一系列生成式 AI Agent。
縮短開發(fā)時(shí)間
Gemini Code Assist 是 Google 專為企業(yè)打造的 AI 代碼輔助解決方案。 為支持開發(fā)人員,我們宣布推出以下項(xiàng)目:
- Gemini 1.5 Pro in Gemini Code Assist:此次升級(jí)帶來了高達(dá) 1 百萬 token 的上下文窗口,甚至可為最大型的項(xiàng)目帶來革命性編碼方式。Gemini Code Assist 現(xiàn)在可以提供更準(zhǔn)確的代碼建議、更深入的洞察,以及精簡的工作流程。
- Gemini Cloud Assist:此功能可在應(yīng)用程序生命周期各階段提供 AI 輔助功能,讓使用者更輕松地設(shè)計(jì)、保護(hù)、操作、故障排除,以及優(yōu)化應(yīng)用的性能與成本效益。
我們?yōu)?Google 內(nèi)部的一組開發(fā)人員部署了 Gemini Code Assist,發(fā)現(xiàn)完成一般開發(fā)任務(wù)所需的時(shí)間縮短了 40% 以上,編寫新代碼的時(shí)間縮短了 55%。事實(shí)上,Gemini Code Assist 支持位于任何位置的私人代碼集,無論是本地部署、GitHub、GitLab、Bitbucket,甚至是多個(gè)位置。
結(jié)合數(shù)據(jù),釋放龐大 AI 潛能
Google Cloud 可讓您將 AI 技術(shù)與您的企業(yè)數(shù)據(jù)相結(jié)合,同時(shí)維持?jǐn)?shù)據(jù)的隱私性和安全性。我們現(xiàn)在宣布推出全新增強(qiáng)功能,協(xié)助組織構(gòu)建出色的數(shù)據(jù) Agent:
- Gemini in BigQuery:Gemini in BigQuery 運(yùn)用 AI 技術(shù)來協(xié)助數(shù)據(jù)團(tuán)隊(duì)準(zhǔn)備、發(fā)現(xiàn)、分析和治理數(shù)據(jù)。 此外,您將能通過新的 BigQuery Data Canvas 構(gòu)建與執(zhí)行數(shù)據(jù)管道,它結(jié)合自然語言與嵌入式可視化功能,提供了與Notebook類似的全新使用體驗(yàn),兩種目前皆提供預(yù)覽版。
- Gemini in Database:您可輕松安全地將數(shù)據(jù)從舊系統(tǒng)中遷出,例如將數(shù)據(jù)庫轉(zhuǎn)成 AlloyDB 等現(xiàn)代云數(shù)據(jù)庫。
- Gemini in Looker:我們將推出數(shù)項(xiàng)預(yù)覽版的新功能,這些功能可輕松地將您的數(shù)據(jù) Agent 集成到您的工作流中。 我們還新增與 Google Workspace 集成的全新生成式 AI 功能,可讓您與業(yè)務(wù)數(shù)據(jù)進(jìn)行對(duì)話。
運(yùn)用 AI 技術(shù)提升網(wǎng)絡(luò)安全
安全 Agent 可在安全生命周期的每個(gè)階段提供幫助,因此生成式 AI 有潛力扭轉(zhuǎn)局勢(shì),讓抵御攻擊的一方占上風(fēng)。Google Cloud 安全產(chǎn)品組合中的創(chuàng)新功能可以提供更強(qiáng)大的安全成果,并使每個(gè)組織都能讓 Google Cloud 成為他們安全團(tuán)隊(duì)的一部分,這些功能包括:
- Gemini in Threat Intelligence:使用自然語言技術(shù),可以針對(duì)威脅發(fā)動(dòng)者的行為提供深入的洞察。通過 Gemini,我們能夠分析數(shù)量龐大的潛在威脅惡意代碼樣本。Gemini 擁有更大的上下文窗口,能分析模塊之間的交互,針對(duì)代碼的真正意圖提供全新洞察。
- Gemini in Security Operations:全新輔助調(diào)查功能可以將自然語言轉(zhuǎn)換為啟動(dòng)檢測、總結(jié)事件數(shù)據(jù)、建議應(yīng)采取的行動(dòng),并通過對(duì)話式聊天引導(dǎo)使用者在平臺(tái)上操作。
利用 Google Workspace 提升工作效率
通過Gemini for Workspace,企業(yè)可直接在 Gmail、文檔和表格等產(chǎn)品中,使用內(nèi)置的 AI Agent。 今天,我們宣布推出 Gemini for Workspace 的下一波創(chuàng)新與增強(qiáng)功能,包含:
- Google Vids:這個(gè)由 AI 驅(qū)動(dòng)的視頻創(chuàng)作應(yīng)用程序,結(jié)合視頻創(chuàng)作、制作及編輯助理于一身,它可以自動(dòng)生成一個(gè)分鏡圖(storyboard)讓您輕松編輯,當(dāng)您選擇好風(fēng)格后,它會(huì)將您的草稿與素材庫中的視頻片段、圖片和背景音樂拼湊在一起。 它還可以幫助您找到合適的旁白來傳遞信息,可以選擇我們預(yù)設(shè)的旁白或是使用您自己的錄音。 Vids 將加入我們其他的生產(chǎn)力工具的行列,例如:文檔、表格和幻燈片等。它擁有簡單易用的界面,讓您能安全地通過瀏覽器協(xié)作和共享工作項(xiàng)目。 Vids 將于六月于 Workspace Labs 發(fā)布。
- AI Meetings and Messaging 插件:這款協(xié)作工具提供 “幫我記錄”(Take notes for me)與聊天摘要功能,支持 69 種語言(相當(dāng)于 4,600 種語言組合)的實(shí)時(shí)翻譯功能。
- 全新的 AI Security 插件:Workspace 管理員現(xiàn)在可以使用專為其組織訓(xùn)練、可保護(hù)隱私的 AI 模型與數(shù)據(jù)外泄防護(hù)控件,來自動(dòng)分類與保護(hù)機(jī)密檔案與數(shù)據(jù)。
回顧過去這一年,看到我們的使用者從最初抱著熱衷嘗試和實(shí)驗(yàn)的心態(tài),一路進(jìn)展到實(shí)際運(yùn)用 AI 工具并推出早期產(chǎn)品,這確實(shí)令人驚嘆,也使我們更加期待他們未來更廣泛的應(yīng)用。