自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

AI巨頭的算力賬:谷歌自研TPU,繞過(guò)英偉達(dá)稅,成本僅為OpenAI兩成!OpenAI VS 谷歌企業(yè)怎么選?盤(pán)點(diǎn)四大決策關(guān)鍵!

原創(chuàng) 精選
人工智能
雖然模型對(duì)比測(cè)試經(jīng)常成為頭條新聞,但對(duì)于技術(shù)決策者而言,選擇 AI 平臺(tái)所涉及的內(nèi)容要深遠(yuǎn)得多。這不僅僅是選擇一個(gè)模型,而是對(duì)整個(gè)生態(tài)系統(tǒng)的承諾,影響到從基礎(chǔ)算力成本、智能體開(kāi)發(fā)策略,到模型可靠性、企業(yè)集成的方方面面。

編譯 | 伊風(fēng)

隨著生成式 AI 技術(shù)的迅猛發(fā)展,全球科技巨頭圍繞 AI 平臺(tái)的競(jìng)爭(zhēng)也日益白熱化。近期,OpenAI 發(fā)布了強(qiáng)大的 o3 和 o4-mini 推理模型以及 GPT-4.1 系列,谷歌則迅速推出了 Gemini 2.5 Flash主打“性?xún)r(jià)比”路線(xiàn),作為對(duì)稍早發(fā)布的旗艦版 Gemini 2.5 Pro 的迭代更新。

雖然模型對(duì)比測(cè)試經(jīng)常成為頭條新聞,但對(duì)于技術(shù)決策者而言,選擇 AI 平臺(tái)所涉及的內(nèi)容要深遠(yuǎn)得多。這不僅僅是選擇一個(gè)模型,而是對(duì)整個(gè)生態(tài)系統(tǒng)的承諾,影響到從基礎(chǔ)算力成本、智能體開(kāi)發(fā)策略,到模型可靠性、企業(yè)集成的方方面面。

其中,隱藏在水面之下、卻具有深遠(yuǎn)長(zhǎng)期影響的最關(guān)鍵差異,是支撐這些 AI 巨頭的硬件經(jīng)濟(jì)學(xué)。憑借自研芯片,谷歌在成本上擁有巨大的優(yōu)勢(shì),使其 AI 工作負(fù)載的運(yùn)行成本可能只是依賴(lài)英偉達(dá)(Nvidia)高利潤(rùn)率 GPU 的 OpenAI 的一小部分。

本文將從算力成本、智能體框架策略、模型能力對(duì)比,以及企業(yè)適配與分發(fā)四個(gè)關(guān)鍵維度,深入對(duì)比谷歌與 OpenAI/Microsoft 的平臺(tái)優(yōu)勢(shì)與局限,剖析這場(chǎng)生成式 AI 平臺(tái)之戰(zhàn)背后更深層次的力量對(duì)比。

算力:硬件層面上,OpenAI的算力成本達(dá)谷歌4-6 倍

谷歌最重要、但往往被低估的優(yōu)勢(shì),是它的“秘密武器”:十年來(lái)持續(xù)投入開(kāi)發(fā)的TPU。TPU是谷歌為自身的核心 AI 工作負(fù)載量身定做并部署自有的,比如最近亮相的 Ironwood 系列,就用在了 Gemini 模型的訓(xùn)練與推理。

而 OpenAI 以及更廣泛的AI玩家,仍高度依賴(lài)英偉達(dá)昂貴而強(qiáng)大的 GPU(如 H100 和 A100)。

這為什么重要?因?yàn)樗鼛?lái)了巨大的成本差異。

英偉達(dá)的 GPU(尤其是面向數(shù)據(jù)中心的 H100 和即將推出的 B100)擁有驚人的毛利率,據(jù)分析師估計(jì)可高達(dá) 80%。這意味著 OpenAI(通過(guò)微軟 Azure)需要為算力支付一筆高昂的溢價(jià)——也就是所謂的“英偉達(dá)稅”。而谷歌憑借自有 TPU,自然跳過(guò)了這層加價(jià)。

據(jù)報(bào)道,雖然制造一塊 GPU 的成本可能僅為 3,000-5,000 美元,但像微軟這樣的超大規(guī)模客戶(hù)(為 OpenAI 提供服務(wù))卻需以 20,000-35,000 美元以上的單價(jià)批量購(gòu)買(mǎi)。行業(yè)內(nèi)部討論和分析表明,谷歌獲得 AI 算力的單位成本,可能僅為依賴(lài)高端英偉達(dá) GPU 客戶(hù)的約 20%。

雖然具體數(shù)字屬于內(nèi)部機(jī)密,但這意味著在硬件層面上,谷歌的單位算力成本優(yōu)勢(shì)大約是 4-6 倍。

這種結(jié)構(gòu)性?xún)?yōu)勢(shì)已經(jīng)反映在 API 定價(jià)上。如果對(duì)比旗艦?zāi)P?,OpenAI 的 o3 在標(biāo)準(zhǔn)上下文長(zhǎng)度下,輸入 token 的價(jià)格大約是谷歌 Gemini 2.5 Pro 的 8 倍,輸出 token 的價(jià)格是 4 倍左右。

而這種成本差異并不僅僅是理論問(wèn)題,它帶來(lái)了深遠(yuǎn)的戰(zhàn)略影響。谷歌能夠以更低的價(jià)格維持競(jìng)爭(zhēng),并且實(shí)現(xiàn)更高的“每美元智能密度”,為企業(yè)提供更可預(yù)測(cè)的長(zhǎng)期總擁有成本(TCO)——而這正是它現(xiàn)在實(shí)際在做的事情。

與此同時(shí),OpenAI 的成本結(jié)構(gòu)則被緊緊綁定在英偉達(dá)的定價(jià)權(quán)和其 Azure 合作協(xié)議上。根據(jù)一些報(bào)告,算力成本預(yù)計(jì)占 OpenAI 2024 年 90 億美元總運(yùn)營(yíng)費(fèi)用的 55%-60%,到 2025 年隨著規(guī)模擴(kuò)大,這一比例可能超過(guò) 80%。雖然 OpenAI 的收入增長(zhǎng)預(yù)期非常驚人——根據(jù)內(nèi)部預(yù)測(cè),到 2029 年有望達(dá)到 1250 億美元——但如何控制算力開(kāi)銷(xiāo),仍然是其必須解決的核心挑戰(zhàn),也促使他們加速自研芯片的布局。

智能體框架:谷歌的開(kāi)放生態(tài)系統(tǒng) vs. OpenAI 的一體化策略

除了硬件之外,這兩大巨頭在構(gòu)建和部署企業(yè)自動(dòng)化智能體方面也走上了截然不同的道路。

谷歌正在積極推進(jìn)互操作性和更開(kāi)放的生態(tài)體系。在兩周前的 Cloud Next 大會(huì)上,谷歌發(fā)布了 Agent-to-Agent(A2A)協(xié)議,旨在讓不同平臺(tái)上構(gòu)建的智能體能夠互相通信,同時(shí)推出了 Agent Development Kit(ADK)和用于發(fā)現(xiàn)與管理智能體的 Agentspace 中樞。

雖然 A2A 的推廣仍面臨挑戰(zhàn)——例如 Anthropic 尚未加入,而且部分開(kāi)發(fā)者質(zhì)疑 A2A 是否有必要,因?yàn)橐延蓄?lèi)似的 Model Context Protocol(MCP)——但谷歌的意圖非常明確:希望打造一個(gè)多供應(yīng)商共存的智能體市場(chǎng),可能依托 Agent Garden 平臺(tái),或未來(lái)推出傳聞中的 Agent App Store。

相比之下,OpenAI 則似乎專(zhuān)注于打造強(qiáng)大、緊密集成在自身技術(shù)棧內(nèi)的工具型智能體。新的 o3 模型就是一個(gè)典型例子,能在一次推理鏈中發(fā)起數(shù)百次工具調(diào)用。開(kāi)發(fā)者可以利用 Responses API、Agents SDK,以及新推出的 Codex CLI 等工具,構(gòu)建運(yùn)行于 OpenAI/Azure 信任邊界內(nèi)的復(fù)雜智能體。雖然微軟的 Autogen 框架提供了一定的靈活性,但 OpenAI 的核心策略顯然不是為了促進(jìn)跨平臺(tái)通信,而是為了在自己可控的環(huán)境中,垂直深化智能體能力。

在這一部分,企業(yè)決策的tips是:如果公司優(yōu)先考慮靈活性,希望能自由組合來(lái)自不同供應(yīng)商的智能體(例如將 Salesforce 智能體接入 Vertex AI),那么谷歌的開(kāi)放策略更具吸引力。而如果企業(yè)已經(jīng)深度綁定 Azure/Microsoft 體系,或更偏好高度集成、性能卓越的智能體棧,則可能更傾向選擇 OpenAI。

模型能力:水平、性能與痛點(diǎn)

快速迭代的發(fā)布周期意味著模型領(lǐng)先地位轉(zhuǎn)瞬即逝。雖然在部分編碼基準(zhǔn)測(cè)試(如 SWE-Bench Verified 和 Aider)上,OpenAI 的 o3 模型略勝于 Gemini 2.5 Pro,但在其他測(cè)試(如 GPQA 和 AIME)中,Gemini 2.5 Pro 又能追平或領(lǐng)先。值得注意的是,Gemini 2.5 Pro 目前在大型語(yǔ)言模型(LLM)競(jìng)技場(chǎng)排行榜(Arena Leaderboard)上總體排名第一。

不過(guò),對(duì)于很多企業(yè)應(yīng)用場(chǎng)景來(lái)說(shuō),兩者在核心能力上已大致持平。

真正的區(qū)別在于各自的取舍側(cè)重點(diǎn):

  • 上下文長(zhǎng)度 vs. 推理深度:Gemini 2.5 Pro 擁有高達(dá) 100 萬(wàn) token 的上下文窗口(未來(lái)計(jì)劃擴(kuò)展到 200 萬(wàn)),非常適合處理大型代碼庫(kù)或文檔集。OpenAI 的 o3 上下文窗口為 20 萬(wàn),但更強(qiáng)調(diào)單輪推理中的深度、多工具協(xié)作推理,得益于其強(qiáng)化學(xué)習(xí)訓(xùn)練方法。
  • 可靠性 vs. 風(fēng)險(xiǎn):這一點(diǎn)正成為關(guān)鍵差異。雖然 o3 展現(xiàn)了令人印象深刻的推理能力,但 OpenAI 自己的模型卡披露,o3 在 PersonQA 測(cè)試上的幻覺(jué)(hallucination)率是 o1 的兩倍。有分析認(rèn)為,這可能與其復(fù)雜的推理鏈與工具調(diào)用機(jī)制有關(guān)。而 Gemini 2.5 Pro 雖然在輸出結(jié)構(gòu)上有時(shí)被認(rèn)為不如 o3 那樣“創(chuàng)新”,但用戶(hù)普遍反映它在企業(yè)任務(wù)中更加可靠、可預(yù)測(cè)。因此,企業(yè)必須在追求最前沿推理能力與接受更高幻覺(jué)風(fēng)險(xiǎn)之間做出權(quán)衡。

考慮到這個(gè)維度,企業(yè)必須針對(duì)具體情況進(jìn)行決策,因?yàn)椴煌P驮诰唧w任務(wù)的表現(xiàn)有高低。若需要處理超大上下文或更注重輸出可預(yù)測(cè)性,Gemini 2.5 Pro 更具優(yōu)勢(shì);若任務(wù)對(duì)多工具深度推理要求極高,且能?chē)?yán)格管理幻覺(jué)風(fēng)險(xiǎn),那么 o3 是一個(gè)非常有力的選項(xiàng)。正如 Sam Witteveen 在我們播客中指出的:在具體企業(yè)場(chǎng)景中進(jìn)行嚴(yán)格測(cè)試是不可或缺的。

企業(yè)適配與分發(fā):集成深度 vs. 市場(chǎng)觸達(dá)最終,企業(yè)是否采納,往往取決于平臺(tái)能否順利融入現(xiàn)有的基礎(chǔ)設(shè)施與工作流。

谷歌的強(qiáng)項(xiàng)在于為現(xiàn)有 Google Cloud 和 Workspace 客戶(hù)提供深度集成。Gemini 模型、Vertex AI、Agentspace 以及 BigQuery 等工具高度協(xié)同,統(tǒng)一的控制平臺(tái)和數(shù)據(jù)治理機(jī)制,使得已投資谷歌生態(tài)的公司可以更快實(shí)現(xiàn)價(jià)值落地。谷歌正積極吸引大型企業(yè)客戶(hù),如 Wendy’s、Wayfair 和富國(guó)銀行等部署案例。

OpenAI 則依托微軟,擁有無(wú)可比擬的市場(chǎng)覆蓋與可達(dá)性。ChatGPT 龐大的用戶(hù)基礎(chǔ)(大約 8 億月活用戶(hù))帶來(lái)了極高的普及度。更重要的是,微軟正將 OpenAI 模型(包括最新的 o 系列)積極融入 Microsoft 365 Copilot 和 Azure 服務(wù),使強(qiáng)大的 AI 能力快速滲透到數(shù)億企業(yè)用戶(hù)每天使用的工具中。對(duì)于已經(jīng)標(biāo)準(zhǔn)化使用 Azure 和 Microsoft 365 的企業(yè)來(lái)說(shuō),采納 OpenAI 解決方案是一種自然的延伸。此外,開(kāi)發(fā)者普遍使用 OpenAI API,也意味著很多企業(yè)已有的提示詞(prompt)和工作流已天然適配 OpenAI 模型。

因此, 最終的選擇往往取決于現(xiàn)有的供應(yīng)商體系:

  • 如果已經(jīng)是谷歌生態(tài)的重度用戶(hù),谷歌提供了高度整合且連貫的解決方案。
  • 如果企業(yè)更偏向微軟體系,OpenAI 則憑借微軟的強(qiáng)大分發(fā)網(wǎng)絡(luò),帶來(lái)了廣泛的可訪問(wèn)性與潛在的低門(mén)檻部署體驗(yàn)。

寫(xiě)在最后:AI巨頭不可忽視的算力之戰(zhàn)

2024年,當(dāng)谷歌發(fā)布屢屢遭到“群嘲”時(shí),谷歌CEOPichai回應(yīng)說(shuō),“當(dāng)我們正處于AI的拐點(diǎn)上時(shí),我看到的是機(jī)會(huì),所以如果把這個(gè)時(shí)間線(xiàn)拉長(zhǎng),那么某一天發(fā)生的某一件事就都無(wú)關(guān)緊要了?!倍F(xiàn)在谷歌正以迅猛的勢(shì)頭,和OpenAI并駕齊驅(qū)。

而在這場(chǎng)拉鋸戰(zhàn)中,算力成本或許是未來(lái)最關(guān)鍵、最具決定性影響的差異——尤其是在 OpenAI 尚未能快速解決這一問(wèn)題的情況下。

這不僅僅是價(jià)格差異的小問(wèn)題,而是直接影響到諸如 API 成本可承受性、長(zhǎng)期總擁有成本(TCO)可預(yù)測(cè)性,以及 AI 部署的可擴(kuò)展性等各個(gè)層面。隨著 AI 工作負(fù)載呈指數(shù)級(jí)增長(zhǎng),擁有更可持續(xù)經(jīng)濟(jì)引擎(即更高硬件成本效率)的平臺(tái),將在戰(zhàn)略上占據(jù)強(qiáng)有力的領(lǐng)先地位。谷歌正在利用這一優(yōu)勢(shì),同時(shí)積極推進(jìn)智能體互操作性的開(kāi)放愿景。

OpenAI 則依托微軟的規(guī)模優(yōu)勢(shì),通過(guò)深度集成的工具型模型和無(wú)與倫比的市場(chǎng)觸達(dá)能力展開(kāi)反擊,盡管其成本結(jié)構(gòu)和模型可靠性仍然存在一定疑問(wèn)。

要做出正確選擇,企業(yè)技術(shù)負(fù)責(zé)人需要超越表面基準(zhǔn)測(cè)試,從以下幾個(gè)維度綜合評(píng)估各大生態(tài)系統(tǒng):

  • 長(zhǎng)期總擁有成本(TCO)的影響;
  • 偏好的智能體策略與開(kāi)放性程度;
  • 對(duì)模型可靠性風(fēng)險(xiǎn)與推理能力原始性能的容忍度;
  • 現(xiàn)有技術(shù)棧的適配情況;
  • 以及自身的具體應(yīng)用需求。

原文鏈接:https://venturebeat.com/ai/the-new-ai-calculus-googles-80-cost-edge-vs-openais-ecosystem/

責(zé)任編輯:武曉燕 來(lái)源: 51CTO技術(shù)棧
相關(guān)推薦

2023-08-29 13:50:00

AI谷歌

2023-10-08 13:56:00

英偉達(dá)芯片AI

2021-06-25 10:40:38

阿里云AIM6

2024-02-20 11:31:07

AI人工智能ChatGPT

2023-04-11 08:18:49

OpenAI人工智能

2024-03-05 09:53:54

2024-12-20 12:30:00

2020-07-30 14:05:53

谷歌華為芯片

2024-06-20 13:19:48

2023-04-06 09:37:22

谷歌AI

2024-07-30 21:47:50

2023-03-31 15:12:33

ChatGPTOpenAI谷歌

2024-04-03 13:05:20

數(shù)據(jù)訓(xùn)練

2024-06-11 08:05:00

2025-03-10 08:20:00

微軟AI模型

2023-04-11 08:37:30

TPUAI芯片

2024-05-07 13:44:00

模型數(shù)據(jù)

2023-09-13 07:33:39

2019-04-28 09:12:47

AWS阿里云谷歌云

2023-02-16 10:26:58

谷歌AI
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)