AI巨頭的算力賬:谷歌自研TPU,繞過(guò)英偉達(dá)稅,成本僅為OpenAI兩成!OpenAI VS 谷歌企業(yè)怎么選?盤(pán)點(diǎn)四大決策關(guān)鍵!
原創(chuàng) 精選編譯 | 伊風(fēng)
隨著生成式 AI 技術(shù)的迅猛發(fā)展,全球科技巨頭圍繞 AI 平臺(tái)的競(jìng)爭(zhēng)也日益白熱化。近期,OpenAI 發(fā)布了強(qiáng)大的 o3 和 o4-mini 推理模型以及 GPT-4.1 系列,谷歌則迅速推出了 Gemini 2.5 Flash主打“性?xún)r(jià)比”路線(xiàn),作為對(duì)稍早發(fā)布的旗艦版 Gemini 2.5 Pro 的迭代更新。
雖然模型對(duì)比測(cè)試經(jīng)常成為頭條新聞,但對(duì)于技術(shù)決策者而言,選擇 AI 平臺(tái)所涉及的內(nèi)容要深遠(yuǎn)得多。這不僅僅是選擇一個(gè)模型,而是對(duì)整個(gè)生態(tài)系統(tǒng)的承諾,影響到從基礎(chǔ)算力成本、智能體開(kāi)發(fā)策略,到模型可靠性、企業(yè)集成的方方面面。
其中,隱藏在水面之下、卻具有深遠(yuǎn)長(zhǎng)期影響的最關(guān)鍵差異,是支撐這些 AI 巨頭的硬件經(jīng)濟(jì)學(xué)。憑借自研芯片,谷歌在成本上擁有巨大的優(yōu)勢(shì),使其 AI 工作負(fù)載的運(yùn)行成本可能只是依賴(lài)英偉達(dá)(Nvidia)高利潤(rùn)率 GPU 的 OpenAI 的一小部分。
本文將從算力成本、智能體框架策略、模型能力對(duì)比,以及企業(yè)適配與分發(fā)四個(gè)關(guān)鍵維度,深入對(duì)比谷歌與 OpenAI/Microsoft 的平臺(tái)優(yōu)勢(shì)與局限,剖析這場(chǎng)生成式 AI 平臺(tái)之戰(zhàn)背后更深層次的力量對(duì)比。
算力:硬件層面上,OpenAI的算力成本達(dá)谷歌4-6 倍
谷歌最重要、但往往被低估的優(yōu)勢(shì),是它的“秘密武器”:十年來(lái)持續(xù)投入開(kāi)發(fā)的TPU。TPU是谷歌為自身的核心 AI 工作負(fù)載量身定做并部署自有的,比如最近亮相的 Ironwood 系列,就用在了 Gemini 模型的訓(xùn)練與推理。
而 OpenAI 以及更廣泛的AI玩家,仍高度依賴(lài)英偉達(dá)昂貴而強(qiáng)大的 GPU(如 H100 和 A100)。
這為什么重要?因?yàn)樗鼛?lái)了巨大的成本差異。
英偉達(dá)的 GPU(尤其是面向數(shù)據(jù)中心的 H100 和即將推出的 B100)擁有驚人的毛利率,據(jù)分析師估計(jì)可高達(dá) 80%。這意味著 OpenAI(通過(guò)微軟 Azure)需要為算力支付一筆高昂的溢價(jià)——也就是所謂的“英偉達(dá)稅”。而谷歌憑借自有 TPU,自然跳過(guò)了這層加價(jià)。
據(jù)報(bào)道,雖然制造一塊 GPU 的成本可能僅為 3,000-5,000 美元,但像微軟這樣的超大規(guī)模客戶(hù)(為 OpenAI 提供服務(wù))卻需以 20,000-35,000 美元以上的單價(jià)批量購(gòu)買(mǎi)。行業(yè)內(nèi)部討論和分析表明,谷歌獲得 AI 算力的單位成本,可能僅為依賴(lài)高端英偉達(dá) GPU 客戶(hù)的約 20%。
雖然具體數(shù)字屬于內(nèi)部機(jī)密,但這意味著在硬件層面上,谷歌的單位算力成本優(yōu)勢(shì)大約是 4-6 倍。
這種結(jié)構(gòu)性?xún)?yōu)勢(shì)已經(jīng)反映在 API 定價(jià)上。如果對(duì)比旗艦?zāi)P?,OpenAI 的 o3 在標(biāo)準(zhǔn)上下文長(zhǎng)度下,輸入 token 的價(jià)格大約是谷歌 Gemini 2.5 Pro 的 8 倍,輸出 token 的價(jià)格是 4 倍左右。
而這種成本差異并不僅僅是理論問(wèn)題,它帶來(lái)了深遠(yuǎn)的戰(zhàn)略影響。谷歌能夠以更低的價(jià)格維持競(jìng)爭(zhēng),并且實(shí)現(xiàn)更高的“每美元智能密度”,為企業(yè)提供更可預(yù)測(cè)的長(zhǎng)期總擁有成本(TCO)——而這正是它現(xiàn)在實(shí)際在做的事情。
與此同時(shí),OpenAI 的成本結(jié)構(gòu)則被緊緊綁定在英偉達(dá)的定價(jià)權(quán)和其 Azure 合作協(xié)議上。根據(jù)一些報(bào)告,算力成本預(yù)計(jì)占 OpenAI 2024 年 90 億美元總運(yùn)營(yíng)費(fèi)用的 55%-60%,到 2025 年隨著規(guī)模擴(kuò)大,這一比例可能超過(guò) 80%。雖然 OpenAI 的收入增長(zhǎng)預(yù)期非常驚人——根據(jù)內(nèi)部預(yù)測(cè),到 2029 年有望達(dá)到 1250 億美元——但如何控制算力開(kāi)銷(xiāo),仍然是其必須解決的核心挑戰(zhàn),也促使他們加速自研芯片的布局。
智能體框架:谷歌的開(kāi)放生態(tài)系統(tǒng) vs. OpenAI 的一體化策略
除了硬件之外,這兩大巨頭在構(gòu)建和部署企業(yè)自動(dòng)化智能體方面也走上了截然不同的道路。
谷歌正在積極推進(jìn)互操作性和更開(kāi)放的生態(tài)體系。在兩周前的 Cloud Next 大會(huì)上,谷歌發(fā)布了 Agent-to-Agent(A2A)協(xié)議,旨在讓不同平臺(tái)上構(gòu)建的智能體能夠互相通信,同時(shí)推出了 Agent Development Kit(ADK)和用于發(fā)現(xiàn)與管理智能體的 Agentspace 中樞。
雖然 A2A 的推廣仍面臨挑戰(zhàn)——例如 Anthropic 尚未加入,而且部分開(kāi)發(fā)者質(zhì)疑 A2A 是否有必要,因?yàn)橐延蓄?lèi)似的 Model Context Protocol(MCP)——但谷歌的意圖非常明確:希望打造一個(gè)多供應(yīng)商共存的智能體市場(chǎng),可能依托 Agent Garden 平臺(tái),或未來(lái)推出傳聞中的 Agent App Store。
相比之下,OpenAI 則似乎專(zhuān)注于打造強(qiáng)大、緊密集成在自身技術(shù)棧內(nèi)的工具型智能體。新的 o3 模型就是一個(gè)典型例子,能在一次推理鏈中發(fā)起數(shù)百次工具調(diào)用。開(kāi)發(fā)者可以利用 Responses API、Agents SDK,以及新推出的 Codex CLI 等工具,構(gòu)建運(yùn)行于 OpenAI/Azure 信任邊界內(nèi)的復(fù)雜智能體。雖然微軟的 Autogen 框架提供了一定的靈活性,但 OpenAI 的核心策略顯然不是為了促進(jìn)跨平臺(tái)通信,而是為了在自己可控的環(huán)境中,垂直深化智能體能力。
在這一部分,企業(yè)決策的tips是:如果公司優(yōu)先考慮靈活性,希望能自由組合來(lái)自不同供應(yīng)商的智能體(例如將 Salesforce 智能體接入 Vertex AI),那么谷歌的開(kāi)放策略更具吸引力。而如果企業(yè)已經(jīng)深度綁定 Azure/Microsoft 體系,或更偏好高度集成、性能卓越的智能體棧,則可能更傾向選擇 OpenAI。
模型能力:水平、性能與痛點(diǎn)
快速迭代的發(fā)布周期意味著模型領(lǐng)先地位轉(zhuǎn)瞬即逝。雖然在部分編碼基準(zhǔn)測(cè)試(如 SWE-Bench Verified 和 Aider)上,OpenAI 的 o3 模型略勝于 Gemini 2.5 Pro,但在其他測(cè)試(如 GPQA 和 AIME)中,Gemini 2.5 Pro 又能追平或領(lǐng)先。值得注意的是,Gemini 2.5 Pro 目前在大型語(yǔ)言模型(LLM)競(jìng)技場(chǎng)排行榜(Arena Leaderboard)上總體排名第一。
不過(guò),對(duì)于很多企業(yè)應(yīng)用場(chǎng)景來(lái)說(shuō),兩者在核心能力上已大致持平。
真正的區(qū)別在于各自的取舍側(cè)重點(diǎn):
- 上下文長(zhǎng)度 vs. 推理深度:Gemini 2.5 Pro 擁有高達(dá) 100 萬(wàn) token 的上下文窗口(未來(lái)計(jì)劃擴(kuò)展到 200 萬(wàn)),非常適合處理大型代碼庫(kù)或文檔集。OpenAI 的 o3 上下文窗口為 20 萬(wàn),但更強(qiáng)調(diào)單輪推理中的深度、多工具協(xié)作推理,得益于其強(qiáng)化學(xué)習(xí)訓(xùn)練方法。
- 可靠性 vs. 風(fēng)險(xiǎn):這一點(diǎn)正成為關(guān)鍵差異。雖然 o3 展現(xiàn)了令人印象深刻的推理能力,但 OpenAI 自己的模型卡披露,o3 在 PersonQA 測(cè)試上的幻覺(jué)(hallucination)率是 o1 的兩倍。有分析認(rèn)為,這可能與其復(fù)雜的推理鏈與工具調(diào)用機(jī)制有關(guān)。而 Gemini 2.5 Pro 雖然在輸出結(jié)構(gòu)上有時(shí)被認(rèn)為不如 o3 那樣“創(chuàng)新”,但用戶(hù)普遍反映它在企業(yè)任務(wù)中更加可靠、可預(yù)測(cè)。因此,企業(yè)必須在追求最前沿推理能力與接受更高幻覺(jué)風(fēng)險(xiǎn)之間做出權(quán)衡。
考慮到這個(gè)維度,企業(yè)必須針對(duì)具體情況進(jìn)行決策,因?yàn)椴煌P驮诰唧w任務(wù)的表現(xiàn)有高低。若需要處理超大上下文或更注重輸出可預(yù)測(cè)性,Gemini 2.5 Pro 更具優(yōu)勢(shì);若任務(wù)對(duì)多工具深度推理要求極高,且能?chē)?yán)格管理幻覺(jué)風(fēng)險(xiǎn),那么 o3 是一個(gè)非常有力的選項(xiàng)。正如 Sam Witteveen 在我們播客中指出的:在具體企業(yè)場(chǎng)景中進(jìn)行嚴(yán)格測(cè)試是不可或缺的。
谷歌的強(qiáng)項(xiàng)在于為現(xiàn)有 Google Cloud 和 Workspace 客戶(hù)提供深度集成。Gemini 模型、Vertex AI、Agentspace 以及 BigQuery 等工具高度協(xié)同,統(tǒng)一的控制平臺(tái)和數(shù)據(jù)治理機(jī)制,使得已投資谷歌生態(tài)的公司可以更快實(shí)現(xiàn)價(jià)值落地。谷歌正積極吸引大型企業(yè)客戶(hù),如 Wendy’s、Wayfair 和富國(guó)銀行等部署案例。
OpenAI 則依托微軟,擁有無(wú)可比擬的市場(chǎng)覆蓋與可達(dá)性。ChatGPT 龐大的用戶(hù)基礎(chǔ)(大約 8 億月活用戶(hù))帶來(lái)了極高的普及度。更重要的是,微軟正將 OpenAI 模型(包括最新的 o 系列)積極融入 Microsoft 365 Copilot 和 Azure 服務(wù),使強(qiáng)大的 AI 能力快速滲透到數(shù)億企業(yè)用戶(hù)每天使用的工具中。對(duì)于已經(jīng)標(biāo)準(zhǔn)化使用 Azure 和 Microsoft 365 的企業(yè)來(lái)說(shuō),采納 OpenAI 解決方案是一種自然的延伸。此外,開(kāi)發(fā)者普遍使用 OpenAI API,也意味著很多企業(yè)已有的提示詞(prompt)和工作流已天然適配 OpenAI 模型。
因此, 最終的選擇往往取決于現(xiàn)有的供應(yīng)商體系:
- 如果已經(jīng)是谷歌生態(tài)的重度用戶(hù),谷歌提供了高度整合且連貫的解決方案。
- 如果企業(yè)更偏向微軟體系,OpenAI 則憑借微軟的強(qiáng)大分發(fā)網(wǎng)絡(luò),帶來(lái)了廣泛的可訪問(wèn)性與潛在的低門(mén)檻部署體驗(yàn)。
寫(xiě)在最后:AI巨頭不可忽視的算力之戰(zhàn)
2024年,當(dāng)谷歌發(fā)布屢屢遭到“群嘲”時(shí),谷歌CEOPichai回應(yīng)說(shuō),“當(dāng)我們正處于AI的拐點(diǎn)上時(shí),我看到的是機(jī)會(huì),所以如果把這個(gè)時(shí)間線(xiàn)拉長(zhǎng),那么某一天發(fā)生的某一件事就都無(wú)關(guān)緊要了?!倍F(xiàn)在谷歌正以迅猛的勢(shì)頭,和OpenAI并駕齊驅(qū)。
而在這場(chǎng)拉鋸戰(zhàn)中,算力成本或許是未來(lái)最關(guān)鍵、最具決定性影響的差異——尤其是在 OpenAI 尚未能快速解決這一問(wèn)題的情況下。
這不僅僅是價(jià)格差異的小問(wèn)題,而是直接影響到諸如 API 成本可承受性、長(zhǎng)期總擁有成本(TCO)可預(yù)測(cè)性,以及 AI 部署的可擴(kuò)展性等各個(gè)層面。隨著 AI 工作負(fù)載呈指數(shù)級(jí)增長(zhǎng),擁有更可持續(xù)經(jīng)濟(jì)引擎(即更高硬件成本效率)的平臺(tái),將在戰(zhàn)略上占據(jù)強(qiáng)有力的領(lǐng)先地位。谷歌正在利用這一優(yōu)勢(shì),同時(shí)積極推進(jìn)智能體互操作性的開(kāi)放愿景。
OpenAI 則依托微軟的規(guī)模優(yōu)勢(shì),通過(guò)深度集成的工具型模型和無(wú)與倫比的市場(chǎng)觸達(dá)能力展開(kāi)反擊,盡管其成本結(jié)構(gòu)和模型可靠性仍然存在一定疑問(wèn)。
要做出正確選擇,企業(yè)技術(shù)負(fù)責(zé)人需要超越表面基準(zhǔn)測(cè)試,從以下幾個(gè)維度綜合評(píng)估各大生態(tài)系統(tǒng):
- 長(zhǎng)期總擁有成本(TCO)的影響;
- 偏好的智能體策略與開(kāi)放性程度;
- 對(duì)模型可靠性風(fēng)險(xiǎn)與推理能力原始性能的容忍度;
- 現(xiàn)有技術(shù)棧的適配情況;
- 以及自身的具體應(yīng)用需求。
原文鏈接:https://venturebeat.com/ai/the-new-ai-calculus-googles-80-cost-edge-vs-openais-ecosystem/