奧特曼曬「星際之門」首期工廠,全美狂建20座超算!70萬(wàn)塊GPU老黃爆賺375億
一大早,奧特曼直播剛下線,就炫出了「星際之門」首期工廠。
而我們以上看到的,還僅僅是「星際之門」的1號(hào)基地。
據(jù)稱,德州阿比林(Abilene)已經(jīng)獲批875英畝地(約354萬(wàn)㎡),面積堪比紐約中央公園,計(jì)劃打造10個(gè)數(shù)據(jù)中心。未來(lái),4年耗資共5000億美金,在全美建設(shè)共20座超算中心。
奧特曼最新的帖子,是對(duì)馬斯克昨日嘲諷做出的有力回復(fù)。
奧特曼與馬斯克正面開(kāi)懟,手撕對(duì)方
難道馬斯克所說(shuō)的一切,真的只是噱頭嗎?
「星際之門」自周二官宣以來(lái),備受各界關(guān)注,尤其是5000美金投資直接引爆了全科技圈的熱議。據(jù)稱,這一金額相當(dāng)于達(dá)到了「曼哈頓計(jì)劃+阿波羅計(jì)劃」總額。
這一令人瞠目結(jié)舌的數(shù)字,不得不引發(fā)各界的猜想。
正如馬斯克昨日battle的所言,軟硬實(shí)際上獲得的融資遠(yuǎn)不到100億美金。
那么,真實(shí)情況到底是怎樣的?
SemiAnalysis獨(dú)家透露,事實(shí)上,「星際之門」的第一階段已經(jīng)確定,并在德克薩斯州阿比林?jǐn)?shù)據(jù)中心基地展開(kāi)。
不過(guò),他們確認(rèn)了馬斯克的話——軟銀的確沒(méi)有足夠資金來(lái)建設(shè)如此規(guī)模的算力集群。
下文中,他們將詳細(xì)剖析「星際之門」的實(shí)際情況、微軟當(dāng)前面臨的危機(jī)、項(xiàng)目架構(gòu)和成本,以及這個(gè)算力集群的真實(shí)情況。
千億美元集群已鎖定
除了奧特曼放出的實(shí)景,SemiAnalysis也制作了一張德州集群建設(shè)的宏觀圖。
確定的第一階段,也僅僅是已承諾的1000億美元投資中的一部分。至少可以說(shuō),這個(gè)數(shù)字最終數(shù)字(5000億美元)的計(jì)算方式著實(shí)令人玩味。
4個(gè)月前,著名分析師便在「Multi-Datacenter Training」報(bào)告中,已經(jīng)公開(kāi)討論了位于德州阿比林?jǐn)?shù)據(jù)中心基地第一階段規(guī)劃。
「星際之門」背后真實(shí)數(shù)據(jù)
他們認(rèn)為,這個(gè)項(xiàng)目是按總擁有成本(TCO, Total Cost of Ownership),而非資本支出來(lái)計(jì)量的。
換言之,1000億美元和5000億美元指的是TCO,其中包括數(shù)據(jù)中心、服務(wù)器、網(wǎng)絡(luò)設(shè)施、電力供應(yīng)的資本支出,以及債務(wù)融資在內(nèi)的諸多運(yùn)營(yíng)成本。
此外,目前只有首期1000億美元項(xiàng)目,已經(jīng)確定了數(shù)據(jù)中心選址和電力供應(yīng)?!感请H之門」項(xiàng)目整體資金仍未完全到位。
還有一個(gè)容易產(chǎn)生誤解的細(xì)節(jié)是,這個(gè)大型項(xiàng)目的第一個(gè)算力集群,其實(shí)就是去年宣布的Oracle和OpenAI合作項(xiàng)目。
該項(xiàng)目完全由Lancium、Crusoe和Oracle負(fù)責(zé)建設(shè)。據(jù)分析師了解,軟銀和MGX等其他方并未參與其中。
全美20座超算,10個(gè)已開(kāi)工
實(shí)際上,OpenAI周二官宣博文中,已經(jīng)明確了「星際之門」是一家新成立的合資企業(yè)公司。
在這個(gè)項(xiàng)目中,他們計(jì)劃在未來(lái)4年內(nèi)斥資5000億美元,用于AI基礎(chǔ)設(shè)施建設(shè),其中1000億美元將立即投入使用。
這是第二屆特朗普政府宣布的首個(gè)重大AI計(jì)劃,由于監(jiān)管政策顯著放寬,未來(lái)可能會(huì)推出更多類似計(jì)劃。
星際之門計(jì)劃的股權(quán)創(chuàng)始方包括軟銀、甲骨文、MGX和OpenAI,其中前三家公司負(fù)責(zé)前期注資。
軟銀和OpenAI是核心合作伙伴,軟銀負(fù)責(zé)財(cái)務(wù)管理,而OpenAI主導(dǎo)運(yùn)營(yíng)工作,包括幾乎所有的算力集群管理軟件。
如前所述,該項(xiàng)目計(jì)劃共建設(shè)20個(gè)數(shù)據(jù)中心,其中10個(gè)已在德克薩斯州阿比林開(kāi)工,每個(gè)占地面積約46,500平方米(50萬(wàn)平方英尺)。
首期1000億美元支出明細(xì)
最初的Oracle/Crusoe項(xiàng)目作為其中一個(gè)數(shù)據(jù)中心,將與其他超級(jí)園區(qū)互聯(lián),實(shí)現(xiàn)規(guī)模比現(xiàn)有任何訓(xùn)練運(yùn)行,都大數(shù)個(gè)量級(jí)的分布式訓(xùn)練。
此前,奧特曼提到的「已經(jīng)在建設(shè)中」的星際之門計(jì)劃園區(qū),即為Oracle/Crusoe阿比林園區(qū)。
該園區(qū)將容納供OpenAI使用的10萬(wàn)臺(tái)GB200算力集群。這個(gè)開(kāi)發(fā)項(xiàng)目以及計(jì)劃在第二季度和第三季度交付的GB200服務(wù)器,將部署在Oracle/Crusoe的數(shù)據(jù)中心內(nèi)。
下面是2024年12月29日,拍攝的園區(qū)高清照片。
4個(gè)約11,150平方米的「模塊」組成了一棟44,600平方米的建筑,目前僅有兩棟建筑在建,關(guān)鍵IT負(fù)載容量約為180兆瓦。
為了讓大家理解這一規(guī)模,整個(gè)由20棟建筑組成的園區(qū)將包含80個(gè)這樣的「模塊」!
根據(jù)「加速器模型和數(shù)據(jù)中心模型」中,分析師為OpenAI/微軟/甲骨文規(guī)劃的建設(shè)計(jì)劃,OpenAI無(wú)需建設(shè)新園區(qū)就能部署全部1000億美元的總擁有成本(TCO)。
因此,他們認(rèn)為「星際之門」計(jì)劃合資企業(yè)的首期1000億美元將全部投入這個(gè)園區(qū)。
在Lancium的官網(wǎng)中,這個(gè)園區(qū)被稱為「Abilene Clean Campus」,并聲稱將在2025年實(shí)現(xiàn)1GW供電能力。
然而,通過(guò)多個(gè)行業(yè)消息源和文件,該園區(qū)已額外獲得1GW容量,總供電能力達(dá)到2.2GW。
據(jù)此可以估算,該園區(qū)的關(guān)鍵IT負(fù)載容量為1.8GW,能源使用效率(PUE)約為1.25。
雖然他們可能通過(guò)優(yōu)化使PUE接近2GW IT容量,但考慮到GB300特別是VR200的功率密度提升,這個(gè)目標(biāo)將很難實(shí)現(xiàn)。
70萬(wàn)塊GPU,老黃首期爆賺375億刀
除了正在部署的10萬(wàn)臺(tái)GB200算力集群外,分析師估計(jì),他們還將在整個(gè)園區(qū)部署另外20萬(wàn)臺(tái)GB300和約40萬(wàn)臺(tái)VR200(英偉達(dá)計(jì)劃在2026年推出的超算,分別對(duì)應(yīng)Vera CPU和Rubin GPU)。
他們根據(jù)園區(qū)1,000億美元總擁有成本(TCO)投資,以及人工智能TCO模型中的單位成本,計(jì)算出了Vera Rubin處理器的隱含數(shù)量。
約70萬(wàn)臺(tái)GPU的總IT功率為1.8GW,這與Oracle/Crusoe阿比林園區(qū)1,800兆瓦的容量相符。
簡(jiǎn)而言之,OpenAI預(yù)計(jì)為首個(gè)GB200集群支付的成本,約為每GPU每小時(shí)2.8美元,全規(guī)模集群的TCO為每小時(shí)2.38美元。
這些數(shù)字會(huì)隨著未來(lái)英偉達(dá)GPU的部署而相應(yīng)調(diào)整。
OpenAI的支出將超過(guò)1,000億美元,但這并非前期資本投入。
分析師還估計(jì)英偉達(dá)從中獲得的收入和IT設(shè)備資本支出相對(duì)較為適中,分別約為375億美元和490億美元。這將占用整個(gè)1.8GW Crusoe Lancium站點(diǎn)的容量。
隨著向GB300和VR200演進(jìn),每一代GPU的數(shù)量都將翻倍,單個(gè)GPU的功率需求也在增長(zhǎng)。
雖然70萬(wàn)塊GPU對(duì)于1,000億美元的投資而言規(guī)模似乎不大,但需要注意的是,這相當(dāng)于數(shù)百萬(wàn)臺(tái)Hopper(英偉達(dá)高性能計(jì)算架構(gòu))GPU的算力。
刷存在感的軟銀
甲骨文和軟銀是知名的股權(quán)提供方。
MGX是一個(gè)新近成立的阿布扎比科技投資平臺(tái),由Mubadala和G42共同創(chuàng)立。該基金由Sheikh Tahnoon bin Zayed al-Nahyan擔(dān)任主席,據(jù)報(bào)道他監(jiān)管著超過(guò)1.5萬(wàn)億美元的投資基金。
鑒于馬斯克聲稱軟銀籌資不到100億美元,需要特別指出的是,該合資企業(yè)還將通過(guò)項(xiàng)目融資籌集「?jìng)鶆?wù)資本」。
目前「股權(quán)融資」和「?jìng)鶆?wù)融資」的具體比例尚未確定,但甲骨文和MGX憑借其雄厚的資產(chǎn)負(fù)債表,可以為項(xiàng)目提供大量資金支持。
也就是說(shuō),即便軟銀沒(méi)錢,還有甲骨文和MGX。
據(jù)悉,OpenAI和軟銀各自在賬面上,承諾投入190億美元。軟銀目前雖然沒(méi)有這么多流動(dòng)資金,但預(yù)計(jì)其可能會(huì)通過(guò)出售部分ARM股份來(lái)籌集所需的股權(quán)投資。
OpenAI同樣缺乏這筆資金,但他們可以在新產(chǎn)品o3發(fā)布后進(jìn)行融資,而且不必直接全額籌集,可以通過(guò)向聯(lián)合體其他成員發(fā)行「混合資本工具」來(lái)實(shí)現(xiàn)。
需要承認(rèn)的是,馬斯克的判斷是正確的,他們目前確實(shí)還沒(méi)有籌集到這筆資金。
關(guān)鍵問(wèn)題在于項(xiàng)目融資風(fēng)險(xiǎn)能否與母機(jī)構(gòu)分離。這種風(fēng)險(xiǎn)隔離十分重要,因?yàn)镺penAI需要籌集資金來(lái)支付相關(guān)費(fèi)用。
對(duì)OpenAI而言,一個(gè)有利因素是這筆資金不需要立即到位。
OpenAI現(xiàn)有資金足以支付今年10萬(wàn)臺(tái)GB200集群的租金,但他們需要確保能夠支付2026年及以后大幅上漲的租金。
雖然OpenAI可能無(wú)法直接籌集到所需資金,但高級(jí)分析師相信,他們的技術(shù)和產(chǎn)品發(fā)展將能夠支撐這一規(guī)模的支出。
誰(shuí)是最大贏家?
我們看到,在「星際之門」合資項(xiàng)目的公告中,出現(xiàn)了許多科技巨頭的名字,比如英偉達(dá)、Arm、微軟、甲骨文以及前面提到的投資方。
這些都是令人印象深刻的知名企業(yè),但現(xiàn)實(shí)情況是,既有輸家,又有贏家。
若說(shuō)誰(shuí)是最大的輸家,恐怕就是微軟了。
微軟,最大loser
當(dāng)OpenAI選擇了另一個(gè)基礎(chǔ)設(shè)施合作伙伴時(shí),微軟實(shí)際上被擠到了邊緣位置。
同時(shí),納德拉的態(tài)度已經(jīng)非常明確:僅僅守住800億美金投資!
周二,微軟博客陳述了合作關(guān)系的事實(shí),以及微軟擁有優(yōu)先購(gòu)買權(quán)。
但現(xiàn)實(shí)是,這對(duì)微軟的長(zhǎng)期發(fā)展將產(chǎn)生逐步顯現(xiàn)的負(fù)面影響,因?yàn)樗麄儾辉赋袚?dān)這項(xiàng)投資的風(fēng)險(xiǎn)。
此外,更令人咋舌的是,負(fù)責(zé)OpenAI合作關(guān)系的Chris Young也在公告發(fā)布之后突然離職。
持樂(lè)觀態(tài)度的分析師會(huì)說(shuō),微軟正將其AI計(jì)劃的部分資本密集型業(yè)務(wù)轉(zhuǎn)移給甲骨文,但SemiAnalysis認(rèn)為這種短期收益無(wú)法抵消失去OpenAI收入和控制權(quán)帶來(lái)的長(zhǎng)期潛在損害。
雖然馬斯克和納德拉提出了同樣的疑問(wèn)——「實(shí)際的收益在哪里」,但馬斯克已制定計(jì)劃,要讓他們的田納西州孟菲斯基地以不低于OpenAI的速度發(fā)展;
而納德拉則沒(méi)有在內(nèi)部建設(shè)前沿AI模型的計(jì)劃。
Arm:技術(shù)合作伙伴,還是虛假新聞
Arm股價(jià)因被列為技術(shù)合作伙伴而上漲約16%,但這僅僅是因?yàn)槠銰race和Vera CPU與英偉達(dá)的Blackwell和Rubin GPU配套使用。
軟銀可能力推讓Arm加入公關(guān)陣營(yíng),表面上確實(shí)效果不錯(cuò)。但實(shí)際上Arm并未發(fā)揮實(shí)質(zhì)性作用。
對(duì)Arm股東而言,現(xiàn)實(shí)情況如上所述,軟銀可能不得不出售其在公司的部分股份,以為「星際之門」股權(quán)投資提供部分資金。
我們認(rèn)為投資者大多忽視了這一點(diǎn),錯(cuò)誤地將這個(gè)公告視為實(shí)質(zhì)性的利好消息。
甲骨文承擔(dān)了管理數(shù)據(jù)中心和供應(yīng)鏈物流的重任;管理1.8GW集群并按照另一家公司的要求采購(gòu)所有必要設(shè)備是一項(xiàng)極具挑戰(zhàn)性的任務(wù)。
英偉達(dá)顯然深度參與其中,因?yàn)橹饕蕾嚨氖撬麄兊挠布?/span>
而OpenAI將保持運(yùn)營(yíng)控制權(quán),并運(yùn)行幾乎所有自己的集群管理軟件。
全部用于一次訓(xùn)練
這個(gè)項(xiàng)目的規(guī)模令人印象深刻,但正如分析師最近在Fabricated Knowledge中所分析的那樣,這似乎是AI發(fā)展熱潮中的又一個(gè)重要里程碑。
我們知道,首批1,000億美元將投資于阿比林基地,而剩余的4,000億美元將用于開(kāi)發(fā)更多數(shù)據(jù)中心基地。
更值得注意的是,所有這些數(shù)據(jù)中心基地都將持續(xù)建設(shè),旨在實(shí)現(xiàn)AI分布式訓(xùn)練的目標(biāo)。
值得注意的是,僅僅復(fù)制4個(gè)相當(dāng)于阿比林規(guī)模的基地,就能產(chǎn)生9GW的核心IT算力,而這些算力將全部用于一次AI訓(xùn)練。
在SemiAnalysis分析中的,隨著數(shù)據(jù)中心互聯(lián)(DCI)建設(shè)的持續(xù)推進(jìn),Marvell和Ciena將成為最大贏家,F(xiàn)abrinet將獲得可觀收益,而Coherent和Lumentum則會(huì)獲得相對(duì)較小的收益。