GPU利潤(rùn)率545%!DeepSeek成本公開(kāi):還值得自建算力嗎?
算力成本,大模型時(shí)代的“生死線”近日,國(guó)產(chǎn)大模型廠商DeepSeek罕見(jiàn)披露了其推理系統(tǒng)DeepSeek-V3/R1的核心架構(gòu)與成本細(xì)節(jié):單日GPU租賃成本超8.7萬(wàn)美元,理論利潤(rùn)率卻高達(dá)545%。這一數(shù)據(jù)讓行業(yè)再次聚焦大模型的核心命題——當(dāng)云廠商提供“水電煤”般的算力時(shí),自建集群是否還有必要?
一、DeepSeek的“吞吐量革命”:專(zhuān)家并行如何顛覆效率?
Diagram of DeepSeek's Online Inference System
DeepSeek-V3/R1的核心目標(biāo)直指大模型推理的痛點(diǎn):用更低的延遲,榨出更高的吞吐量。其殺手锏是大規(guī)??绻?jié)點(diǎn)專(zhuān)家并行(EP):
?專(zhuān)家“分而治之”:每層256個(gè)專(zhuān)家中僅激活8個(gè),通過(guò)跨節(jié)點(diǎn)分散計(jì)算,單卡負(fù)載銳減,矩陣乘法效率飆升。
?雙Batch流水線:Prefill階段用雙Batch交替掩蓋通信耗時(shí);Decode階段拆解Attention實(shí)現(xiàn)5級(jí)流水,通信與計(jì)算“無(wú)縫銜接”。
?動(dòng)態(tài)負(fù)載均衡:針對(duì)不同GPU的請(qǐng)求長(zhǎng)度、專(zhuān)家熱度差異,實(shí)時(shí)平衡計(jì)算量、通信量、KVCache內(nèi)存占用,避免“短板效應(yīng)”。
結(jié)果如何? 單臺(tái)H800 GPU的吞吐量達(dá)到:
- ?輸入73.7k tokens/s(Prefill,含56.3%緩存命中)
- ?輸出14.8k tokens/s(Decode),支撐日均7760億token處理。
二、云上推理的“成本真相”:租賃竟比自建更賺?
Cost And Theoretical Income
DeepSeek的成本賬本揭開(kāi)了一個(gè)反直覺(jué)結(jié)論:租用云GPU,反而比自建集群更“暴利”。
- ?成本結(jié)構(gòu):日均租賃278節(jié)點(diǎn)(2222塊H800),成本8.7萬(wàn)美元;理論收入達(dá)56.2萬(wàn)美元,利潤(rùn)率545%。
- ?彈性?xún)?yōu)勢(shì):白天流量高峰全節(jié)點(diǎn)推理,夜間縮容用于訓(xùn)練研究,無(wú)需為閑置算力買(mǎi)單。
- ?定價(jià)策略:按需使用云廠商的運(yùn)維、網(wǎng)絡(luò)、故障冗余能力,邊際成本近乎為“零”。
- 行業(yè)啟示錄:云廠商的規(guī)?;?yīng),已讓自建集群的“重資產(chǎn)模式”失去性?xún)r(jià)比。正如DeepSeek所暗示——“33%毛利的生意不值得做,不如白嫖云廠商的基建”。
三、自建VS租賃:大廠的兩難選擇
盡管云租賃經(jīng)濟(jì)性占優(yōu),但大廠仍有兩大“難言之隱”:
1.可用性焦慮:高峰期搶不到資源?核心業(yè)務(wù)宕機(jī)損失遠(yuǎn)超成本。
2.數(shù)據(jù)安全心結(jié):即便有“專(zhuān)機(jī)專(zhuān)用”“數(shù)據(jù)不出域”方案,領(lǐng)導(dǎo)仍可能認(rèn)為“機(jī)器搬進(jìn)自家機(jī)房才安心”。
現(xiàn)實(shí)魔幻一幕:某算力平臺(tái)為說(shuō)服客戶(hù),最終將服務(wù)器拆下直接送到甲方辦公室——這本質(zhì)上仍是“變相自建”,卻折射出行業(yè)對(duì)數(shù)據(jù)安全的極致偏執(zhí)。
四、未來(lái)展望:算力會(huì)像電力一樣“即插即用”嗎?
DeepSeek的實(shí)踐指向一個(gè)未來(lái):
- ?算力電網(wǎng)化:廠商只需關(guān)注“接網(wǎng)能力”,無(wú)需自建發(fā)電廠(GPU集群)。
- ?云廠商“工具化”:提供標(biāo)準(zhǔn)化、高彈性的算力單元,成為大模型時(shí)代的“基建底座”。
但有一個(gè)前提:云服務(wù)的穩(wěn)定性、安全性必須無(wú)限接近“自建體驗(yàn)”,否則巨頭們?nèi)詴?huì)押注可控性更高的私有集群。
結(jié)語(yǔ):成本與控制的博弈,遠(yuǎn)未終局
DeepSeek的案例證明,云租賃已是大模型商業(yè)化的最優(yōu)解。但對(duì)巨頭而言,是否交出算力控制權(quán),仍是戰(zhàn)略級(jí)抉擇?;蛟S未來(lái)的答案不在“二選一”,而在于混合云——讓核心數(shù)據(jù)留在本地,邊緣計(jì)算擁抱云端。這場(chǎng)博弈,才剛剛開(kāi)始。
引用鏈接
??[1]?
?? deepseek-ai/open-infra-index: ???https://github.com/deepseek-ai/open-infra-index??
本文轉(zhuǎn)載自??云原生AI百寶箱??,作者:云原生AI百寶箱
