華為星河AI數(shù)據(jù)中心網(wǎng)絡(luò):以智能底座釋放AI時代算力潛能
原創(chuàng)隨著人工智能技術(shù)的快速發(fā)展,大模型訓(xùn)練、實時推理等應(yīng)用對算力的需求呈現(xiàn)爆發(fā)式增長。全球科技企業(yè)紛紛加碼智算中心建設(shè),試圖以規(guī)模化的硬件投入搶占技術(shù)高地。然而,高投入背后隱藏著諸多現(xiàn)實難題:數(shù)據(jù)中心能耗居高不下、算力利用率不足、跨區(qū)域資源協(xié)同效率低、網(wǎng)絡(luò)通信性能制約訓(xùn)練速度……這些問題不僅推高了AI研發(fā)成本,更成為技術(shù)規(guī)?;涞氐年P(guān)鍵瓶頸。
算力作為驅(qū)動千行萬業(yè)智能化轉(zhuǎn)型的核心引擎,其潛能的釋放離不開高效、可靠的數(shù)據(jù)中心網(wǎng)絡(luò)。面對當前數(shù)據(jù)中心存在的諸多難題,如何通過數(shù)據(jù)中心網(wǎng)絡(luò)充分釋放算力,成為行業(yè)亟待解決的關(guān)鍵問題。
近日,在華為中國合作伙伴大會2025上,華為數(shù)據(jù)通信產(chǎn)品線副總裁趙志鵬接受了媒體專訪,剖析了數(shù)據(jù)中心網(wǎng)絡(luò)的現(xiàn)狀與挑戰(zhàn),并分享了華為星河AI數(shù)據(jù)中心網(wǎng)絡(luò)的破局之道。
華為數(shù)據(jù)通信產(chǎn)品線副總裁趙志鵬
AI時代數(shù)據(jù)中心網(wǎng)絡(luò)新挑戰(zhàn)
傳統(tǒng)數(shù)據(jù)中心網(wǎng)絡(luò)架構(gòu)在能耗、算力利用率、跨區(qū)域協(xié)同和網(wǎng)絡(luò)通信性能等方面存在諸多不足。
首先是算力利用率不足的問題。由于器件性能和算法優(yōu)化水平有限,眾多數(shù)據(jù)中心的實際算力利用率遠低于理論值,大量算力資源被白白浪費。
其次是跨數(shù)據(jù)中心協(xié)同難。單一數(shù)據(jù)中心規(guī)模受電力等因素制約,分散建設(shè)的區(qū)域算力節(jié)點又面臨協(xié)同效率低下的問題,網(wǎng)絡(luò)延遲和通信損耗導(dǎo)致整體訓(xùn)練效率大幅降低。
再者是企業(yè)普惠接入門檻高。即便成功建成了智算中心如何確保企業(yè)能低成本、高效率地調(diào)用算力,仍是亟待攻克的難關(guān)。
雙向賦能,重塑網(wǎng)絡(luò)價值
面對數(shù)據(jù)中心網(wǎng)絡(luò)的種種挑戰(zhàn),趙志鵬介紹到華為升級了星河AI數(shù)據(jù)中心網(wǎng)絡(luò)解決方案,通過“Netwrok for AI”和“AI for Network”雙向賦能,為行業(yè)智能化轉(zhuǎn)型提供了堅實底座。
在釋放算效方面,當前推理需求爆發(fā),同一任務(wù)網(wǎng)絡(luò)通信時長普遍大于計算時長,造成近20%的算力浪費。華為推出CloudEngine XH9000全系列交換機,支持350ns超低時延轉(zhuǎn)發(fā),通過星智AI推理調(diào)度算法,減少推理流量的通信耗時,推理性能提升20%。在通算場景,華為最新的網(wǎng)安一體仿真方案,通過獨家的CMOS仿真算法確保準確,實現(xiàn)安全策略自動生成和100%準確。此外,華為通過網(wǎng)絡(luò)級負載均衡算法NSLB持續(xù)增強,有效提升了AI的訓(xùn)練效率,使得有限的算力發(fā)揮出最大的潛能。同時,通過構(gòu)建“算力基礎(chǔ)網(wǎng)”,將零散的算力節(jié)點虛擬化為統(tǒng)一資源池,不僅提高AI能效,還實現(xiàn)了算力的有效整合與提升。
在“AI for Network”方面,華為聚焦于運用AI技術(shù)提升網(wǎng)絡(luò)質(zhì)量。通過AI算法實時監(jiān)測光模塊、交換機等設(shè)備狀態(tài),實現(xiàn)了預(yù)測性維護。此外,客戶可以利用AI分析用戶需求,提供差異化的算力服務(wù)與定價策略,進而實現(xiàn)增收。
此外,華為還推出了數(shù)據(jù)中心網(wǎng)絡(luò)星聯(lián)光模塊,具有超遠傳輸、超高可靠、超高安全三大能力,為企業(yè)打造3S高品質(zhì)網(wǎng)絡(luò)體驗,滿足企業(yè)對網(wǎng)絡(luò)性能的高要求。
傳統(tǒng)光模塊存在高價低質(zhì)、故障率高的問題,嚴重制約了數(shù)據(jù)中心網(wǎng)絡(luò)的發(fā)展。華為通過三大創(chuàng)新實現(xiàn)破局。在高集成器件設(shè)計方面,通過減少部件數(shù)量,有效提升了光模塊的可靠性,降低了故障發(fā)生的概率。同時,采用多通道冗余技術(shù),當單通道出現(xiàn)故障時,可自動降速運行而不斷連,大大降低了訓(xùn)練中斷的風(fēng)險,保障了算力傳輸?shù)姆€(wěn)定性。此外,在同等性能下,提升光模塊覆蓋距離和兼容性,更好地適應(yīng)不同的網(wǎng)絡(luò)環(huán)境,為數(shù)據(jù)中心網(wǎng)絡(luò)的高效運行提供了有力支持。
結(jié)語:重塑網(wǎng)絡(luò)價值,開啟AI新未來
破解AI算力困局,不能僅靠硬件堆砌,更需通過網(wǎng)絡(luò)架構(gòu)創(chuàng)新打破資源孤島,實現(xiàn)算力的高效流動與智能調(diào)度。華為星河AI數(shù)據(jù)中心網(wǎng)絡(luò)正在重新定義智能時代的網(wǎng)絡(luò)價值,以“網(wǎng)絡(luò)+AI”的雙向賦能模式,為行業(yè)智能化轉(zhuǎn)型提供堅實底座。