百舸爭流逐鹿以太 | 銳捷網(wǎng)絡助力中國移動GSE領跑智算網(wǎng)絡
2023年5月,銳捷網(wǎng)絡作為首批領航者計劃合作伙伴,受邀參與中國信息通信研究院、中國通信標準化協(xié)會 CCSA TC610 SDN / NFV / AI 標準與產(chǎn)業(yè)推進委員會共同發(fā)起的“自智網(wǎng)絡領航者計劃”授牌儀式。同時,由中國移動研究院聯(lián)合銳捷網(wǎng)絡等產(chǎn)業(yè)合作伙伴共同編寫的《全調(diào)度以太網(wǎng)技術架構(gòu)白皮書》正式發(fā)布。多年來,銳捷網(wǎng)絡堅持創(chuàng)新數(shù)智網(wǎng)絡,以“筑算網(wǎng)基石,創(chuàng)數(shù)智未來”為目標,以前沿網(wǎng)絡技術提升高性能智算網(wǎng)絡產(chǎn)品方案能力,夯實云網(wǎng)新型基礎設施基石。
2023年5月,銳捷受邀參加“自智網(wǎng)絡領航者計劃”授牌儀式
當前,AIGC(AI-Generated Content,人工智能生產(chǎn)內(nèi)容) 發(fā)展迅猛,業(yè)內(nèi)大模型已推出千億、萬億級參數(shù)量,底層GPU算力部署規(guī)模也達到萬卡級別,對智能算力的需求不斷增長。在AI大模型的訓練中,網(wǎng)絡的性能成為了制約其規(guī)模擴展和性能提升的關鍵因素,一旦網(wǎng)絡性能不佳,就會影響分布式訓練的質(zhì)量和速度。因此,互連計算資源的網(wǎng)絡必須盡可能高效且具有成本效益,否則當網(wǎng)絡表現(xiàn)不佳時,高價值算力得不到充分利用將造成集群的低效。同時,智算中心的網(wǎng)絡芯片、網(wǎng)卡芯片長期處于技術體系復雜、封閉壟斷的局面,導致通信行業(yè)中的上下游企業(yè)難以在其基礎上協(xié)同創(chuàng)新。以太網(wǎng)作為在生態(tài)系統(tǒng)、性能/規(guī)模、成本、標準調(diào)整等方面具有諸多優(yōu)勢的技術,雖受到了國內(nèi)外眾多專家的青睞,但也存在為提升擁塞控制和負載均衡效率而強制進行算法協(xié)議優(yōu)化的問題。
那么,面向未來智算中心規(guī)模建設部署,如何建立開放生態(tài)發(fā)展以太技術用于HPC/AI網(wǎng)絡,如何打造無阻塞、高帶寬、超低時延的高性能網(wǎng)絡成為提升算力能力的關鍵,也成為國內(nèi)外數(shù)據(jù)中心網(wǎng)絡領域研究的重要課題。
為突破智算中心網(wǎng)絡性能瓶頸,打造開放的無阻塞、高帶寬及超低時延的新型智算中心網(wǎng)絡產(chǎn)業(yè)鏈生態(tài),助力AIGC等高性能業(yè)務快速發(fā)展,中國移動研究院聯(lián)合產(chǎn)業(yè)界原創(chuàng)提出全調(diào)度以太網(wǎng)技術(GSE Global Scheduled Ethernet)。在2023年5月云網(wǎng)智聯(lián)大會主論壇上,中移動聯(lián)合銳捷網(wǎng)絡等十多家合作伙伴發(fā)布《全調(diào)度以太網(wǎng)技術架構(gòu)白皮書》,明確了全調(diào)度以太網(wǎng)的總體架構(gòu)、GSE網(wǎng)絡核心技術和演進路徑,并在中國通信標準化協(xié)會(CCSA China Communications Standards Association)成功立項相關行業(yè)標準。
2023年5月,銳捷參與的《全調(diào)度以太網(wǎng)技術架構(gòu)白皮書》在云網(wǎng)智聯(lián)大會發(fā)布
8月19日,在2023中國算力大會主論壇上,銳捷網(wǎng)絡受邀參加“全調(diào)度以太網(wǎng)(GSE)推動計劃”,其目標是凝結(jié)產(chǎn)業(yè)各方力量,突破關鍵技術,推動標準和開源發(fā)展,打造開放、標準、兼容的新型以太網(wǎng)協(xié)議體系,全面提升智算中心網(wǎng)絡規(guī)模和性能,支撐AI等高性能業(yè)務的快速發(fā)展。
9月9日,在2023年中國網(wǎng)絡大會上,中國移動研究院攜手銳捷等合作伙伴發(fā)布“全調(diào)度以太網(wǎng)(GSE)”樣機。此次發(fā)布的全調(diào)度以太網(wǎng)(GSE)樣機為GSE核心技術實現(xiàn)的原型系統(tǒng),對后續(xù)GSE關鍵技術研究和應用推廣具有重要意義,標志著我國在AI網(wǎng)絡方案的重要突破。
2023年9月,中國移動攜手銳捷發(fā)布“全調(diào)度以太網(wǎng)GSE”樣機
GSE樣機為1U的盒式交換設備,支持32個100GE端口,可以同時兼做GSP和GSF的硬件底座。在功能上支持基于報文容器的全路徑“噴灑”轉(zhuǎn)發(fā),端到端DGSQ請求及授權調(diào)度機制,以及報文亂序重排等,可滿足各種大模型的流量優(yōu)化需求。經(jīng)過真實環(huán)境驗證相較傳統(tǒng)方案性能大幅提升,相較于RoCE網(wǎng)絡,GSE網(wǎng)絡在AllReduce及alltoall兩大流量場景訓練業(yè)務完成時間(JCT)大幅縮短30%以上,算力效率得到明顯的提升。
中國網(wǎng)絡大會上展示的GSE樣機
銳捷網(wǎng)絡作為智算中心網(wǎng)絡建設領軍者,積極支持業(yè)內(nèi)聯(lián)合開發(fā)創(chuàng)新,支撐超大規(guī)模的算力集群建設,踐行以太無損網(wǎng)絡解決方案的路線,并且推出了AI-Fabric智算中心網(wǎng)絡解決方案,天然支持無損機制和負載均衡,無需算法優(yōu)化和網(wǎng)絡調(diào)優(yōu),解決RoCE組網(wǎng)的局限性。同時,銳捷網(wǎng)絡不僅在國內(nèi)與移動深入合作,為研發(fā)全調(diào)度以太網(wǎng)(GSE)技術積極貢獻力量,而且在國際上已成為UEC超以太網(wǎng)聯(lián)盟 (UltraEthernetConsortium,UEC) 成員。未來,銳捷網(wǎng)絡將始終以開放的態(tài)度全面擁抱面向下一代智算網(wǎng)絡的創(chuàng)新技術,助力實現(xiàn)對以太網(wǎng)標準的優(yōu)化和對高性能網(wǎng)絡的革新,在未來網(wǎng)絡技術領域持續(xù)貢獻力量。