AI添動(dòng)力,無損網(wǎng)絡(luò)通向下一站
網(wǎng)絡(luò)傳輸可以多高效?讓我們來一探“無損網(wǎng)絡(luò)”的奧秘。
“東數(shù)西算”正熱 數(shù)字經(jīng)濟(jì)加速發(fā)展有“新路”
隨著《全國一體化大數(shù)據(jù)中心協(xié)同創(chuàng)新體系算力樞紐實(shí)施方案》的引發(fā), “東數(shù)西算”、“數(shù)據(jù)中心創(chuàng)新性發(fā)展”成為業(yè)界高度關(guān)注的熱點(diǎn)話題。“東數(shù)西算”是建設(shè)“全國一體化算力網(wǎng)絡(luò)國家樞紐節(jié)點(diǎn)”的國家級(jí)戰(zhàn)略工程,旨在改善我國數(shù)字基礎(chǔ)設(shè)施不平衡的布局,讓數(shù)據(jù)中心能夠在數(shù)字經(jīng)濟(jì)的發(fā)展中發(fā)揮“扛鼎之力”。
“東數(shù)西算”工程將在未來形成以數(shù)據(jù)流為導(dǎo)向的新型算力網(wǎng)絡(luò)格局。在這一背景下,我們急需可以提供承載的下一代網(wǎng)絡(luò),賦能數(shù)字經(jīng)濟(jì)的發(fā)展真正走上一條極速而又穩(wěn)健的康莊大道。作為下一代網(wǎng)絡(luò)發(fā)展代表,“無損網(wǎng)絡(luò)”憑借正猛的創(chuàng)新發(fā)展勢頭,走入我們的視野。
什么是無損網(wǎng)絡(luò)?
無損,顧名思義即是“零”損耗,這里的損耗指的是在網(wǎng)絡(luò)傳輸過程中的協(xié)議包轉(zhuǎn)發(fā)、響應(yīng)時(shí)間、處理時(shí)間以及設(shè)備吞吐量等主要指標(biāo)。答案很明顯,無損網(wǎng)絡(luò)就是能夠?qū)崿F(xiàn)“零丟包、低時(shí)延、高吞吐”的網(wǎng)絡(luò)環(huán)境,其目標(biāo)就是“延遲越低越好,效率越高越好“。因此,比起曾經(jīng)丟包、高時(shí)延的“有損”網(wǎng)絡(luò)環(huán)境來說,無損網(wǎng)絡(luò)在擁塞控制、流量控制、分組轉(zhuǎn)發(fā)、路由選擇等方面進(jìn)行了改進(jìn)與創(chuàng)新,滿足數(shù)據(jù)中心海量算力和海量數(shù)據(jù)的高效存儲(chǔ)需求,極大提升了用戶體驗(yàn)。
- 關(guān)鍵的“兩把刷子”—PFC和ECN
隨著云計(jì)算、大數(shù)據(jù)、人工智能以及5G的興起,網(wǎng)絡(luò)數(shù)據(jù)呈現(xiàn)爆炸式增長,對(duì)數(shù)據(jù)的處理性能、數(shù)據(jù)中心建設(shè)都提出了更高的要求。當(dāng)前,在HPC(High Performance Computing,高性能計(jì)算)、分布式存儲(chǔ)、AI人工智能等業(yè)務(wù)場景下,采用RDMA協(xié)議來降低CPU的處理和延遲,提升應(yīng)用性能,成為算力時(shí)代數(shù)據(jù)中心網(wǎng)絡(luò)的發(fā)展方向。
其中,RDMA網(wǎng)絡(luò)正是通過在網(wǎng)絡(luò)中部署PFC(Priority-based Flow Control,基于優(yōu)先級(jí)的流量控制)和ECN(Explicit Congestion Notification,顯示擁塞通知)功能來實(shí)現(xiàn)無損保障。
PFC是基于隊(duì)列的反壓技術(shù),保證對(duì)鏈路上RDMA專屬隊(duì)列的流量進(jìn)行控制,并在交換機(jī)入口(Ingress port)出現(xiàn)擁塞時(shí)對(duì)上游設(shè)備流量進(jìn)行反壓。在單機(jī)場景下,PFC可以快速、有效的調(diào)節(jié)服務(wù)器速率來保證網(wǎng)絡(luò)不丟包。但是在多級(jí)網(wǎng)絡(luò)中,就會(huì)出現(xiàn)不公平降速、PFC風(fēng)暴、PFC死鎖等問題。因此,在數(shù)據(jù)中心開啟PFC,需要通過對(duì)Pause幀進(jìn)行嚴(yán)格的監(jiān)控、管理,以保證網(wǎng)絡(luò)的可靠性。
圖1 :PFC流程
ECN是一種基于流的端到端流控技術(shù),保證實(shí)現(xiàn)端到端的擁塞控制,在交換機(jī)出口(Egress port)擁塞時(shí),對(duì)數(shù)據(jù)包做ECN標(biāo)記,并讓流量發(fā)送端降低發(fā)送速率。ECN效果上會(huì)優(yōu)于PFC,但是也存在如下問題:
- ECN需要接收端生成反壓報(bào)文,反饋路徑周期比較長;
- 隨機(jī)性標(biāo)記,會(huì)不公平;
- 水線設(shè)計(jì)比較復(fù)雜,需要結(jié)合網(wǎng)絡(luò)架構(gòu)和業(yè)務(wù)特點(diǎn)來設(shè)計(jì);
圖2: ECN流程
- ECN與PFC怎樣組成黃金搭檔
從無損網(wǎng)絡(luò)設(shè)計(jì)看,為充分發(fā)揮網(wǎng)絡(luò)高性能轉(zhuǎn)發(fā),ECN和PFC組合配置時(shí),需通過專家經(jīng)驗(yàn)來調(diào)整ECN和PFC的buffer水線門限,讓ECN先于PFC觸發(fā)。即網(wǎng)絡(luò)還是持續(xù)全速進(jìn)行數(shù)據(jù)轉(zhuǎn)發(fā),讓服務(wù)器主動(dòng)降低發(fā)包速率。如果還不能解決問題,再通過PFC讓上游交換機(jī)暫停報(bào)文發(fā)送。這樣雖然整網(wǎng)吞吐性能有所下降,但是不會(huì)導(dǎo)致丟包。
圖3:ECN+PFC組合流程
流量與速率挑戰(zhàn)下 ECN&PFC的“遠(yuǎn)交近攻”
在 RoCE網(wǎng)絡(luò)中,構(gòu)建無損以太網(wǎng)要支持如下關(guān)鍵特性:
- PFC:逐跳提供基于優(yōu)先級(jí)的流量控制,能夠?qū)崿F(xiàn)在以太網(wǎng)鏈路上運(yùn)行多種類型的流量而互不影響。
- ECN:設(shè)備發(fā)生擁塞時(shí),通過對(duì)報(bào)文 IP 頭中 ECN 域的標(biāo)識(shí),由接收端向發(fā)送端發(fā)出降低發(fā)送速率的 CNP(Congestion Notification Packet,擁塞通知報(bào)文),實(shí)現(xiàn)端到端的擁塞管理,減緩擁塞擴(kuò)散惡化。
其中,ECN的最大難點(diǎn)是水線設(shè)置比較復(fù)雜,需要結(jié)合網(wǎng)絡(luò)架構(gòu)和業(yè)務(wù)特點(diǎn)來設(shè)計(jì)。然而現(xiàn)網(wǎng)中的流量復(fù)雜多變,導(dǎo)致基于專家經(jīng)驗(yàn)的靜態(tài)ECN水線門限功能并不能覆蓋所有流量場景,無法保障無損業(yè)務(wù)達(dá)到最優(yōu)性能。AI ECN則是借助AI算法來實(shí)現(xiàn)無損隊(duì)列的水線調(diào)整,通過AI訓(xùn)練的流量模型,可實(shí)時(shí)預(yù)測網(wǎng)絡(luò)流量的變化趨勢,動(dòng)態(tài)調(diào)整ECN的水線門限,從而實(shí)現(xiàn)對(duì)無損隊(duì)列的精確調(diào)度,保障整網(wǎng)的最優(yōu)性能。
新華三AI ECN算法 AI添翼性能領(lǐng)先
在此背景下,新華三推出的AI ECN智能無損算法,能根據(jù)網(wǎng)絡(luò)流量模型(N打1的Incast值、隊(duì)列深度、大小流占比等流量特征),通過強(qiáng)化學(xué)習(xí)算法對(duì)流量模型進(jìn)行AI訓(xùn)練,實(shí)時(shí)感知和預(yù)測網(wǎng)絡(luò)流量變化趨勢,自動(dòng)調(diào)節(jié)出最優(yōu)的ECN水線,進(jìn)行隊(duì)列的精確調(diào)度。在盡量避免觸發(fā)網(wǎng)絡(luò)PFC流控的同時(shí),兼顧時(shí)延敏感小流和吞吐敏感大流的轉(zhuǎn)發(fā),進(jìn)一步保障整網(wǎng)的最優(yōu)性能。
新華三AD-DC SeerFabric方案采用的AI ECN調(diào)優(yōu)算法處理流程如下:
圖4: AI ECN流程
作為新華三AD-DC SeerFabric無損網(wǎng)絡(luò)解決方案的重要一環(huán),AI ECN算法實(shí)現(xiàn)了對(duì)出端口隊(duì)列中ECN水線的動(dòng)態(tài)調(diào)整,使網(wǎng)絡(luò)設(shè)備在各種不同的通信網(wǎng)絡(luò)或者實(shí)時(shí)變化的通信網(wǎng)絡(luò)中,可以實(shí)現(xiàn)低傳輸時(shí)延以及高吞吐量,提高了網(wǎng)絡(luò)擁塞控制的靈活性。在實(shí)際組網(wǎng)測試中,各項(xiàng)性能指標(biāo)都有很大提高,很好完成了助力RDMA網(wǎng)絡(luò)性能的目標(biāo)。
三大特色引擎驅(qū)動(dòng)智能無損網(wǎng)絡(luò)加速演進(jìn)
今年初,新華三正式發(fā)布AD-DC SeerFabric無損網(wǎng)絡(luò)解決方案。基于云邊AI協(xié)同架構(gòu),通過對(duì)業(yè)界AI ECN調(diào)優(yōu)算法的優(yōu)化創(chuàng)新,結(jié)合新華三數(shù)據(jù)中心交換機(jī)的本地AI Inside能力,在保障零丟包的情況下,盡可能提升吞吐率、降低時(shí)延,保障網(wǎng)絡(luò)業(yè)務(wù)的精確轉(zhuǎn)發(fā)和網(wǎng)絡(luò)服務(wù)質(zhì)量的確定性。同時(shí),通過精細(xì)化的智能運(yùn)維,實(shí)現(xiàn)RoCE網(wǎng)絡(luò)的業(yè)務(wù)體驗(yàn)可視。
新華三AD-DC SeerFabric無損網(wǎng)絡(luò)解決方案的核心驅(qū)動(dòng)力來自三大關(guān)鍵智能組件:
- 智能分析引擎:利用無損網(wǎng)絡(luò)及聯(lián)接的存儲(chǔ)和計(jì)算資源,借助AI算法和專家經(jīng)驗(yàn),實(shí)現(xiàn)對(duì)數(shù)據(jù)中心不同流量場景的AI無損調(diào)優(yōu)模型的分析和構(gòu)建。通過現(xiàn)網(wǎng)流量的實(shí)時(shí)學(xué)習(xí)訓(xùn)練,自動(dòng)適配不同業(yè)務(wù)流量模型的特點(diǎn),動(dòng)態(tài)生成最優(yōu)網(wǎng)絡(luò)參數(shù),實(shí)現(xiàn)網(wǎng)絡(luò)的無損轉(zhuǎn)發(fā);
- 智能控制引擎:將智能分析引擎動(dòng)態(tài)生成的調(diào)優(yōu)參數(shù)自動(dòng)向設(shè)備下發(fā),實(shí)現(xiàn)無損網(wǎng)絡(luò)全局最優(yōu)化運(yùn)行;
- 邊緣AI引擎:交換機(jī)內(nèi)嵌高性能AI計(jì)算模塊,借助智能分析引擎的離線AI流量模型,進(jìn)行網(wǎng)絡(luò)狀態(tài)的實(shí)時(shí)監(jiān)控。自動(dòng)根據(jù)現(xiàn)網(wǎng)流量特征進(jìn)行RDMA隊(duì)列水線的本地智能調(diào)整,實(shí)現(xiàn)網(wǎng)絡(luò)參數(shù)優(yōu)化,保障本地網(wǎng)絡(luò)的無損轉(zhuǎn)發(fā)性能;
圖5 AD-DC SeerFabric無損網(wǎng)絡(luò)解決方案架構(gòu)
步入5G、云和AI等技術(shù)驅(qū)動(dòng)的智能時(shí)代,高吞吐、低時(shí)延的無損網(wǎng)絡(luò)成為網(wǎng)絡(luò)業(yè)務(wù)發(fā)展的普遍訴求。未來,新華三集團(tuán)將基于“云智原生”和“數(shù)字大腦2021”,繼續(xù)與業(yè)界伙伴一起,積極推進(jìn)智能無損網(wǎng)絡(luò)的標(biāo)準(zhǔn)化和應(yīng)用落地,并提供標(biāo)準(zhǔn)、開放的產(chǎn)品、方案和服務(wù),持續(xù)賦能生態(tài),為國家新型數(shù)據(jù)中心建設(shè)貢獻(xiàn)力量。從無損網(wǎng)絡(luò)到無損世界,科幻電影中的種種畫面即將成為現(xiàn)實(shí),無損世界的更多精彩,新華三將持續(xù)與你一同發(fā)現(xiàn)。