詳解:實現(xiàn)廣域確定性網(wǎng)絡(luò)的三種技術(shù)路線
上回介紹了確定性網(wǎng)絡(luò)的背景,并提到確定性網(wǎng)絡(luò)不是單一的技術(shù),而是一系列協(xié)議和機制的合集(確定性網(wǎng)絡(luò):打造網(wǎng)絡(luò)中的超級高鐵)。那么到底有哪些技術(shù),怎么實現(xiàn)的,成熟度怎么樣?這次就接著聊一聊實現(xiàn)廣域確定性網(wǎng)絡(luò)的三種技術(shù)路線。
一、1層動態(tài)光電交叉/1.5層硬管道切片
最簡單的確定性網(wǎng)絡(luò)莫過于全光網(wǎng),比如點到點連接的裸光纖,服務(wù)質(zhì)量極為穩(wěn)定,但這樣的方式帶寬沒法統(tǒng)計復(fù)用、不支持點到多點傳輸、費用高昂、光纖資源浪費大。因此,要想靈活組網(wǎng)又便宜,還是要引入基于分組交換的以太網(wǎng)。于是就有了OTN(Optical Transport Network,光傳送網(wǎng)絡(luò)),其將電域和光域統(tǒng)一管理,可提供巨大的傳送容量、完全透明的端到端波長連接以及電信級保護;因為OTN具有強大的開銷、維護管理以及組網(wǎng)能力,其已成為當前廣域承載的主要技術(shù)。
那OTN有沒有問題?它主要有兩大問題。
一是難以動態(tài)地光電交叉。OTN主要采用波分復(fù)用和時分復(fù)用技術(shù)來調(diào)度資源,其要求提前建立虛電路連接,然后才能在信道上傳輸信號。OTN既可以在光層做交叉,也可以在電層做交叉,還可以光電一起做交叉,但開銷和復(fù)雜度越往后越高。諾基亞貝爾實驗室在2019年提出了確定性動態(tài)網(wǎng)絡(luò)(DDN)的概念以及OE(Optical-Ethernet)技術(shù),將光層時隙資源和以太隊列資源聯(lián)合進行調(diào)度,動態(tài)地建立釋放連接,期望時分復(fù)用達到統(tǒng)計復(fù)用的帶寬利用效果。其采用在中間節(jié)點只處理包頭、只在邊緣節(jié)點進行FEC差錯校驗、嚴格優(yōu)先級調(diào)度等方式降低管理控制開銷,并試驗了將DDN用于邊緣云間的確定性互聯(lián)。
二是帶寬顆粒不夠細、不夠靈活。OTN目前最小只能到2.5Gb/s的電層帶寬顆粒,為此,OIF光學互聯(lián)論壇提出了FlexE靈活以太網(wǎng)技術(shù),一種在1.5層提供細粒度硬管道切片、業(yè)務(wù)隔離的技術(shù)。FlexE在以太網(wǎng)L2/L1層之間增加了FlexE Shim層,它通過時分復(fù)用分發(fā)機制,將多個client接口的數(shù)據(jù)按照時隙方式調(diào)度并分發(fā)至多個不同的子通道,使網(wǎng)絡(luò)即具備類似于時分復(fù)用的獨占時隙、隔離性好的特性,又具備以太網(wǎng)統(tǒng)計復(fù)用、網(wǎng)絡(luò)效率高的特性。
FlexE 有3種應(yīng)用模式:鏈路捆綁模式、子速率模式和通道化模式。鏈路捆綁模式是將多個物理通道捆綁起來,形成一個大的邏輯通道,實現(xiàn)大流量的業(yè)務(wù)傳輸。子速率模式是指單條客戶業(yè)務(wù)速率小于一條物理通道速率時,將多條客戶速率匯聚起來共享一條物理通道,提高物理通道的帶寬利用率。通道化模式是客戶業(yè)務(wù)分布在多條不同物理通道的多條時隙上,多個客戶共享多條物理通道。
換個簡單說法,F(xiàn)lexE是一個接口技術(shù),把以太網(wǎng)接口速率和光接口速率解耦。你可以把4個100G的接口合起來當400G的接口用,也可以把100G的接口劃分出來1G給專門的業(yè)務(wù)用,目前OIF更有考慮實現(xiàn)MB級別的小顆粒切片。
總結(jié)一下,技術(shù)路線一是利用OE、FlexE等技術(shù),在光層/1.5層進行調(diào)度,通過硬管道切片隔離,保證帶寬層面、業(yè)務(wù)層面的確定性傳輸。
二、網(wǎng)絡(luò)演算+軟件定義隊列
保證確定性帶寬后,如何保證確定性的時延和抖動呢?技術(shù)路線一只能保證業(yè)務(wù)層面的確定性,為了保證每流、每包級別的確定性,還需要網(wǎng)絡(luò)演算和軟件定義隊列技術(shù)。
在QoS保障方面,很早就有智能路由、帶時延約束的路由、帶寬時延聯(lián)合調(diào)度等保障時延的方法,但這些方法大多類似DiffServ模型,得到的結(jié)果是統(tǒng)計意義上的平均時延/抖動變小了,是優(yōu)化的平均指標。平均指標其實跟負載有關(guān),負載小了平均時延自然就小了。而確定性要求的是最壞時延有界,即在有流突發(fā)、聚播等情況下,流的最大端到端時延依然不超過某個值;同時滿足低時延,即最壞時延接近最小時延,從而減小時延變化(抖動)。這個時候,就需要確定性網(wǎng)絡(luò)演算理論。
先從單節(jié)點單流看,確定性網(wǎng)絡(luò)演算理論是說已知一條流的到達速率、突發(fā)尺寸、到達時間、以及節(jié)點的服務(wù)速率,那么就能算出來流在該節(jié)點的服務(wù)時間。從單節(jié)點多流看,已知多條流的上述信息,則可以根據(jù)卷積疊加原理,算出各條流的等待時間和服務(wù)時間,從而算出各流的逐跳最壞時延。最后從多節(jié)點多流看,也就是從全局整個系統(tǒng)看,若全網(wǎng)通過SDN的方式可管可控,已知網(wǎng)絡(luò)和流的上述信息,則可以通過控制發(fā)包速率、調(diào)整發(fā)包時間、邊緣整形等方式,得到每流通過網(wǎng)絡(luò)系統(tǒng)的理論端到端時延上界,從而提前為流選擇滿足時延上界要求的合適的路由路徑和調(diào)度方法。
其實,很早就有IntServ、異步整形器等這類基于網(wǎng)絡(luò)演算的機制,但因為要為每流提供調(diào)度器、核心節(jié)點要維護每流狀態(tài)、存在可擴展性等問題,以及廣域海量流量會實時動態(tài)變化,需要強大的實時測量、全局管理、精準控制能力等原因,其未能得到廣泛部署。
此外,各流的等待時間跟它的優(yōu)先級有關(guān)系,在無搶占的情況下,一條流要先等比它優(yōu)先級高的流傳完,以及同等優(yōu)先級先到的流傳完后,才輪到它開始傳輸。顯然,如果隊列優(yōu)先級越多,那么能夠調(diào)度規(guī)劃流的粒度就越細。傳統(tǒng)交換機出端口只有8個優(yōu)先級隊列,是以業(yè)務(wù)類為粒度進行調(diào)度,因此,當前還提出了軟件定義隊列的方法,其最多每端口能創(chuàng)建65000個隊列,希望做到每流每隊列的調(diào)度粒度。通過動態(tài)地創(chuàng)建隊列、刪除隊列、以及修改隊列調(diào)度算法,使得調(diào)度方式更加靈活、時延計算更加精細。
三、基于周期的循環(huán)隊列調(diào)度
那有沒有可擴展性很強的廣域確定性調(diào)度機制?有,比如多隊列循環(huán)排隊轉(zhuǎn)發(fā)、可擴展確定性轉(zhuǎn)發(fā)、周期具化的循環(huán)排隊轉(zhuǎn)發(fā)、Paternoster等機制,它們都是基于周期的循環(huán)隊列調(diào)度機制,接下來以IETF DetNet工作組提出的周期具化的循環(huán)排隊轉(zhuǎn)發(fā)[1][2](CSQF,Cycle Specified Queuing and Forwarding)機制為例進行介紹。
CSQF是基于多周期的多隊列循環(huán)調(diào)度機制,其要求設(shè)備間頻率同步、設(shè)備出端口隊列循環(huán)排隊轉(zhuǎn)發(fā)、且需維護相鄰節(jié)點的周期映射關(guān)系,最后將帶有周期信息的分段路由標識符(SID,Segment Routing Identifier)列表附加到數(shù)據(jù)包。如下圖所示,當發(fā)端想要將時間敏感的流發(fā)送給收端時,連接建立的工作流程為:(1)集中式網(wǎng)絡(luò)控制器收集服務(wù)質(zhì)量的請求。(2)控制器通過計算滿足約束的可行路徑和周期來生成SID。 (3)控制器將SID標簽棧分配給發(fā)端和沿路徑的網(wǎng)絡(luò)設(shè)備。
SID指定了在每個節(jié)點(跳)上傳輸數(shù)據(jù)包的出端口和傳輸周期。例如,4076表示在4節(jié)點的7端口的6周期傳輸該包。因此,啟用CSQF的設(shè)備可以通過消耗數(shù)據(jù)包頭標簽堆棧中可用的第一個SID,以精確的預(yù)留時間來轉(zhuǎn)發(fā)時間敏感數(shù)據(jù)包。此外,分段路由不僅是實現(xiàn)顯式路由的可行方法,還是一種源路由技術(shù),不需要在中間節(jié)點和出口節(jié)點維持每流狀態(tài),因此具有很好的可擴展性,能調(diào)度大規(guī)模海量的流量。
這種技術(shù)路線和TSN時間敏感網(wǎng)絡(luò)的同步調(diào)度機制一脈相承,都是基于時分復(fù)用的思想;希望通過約束最大隊列長度,從而控制排隊時延;找到合適的逐跳傳輸時延,則可以保證端到端最壞時延有界。此外,DetNet還在TSN的基礎(chǔ)上提出了顯性路由、抖動消減、包復(fù)制與消除等三層確定性技術(shù),融合TSN與DetNet是廣域確定性網(wǎng)絡(luò)的主要發(fā)展方向之一。
四、總結(jié)
最后,如下圖總結(jié),筆者認為確定性網(wǎng)絡(luò)及其類似技術(shù)的共同點是:要解決性能保證與資源共享之間的矛盾。以太網(wǎng)的Best-effort分組轉(zhuǎn)發(fā)就勝在能充分的實現(xiàn)資源共享,而未來確定性網(wǎng)絡(luò)的趨勢是:基于IP以太網(wǎng),通過業(yè)務(wù)隔離、資源預(yù)留,以盡可能低的成本與開銷,實現(xiàn)性能保證與資源共享間的均衡。
[1] https://datatracker.ietf.org/doc/html/draft-chen-detnet-sr-based-bounded-latency
[2] S. Chen, J. Leguay, S. Martin and P. Medagliani, “Load Balancing for Deterministic Networks,” 2020 IFIP Networking Conference (Networking), 2020, pp. 785-790.
作者簡介:黃玉棟,北京郵電大學網(wǎng)絡(luò)與交換國家重點實驗室研二在讀,研究方向為未來網(wǎng)絡(luò)體系架構(gòu),確定性網(wǎng)絡(luò),郵箱地址: hyduni@163.com.