一文讓你了解集群路由器技術(shù)
1.集群路由器產(chǎn)生的原因
集群就是當(dāng)一個(gè)人/物解決不了時(shí),必須集中一群人/物協(xié)同工作,集群的概念應(yīng)用在許多領(lǐng)域。
集群路由技術(shù)的產(chǎn)生,主要有兩個(gè)直接的原因:
首先,單機(jī)容量逐步發(fā)展到極限;
其次,超級(jí)節(jié)點(diǎn)的產(chǎn)生使得網(wǎng)絡(luò)結(jié)構(gòu)越趨復(fù)雜,運(yùn)維管理難度加大。
(1)單機(jī)容量到達(dá)極限
近年來(lái),路由器技術(shù)發(fā)展很快,容量有了大幅度的提升,具體表現(xiàn)為槽位數(shù)量的增多、每槽交換能力的提升以及板卡端口密度的不斷提高。設(shè)備廠商每年推出的新路由器,都是朝著這個(gè)方向發(fā)展。單槽位處理能力從原有40G、100G到400G,目前主流的廠商均支持單槽位1T。
對(duì)于核心層路由器來(lái)說,除了具備快速轉(zhuǎn)發(fā)的能力、高安全穩(wěn)定性之外,更重要的是,容量足夠大、可擴(kuò)展強(qiáng)。然而,互聯(lián)網(wǎng)流量的發(fā)展都是遠(yuǎn)遠(yuǎn)超過設(shè)備容量更新的速度?;ヂ?lián)網(wǎng)流量每12個(gè)月增長(zhǎng)1倍,而路由器的容量每18個(gè)月才增長(zhǎng)1倍。對(duì)于單臺(tái)路由器來(lái)說,其擴(kuò)展是有一定限制的,需考慮光器件的發(fā)展成熟度,以及電源、散熱、機(jī)房承重等方面,而且也無(wú)法超越流量增長(zhǎng)的摩爾定律。目前單臺(tái)路由器的開發(fā)技術(shù)已經(jīng)逐步發(fā)展到極限,路由器的發(fā)展需尋求一個(gè)新的出路。
(2)網(wǎng)絡(luò)結(jié)構(gòu)越趨復(fù)雜
由于單臺(tái)路由器的容量擴(kuò)展性有限,因此,近年來(lái)不斷提出了其他方案來(lái)緩解設(shè)備壓力。主要有以下兩種:
網(wǎng)絡(luò)層次分布式,即部署多個(gè)網(wǎng)絡(luò)層次,通過逐層匯聚,減輕設(shè)備壓力。
節(jié)點(diǎn)內(nèi)部署多臺(tái)設(shè)備,即增加節(jié)點(diǎn)內(nèi)設(shè)備數(shù)量,通過負(fù)載分擔(dān)的方式減輕設(shè)備壓力。

兩者都是在單臺(tái)路由器不能繼續(xù)擴(kuò)展的情況下,通過改變網(wǎng)絡(luò)結(jié)構(gòu)來(lái)適應(yīng)流量的增長(zhǎng),主要差別在于網(wǎng)絡(luò)分別在縱向和橫向進(jìn)行擴(kuò)展。這兩種方法都在一定程度上緩解了單臺(tái)設(shè)備容量有限的局面,但隨之而來(lái)的卻是網(wǎng)絡(luò)復(fù)雜度以及內(nèi)部互聯(lián)端口的增加。眾所周知,內(nèi)部端口是不產(chǎn)生實(shí)際經(jīng)濟(jì)效益的,相反還會(huì)增加不少投資。而網(wǎng)絡(luò)結(jié)構(gòu)的日趨復(fù)雜,也增加了運(yùn)維部門的管理難度,同時(shí)也產(chǎn)生了多臺(tái)路由器之間如何均衡流量的問題。超級(jí)節(jié)點(diǎn)就是這樣誕生的,即一個(gè)城市同時(shí)存在多個(gè)網(wǎng)絡(luò)層次,而每個(gè)網(wǎng)絡(luò)層次都有多臺(tái)設(shè)備(如圖2所示),網(wǎng)絡(luò)連接的復(fù)雜程度可想而知。因此,此方案只是目前路由器容量無(wú)法繼續(xù)擴(kuò)展的替代方案,是暫時(shí)性的,互聯(lián)網(wǎng)網(wǎng)絡(luò)流量的飛速增長(zhǎng),新興應(yīng)用的不斷呈現(xiàn),都在呼喚容量更高,更具擴(kuò)展性路由器-集群路由器。
2 集群路由器技術(shù)概述:
集群路由器:又稱路由器矩陣或多機(jī)框互聯(lián)(Multi-Chasis),即通過采用并行交換技術(shù)(PPS),將兩臺(tái)或兩臺(tái)以上的普通核心路由器通過某種方式連接,共同組成一個(gè)多級(jí)多平面的交換矩陣系統(tǒng),使其能夠協(xié)同工作,并且對(duì)外只表現(xiàn)為一臺(tái)邏輯路由器,從而突破單機(jī)箱在交換容量、功耗、散熱等方面的限制,平滑擴(kuò)展為更大容量的路由交換系統(tǒng)。
集群路由器根據(jù)組合方式不同,分別對(duì)應(yīng)背對(duì)背和n(交換框)拖m(用戶框)兩種。背對(duì)背即是將兩臺(tái)路由器單機(jī)直接互聯(lián),無(wú)需通過交換矩陣。這種方法擴(kuò)展性較差,屬于過渡期的暫代方案。n拖m是指將m臺(tái)路由器單機(jī)通過1臺(tái)或n臺(tái)交換矩陣機(jī)箱互聯(lián)。集群系統(tǒng)內(nèi)各臺(tái)設(shè)備之間采用專門的光纖束進(jìn)行互連。這種方式擴(kuò)展性較好,是目前路由器集群技術(shù)的主流方式,也是未來(lái)的發(fā)展方向。用戶框可作為一個(gè)獨(dú)立系統(tǒng)運(yùn)行, 獨(dú)立運(yùn)行的用戶框即單機(jī)系統(tǒng);多個(gè)用戶框通過交換框級(jí)聯(lián)形成一個(gè)邏輯上的系統(tǒng),對(duì)外體現(xiàn)為單臺(tái)路由器設(shè)備,邏輯系統(tǒng)中的用戶框、交換框及級(jí)聯(lián)部件統(tǒng)稱為集群系統(tǒng)。

交換框級(jí)聯(lián),可行的配置方式包括但不限于:1+4(1個(gè)交換框和最多4個(gè)用戶框), 2+8(2個(gè)交換框和最多8個(gè)用戶框), 4+16(4個(gè)交換框和最多16個(gè)用戶框),16+64(16個(gè)交換框和最多64個(gè)用戶框)等,集群路由器要求可以根據(jù)需要配置交換框和用戶框數(shù)量,如實(shí)現(xiàn)2+4的產(chǎn)品形態(tài),即2個(gè)交換框和4個(gè)用戶框,用戶框的數(shù)量根據(jù)用戶的需要配置。上圖所示為1+4產(chǎn)品形態(tài)的示意圖,一個(gè)交換機(jī)框跟4 個(gè)用戶框連接,用戶框和交換機(jī)框之間通過級(jí)聯(lián)專用接口實(shí)現(xiàn)數(shù)據(jù)平面和控制平面的級(jí)聯(lián)。
3. 集群技術(shù)的交換機(jī)制
交換是路由器的核心,直接決定了整個(gè)系統(tǒng)的主要性能。在引入交換方式之前,路由器大多采用共享總線的分布式處理技術(shù)。共享總線的實(shí)現(xiàn)比較簡(jiǎn)單,但由于不能避免產(chǎn)生內(nèi)部沖突,使得高速率總線的設(shè)計(jì)受到限制,難度也越來(lái)越大。交換技術(shù)借鑒了ATM交換機(jī)的各種優(yōu)勢(shì),很好地解決了共享總線的不足。一直以來(lái),設(shè)備廠商和運(yùn)用商都在研究和尋求更有效率的交換方案,以解決交換過程中的阻塞問題。
交換結(jié)構(gòu)又分為單級(jí)交換和多級(jí)交換兩種。
3.1 單級(jí)交換

目前使用較多的單級(jí)交換結(jié)構(gòu)有共享內(nèi)存和Crossbar兩種。
共享內(nèi)存結(jié)構(gòu)通過共享輸入和輸出端口存儲(chǔ)器件,減少了對(duì)總體存儲(chǔ)空間的需求。分組交換通過指針調(diào)度實(shí)現(xiàn),提高了交換容量。共享內(nèi)存結(jié)構(gòu)相對(duì)簡(jiǎn)單,交換效率可根據(jù)需求不斷優(yōu)化。共享內(nèi)存交換結(jié)構(gòu)的交換性能取決于共享內(nèi)存的存取速率,可擴(kuò)展性較差,尤其當(dāng)板卡端口數(shù)量較多時(shí),交換效率有所下降。另外,并且共享內(nèi)存的穩(wěn)定一般,也直接影響了整個(gè)交換體系。
Crossbar是一種嚴(yán)格的非阻塞交換結(jié)構(gòu),輸入輸出之間可建立多條通路。Crossbar交換結(jié)構(gòu)又分為集中式(輸入>輸出)、擴(kuò)展式(輸入<輸出)和連接式(輸入=輸出)3種。典型的Crossbar采用連接式,即N×N的交叉矩陣。Crossbar使用調(diào)度器,根據(jù)各輸入點(diǎn)相關(guān)的信息,運(yùn)算調(diào)度算法得到輸入和輸出之間的一個(gè)匹配,并配置相應(yīng)交叉點(diǎn)。調(diào)度器的效率非常關(guān)鍵,決定了Crossbar的交換速率,因此調(diào)度算法必須高度完善。
但Crossbar同樣存在擴(kuò)展性的問題,即交換矩陣的交叉點(diǎn)會(huì)隨著輸入輸出數(shù)量的增多呈指數(shù)增長(zhǎng)。為維持無(wú)阻塞交換,需不斷完善和改進(jìn)調(diào)度算法,代價(jià)是開發(fā)的技術(shù)成本越來(lái)越高。另外,Crossbar也同樣不能避免排隊(duì)仲裁,傳輸效率受到一定影響和限制。但相比共享內(nèi)存結(jié)構(gòu),Crossbar效率和擴(kuò)展性都比較好,目前大部分高端路由器都使用Crossbar交換結(jié)構(gòu)。
共享內(nèi)存和Crossbar都屬于單級(jí)交換結(jié)構(gòu)的范疇。單級(jí)交換結(jié)構(gòu)由于受到技術(shù)上的各種限制,可擴(kuò)展性畢竟不夠完善,而且由于無(wú)法避免仲裁機(jī)制,容易形成瓶頸。因此,單級(jí)交換結(jié)構(gòu)不是未來(lái)大容量路由器的發(fā)展方向,需逐步擴(kuò)展至多級(jí)交換結(jié)構(gòu)。
3.2 多級(jí)交換
多級(jí)交換通過多個(gè)獨(dú)立的交換矩陣,組成一個(gè)多級(jí)多平面交換矩陣。每個(gè)平面配置獨(dú)立的仲裁器,避免了仲裁器瓶頸問題。多級(jí)交換大大增強(qiáng)了系統(tǒng)擴(kuò)展能力,目前路由器集群都是采用多級(jí)交換結(jié)構(gòu)。
多級(jí)交換結(jié)構(gòu)的基本組成單位叫交換單元,每個(gè)交換單元具有輸入和輸出功能。各個(gè)交換單元通過一定的邏輯順序相互連接,形成一個(gè)巨大的、可擴(kuò)展的交換網(wǎng)絡(luò)。多級(jí)交換結(jié)構(gòu)的形式有很多種,包括Clos、Banyan、Butterfly和Benes等,各種交換結(jié)構(gòu)的不同主要在于交換單元的互聯(lián)方式。多級(jí)交換結(jié)構(gòu)又可分為有阻塞和無(wú)阻塞兩種,其中無(wú)阻塞交換又分為嚴(yán)格無(wú)阻塞、可重排無(wú)阻塞和廣義無(wú)阻塞3種。
嚴(yán)格無(wú)阻塞交換是指只要這個(gè)連接的起點(diǎn)和終點(diǎn)是空閑的,任何時(shí)刻都可以在交換網(wǎng)絡(luò)中建立一個(gè)連接;
可重排無(wú)阻塞網(wǎng)絡(luò)是指只要某個(gè)連接的起點(diǎn)、終點(diǎn)是空閑的,任何時(shí)刻都可以在交換網(wǎng)絡(luò)中直接或間接對(duì)已有的連接重新選路來(lái)建立一個(gè)連接;
廣義無(wú)阻塞網(wǎng)絡(luò)是指在順序建立連接時(shí)按照一定的規(guī)則選路,那么也可以在任何時(shí)刻建立連接。
Benes屬于可重排無(wú)阻塞網(wǎng)絡(luò)。Benes使用方形交換單元(輸入輸出端口數(shù)相同)。一個(gè)典型的3級(jí)Benes N*N交換結(jié)構(gòu)可以在每個(gè)輸入端和每個(gè)輸出端之間形成n個(gè)可能的通路。Benes輸出可以擴(kuò)展至任意奇數(shù)級(jí)。Benes的主要優(yōu)點(diǎn)是實(shí)現(xiàn)簡(jiǎn)單,缺點(diǎn)是建立連接時(shí)需要重新選路,會(huì)增加數(shù)據(jù)傳輸時(shí)延。目前Cisco的CRS集群路由器系統(tǒng)采用此方案。

Clos屬于嚴(yán)格無(wú)阻塞方式,是Benes的延伸,由非方形交換單元組成。Clos交換結(jié)構(gòu)在任一輸入與輸出之間存在多條可達(dá)路徑。要保證嚴(yán)格的無(wú)阻塞,Clos必須滿足以下條件,即m>=2n-1,其中m是第二級(jí)的交換單元數(shù),n是***級(jí)單元的入線數(shù)和第三級(jí)單元的出線數(shù)。典型的Clos結(jié)構(gòu)有3級(jí)。

Clos的優(yōu)點(diǎn)在于網(wǎng)絡(luò)結(jié)構(gòu)清晰,傳輸時(shí)延較低。但是,為了增加容量和降低阻塞,需大量上調(diào)m和n的數(shù)量,將導(dǎo)致技術(shù)成本和實(shí)現(xiàn)復(fù)雜度的增加。Clos適合于在大型網(wǎng)絡(luò)設(shè)計(jì)中使用,通過使用較小的交換結(jié)構(gòu)簡(jiǎn)化網(wǎng)絡(luò)層次,另外可大大減少構(gòu)建無(wú)阻塞交換結(jié)構(gòu)所需要的交叉點(diǎn),降低構(gòu)建大型交換網(wǎng)絡(luò)的成本。
除了思科外的廠家如HW、ZTE、Juniper均采用的CLOS交換網(wǎng)絡(luò)做數(shù)據(jù)平面的集群。
4.集成路由器部署帶來(lái)的好處

路由器集群技術(shù)通過集中化、一體化的控制管理,使集群系統(tǒng)各臺(tái)路由器單機(jī)之間能夠很好地協(xié)同工作,極大的擴(kuò)展了路由器的容量,從而突破了單機(jī)在開發(fā)技術(shù)工藝上的限制。在成本方面,由于集群系統(tǒng)中各臺(tái)路由器通過高速光纖互連,節(jié)省了額外的內(nèi)部互聯(lián)端口,大大減少了投資。更為重要的是,由于集群路由器對(duì)外僅體現(xiàn)為一臺(tái)路由器,使得網(wǎng)絡(luò)拓?fù)浜吐酚刹呗宰兊煤?jiǎn)單和清晰,維護(hù)也更加方便快捷。