認識千兆以太網(wǎng)和路由交換機技術(shù)
1、千兆以太網(wǎng)技術(shù)原理
1.1早期以太網(wǎng)技術(shù)
以太網(wǎng):IEEE802.3定義了10Mbps的以太網(wǎng)標準,采用載波監(jiān)聽和沖突檢測(CSMA/CD) 協(xié)議,以半雙工方式運行。從80年代末開始以太網(wǎng)取得了巨大的成功。10BaseT是運行在3類或 更高類別的雙絞線上的以太網(wǎng),10Base2/5是運行在同軸電纜上的以太網(wǎng),10BaseFL是運行在 光纖上的以太網(wǎng)。由于沖突檢測的協(xié)議要求一個512位的時間槽保證無錯誤的檢測到?jīng)_突,所以 以太網(wǎng)的距離覆蓋范圍受到了限制,10BaseFL最大的覆蓋距離為2km,10BaseT在一個網(wǎng)段內(nèi)的 最大覆蓋距離為100m。
快速以太網(wǎng):IEEE802.3u定義了100Mbps的快速以太網(wǎng)標準,它可以用半雙工的方式運行 CSMA/CD協(xié)議,也可以有全雙工的方式。由于快速以太網(wǎng)對以太網(wǎng)的后向兼容性,在90年代的 中后期,快速以太網(wǎng)成為局域網(wǎng)中的主流技術(shù)。100BaseTX是運行于5類雙絞線上的快速以太網(wǎng), 100BaseFX是運行于光纖上的快速以太網(wǎng)。對于以半雙工方式運行的快速以太網(wǎng),同樣也有距離 覆蓋范圍的限制,并且由于快速以太網(wǎng)以100Mbps的速率運行,時間槽長度同樣是512位,所以 它的最大距離覆蓋范圍是以太網(wǎng)的1/10,為200m。但是對于全雙工方式運行的快速以太網(wǎng), 在理論上就不再有距離的限制,而實際受限于電或光信號的衰減。如實際中運行在單模光纖上 的100BasFX SMF的全雙工快速以太網(wǎng)最大覆蓋距離可達20km以上。
1.2千兆以太網(wǎng)協(xié)議
1998年6月在千兆以太網(wǎng)聯(lián)盟的推動下IEEE正式發(fā)布了千兆以太網(wǎng)標準IEEE 802.3。把以 太網(wǎng)的速率提高到了1000MbPs。而在此之前的1997年,就已經(jīng)有很多的廠商迫不及待地推出了 千兆以太網(wǎng)的產(chǎn)品,結(jié)網(wǎng)絡(luò)界帶來了全新的解決方案。到了現(xiàn)在的2000年,我們已經(jīng)可以很清 晰地看到,不僅以太網(wǎng)和快速以太網(wǎng)在桌面和工作組級網(wǎng)絡(luò)中打敗了ATM,在城域網(wǎng)中,千兆 以太網(wǎng)也憑借其良好的兼容性和優(yōu)異的性價比占據(jù)了絕對的上風(fēng)??梢灶A(yù)見未來隨著價格的下 跌,千兆以太網(wǎng)會象快速以太網(wǎng)一樣普及。
1.2.1 半雙工千兆以太網(wǎng) MAC層協(xié)議
對于快速以太網(wǎng)來說,512位的時間槽內(nèi)電波或光可以傳輸400m遠,如果在千兆以太網(wǎng)中, 512位的時間槽內(nèi)電波或光的傳輸距離則只有40m遠,采用星型拓撲結(jié)構(gòu)的半雙工千兆以太網(wǎng)的 覆蓋半徑只有20m。這樣的距離覆蓋范圍在實際中無法得到大規(guī)模推廣。為了解決這個問題, IEEE對以太網(wǎng)的MAC層協(xié)議作了第一次重大修改:載波擴展和幀突發(fā)。
(1)載波擴展
為了使千兆以太網(wǎng)的距離覆蓋范圍達到實用標準,半雙工千兆以太網(wǎng)時間槽長度擴展到了 4096位,這樣半雙工千兆以太網(wǎng)的距離覆蓋范圍擴展到了160m。為了兼容以太網(wǎng)和快速以太網(wǎng) 中的幀結(jié)構(gòu),半雙工千兆以太網(wǎng)的最小幀長度仍需要保持為64byte。但考慮到時間槽長度為51 byte,為了能夠匹配時間糟的長度,當(dāng)某個DTE發(fā)送小于512byte幀時,半雙 工千兆以太網(wǎng)MAC 將在正常發(fā)送數(shù)據(jù)之后發(fā)送一個載波擴展序列直到一個時間精結(jié)束。例如:某DTE發(fā)送一個64 byte幀,MAC將會在其后加入512-64=448byte的載波擴展序列。如果DTE發(fā)送的幀長度大于512 byte,則MAC不做任何改變。
在載波擴展的情況下,解決了半雙工千兆以太網(wǎng)距離覆蓋范圍的問題,但引入了一個新的 問題:對于長度較小的以太網(wǎng)幀的發(fā)送效率降低了。對于一個64byte的幀來說,盡管發(fā)送速度 較快速以太網(wǎng)增加了10倍,但發(fā)送時間增加了8倍。這樣的效率并未比快速以太網(wǎng)提高多少,為 了解決半雙工千兆以太網(wǎng)的效率問題,IEEE又引入了幀突發(fā)這種技術(shù)。
(2)幀突發(fā)
幀突發(fā)的工作方式如下:對于 DTE發(fā)送的第一個小于512byte的幀,依然使用載波擴展到 512byte,但隨后發(fā)送的小于512byte的短幀不再使用載波擴展,而是加入96bit的幀間隔序列 后連續(xù)發(fā)送短幀,最長可以突發(fā)到65536位。這種做法可以成立的原因在于一個正確配置的網(wǎng) 絡(luò)環(huán)境里,如果某個DTE開始發(fā)送數(shù)據(jù)后,其他 DTE都可以通過載波監(jiān)聽協(xié)議檢測到其信號并 抑制本身的數(shù)據(jù)發(fā)射。使用了幀突發(fā)的半雙工千兆以太網(wǎng)的效率得到了改善,當(dāng)一個DTE連續(xù) 的突發(fā)64byte幀并突發(fā)持續(xù)65536位時,其效率約為72%。
1.2.2 全雙工千兆以太網(wǎng)MAC層協(xié)議
在全雙工千兆以太網(wǎng)中,由于每個千兆以太網(wǎng)DTE在通信時獨占一個信道,因此不需要考 慮以太網(wǎng)的沖突問題。自然,全雙工千兆以太網(wǎng)也不受時間槽長度的限制,從而也沒有距離覆 蓋范圍的限制。
與半雙工方式相比,全雙工千兆以太網(wǎng)的MAC層的區(qū)別主要有以下幾點:
(1)在接受活動中幀的發(fā)送不會被推遲
(2)全雙工方式下的沖突指示將被忽略
(3)沒有載波擴展,最小幀長度仍為64字節(jié)
(4)沒有幀突發(fā)
在全雙工交換式以太網(wǎng)中,如果多個輸人端口同時向一個輸出瑞口輸出數(shù)據(jù),那么將會在 輸出端口產(chǎn)生擁塞,這時一些輸入喘口發(fā)送的幀將會被丟棄。如果在以太網(wǎng)幀上承載的是TCP /IP協(xié)議的數(shù)據(jù)包,那么TCP的傳輸機制會自動重發(fā)被丟棄的數(shù)據(jù)包,可以想象每個產(chǎn)生了丟 包的輸入端口都將重新發(fā)包,引發(fā)新一輪的擁塞和丟包,結(jié)果是導(dǎo)致網(wǎng)絡(luò)的吞吐率大幅下降。 為了避免丟包(丟幀)和重發(fā)現(xiàn)象的發(fā)生,IEEE在MAC層引入了802.3x流量控制協(xié)議來避免丟 包現(xiàn)象發(fā)生。
流量控制的原理是當(dāng)交換機檢測到發(fā)生擁塞的端口之后,就會向輸入端口發(fā)送暫停幀,通 知其抑制發(fā)送的流量,最后達到消除擁塞。流量控制并不能提高整個交換機的數(shù)據(jù)吞吐能力, 但是避免了在交換機內(nèi)的丟包現(xiàn)象。
1.2.3千兆以太網(wǎng)物理層協(xié)議
IEEE定義了幾種用于不同物理介質(zhì)的千兆以太網(wǎng)接口,有1000Base-CX,1000Base-SX, 1000Base-LX,1000Base-T,其中1000Base-CX是用于155Ω平衡同軸電纜上的接口,在實際 中沒有真正的產(chǎn)品,1000Base-T是可用于5類或更高類別雙絞線的接口,它的標準是IEEE802.3 ab,這一標準剛剛于1999年6月發(fā)布,現(xiàn)在市場中剛剛推出商用的產(chǎn)品。
1000Base—SX使用850nm波長激光的接口,只適用于多模光纖。 1000Base-LX使用1300nm 波長激光的接口,適用于單模和多模光纖。1000Base一SX主要用于校園網(wǎng)和企業(yè)網(wǎng)骨干。 1000Base一LX主要應(yīng)用于城域網(wǎng),現(xiàn)在城域網(wǎng)中另外一種應(yīng)用較多的是1000Base一LH的長距離 千兆以太網(wǎng)光接口,一般使用1300nm或1550nm波長的激光,可達到50km以上甚至100km的無中 繼傳輸距離。
需要特別指出的是,由于 IEEE給出的是最惡劣傳輸條件下的千兆以太網(wǎng)傳輸距離,在實 際應(yīng)用中,各個廠商的產(chǎn)品的傳輸距離遠遠超過標準的規(guī)定,如阿爾卡特的PowerRail千兆路 由交換機的1000Base—LX接口在實際測試中可以無中繼的傳輸 22km。
1.3千兆以太網(wǎng)效率
半雙工以太網(wǎng)的效率問題一直是其弱點,在一個半雙工以太網(wǎng)里的工作站(如計算機)數(shù) 增加到某一門限值后,盡管每個工作站是以 10Mbps速率發(fā)送數(shù)據(jù),但由于沖突的增加,每 個工作站不得不等待很長時間后才有可能發(fā)送數(shù)據(jù),因此每個工作站得到的平均可用帶寬急劇 下降。在全雙工的交換式以太網(wǎng)中,CSMA/CD協(xié)議中的CD沖突檢測機制不再需要,每臺工作站 可以得到獨占的帶寬。因此全雙工交換式以太網(wǎng)的效率不再取決于網(wǎng)絡(luò)內(nèi)的工作站數(shù),而是由 以太網(wǎng)幀的長度而決定。
1.4千兆以太網(wǎng)可靠性
從傳統(tǒng)意義上,以太網(wǎng)被看作是一種局域網(wǎng)(LAN)技術(shù),被大量的應(yīng)用于企業(yè)網(wǎng)中,因 此以太網(wǎng)交換機和以太網(wǎng)的可靠性并沒有被作為最關(guān)鍵的因素加以考慮。隨著交換式全雙工快 速以太網(wǎng)和千兆以太網(wǎng)的成熟,越來越多的運營商選擇千兆以太網(wǎng)作為城域網(wǎng)MAN的首選技術(shù), 這時千兆以太網(wǎng)的可靠性就成為運營商考慮的關(guān)鍵因素。
用千兆以太網(wǎng)實現(xiàn)一個可靠的城域網(wǎng),現(xiàn)在有兩種成熟的技術(shù):
(1)千兆以太網(wǎng)端口聚合;
(2)千兆以太網(wǎng)1+1備份。
如果千兆以太網(wǎng)被用于承載IP業(yè)務(wù),在網(wǎng)絡(luò)層IP這一層次,也可以采用環(huán)型或網(wǎng)狀網(wǎng)拓撲 結(jié)構(gòu),使用IP路由協(xié)議來保證網(wǎng)絡(luò)可靠性。
下面就這三種技術(shù)作一詳細介紹。關(guān)于千兆路 由交換機的可靠性,請參見第二章。
1.4.1千兆以太網(wǎng)端口聚合(Port Trunking)
在千兆路由交換機中,可以將多個千兆以太網(wǎng)鏈路捆綁為一個虛擬的邏輯鏈路,以達到增 加帶寬,可靠性的目的。這種技術(shù)叫做端口聚合(鏈路捆綁)。比較常見的是將四個千兆以太 網(wǎng)鏈路捆綁為一個鏈路,這時的帶寬可達到單向4Gbps雙向8Gbps。
在端口聚合中的多條千兆以太網(wǎng)鍵路可以實現(xiàn)負載分擔(dān),即使其中的一條鏈路的光纖出現(xiàn) 故障,邏輯鏈路仍會保持正常工作。端口聚會需要較多的光纖來構(gòu)成,2個端口的端口聚合需 要4根光纖,3個端口的聚會需要6根光纖,4個端口的端口聚會需要8根光纖。 1.4.2千兆以太同1+1備份 和很多ATM交換機里實現(xiàn)的ATM物理鏈路1+1備份相似,千兆以太網(wǎng)也可以實現(xiàn)1十1備份,即 在一個千兆路由交換機的接口模塊上,對應(yīng)于一個千兆以太網(wǎng)鍵路,實際用兩個千兆以太網(wǎng)鏈 路來連接,一條千兆以太網(wǎng)鏈路作為主用鍵路,另一條則作為備用鍵路。當(dāng)主用鏈路的光纖出 現(xiàn)故障時,千兆路由交換機可以在1ms的時間內(nèi)把數(shù)據(jù)切換到備用鍵路的光纖上傳輸。 在這種1+1備份方式下,需要用四根光纖來完成1GbPS的傳輸帶寬。每一個千兆以太網(wǎng)鏈路 需要1發(fā)1收兩根光纖。
1.4.3 用IP路由來保證城域網(wǎng)可靠性
如果是用千兆以太網(wǎng)來承載IP業(yè)務(wù),那么就可以應(yīng)用IP路由協(xié)議的收斂特性來保證城域網(wǎng) 可靠性。使用IP路由,網(wǎng)絡(luò)拓撲可以比較靈活,可以是星型、環(huán)型、網(wǎng)狀網(wǎng),或是它們的混合。 這里順帶指出一點:如果沒有使用IP路由,由于生成樹協(xié)議(SPanning Tree)的作用,千兆以 太網(wǎng)即使在物理鍵路上構(gòu)成了環(huán)型或網(wǎng)狀網(wǎng),在交換機的實際的以太網(wǎng)數(shù)據(jù)交換也無法構(gòu)成環(huán) 狀和網(wǎng)狀網(wǎng)。而在環(huán)型和網(wǎng)狀網(wǎng)的拓撲結(jié)構(gòu)中,即使某條鏈路或某個網(wǎng)絡(luò)節(jié)點故障,由于迂回 路由的存在,整個網(wǎng)絡(luò)不會癱瘓。城域網(wǎng)中最典型的 IP路由協(xié)議是 OSPF,運行OSPF協(xié)議的路 由器利用Hello信息周期性傳遞路由器狀態(tài),當(dāng)發(fā)現(xiàn)鄰近節(jié)點故障后,路由器會重新計算路由, 自動找到可迂回的路由,保證網(wǎng)絡(luò)恢復(fù)正常工作。這一過程被稱之為路由的收斂。一般OSPF協(xié) 議的收斂時間大于10秒。與千兆以太網(wǎng)1+1備份方式相比,OSPF協(xié)議從故障中恢復(fù)的時間要長 很多。
1.5 千兆以太網(wǎng)和其他承載IP的城域網(wǎng)技術(shù)比較
目前形式下,廣電的寬帶城域網(wǎng)承載的都是基于IP的業(yè)務(wù),承載IP的平臺主要有ATM、千兆以太網(wǎng)、POS、DPT這四種技術(shù)。本文不做ATM和千兆以太網(wǎng)承載IP的比較,將會有另一文章專門 論述這一課題。 POS最初是用于廣域網(wǎng)在SDH上承載IP的技術(shù),也可以用于探光纖上在城域網(wǎng)使 用。DPT是 CISCO公司專有的城域網(wǎng)技術(shù)。 #p#
2 、千兆路由交換機
2.1路由交換機的定義
傳統(tǒng)意義上,只處理第二層數(shù)據(jù)轉(zhuǎn)發(fā)的設(shè)備被稱之為交換機,交換機只根據(jù)數(shù)據(jù)包中的目 的和源MAC地址進行處理和轉(zhuǎn)發(fā),而不涉及第三層的數(shù)據(jù)包中的內(nèi)容。如進行以太網(wǎng),F(xiàn)DDI,令 牌杯交換的局域網(wǎng)交換機。第三層的數(shù)據(jù)包的轉(zhuǎn)發(fā)由路由器來完成,對于IP協(xié)議來說,路由器 檢查第三層數(shù)據(jù)包的目的和源IP地址,然后作出相應(yīng)的處理或轉(zhuǎn)發(fā)。在90年代中期以前,由于 硬件芯片技術(shù)的限制,路由器和交換機是兩個獨立的網(wǎng)絡(luò)設(shè)備。路由器的內(nèi)部系統(tǒng)結(jié)構(gòu)很象一 臺專用計算機,有一個主CPU,如486或MIPS,有內(nèi)存,在CPU上運行軟件來進行包的轉(zhuǎn)發(fā)和路由 的計算及更新。所以路由器的性能比較差,往往成為一個網(wǎng)絡(luò)的瓶頸。
為了解決基于軟件的路由器在性能上的缺陷,在新的ASIC芯片技術(shù)的推動下,交換機中用來 處理第二層數(shù)據(jù)包的芯片功能增強到能夠進行第三層數(shù)據(jù)包的處理,這種具有路由功能的交換機 被稱為路由交換機。
2.2 路由交換機的背板及其實現(xiàn)方式
背板是交換機的中央交換部件,用于交換機的各個端口之間傳送數(shù)據(jù)。背板的結(jié)構(gòu)和容量決 定了一個路由交換機的性能?,F(xiàn)在的路由交換機背板主要有三種結(jié)構(gòu):交叉矩陣(Cross Bar); 共享內(nèi)存;并行訪問共享內(nèi)存。下面分別詳細論述。
2.2.1 交叉矩陣(Cross Bar)
這種結(jié)構(gòu)容易設(shè)計,擴展性好,并且在其基本形式中可以提供較低的每端口成本。然而,它 有幾個關(guān)鍵的局限性。
交叉矩陣結(jié)構(gòu)的3個主要的局限和其對網(wǎng)絡(luò)的影響如表1所述。
表1
靜態(tài)內(nèi)存他和隊頭阻塞的問題的共同影響使其難以在逐端口的基礎(chǔ)上轉(zhuǎn)發(fā)基于優(yōu)先級的業(yè) 務(wù)。 所以交叉矩陣結(jié)構(gòu)提供可靠的QoS支持的能力有限,這與整個IP網(wǎng)絡(luò)提高QoS能力的要求不符。
2.2.2共享內(nèi)存
傳統(tǒng)的共享內(nèi)存結(jié)構(gòu)是基于總線的。這種結(jié)構(gòu)克服了交叉矩陣背板的局限性,并且它們在背 板容量小于10GbPS的交換機中十分普遍。在一個共享內(nèi)存總線結(jié)構(gòu)中,所有的端口通過一個共享 總統(tǒng)訪問中央內(nèi)存。采用仲裁機制來控制端口訪問共享端口。這消除了交叉矩陣交換機具有的基 于端口的靜態(tài)內(nèi)存分配和隊頭阻塞的問題并以一種高效的方式使用系統(tǒng)內(nèi)存。共享內(nèi)存的問題是, 構(gòu)造一個快的足以提供無阻塞的速度超過20Gbps性能的仲裁機構(gòu)現(xiàn)在很難作到。例如:現(xiàn)在的芯片,技術(shù)的數(shù)據(jù)總線一般是64位,總統(tǒng)的時鐘頻率(并非芯片的內(nèi)部時鐘頻率)為 100MHz,這 樣的系統(tǒng)背板性能可達到64×100MHz=6.4GbPs,按雙向計算,系統(tǒng)背板性能為12.8GbPS。因 此, 受限于現(xiàn)在的內(nèi)存促裁機制芯片,共享內(nèi)存體系的擴展性比較差。
2.2.3并行訪問共享內(nèi)存
并行訪問共享內(nèi)存是一種共享內(nèi)存結(jié)構(gòu)設(shè)計:所有端口共享一個中央內(nèi)存空間。然而,不象 傳統(tǒng)的基于總統(tǒng)的共享內(nèi)存結(jié)構(gòu),并行訪問共享內(nèi)存為每個模塊上的每個端口提供一個專用的可 同時寫入中央內(nèi)存機構(gòu)和從中讀出的機制,這種機制無需要總線仲裁設(shè)備。并行訪問共享內(nèi)存能 夠保證在所有端口上同時實現(xiàn)完全的線速性能。并行共享內(nèi)存解決了基于總線的共享內(nèi)存的擴展 性問題,它的每一個模塊到中央內(nèi)存的存取速度都可以達到10GbPS以上,而整個中央內(nèi)存可以容 許超過30路的同時訪問,這樣一個系統(tǒng)的背板容量可以擴展到300GbPs以上。同時并行訪問共享 內(nèi)存也沒有引人交叉矩陣背板帶來的隊頭阻塞等問題。
2.3 交換機的第三層包轉(zhuǎn)發(fā)機制(胸中式與分布式)
每個廠商的路由交換機的實現(xiàn)機制不同,在路由功能的實現(xiàn)上,主要有集中式和分布式兩種 機制。下面進行詳細論述。
2.3.1 集中式第三層包轉(zhuǎn)發(fā)
集中式第三層包轉(zhuǎn)發(fā)是指在交換機中有一個專門的硬件模塊(路由模塊)來對全交換機的 第三層包進行轉(zhuǎn)發(fā)。交換機的每個接口模塊如千兆以太同交換模塊,都不具備第三層的處理功 能,需要把第三層的數(shù)據(jù)包從背飯送往路由模塊來查詢路由并轉(zhuǎn)發(fā)。嚴格的講,這種結(jié)構(gòu)的交 換機更準確的名稱是第三層交換機,而不是路由交換機。 集中式第三層包轉(zhuǎn)發(fā)是早期的技術(shù),它的缺點在于整個交換機的路由性能受限于其路由模 塊的能力。另外,當(dāng)一個IP包要進行路由時,它經(jīng)常要從一個以太網(wǎng)接口模塊通過背板總線送 往路由模塊,在路由模塊處理后,又經(jīng)背板總統(tǒng)送往同一以太網(wǎng)接口模塊,這樣一種數(shù)據(jù)包傳 送方式浪費了背板總規(guī)處理能力。并且路由模塊的故障會導(dǎo)致整個交換機內(nèi)的路由功能的失效。 實際中很多廠商交換機中的路由模塊就是一個以插卡形式集成在交換機內(nèi)的軟件路由器。 因此在各廠商的產(chǎn)品中,采用集中式包轉(zhuǎn)發(fā)的交換機的路由能力一般可達到15Mpps。
2.3.2 分布式第三層包轉(zhuǎn)發(fā)
隨著ASIC芯片技術(shù)的發(fā)展,具有路由功能的模塊被集成到一塊芯片上,于是廠商將路由芯 片設(shè)計到了路由交換機中的每一個接口模塊上,這種技術(shù)就被稱為分布式第三層包轉(zhuǎn)發(fā)。它不需要一個專門的模塊來為整個機箱服務(wù)做包的轉(zhuǎn)發(fā),第三層的包轉(zhuǎn)發(fā)可以由每個接口模塊上的 路由芯片獨立完成。 分布式第三層包轉(zhuǎn)發(fā)突破了集中式第三層包轉(zhuǎn)發(fā)的性能瓶頸,但它的路由控制機制比集中 式要復(fù)雜,它需要在每一個端口保留路由表信息以進行快速的包轉(zhuǎn)發(fā)。盡管在技術(shù)上更復(fù)雜, 由于在性能上遠遠超出集中式,分布式第三層包轉(zhuǎn)發(fā)技術(shù)已經(jīng)成為了現(xiàn)在路由交換機的主流技 術(shù)。
2.4 線速的包轉(zhuǎn)發(fā)
現(xiàn)在廠商往往直稱自己的路由交換機的每個端口都是線速的,那么怎么判定一個路由交換 機中所有的端口是否線速呢?線速的衡量標準是以64byte的數(shù)據(jù)包(第二層或第三層包)作為 計算基準,常用的基準如下:
◆對于千兆以太網(wǎng),一個線速端口的包轉(zhuǎn)發(fā)率為1.488Mpps。
◆對于快速以太網(wǎng),一個線速端口的包轉(zhuǎn)發(fā)率為148.8kpps。
◆對于OC-12的POS端口,一個線速端口的包轉(zhuǎn)發(fā)率為1.17Mpps。
◆對于OC-48的POS端口,一個線速端口的包轉(zhuǎn)發(fā)率為468MppS。 對于千兆以太網(wǎng)來說,計算方法如下: (64+8+12)byte×1,488,095pps.×8bit=1,000,000,000bps 說明:當(dāng)以太網(wǎng)幀為64byte時,需考慮8byte。的幀頭和12byte的幀間隙的固定開銷。故 一個線速的千兆以太網(wǎng)端口在轉(zhuǎn)發(fā)64byte包時的包轉(zhuǎn)發(fā)率為1.488Mpps??焖僖蕴W(wǎng)的統(tǒng)速端 口包轉(zhuǎn)發(fā)率正好為千兆以太網(wǎng)的十分之一,為148.8kpps。 對于POS端口來說,計算方法如下: 一個OC-12的SDH中容器的有效速率約為599MbPs,將其除以64×8bit的包長度,就可以 得出一個線速的OC-12POS端口的包轉(zhuǎn)發(fā)率為1.17Mpps。OC-48的容器的有效速率為OC-12一 的四倍,所以O(shè)C-48 POS端口的線速包轉(zhuǎn)發(fā)率為1.17×4=4.68Mpps。 #p#
3 、路由交換機選型標準
3.1 路由交換機造型五項主要標準 針對廣電部門在建設(shè)寬帶IP城域網(wǎng)需要進行千兆路由交換機選型的實際工作,本文列出了 五項主要的選型標準供廣電部門參考,通過這五項選型標準,基本上可以比較各廠家的路由交 換機性能的優(yōu)劣: *背板容量 *無阻塞千兆端口數(shù)量 *第二層包轉(zhuǎn)發(fā)速度 *第三層包轉(zhuǎn)發(fā)速度 *路由數(shù)量
3.1.1 背板容量
衡量路由交換機容量大小的主要指標是交換機的背板容量,其單位是GbPs。
3.1.2 無阻塞千兆端口數(shù)量
一個千兆路由交換機可以交換或路由多個千兆以太網(wǎng)端口,但其支持的最大千兆以太網(wǎng) 端口數(shù)量并不意味著它可以全部無阻塞的線速交換這些千兆端口。原因在于有些千兆路由交 換機的設(shè)計目標是為計算機服務(wù)器提供千兆連接,而現(xiàn)有的計算機上千兆網(wǎng)卡的通信速度受 限于計算機的總線,遠遠達不到1000MbPS,一般是300~400MbPS,因此對于這些安裝了千兆 以太網(wǎng)卡的服務(wù)器,并沒有必要為其提供線速的千兆交換。但一些廠商的產(chǎn)品往往回避這一 設(shè)計目標,一味宣傳千兆路由交換機支持的最多千兆端口數(shù)量,而真正衡量千兆路由交換機 的能力的是其可以交換的無阻塞千兆端口數(shù)量。
3.1.3第二層包轉(zhuǎn)發(fā)速度
對于千兆路由交換機來說,第二層包轉(zhuǎn)發(fā)速度就是其轉(zhuǎn)發(fā)以太網(wǎng)幀的速度。以PPS(包每 秒)為衡量單位。
3.1.4第三層包轉(zhuǎn)發(fā)速度
第三層包轉(zhuǎn)發(fā)速度指千兆路由交換機轉(zhuǎn)發(fā)第三層協(xié)議包的速度,如轉(zhuǎn)發(fā)IP或IPX包的速度。 以PPS(包每秒)為衡量單位。
這里需要指出的是,第二層包轉(zhuǎn)發(fā)速度和第三層包轉(zhuǎn)發(fā)速度是兩個不同的概念。很多廠 商往往只提包轉(zhuǎn)發(fā)速度,而沒有明確區(qū)分是第二層還是第三層的包轉(zhuǎn)發(fā)速度。對于采用分布 式路由的路由交換機,一般情況下,第二層包轉(zhuǎn)發(fā)速度等于第三層包轉(zhuǎn)發(fā)速度。對于采用集 中式路由的路由交換機,其第三層包轉(zhuǎn)發(fā)速度往往不等于第二層的包轉(zhuǎn)發(fā)速度,因為集中式 路由需要一個單獨的路由模塊來進行第三層包轉(zhuǎn)發(fā),而第二層包轉(zhuǎn)發(fā)是在各個千兆接口模塊 中進行的。
3.1.5路由數(shù)量
路由交換機中路由表支持的路由數(shù)量越多,意味著可支持的網(wǎng)絡(luò)拓撲結(jié)構(gòu)越大,典型的 城域網(wǎng)路由交換機的路由數(shù)量是64K/每端口。這里需要明確的是廠商宣稱的路由數(shù)量是每個 機箱還是每個端口支持的數(shù)量,通常情況下,每機箱的路由數(shù)量=端口數(shù)量×每端口的路由數(shù)量。 當(dāng)前的Internet中實際運行BGP-4的骨干路由器的路由表大小約為77K(資料來源: www.telatra.net/ops/bgPtable.html),并且在緩慢增長,增長速率的放慢主要是由于 CIDR技術(shù)的采用。對于一個城域網(wǎng)路由交換機來說,支持64K的路由表容量是可以滿足未來很 長時間內(nèi)的城域網(wǎng)需求。
3.2 判斷千兆路由交換機無阻塞的標準
一個千兆路由交換機需要符合以下幾個要求才可以實現(xiàn)真正的無阻塞。
(1)背板是無阻塞結(jié)構(gòu),常見的算法是如果背板容量≥端口數(shù)量×端口速率×2,那么這 個路由交換機在背板上是無阻塞的。
(2)第二層包轉(zhuǎn)發(fā)線速,算法是如果機箱的第二層包轉(zhuǎn)發(fā)率=千兆端口數(shù)量×1.488Mpps, 那么講路由交換機在做第二層交換的時候可以做到線建。
(3)第三層包轉(zhuǎn)發(fā)線速,算法是如果機箱的第三層包轉(zhuǎn)發(fā)率=千兆端口數(shù)量×1.488Mpps, 那么這個路由交換機在做第三層交換的時候可以做到線速。
有很多廠商的產(chǎn)品數(shù)據(jù)滿足第二層和第三層線速的標準,但不滿足背板無阻塞的標準,這 種情況表明其第二層和第三層線速是在數(shù)據(jù)包未通過背權(quán)交換的條件下取得的;如果有大量的 數(shù)據(jù)包需要通過其背板轉(zhuǎn)發(fā),那么這個路由交換機將無法做到統(tǒng)速。
另一種情況是背板滿足無阻塞的要求,但是其第二層和第三層的包轉(zhuǎn)發(fā)率未滿足統(tǒng)速標準, 這說明此路由交換機的包轉(zhuǎn)發(fā)模塊存在瓶頸。
需要澄清的是,在本文中述及的阻塞和擁塞在路由交換機里是二個不同的概念。擁塞是當(dāng) 多個端口向一個端口同時發(fā)送數(shù)據(jù)時,由于接收端口的速率小于多個端口速率之和而引起的數(shù) 據(jù)丟包或發(fā)送速率下降的問題,這一問題可以通過標準的IEEE802.3X流控協(xié)議來加以控制。阻 塞是由于交換機內(nèi)部結(jié)構(gòu)的缺陷而引起的單個端口通信速率達不到全速率的問題,這一問題不 是可以通過流技協(xié)議加以避免的。
4、結(jié)束語
千兆以太網(wǎng)技術(shù)正在日趨成熟,除了原有的兼容性,寬帶,廉價,對IP良好的支撐的特點, 正在增強其可靠性,可擴展性。在當(dāng)前廣電寬帶城域網(wǎng)主要承載IP業(yè)務(wù)的趨勢下,千兆以太網(wǎng) 是建設(shè)寬帶城域網(wǎng)的首選技術(shù)。
【編輯推薦】