網(wǎng)絡(luò)性能指標(biāo)構(gòu)成數(shù)據(jù)中心挑戰(zhàn)
網(wǎng)絡(luò)世界因為思維模式的廣泛變化而聞名,并通常驅(qū)動著網(wǎng)絡(luò)行業(yè)的炒作周期。其中有很多模式轉(zhuǎn)變,例如集中控制平臺、分散控制平臺,以及各種路由協(xié)議和范例。
目前正在發(fā)生的一個主要變化是支持公共云或私有云的葉脊數(shù)據(jù)中心結(jié)構(gòu),可以將其視為將網(wǎng)絡(luò)、計算和存儲資源作為計算能力單元進行的銷售。
數(shù)據(jù)中心結(jié)構(gòu)通?;谧畛鯙殡娫捑W(wǎng)絡(luò)設(shè)計的CLOS結(jié)構(gòu),其中準(zhǔn)入控制是服務(wù)質(zhì)量的主要手段。在電路交換領(lǐng)域,網(wǎng)絡(luò)性能指標(biāo)主要是分配固定數(shù)量的帶寬,如果沒有可用帶寬,則拒絕允許連接。
這些最初的LOS網(wǎng)絡(luò)已經(jīng)通過折疊(或雙向傳遞流量)和構(gòu)建不同的變體(如Benes和Butter)來適應(yīng)計算機網(wǎng)絡(luò)。這些更通用的葉脊網(wǎng)絡(luò)對網(wǎng)絡(luò)性能指標(biāo)提出了超出導(dǎo)納控制的挑戰(zhàn)。
以下是網(wǎng)絡(luò)面臨的一些挑戰(zhàn)。
例如在一個網(wǎng)絡(luò)中,主機1和主機2之間有256條路徑。那么可以收集哪種網(wǎng)絡(luò)性能指標(biāo)來了解網(wǎng)絡(luò)的運行情況?
收集每個接口的隊列深度、丟棄數(shù)量和傳輸控制協(xié)議重傳將提供網(wǎng)絡(luò)性能的可靠通用視圖。但是,除了這個抽象視圖之外,很難看到如何收集有助于任何一個應(yīng)用程序更高效地操作的信息。
這是一個更具體的示例:如果應(yīng)用程序性能不佳,并且懷疑問題出在網(wǎng)絡(luò)中,那么將在哪里開始故障排除?很難通過這些類型的寬泛等價多路徑網(wǎng)絡(luò)跟蹤任何數(shù)據(jù)包或數(shù)據(jù)包流的路徑,以確定可能存在問題的位置。
一個可能的答案是向網(wǎng)絡(luò)添加更多狀態(tài),尤其是在網(wǎng)絡(luò)性能指標(biāo)中。例如,如果使用IPv6版本的分段路由(SRv6),則可以為網(wǎng)絡(luò)接受的每個數(shù)據(jù)包添加一個報頭,并在數(shù)據(jù)包報頭上添加路徑列表。
由于SRv6在交換過程中不會刪除或修改此標(biāo)頭,因此檢查路徑中任何一點的數(shù)據(jù)包報頭將顯示數(shù)據(jù)包已通過網(wǎng)絡(luò)的路徑。有許多不同的方法,可以通過網(wǎng)絡(luò)添加跟蹤單個流所需的信息類型,但每種方法還涉及另一種權(quán)衡。
添加這些網(wǎng)絡(luò)性能指標(biāo)可能會產(chǎn)生大量新信息,網(wǎng)絡(luò)管理系統(tǒng)必須消耗、管理、分類和考慮。在對問題進行故障排除、容量規(guī)劃以及通常了解網(wǎng)絡(luò)健康狀況的過程中,人們也必須消耗這些信息洪流。這些問題尚未得到完全解決,但它們可能是研究、機器學(xué)習(xí)以及網(wǎng)絡(luò)管理系統(tǒng)設(shè)計和部署中更強大架構(gòu)方法的新方向。