更智能化的CDN技術(shù),CDN邁向3.0時(shí)代
我們的生活無(wú)時(shí)不刻不依賴(lài)著網(wǎng)絡(luò),伴隨著終日對(duì)網(wǎng)速慢的抱怨和詛咒,同時(shí)也享受著網(wǎng)絡(luò)技術(shù)發(fā)展帶來(lái)的紅利。懷著對(duì)技術(shù)細(xì)節(jié)刨根問(wèn)底的執(zhí)著,我們會(huì)發(fā)現(xiàn)原來(lái)身邊還存在著像CDN這樣生活在舞臺(tái)背后的內(nèi)容分發(fā)技術(shù)。然而當(dāng)我們剛想了解他的時(shí)候,似乎他的步伐又邁得那么矯健,正在完成CDN 2.0到3.0的跨越,貌似還是一場(chǎng)智能化的跨越。
1.0到2.0,20年技術(shù)演進(jìn)
CDN(Content Delivery Network),即內(nèi)容分發(fā)網(wǎng)絡(luò)。其目的是通過(guò)在現(xiàn)有的Internet中增加一層新的網(wǎng)絡(luò)架構(gòu),將網(wǎng)站的內(nèi)容發(fā)布到最接近用戶(hù)的網(wǎng)絡(luò)“邊緣”,使用戶(hù)可以就近取得所需的內(nèi)容,提高用戶(hù)訪(fǎng)問(wèn)網(wǎng)站的響應(yīng)速度。CDN PoP(Point of Presence)架構(gòu)是為內(nèi)容傳送服務(wù)提供支持的軟件堆棧,到現(xiàn)在經(jīng)歷了1.0到2.0的發(fā)展,直到智能化的3.0出現(xiàn)。下面我們將用少量的篇幅對(duì)這段歷史進(jìn)行一下梳理。
CDN PoP 1.0的架構(gòu)誕生于20年前,這對(duì)于當(dāng)時(shí)的網(wǎng)站非常適合,一些小容量的信息可以通過(guò)緩慢的互聯(lián)網(wǎng)連接實(shí)現(xiàn)傳遞。這時(shí)CDN的主要挑戰(zhàn)是從部署在互聯(lián)網(wǎng)服務(wù)提供商(ISP)的邊緣節(jié)點(diǎn) (POPs)傳輸網(wǎng)頁(yè)內(nèi)容。每一個(gè)接入POP的終端用戶(hù)都會(huì)快速獲得響應(yīng)內(nèi)容,而不是首先通過(guò)網(wǎng)絡(luò)(當(dāng)時(shí)依然很慢)來(lái)訪(fǎng)問(wèn)源服務(wù)器。通過(guò)這種方式,CDN可以很容易把受歡迎的內(nèi)容發(fā)送給大量的互聯(lián)網(wǎng)用戶(hù)。
CDN PoP 2.0的架構(gòu)離我們的生活更近了一些,也是我們目前使用最廣泛的CDN技術(shù)。由于2.0架構(gòu)有基本的軟件堆棧組成,但不具備數(shù)據(jù)和信息的深入分析,更不用談及少得可憐的智能化功能,這也就決定了其架構(gòu)是被動(dòng)的、響應(yīng)式的、無(wú)狀態(tài)的。2.0架構(gòu)的目標(biāo)是緩存邊緣內(nèi)容,并在邊緣進(jìn)行一些簡(jiǎn)單的處理,從就近原則中爭(zhēng)取TCP傳輸性能上的提升。2.0架構(gòu)以緩存軟件為核心,同時(shí)配套負(fù)載均衡、日志分析、DNS等服務(wù)。
CDN 3.0,向智能化不斷邁進(jìn)
隨著網(wǎng)絡(luò)服務(wù)的創(chuàng)新與移動(dòng)終端的智能化,與此相適應(yīng)的CDN也在不斷進(jìn)化。似乎講到了這里我們?cè)撜?qǐng)出今天的主角了——CDN 3.0,下面我們將從幾個(gè)方面的對(duì)比去闡述3.0究竟有哪些優(yōu)勢(shì)。
關(guān)于CDN 3.0的研究其實(shí)經(jīng)歷了大量的理論研究和論證,包括流處理器,批處理,消息代理, Hadoop,NoSQL,機(jī)器學(xué)習(xí),Cassandra,Spark,深層神經(jīng)網(wǎng)絡(luò),循環(huán)神經(jīng)網(wǎng)絡(luò),卷積神經(jīng)網(wǎng)絡(luò)以及大量的不同類(lèi)型的算法等數(shù)百個(gè)概念。下面我們將從中抽取一些典型的研究?jī)?nèi)容來(lái)論證CDN 3.0的優(yōu)勢(shì):
- 規(guī)則引擎:許多CDN都具有自動(dòng)規(guī)則引擎,客戶(hù)端可以為其內(nèi)容設(shè)置緩存規(guī)則。機(jī)器學(xué)習(xí)模型中使用分類(lèi)器可以使***進(jìn)的規(guī)則引擎難度回歸到史前科技水平。
- WAF+DDoS+Bot緩解:這些用于應(yīng)對(duì)威脅的分布式系統(tǒng)將會(huì)被監(jiān)督式和非監(jiān)督式機(jī)器學(xué)習(xí)模型取代,包括深層神經(jīng)網(wǎng)絡(luò)、重復(fù)神經(jīng)網(wǎng)絡(luò)等。
- 深度學(xué)習(xí):我們不再需要手動(dòng)進(jìn)行緩存軟件棧、路由、存儲(chǔ)等繁瑣的配置,這些工作將會(huì)被學(xué)習(xí)模式所接管。
關(guān)于CDN 2.0和CDN 3.0的對(duì)比一言不和就上圖:
圖一 CDN 2.0和CDN 3.0體系結(jié)構(gòu)對(duì)比
但3.0架構(gòu)卻截然不同,與生俱來(lái)的大數(shù)據(jù)和機(jī)器學(xué)習(xí)加持彰顯了其智能化的屬性。他將比2.0架構(gòu)應(yīng)對(duì)更龐大的邊緣傳輸,每個(gè)PoP節(jié)點(diǎn)都將成為Hadoop生態(tài)中的一環(huán),包括HDFS、Apache Spark、Apache Flink、Kafka、Redis以及許多由Facebook、Google、LinkedIn、Spotify這類(lèi)公司創(chuàng)建的開(kāi)源插件等等。
在CDN 3.0架構(gòu)世界里,緩存工程師,網(wǎng)絡(luò)工程師等將與數(shù)學(xué)家和數(shù)據(jù)科學(xué)家一起工作。整個(gè)功能集將迎來(lái)無(wú)窮的變化,具體反映到所使用的算法類(lèi)型以及算法數(shù)目。本來(lái)需要人工介入的任務(wù),如集群性能調(diào)優(yōu),網(wǎng)絡(luò)調(diào)優(yōu)等,將采用機(jī)器學(xué)習(xí)(ML)等手段來(lái)解決。
機(jī)器學(xué)習(xí)將調(diào)優(yōu)工作從手動(dòng)調(diào)優(yōu)改為自調(diào)優(yōu),即始終處于學(xué)習(xí)過(guò)程中。新的個(gè)性化功能特性將利用ML算法,先捕獲訪(fǎng)問(wèn)者訪(fǎng)問(wèn)站點(diǎn)的行為,然后將該行為用作分類(lèi)器的輸入,***基于培訓(xùn)數(shù)據(jù)構(gòu)建模式。此后,每次訪(fǎng)問(wèn)者訪(fǎng)問(wèn)該網(wǎng)站時(shí),ML算法都會(huì)對(duì)哪些頁(yè)面產(chǎn)生最多銷(xiāo)售量進(jìn)行預(yù)測(cè)并個(gè)性化交付內(nèi)容。
銷(xiāo)售機(jī)構(gòu)他們將不得不接受全新的技術(shù)語(yǔ)言的再培訓(xùn),其中包括AI,機(jī)器學(xué)習(xí),大數(shù)據(jù),DevOps,數(shù)據(jù)科學(xué),統(tǒng)計(jì)學(xué)和應(yīng)用數(shù)學(xué)等。今天,機(jī)器學(xué)習(xí)這個(gè)詞或許只是營(yíng)銷(xiāo)部門(mén)使用的一個(gè)流行語(yǔ)。在適當(dāng)?shù)臅r(shí)候,CDN行業(yè)和機(jī)器學(xué)習(xí)的結(jié)合將會(huì)進(jìn)一步深化,因?yàn)樵絹?lái)越多的人在微小的細(xì)節(jié)上受到教育啟發(fā),例如什么算法做什么,每類(lèi)算法的目的,各種神經(jīng)網(wǎng)絡(luò)之間的差異等等。
我們也可以從了另一個(gè)維度去觀(guān)察這種變化
圖2 CDN 2.0和CDN 3.0 Feature Set對(duì)比
面對(duì)網(wǎng)絡(luò)和軟件堆棧的大范圍更改,我們所做的或許不再是一味地增加代碼、通過(guò)API擴(kuò)展功能或者是優(yōu)化BGP路由,可能只需要簡(jiǎn)單地做下減法去換成更好用的3.0架構(gòu)。CDN3.0的重要標(biāo)志是其能很好地支持目前互聯(lián)網(wǎng)的主流應(yīng)用,同時(shí)有更好的性?xún)r(jià)比,服務(wù)質(zhì)量更有保障,也更安全。事實(shí)上,CDN 3.0已經(jīng)應(yīng)用在Facebook、LinkedIn和Twitter的場(chǎng)景中。下面我們用一張表格來(lái)做一些對(duì)CDN2.0和3.0做一些分析。
人工智能,噱頭還是革命
上圖是一個(gè)科研機(jī)構(gòu)從2000年開(kāi)始對(duì)技術(shù)創(chuàng)新程度按照時(shí)間推移的曲線(xiàn)變化,一段時(shí)期新技術(shù)出現(xiàn)的數(shù)量越多,創(chuàng)新等級(jí)越高,并稱(chēng)之為技術(shù)分裂曲線(xiàn)??梢钥闯?015年前,創(chuàng)新技術(shù)的萌生和進(jìn)步是一個(gè)線(xiàn)性增長(zhǎng)態(tài)勢(shì),隨著大數(shù)據(jù)和機(jī)器學(xué)習(xí)技術(shù)的誕生,創(chuàng)新性的增長(zhǎng)展現(xiàn)出了瘋狂的態(tài)勢(shì)。圍繞著這兩項(xiàng)技術(shù)的新技術(shù)萌生也逐漸推動(dòng)者科技的發(fā)展。按照這個(gè)曲線(xiàn)的走勢(shì),在未來(lái)的12個(gè)月內(nèi),機(jī)器學(xué)習(xí)和大數(shù)據(jù)技術(shù)將對(duì)整個(gè)科技界產(chǎn)生顛覆。
今天,機(jī)器學(xué)習(xí)這個(gè)詞或許只是營(yíng)銷(xiāo)部門(mén)炒作的詞匯,但在未來(lái)的某一天,它必將改變CDN產(chǎn)業(yè)。
參考鏈接:
1、https://www.bizety.com/2017/02/20/cdn-edge-pop-architecture-2-0-end-life-hello-3-0-architecture/
2、https://www.bizety.com/2017/03/07/cdn-pop-architecture-3-0-end-cdn-commoditization-part-1/
3、https://www.bizety.com/2017/03/08/cdn-pop-architecture-3-0-end-cdn-commoditization-part-2/