亞馬遜云如何應(yīng)對網(wǎng)絡(luò)界的“完美風(fēng)暴”?
譯文亞馬遜網(wǎng)絡(luò)服務(wù)(AWS)的經(jīng)營規(guī)模超大――在知名調(diào)研公司Gartner***的魔力象限(Magic Quadrant)中,該公司估計(jì)AWS的計(jì)算能力比該公司14個緊隨其后的競爭對手的總和還強(qiáng)五倍。
亞馬遜云覆蓋全球11個地區(qū),共由28個可用區(qū)域(availability zone)組成,每個可用區(qū)域至少有一個數(shù)據(jù)中心,每個數(shù)據(jù)中心部署的服務(wù)器數(shù)量在5萬臺到8萬臺之間。AWS每天為其云添加的新計(jì)算能力足以滿足亞馬遜網(wǎng)站在2004年的要求,當(dāng)時它還是一家年收入只有70億美元的公司。
AWS副總裁兼杰出工程師James Hamilton擔(dān)心會拖累整個系統(tǒng)的一個環(huán)節(jié)就是網(wǎng)絡(luò)。
Hamilton在AWS re:Invent大會上演講時表示,網(wǎng)絡(luò)行業(yè)出現(xiàn)了一場“***風(fēng)暴”。“這是問題,是紅色警報情形。”
諸多因素讓網(wǎng)絡(luò)成為AWS非常擔(dān)憂的大問題。首先,相比計(jì)算和存儲,網(wǎng)絡(luò)成本在增加。Hamilton表示,服務(wù)器價格在下降,而網(wǎng)絡(luò)價格“歷久不變”。
由于計(jì)算能力的成本不斷下降,每臺服務(wù)器塞滿了數(shù)量更多的虛擬機(jī)。光這一點(diǎn)就讓網(wǎng)絡(luò)不堪重負(fù),不過現(xiàn)在還在使用更多的網(wǎng)絡(luò)資源密集型先進(jìn)數(shù)據(jù)分析方法,這增添了另外的壓力。主要的問題是數(shù)據(jù)中心內(nèi)部的流量,也就是所謂的“東西向”流量,與之相對的是出入站流量,又叫“南北向”流量。
AWS應(yīng)對這個問題的辦法其實(shí)很簡單:該公司構(gòu)建了自己的網(wǎng)絡(luò)和設(shè)備。Hamilton表示,這是大膽的舉動,不過就AWS的規(guī)模來看,這又是很自然的解決辦法。
多年前,AWS就開始與原始網(wǎng)絡(luò)設(shè)備制造商合作,設(shè)計(jì)自己的定制網(wǎng)絡(luò)設(shè)備。AWS開發(fā)了一種定制的協(xié)議,現(xiàn)在用來運(yùn)行其云。此舉不僅降低了成本,還提高了可用性。Hamilton表示,通過直接與制造商合作,AWS獲得了優(yōu)勢。如今的許多網(wǎng)絡(luò)硬件公司無力根據(jù)客戶的具體要求來定制設(shè)備。通過與制造商直接合作,AWS就能做到這點(diǎn)。
不過,這還不足以支持AWS的龐大規(guī)模。AWS有自己的專用網(wǎng)絡(luò)連接其服務(wù)地區(qū)。這家公司并不是依賴公有云提供商,而是擁有專用的隧道,這就提高了可用性、提高了性能,抖動更少、成本更低。Hamilton說:“變得更可靠了,鏈路成本更低,延遲更短。用戶完全變得更滿意。”
相比其他基礎(chǔ)設(shè)施即服務(wù)(IaaS)云服務(wù)提供商,AWS擁有一種獨(dú)特的架構(gòu)。在每個地區(qū)(共有11個地區(qū))的后面是可用區(qū)域,可用區(qū)域提供了物理上分離的數(shù)據(jù)中心,以便在每個地區(qū)建立容錯機(jī)制。每個地區(qū)的前面是轉(zhuǎn)接中心,它為三個主目的地提供了連接:可用區(qū)域與其他地區(qū)之間、連接到AWS的直連項(xiàng)目(Direct Connect)合作伙伴,以及連接到公共互聯(lián)網(wǎng)。
AWS已將冗余路徑做入到可用區(qū)域里面,那樣如果其中一個在某地區(qū)出現(xiàn)了故障,該地區(qū)仍能正常服務(wù)。某地區(qū)里面的每個可用區(qū)域其彼此之間的延遲不到2毫秒,通常更接近1毫秒。每個可用區(qū)域起碼有自己的數(shù)據(jù)中心;至于美國東部地區(qū)(US-East),這個AWS歷史最悠久的地區(qū)其可用區(qū)域有五個數(shù)據(jù)中心。
眾所周知,AWS對于其運(yùn)營系統(tǒng)的內(nèi)部機(jī)制一直保持緘默,但Hamilton透露了這家公司如何順暢運(yùn)營、快速創(chuàng)新。今年,該公司預(yù)計(jì)會向其云發(fā)布大約500項(xiàng)更新服務(wù)。與此現(xiàn)時,其簡單存儲解決方案(S3)在使用率方面預(yù)計(jì)同比增長120%以上,彈性計(jì)算云(EC2)每年增長99%。不是每家公司都能夠采取AWS那樣的措施來解決問題,但也不是每家公司都面臨AWS那樣的規(guī)模和問題。
布加迪編譯






