云震 -- 亞馬遜4.21事故的反思
美國當?shù)貢r間4月21日早晨,位于北弗吉尼亞州的亞馬遜EC2、RDS 服務(wù)器出現(xiàn)了技術(shù)問題,導(dǎo)致網(wǎng)絡(luò)延遲及鏈接錯誤。亞馬遜的此次“云端”技術(shù)故障導(dǎo)致多個知名應(yīng)用出現(xiàn)大規(guī)模停頓。受害者包括:Foursquare,Quora,HootSuite,Reddit。
我將這次技術(shù)故障稱為:云震,云端大地震。
IDC 的分析師 Matthew Eastwood 說:“這是對云計算的一次特別提醒。”云震是對云計算理念的一次警告。以往云所宣稱的“永不宕機的可靠性”其實只是一種期望。
簡單的去理解云,它是一種以最終計算能力和存儲能力為產(chǎn)品的信息服務(wù),和以往機房提供的服務(wù)不同,客戶無需關(guān)心計算能力和存儲能力的由來。然而這項服務(wù)的根基仍然是機房服務(wù)??蛻艨梢圆魂P(guān)心云的運營,然而將這個概念擴展到“任何人無需關(guān)心云的運營”就不可取了。今天亞馬遜關(guān)心的不到位,就要客戶和終端用戶為這樣的不到位買單。
針對“云不是***的”這項事實,全球的信息專家發(fā)出了各種設(shè)想,意在云震之后完善這個理念,讓各種服務(wù)繼續(xù)飄在云端。
分布式的云
Netflix是亞馬遜云服務(wù)的重要客戶,在此次云震中他們幸免于難。Netflix 的發(fā)言人 Steve Swasey 表示:我們充分利用了亞馬遜的冗余云架構(gòu),任何發(fā)生在單點的技術(shù)問題不會影響 Netflix 的業(yè)務(wù)。
將產(chǎn)品部署到地理位置更廣泛的云端去,同時啟用幾片云而不是一片云。是云震求生的***條技能。
快速恢復(fù)
BigDoor是本次云震中另一個快速恢復(fù)服務(wù)的公司??偛?Keith Smith 說:由于購買了亞馬遜的備份恢復(fù)服務(wù),我們很快恢復(fù)了過來。不過這個服務(wù)只在弗吉尼亞數(shù)據(jù)中心才有。當然公司需要在費用和可靠性中尋求一個平衡點。
快速恢復(fù)也許現(xiàn)在的價格很高,但比起丟失用戶體驗,這些錢值得放進創(chuàng)業(yè)規(guī)劃中去。
陰謀論
此次云震的***受害者是誰?亞馬遜云端上的那些創(chuàng)新企業(yè)。今天,已經(jīng)有大量創(chuàng)新企業(yè)建筑在大公司提供的低廉的云端上。
會不會有天,當你不聽話了:搶掉了大公司的用戶,或者不同意某項由大公司股東提議的收購,接著,你的那片云就崩了。
云可能成為大公司談判的資本,云也有可能成為大公司操縱市場運作的籌碼。
可能,有可能。
創(chuàng)新公司有想法和團隊,但他們?nèi)鄙贆C房和電纜。前者是他們賴以生存的氧氣,后者是他們賴以生存的水,缺了哪項都不行。
自建云
Facebook的馬克·扎克伯格是一位有遠見的技術(shù)狂人。在 Facebook 創(chuàng)建初期堅持儲備大于當前用戶數(shù)量10倍的計算與存儲作為業(yè)務(wù)的保障。在當他們還負擔不起自有機房的時期里,這項策略幫助 Facebook 邁過了一次次的用戶涌入而不至于崩盤?,F(xiàn)在 Facebook 將建造數(shù)據(jù)中心作為業(yè)務(wù)發(fā)展的重要任務(wù)予以對待,從機房設(shè)計到硬件配置始終親力親為。(近日,F(xiàn)acebook 將披露新建的一家數(shù)據(jù)中心的技術(shù)規(guī)格,其中包括計算機、電源、服務(wù)器機柜、電池備份系統(tǒng)和建筑設(shè)計的細節(jié)。Open Compute Project)
自建云,讓大企業(yè)的發(fā)展不受制約,并給予其制約其他企業(yè)的機會。
云震,終將過去。多難興邦,“多震興業(yè)”,希望如此吧。
【編輯推薦】
- 使用Microsoft Azure 讓云遷移變得簡便的5種方法
- VMware的混合云遷移工具:vCloud Connector
- 企業(yè)CRM等業(yè)務(wù)系統(tǒng)遷移到 "云"中的***實現(xiàn)
- 云計算該“遷移”還是“自建”?
- 云遷移全攻略:哪些應(yīng)用適合遷移
- 亞馬遜 谷歌 微軟三大試用云服務(wù)大比拼(上)
- 亞馬遜推出1年免費云計算服務(wù)
- 亞馬遜EC2中斷 “可用區(qū)”遭質(zhì)疑
- 傷不起!亞馬遜史前***宕機事件的啟示