因亞馬遜服務(wù)器故障服務(wù)中斷誰的錯?
上周,亞馬遜在弗吉尼亞州(Virginia)北部的云計算中心宕機(jī),導(dǎo)致包括Quora、新聞服務(wù)Reddit、Hootsuite和位置跟蹤服務(wù)FourSquare在內(nèi)的眾多網(wǎng)站都受到了影響。受影響的這些網(wǎng)站都依靠亞馬遜的這個云計算中心提供服務(wù)。
Everyblock網(wǎng)站也是其中一個受影響的網(wǎng)站,但是令人驚訝的是,他們并沒有把所有的錯歸咎在亞馬遜上,“坦白地說,我們搞砸了,”Everyblock網(wǎng)站的一位技術(shù)人員Paul Smith在其博客上寫道:
“AWS就明確建議開發(fā)者在設(shè)計網(wǎng)站架構(gòu)時,應(yīng)該考慮網(wǎng)站的彈性考慮到意外的失敗和中斷,比如說昨天的中斷,但是我們并沒有遵守這個建議……我們是否在我們跨區(qū)域的服務(wù)器都部署了,是否考慮到ASW建議的那些單獨(dú)服務(wù)器和其他服務(wù),我們可能還會在同一個地方跌倒。”
Paul Smith是比較理智的,因?yàn)槿绻汩喿x亞馬遜的“AWS網(wǎng)絡(luò)托管最佳實(shí)例(PDF)”,你回看到里面明確的寫著很多建議,幫你度過中斷的建議。
當(dāng)然,筆者并不認(rèn)為亞馬遜就無過錯了。多日的宕機(jī)影響了東部眾多地區(qū)的服務(wù)本身就是一個很嚴(yán)重的問題。他們的報告寫道:“一些多排列故障轉(zhuǎn)移需要的時間比預(yù)期的長”,受影響的用戶有權(quán)生氣發(fā)脾氣。另一方面,用戶也受到警告——如果他們想要容錯能力,那么就需要在多個地區(qū)建立故障轉(zhuǎn)移。但是他們沒有這樣做,網(wǎng)頁服務(wù)被關(guān)停,這又是誰的錯呢?
出現(xiàn)這樣的問題,并不是因?yàn)樵朴嬎悴荒鼙恍湃?。問題的關(guān)鍵在于正確部署一個云計算應(yīng)用并不像購買一些服務(wù)器實(shí)例一樣簡單。但是話又說回來,在你自己的數(shù)據(jù)中心部署一個關(guān)鍵任務(wù)應(yīng)用也沒有設(shè)置一些服務(wù)器來的簡單。
CSS公司的云服務(wù)部門高級副總裁Ahmar Abbas指出:“充分利用本地AWS能力的組織,例如為所有應(yīng)用建立亞馬遜機(jī)器鏡像,優(yōu)化快照,利用多個其他地區(qū)隔離的AWS,就能夠成功度過這些終端。”上周并未受影響的一位亞馬遜云服務(wù)用戶Netflix表示。
云計算最大的優(yōu)勢就是能夠簡單輕松的進(jìn)行擴(kuò)展,你可以很快的部署一個非關(guān)鍵應(yīng)用,但上周亞馬遜的中斷,讓筆者學(xué)到了兩個教訓(xùn):遷移到云中并不能消除你對IT專業(yè)人士的需求,另一個教訓(xùn)就是如果你不遵循提供商的建議,那就等著火燒眉毛吧!
【編輯推薦】
- 使用Microsoft Azure 讓云遷移變得簡便的5種方法
- VMware的混合云遷移工具:vCloud Connector
- 企業(yè)CRM等業(yè)務(wù)系統(tǒng)遷移到 "云"中的最佳實(shí)現(xiàn)
- 云計算該“遷移”還是“自建”?
- 云遷移全攻略:哪些應(yīng)用適合遷移
- 亞馬遜 谷歌 微軟三大試用云服務(wù)大比拼(上)
- 亞馬遜推出1年免費(fèi)云計算服務(wù)
- 亞馬遜EC2中斷 “可用區(qū)”遭質(zhì)疑
- 傷不起!亞馬遜史前最大宕機(jī)事件的啟示
- 云震 -- 亞馬遜4.21事故的反思
- 從亞馬遜云服務(wù)故障中吸取的七個教訓(xùn)
- 云計算與集群:是攜手還是爭斗?