AWS推快照備份服務抵御宕機風險 靠譜嗎?
似乎亞馬遜的云服務每隔一段時間都要宕機一次。不過AWS今天發(fā)布一個新的功能——EBS Snapshot Copy,該服務能夠讓全世界各個地區(qū)的用戶快速的恢復彈性塊存儲卷(EBS volumes)設備。即使發(fā)生宕機,也有利于整個系統(tǒng)快速恢復穩(wěn)定。對于亞馬遜的極客來說,這絕對是一個“重磅新聞”。其中有人就表示:“到目前為止,我們不得不自己動手編寫代碼,或者說使用像Ylastic(每個月需要50美元)這樣的服務來實現(xiàn)跨區(qū)域移動EBS卷。而EBS Snapshot Copy功能將大大的簡化跨區(qū)域之間的災難恢復過程,這正是我們所需要的。”
AWS的官方網站***時間也對EBS Snapshot Copy功能進行了說明,以下是來自AWS官方博客的***手資料:
為什么要拷貝?
當然,很多人會有這樣的疑問:為什么要從一個AWS分區(qū)拷貝EBS Snapshot到另一個分區(qū)呢?先說說用戶常常遇到的情況:
地理區(qū)域的擴展:用戶想在一個新的區(qū)域內推出自己的應用。
遷移:用戶想跨區(qū)域遷移自己的應用程序。
災難恢復:用戶想跨區(qū)域進行備份自己的數據以及日志文件,通過這種定期備份就能最小化數據丟失的概率,也能縮短災難恢復的時間。
那么針對這些問題,EBS快照備份可以幫助用戶簡化實現(xiàn)這些用例的拷貝流程。
如何進行快照備份?
用戶現(xiàn)在不僅可以實現(xiàn)跨區(qū)域備份,而且只要是“完成”狀態(tài)的Snapshot,用戶都可以任意進行拷貝,包括用戶自己創(chuàng)建的Snapshot,用戶分享的Snapshot以及來自AWS市場,虛擬機的Import/Export還有Storage Gateway的Snapshot。不過如果用戶拷貝了市場上的產品,就必須確保產品在目標區(qū)域內是可用的。
用戶可以使用AWS管理面板或者通過命令行來創(chuàng)建備份,當然也可以使用***的[CopySnapshot]功能來實現(xiàn),下面是從面板創(chuàng)建備份操作的過程:

當用戶選擇了拷貝Snapshot操作,管理面板就會詢問用戶備份的目標位置:

而且在拷貝的過程中,用戶可以切換到目標區(qū)域查看拷貝的進程:

這里是該功能一些重要的信息:
AWS管理面板顯示了Snapshot拷貝的進程,用戶可以在其上查看完成的百分比情況。
用戶可以同時創(chuàng)建多個Snapshot拷貝命令,僅僅需要選擇然后就可以備份多個Snapshot到同一個區(qū)域,不過也可以拷貝同一個Snapshot到不同的區(qū)域,而且正在拷貝中的副本不會影響到相關EBS卷的性能。
如果備份是基于控制臺的接口,那么用戶首先需要登錄到源區(qū)域,然后告知控制臺Snapshot的拷貝位置。相比之下,基于API和命令行為基礎的備份過程,用戶就必須在目標區(qū)域內進行執(zhí)行(API以及命令行)。
資費
跨區(qū)域之間是按照常規(guī)的數據遷移資費標準,一旦用戶創(chuàng)建一個新的Snapshot,用戶需要按照目標區(qū)域的常規(guī)存儲資費標準。
未來的發(fā)展
正如用戶看到的那樣,EBS Snapshot Copy可以簡化用戶的區(qū)域擴展、數據中心遷移以及災難恢復的過程。下一步,亞馬遜將實施AMI(Amazon Machine Images)區(qū)域間的備份,用戶可以備份公有的或者自己創(chuàng)建的AMIs到目標區(qū)域。
不過新功能的效果到底如何?能不能夠減弱宕機的對運營的影響?還必須經過實踐的檢驗,我們也將拭目以待!
后記:
不過雖然EBS Snapshot Copy允許用戶跨區(qū)域拷貝EBS卷,但是這必須是在有公有云服務的范圍內。AWS表示這有利于客戶在新地區(qū)推出一項服務以及有利于確定接近終端用戶的EBS卷。EBS Snapshot Copy的另一個很重要的用途就是幫助用戶快速的進行災難恢復,亞馬遜鼓勵用戶使用云端的多可用區(qū)(Availability Zones),這樣就可以保證系統(tǒng)的容災能力,而且添加了多分區(qū)的支持,這對創(chuàng)建高可用性的系統(tǒng)來說也是合乎邏輯的。AWS將其公共云產品劃分成九個區(qū)域,而且在每個地區(qū)內都配置了可用區(qū)(該可用區(qū)獨立于區(qū)域內的其他部分)。這樣不僅僅能擴展工作負載,還能為客戶添加新的工具來預防宕機。
亞馬遜的多起宕機事件:在今年6月14日,位于美國東部的Amazon數據中心出現(xiàn)故障,并影響了AWS多項云服務以及基于之上的Heroku、Quora等知名網站。在今年10月22日,AWS東部地區(qū)再次出宕機問題, 這次宕機對Reddit, Airbnb, Flipboard, GetGlue, Coursera等多家知名網站造成了很大的影響,此次事件發(fā)生之后,AWS官方網站對本次宕機事件做出了解釋,而且告訴用戶AWS正在做的工作,以防止 未來再次發(fā)生類似的問題。時至今日,我們終于看到了亞馬遜的動作。