部署VMware vCenter SRM時的三大注意事項
VMware vCenter站點恢復管理器(SRM)可以作為實施虛擬化環(huán)境災難恢復(DR)計劃的一個有效工具。它可以在數(shù)據(jù)中心和災難恢復站點之間實現(xiàn)自動化故障轉移,在不中斷生產(chǎn)環(huán)境的情況下對故障轉移計劃進行測試。對于關鍵業(yè)務環(huán)境必不可少:它可以保證應用程序的正常運行時間并減少災難恢復計劃的測試。
但是如果在實際部署SRM之前沒有對一些關鍵因素進行考慮,你可能會遇到各種各樣的問題。事實上,安裝VMware SRM是實施SRM的***一步,在你理解和解決各種各樣的問題之后,才應該進行部署。這篇文章列出了三個特別注意事項:虛擬機(VM)布置、應用程序依賴關系和全面的災難恢復計劃。***部分我們先來看虛擬機布置。
虛擬機布置
對于VMware SRM,簡單地將所有的虛擬機存儲在一個SAN當中是遠遠不夠的。對于成功的SRM部署,虛擬機在存儲區(qū)域網(wǎng)絡(SAN)中的位置也是十分重要的。
為什么虛擬機位置十分重要?首先,虛擬機位置可以影響SAN的復制。VMware SRM依賴于SAN提供的復制技術。VMware SRM不能管理或者提供這種技術;它需要的只是其可用、恰當配置和可操作性。大多數(shù)SAN復制技術在邏輯單元號(LUN)層進行復制,意味著只能以整個LUN決定是是否復制。這樣的結果是,組織必須確保需要通過VMware SRM 保護的虛擬機被存放于同一個可被復制的LUN當中(否則SRM將不能提供保護)。一些組織可能會在***次安裝和配置SAN復制時考慮解決虛擬機放置問題。如果沒有,就需要在安裝SRM之前解決這個問題。幸運的是,你可以使用VMwareStorage VMotion實現(xiàn)在沒有宕機的情況下將虛擬機在數(shù)據(jù)存儲間進行遷移。
其次,虛擬機位置重要的原因是VMware SRM在操作時需要同時移動整個LUN(或者 數(shù)據(jù)存儲)。在SRM故障轉移過程中,有些虛擬機不能同時進行移動,就需要將它們放置于不同的 數(shù)據(jù)存儲當中。只有當災難恢復過程中,位于同一個 數(shù)據(jù)存儲的所有虛擬機可以同時進行故障轉移的情況下,才可以將虛擬機放置于同一個 數(shù)據(jù)存儲當中。同樣,Storage VMotion可以在沒有產(chǎn)生宕機的情況下將虛擬機移動到恰當?shù)?數(shù)據(jù)存儲之中。
為了解決這個注意事項,組織需要在文檔中明確規(guī)定虛擬機在SAN中的存儲位置。一旦位置被確定下來,就需要對一些虛擬機進行遷移,比如將虛擬機移動到可復制的LUN之中,實現(xiàn)通過VMware SRM進行保護。直到SRM實施過程中才會進行另一部分必要的遷移。擁有這些文檔可以簡化之后的遷移過程。#p#
應用依賴關系
必須完全理解應用程序的依賴關系并且將其記載在文檔之中。VMware SRM可能會改變被保護虛擬機的IP地址,但是其不能解決應用程序依賴關系的問題。計劃實施VMware SRM的IT部門如果沒有對應用程序依賴關系進行理解,那么注定是要失敗的。
在完全了解應用程序的依賴關系之后,一些虛擬機可以由VMware SRM進行保護,但是其他一些為被保護虛擬機提供服務的機器仍然處于沒有保護的狀態(tài)。所以,如果當災難恢復發(fā)生時,被保護的虛擬機雖然被移動到了指定的故障轉移站點,但是由于失去依賴的服務,應用程序運行時還是會發(fā)生錯誤?;蛘撸摂M機以錯誤的順序啟動了,在從其他虛擬機需要的底層服務啟動之前,具有依賴性的應用程序就嘗試啟動了。在這兩種情況下,了解應用程序間如何相互作用可以幫助IT部門恰當?shù)夭渴餠Mware SRM來修復依賴性問題。
一些應用程序的依賴性更加明顯。比如在一個組織當中,通常情況下應用程序或者中間件服務器通常要和底層數(shù)據(jù)庫服務器同時進行故障轉移。但是更加微小的依賴關系容易被忽視。不要忘記考慮非虛擬化環(huán)境中的依賴關系。
為了解決這個顧慮,組織應該詳細地列出應用程序間的依賴關系和相互作用圖,擁有了依賴關系圖之后,組織可能會發(fā)現(xiàn)為了滿足***個注意事項,可能需要將其他的虛擬機進行遷移。組織可能還需要改變SAN的復制配置。但是完成VMware SRM的安裝和配置之后,至少組織可以準備創(chuàng)建災難恢復計劃,而保證應用程序能夠以正確的順序進行啟動了。#p#
詳盡的災難恢復計劃
盡管這可能是顯而易見的,但是仍然要注意SRM只能用于數(shù)據(jù)中心的虛擬化部分。所以你仍然需要一個為數(shù)據(jù)中心余下的物理機器制定一個完善的災難恢復計劃。VMware SRM可以為非虛擬化資源提供集成特性——比如運行腳本來控制網(wǎng)絡設備——VMware SRM的正確定位為:災難恢復策略中的一個組成部分。組織仍然必須定義災難恢復事件,比如怎樣才能構成一個合格的災難恢復事件,組織仍然必須定義多個角色來表明災難事件中的任務分配。VMware SRM不能替換這些角色,但是VMware SRM需要組織這些定義來使得這項技術可以適用于災難恢復策略。尋求以技術作為策略的組織***會發(fā)現(xiàn)很難達到項目的成功準則。
另一方面,如果一個組織能夠認真地檢查所有這些注意事項,那么其VMware SRM的實施過程將會十分順利。安裝VMware SRM時,虛擬化部門會發(fā)現(xiàn)這個過程不再復雜,項目當中也不會包含太多的任務,其實原本就應該這樣。