單個VMware虛擬機故障監(jiān)控和重置
自從發(fā)布VI3 3.5以來,VMware HA開始實驗性支持單個虛擬機故障的監(jiān)控,并且基于你預(yù)先設(shè)置的方式的進行故障處理,這個新的模塊稱為虛擬機故障監(jiān)控模塊。虛擬機故障監(jiān)控可以處理來賓操作系統(tǒng)的故障。
關(guān)于虛擬機故障監(jiān)控模塊
由于虛擬機故障監(jiān)控是實驗性支持,因此默認是關(guān)閉的。如果你啟用了該功能,VMware HA將開始檢測虛擬機是否可用。VMware HA通過VMware Tools收集到的心跳信息來決定虛擬機的可用性。
每一臺虛擬機中的VMware Tools每秒鐘發(fā)送一次心跳信息,虛擬機監(jiān)控模塊每20秒檢測一下心跳。如果心跳在用戶指定的時間內(nèi)沒有收到,虛擬機監(jiān)控模塊就認為該虛擬機發(fā)生故障,就會重置該虛擬機。
虛擬機故障監(jiān)控模塊可以自己分辨出來是虛擬機打開,但是心跳中止;還是虛擬機關(guān)閉、遷移走了。它也可以區(qū)分是虛擬機太忙導(dǎo)致心跳丟失還是真的發(fā)生了虛擬機故障,因為虛擬機故障監(jiān)控模塊可以判斷出在特定時間段心跳的次數(shù)為零。
當然,虛擬機故障監(jiān)控模塊工作的基礎(chǔ)是該來賓操作系統(tǒng)里已經(jīng)安裝了VMware Tools,沒有安裝VMware Tools的虛擬機,該模塊無法監(jiān)控。
使用虛擬機故障監(jiān)控模塊
你可以為整個群集配置虛擬機監(jiān)控模塊,當然,該虛擬機群集必要先啟用VMware HA,否則沒法進行監(jiān)控。當然,你沒法創(chuàng)建一個支持虛擬機故障監(jiān)控的群集,你要先創(chuàng)建一個普通群集,然后更改它的配置。
具體如何來配置虛擬機故障監(jiān)控模塊呢?下面是具體的步驟:
<!--[if !supportLists]-->1. <!--[endif]-->登陸到VMware VI客戶端,在Inventory欄,選擇需要監(jiān)控的群集,點擊鼠標右鍵;
<!--[if !supportLists]-->2. <!--[endif]-->選擇Edit Settings;
<!--[if !supportLists]-->3. <!--[endif]-->如果該群集沒有啟用VMware HA,在General選擇Enable VMware HA;
<!--[if !supportLists]-->4. <!--[endif]-->在接下來選擇Advanced Options
<!--[if !supportLists]-->5. <!--[endif]-->在出現(xiàn)的選項里輸入合適的值,然后點擊OK。
該頁目前支持的選項解釋如下:
如果你沒有進行任何配置,說明das.vmFailoverEnabled仍然是false。如果虛擬機故障監(jiān)控已經(jīng)啟用,這些選項你都沒有進行配置的情況下,所有的選項都會使用默認配置。
配置實例
下面的實例是某個虛擬機故障監(jiān)控的配置情況。
<!--[if !vml]-->
<!--[endif]-->
該配置說明:
<!--[if !supportLists]-->1. <!--[endif]-->在Virtual Center Server上已經(jīng)啟用了虛擬機故障監(jiān)控模塊;
<!--[if !supportLists]-->2. <!--[endif]-->如果60秒或更長時間內(nèi)不能收到該群集的心跳,VMware HA將重置該虛擬機
<!--[if !supportLists]-->3. <!--[endif]-->每臺虛擬機允許240秒時間來啟動穩(wěn)定其心跳。該時間用來進行虛擬機啟動和VMware Tools重置;
<!--[if !supportLists]-->4. <!--[endif]-->如果一天中虛擬機故障達到或超過3次,VMware HA就不再進行虛擬機重置。
當然,目前虛擬機故障監(jiān)控模塊仍然處于試驗性支持階段,因此沒提供明確的系統(tǒng)管理員通知。
【編輯推薦】