如何確保vSphere高可用性
配置vSphere集群時(shí)一個(gè)最重要的特性就是vSphere高可用性,當(dāng)服務(wù)器或者操作系發(fā)生故障時(shí),可以在其他可用的主機(jī)上重啟虛擬機(jī)。
只有系統(tǒng)管理員針對(duì)環(huán)境恰當(dāng)?shù)嘏渲胿Sphere高可用性(HA)后,虛擬安全機(jī)制才能發(fā)揮其作用。通過合理的配置,vSphere HA可以提高vSphere集群中所有虛擬機(jī)的可用性。需要保證以下幾個(gè)方面配置正確,才可以避免產(chǎn)生宕機(jī)。
正確配置接入控制策略
啟用HA后,就可以配置接入控制策略(ACP)了。這個(gè)特性允許你設(shè)定故障轉(zhuǎn)移過程中使用的資源數(shù)量。在故障轉(zhuǎn)移過程中如果集群中沒有足夠的資源,ACP就會(huì)阻止虛擬機(jī)(VM)重新啟動(dòng)。在改變配置之前,需要注意集群當(dāng)中主機(jī)的配置和可承受失效主機(jī)的最大數(shù)量。
接入控制策略中有三個(gè)選項(xiàng)。
第一個(gè)接入控制策略選項(xiàng)定義了可以接受的失效主機(jī)的最大數(shù)量。當(dāng)計(jì)算一個(gè)虛擬機(jī)是否能夠重啟時(shí),HA會(huì)假設(shè)發(fā)生了最大規(guī)模的主機(jī)宕機(jī)。
第二個(gè)接入控制策略選項(xiàng)定義了集群中CPU和內(nèi)存資源的預(yù)留比例。在復(fù)雜的主機(jī)環(huán)境當(dāng)中,其可以控制預(yù)留多少資源。
第三個(gè)接入控制策略選項(xiàng)指定預(yù)留哪些主機(jī)用于故障轉(zhuǎn)移。為了保證當(dāng)故障發(fā)生時(shí)有足夠的資源,HA會(huì)在主機(jī)上禁止啟動(dòng)虛擬機(jī)。
正確配置主機(jī)隔離響應(yīng)
新的主機(jī)必須能夠鎖定虛擬機(jī)的虛擬磁盤文件,HA才能夠重新啟動(dòng)虛擬機(jī)。如果之前的主機(jī)仍然可以進(jìn)行操作,那么虛擬磁盤文件將會(huì)被鎖定,阻止新的主機(jī)啟動(dòng)虛擬機(jī)。為了防止這種現(xiàn)象發(fā)生,HA中的設(shè)定可以定義當(dāng)一個(gè)主機(jī)和其他集群節(jié)點(diǎn)處于隔離狀態(tài)時(shí),其可以接受的響應(yīng)類型。這個(gè)設(shè)定可以用于關(guān)閉、斷電或者保持虛擬機(jī)的供電狀態(tài)。必須設(shè)定默認(rèn)狀態(tài),但是每個(gè)虛擬機(jī)都可以進(jìn)行單獨(dú)配置。
如何避免主機(jī)隔離
一些設(shè)定可以防止主機(jī)宣告自己處于隔離狀態(tài)。
第一個(gè)選項(xiàng)是指定一個(gè)隔離地址。HA將會(huì)嘗試ping這個(gè)地址,以決定主機(jī)是否已經(jīng)斷開。默認(rèn)情況下,使用主機(jī)上的默認(rèn)網(wǎng)關(guān)作為隔離地址。如果HA運(yùn)行在一些子網(wǎng)而不是默認(rèn)網(wǎng)關(guān)上,就要使用高級(jí)命令das.isolationaddress來配置另外的隔離地址。
第二個(gè)選項(xiàng)是正確配置HA使用的網(wǎng)絡(luò)。所有的非vMotion VMkernel端口都要用于集群中主機(jī)間的HA通訊。對(duì)于單一VMkernel端口或者多VMkernel端口來說,配置恰當(dāng)?shù)木W(wǎng)絡(luò)接口卡(NIC)和交換機(jī)冗余非常關(guān)鍵。
在維護(hù)期間禁用主機(jī)監(jiān)控。這樣可以防止因?yàn)槿魏斡绊慔A端口或其他HA組件的臨時(shí)情況而導(dǎo)致虛擬機(jī)意外重啟。除此之外,VMware建議在發(fā)生網(wǎng)絡(luò)改變時(shí)將主機(jī)設(shè)定為維護(hù)模式,當(dāng)退出維護(hù)模式時(shí)強(qiáng)制HA承認(rèn)任何網(wǎng)絡(luò)改動(dòng)。
確保HA主機(jī)監(jiān)控啟用。當(dāng)建立集群或者結(jié)束維護(hù)時(shí)忘記檢查集群屬性復(fù)選框時(shí),可能會(huì)發(fā)生這種情況。并且一些用戶并不相信虛擬環(huán)境中的自動(dòng)化,所以不啟用它們。