通過(guò)可靠的設(shè)計(jì)預(yù)防VMware環(huán)境故障
ESXi主機(jī)需要vCenter才能進(jìn)行高級(jí)功能和管理,當(dāng)然,即使沒(méi)有它,你也可以執(zhí)行很多管理任務(wù)。但是,當(dāng)你遇到事故或中斷時(shí),vCenter是虛擬環(huán)境中最重要的工具。在設(shè)計(jì)VMware環(huán)境時(shí),你必須保護(hù)vCenter,并考慮為大規(guī)模故障制定應(yīng)急計(jì)劃。
很多管理員在同一個(gè)環(huán)境虛擬化vCenter以及管理vCenter。這意味著如果你遇到大問(wèn)題(例如存儲(chǔ)故障),你的主要診斷工具也可能會(huì)脫機(jī)。
當(dāng)你使用冗余網(wǎng)絡(luò)和電源連接時(shí),你可能會(huì)忽略對(duì)vCenter的全面保護(hù)。幸運(yùn)的是,你可以在發(fā)生故障時(shí)將多個(gè)vCenter服務(wù)器鏈接在一起。高可用性(HA)也可以提供vCenter保護(hù)–通過(guò)備份vCenter服務(wù)器并啟動(dòng)故障轉(zhuǎn)移,但如果整個(gè)虛擬環(huán)境出現(xiàn)故障,這將無(wú)濟(jì)于事。
規(guī)劃管理集群
管理集群是位于主要生產(chǎn)基礎(chǔ)架構(gòu)外的主機(jī),專(zhuān)用于管理工具和應(yīng)用程序。管理集群應(yīng)包含vCenter、Active Directory控制器、備份打印服務(wù)器、備份域名系統(tǒng)和動(dòng)態(tài)主機(jī)配置協(xié)議服務(wù)器。異地管理群集對(duì)數(shù)據(jù)中心至關(guān)重要。
要使管理群集真正有效,你必須將其連接到主生產(chǎn)網(wǎng)絡(luò),但同時(shí)保持其獨(dú)立,以免網(wǎng)絡(luò)問(wèn)題影響它。存儲(chǔ)也是如此,存儲(chǔ)應(yīng)該存在于自己的框架中,或者你可以使用本地共享存儲(chǔ)(例如vSAN)來(lái)提供備用存儲(chǔ)位置。
如果你無(wú)法阻止VMware環(huán)境發(fā)生故障,包含關(guān)鍵工具和服務(wù)的管理集群可以為你提供基本功能以使其他系統(tǒng)重新聯(lián)機(jī)。這不應(yīng)取代或復(fù)制你現(xiàn)有的數(shù)據(jù)中心。但是,它可以在發(fā)生大規(guī)模中斷時(shí)保持vCenter安全。
調(diào)整規(guī)模以防止VMware環(huán)境故障
故障威脅會(huì)影響你創(chuàng)建主機(jī)的大小以及可向主機(jī)中部署多少個(gè)VM或容器。你的主機(jī)越大,中斷的影響就越大,具體取決于你的工作負(fù)載分布情況。
VM密度也會(huì)影響HA。對(duì)于相同數(shù)量的VM,你擁有的主機(jī)越少,重啟所用的時(shí)間就越長(zhǎng),因?yàn)槟惚仨氁淮沃匦聠?dòng)更多的VM。
同時(shí),保持工作負(fù)載分離可能會(huì)增加主機(jī)故障的影響。而如果你將生產(chǎn)工作負(fù)載與開(kāi)發(fā)或測(cè)試工作負(fù)載混合在一起,則故障的影響會(huì)更小。但你必須管理更多資源池以確保生產(chǎn)VM具有資源權(quán)限?;旌瞎ぷ髫?fù)載還會(huì)創(chuàng)建更密集的主機(jī),因此你必須確定哪個(gè)更重要:在環(huán)境平穩(wěn)運(yùn)行時(shí)減少工作量,還是在發(fā)生重大故障時(shí)減少工作量。
在設(shè)計(jì)中尋找折中點(diǎn)
好的設(shè)計(jì)需要折中點(diǎn)。對(duì)你有意義的內(nèi)容可能會(huì)讓另一個(gè)管理員感到困惑,并且,修復(fù)可能并不總是完美。你可以通過(guò)確保其他管理員了解你的思維過(guò)程,以防止未來(lái)的VMware環(huán)境故障。
你應(yīng)該記錄你的設(shè)計(jì)過(guò)程,這不僅包括你做出的決定,還包括做出這些決定的原因。這有助于其他人理解背后的邏輯。這些細(xì)節(jié)可以防止他人犯錯(cuò)誤。你當(dāng)然不會(huì)希望新員工升級(jí)或更換基礎(chǔ)架構(gòu)時(shí),遇到與你相同的問(wèn)題。