解決虛擬機遷移五大問題(2)
上節(jié)我們介紹了導(dǎo)致虛擬機遷移失敗的兩個原因:硬件資源不足以及服務(wù)器硬件不兼容。本文接續(xù)介紹虛擬機遷移失敗的其他三個原因以及如何解決。
3.虛擬機任務(wù)沖突
某些虛擬化任務(wù)需要花費相當多的時間才能完成,而且即使在發(fā)生超時錯誤后仍在后臺運行。當另一個虛擬化任務(wù)也在同時運行時嘗試啟動一個虛擬機可能會導(dǎo)致服務(wù)器發(fā)生錯誤。例如,當你刪除不需要的快照時,在合并過程中,虛擬機可能不會重啟。修改虛擬機配置文件中的超時設(shè)置將允許關(guān)鍵的活動不間斷運行,但是你可能還需要重新配置后臺任務(wù)來避免在下班時間虛擬機發(fā)生遷移以及重啟。
4.虛擬機文件損壞
虛擬機僅僅是運行于內(nèi)存中的鏡像,而且該鏡像以特定的虛擬機文件格式比如.vmx以及.vmdk保存在磁盤中。與所有基于磁盤的存儲一樣,磁盤存儲子系統(tǒng)或者網(wǎng)絡(luò)連接存儲以及服務(wù)器存在的問題可能會破壞虛擬機文件。當虛擬機所需要的必要文件丟失、被鎖定、損壞時,虛擬機將無法啟動。
文件鎖定用于避免并發(fā)的任務(wù)對正在使用的文件帶來意想不到的變化,經(jīng)常會發(fā)生上述錯誤。在某些情況下,虛擬機組件文件仍舊被鎖定而且避免了虛擬機在另一臺服務(wù)器上啟動。你可以修改被鎖定的文件然后移除鎖定,但是這一詳細的過程需要具備有關(guān)特定hypervisor以及數(shù)據(jù)中心環(huán)境的專業(yè)知識。更為常見的是從最近的快照或者另一個備份恢復(fù)虛擬機。
5.許可、管理輸入以及其他問題
導(dǎo)致虛擬機無法啟動的其他問題與比如用戶輸入意外中斷有關(guān),而與服務(wù)器功能或者文件完整性無關(guān)。虛擬機可能開啟了一個正常以及成功的啟動過程,但是在啟動完成之前暫停了,并等待管理輸入。一旦你回答了該問題,虛擬機將會繼續(xù)啟動。在重新配置虛擬機以自動應(yīng)答常規(guī)問題、消除人為干預(yù)之前,你需要在虛擬機啟動過程中避免中斷。這一過程與hypervisor相關(guān)而且需要具備專業(yè)知識。
另一個經(jīng)常被忽略的問題是許可,該問題通常源于hypervisor安裝疏忽。例如,將虛擬機部署在一臺剛被虛擬化的服務(wù)器上時,這臺新服務(wù)器的許可可能沒有被正確配置。在其他情況下,許可可能被破壞了,或者組織可能就沒有許可。因此,你必須確保有足夠的許可來支持正在使用的虛擬化服務(wù)器,確保服務(wù)器已經(jīng)配置了許可而且務(wù)必使許可是完整的而且沒有被破壞。
訪問hypervisor的日志文件或者管理日志也可能會加速故障診斷過程。如果通過日志沒有找到問題,根本原因很可能是上述問題中的一個。