三下搞定VMware虛擬機的數(shù)據(jù)恢復(fù)
作者:張宇,北亞VMWARE數(shù)據(jù)恢復(fù)中心,轉(zhuǎn)載請聯(lián)系作者,如果實在不想聯(lián)系作者,至少請保留版權(quán),謝謝。
對前幾天接手的一個VMWARE ESX SERVER的數(shù)據(jù)恢復(fù)案子進行一下總結(jié)
[數(shù)據(jù)恢復(fù)故障描述]
中石化某省分公司,信息管理平臺,幾臺VMware虛擬機——ESX SERVER共享一臺IBM DS4100存儲,大約有40~50組虛擬機,占用1.8TB空間,數(shù)據(jù)重要。
正常工作中,vc里報告虛擬磁盤丟失,ssh到ESX中執(zhí)行fdisk -l查看磁盤,發(fā)現(xiàn)storage已經(jīng)沒有分區(qū)表了。重啟所有設(shè)備后,ESX SERVER均無法連接到DS4100所在的STORAGE。
仔細詢問當時的管理員,他們提到一點,曾經(jīng)在這個存儲網(wǎng)絡(luò)里連接過一臺windows 2003服務(wù)器,具體情況不詳。
[數(shù)據(jù)恢復(fù)分析]
很自然地想到了,可能是那臺windows 2003因?qū)torage的獨享操作導(dǎo)致了整個vmfs卷損壞。
以整個存儲做分析發(fā)現(xiàn):
1、分區(qū)表清0,有55aa有效結(jié)束標志,有硬盤ID標志。
2、簡單從前向后查看,發(fā)現(xiàn)一個NTFS卷,但似乎并未寫數(shù)據(jù)進去,像一個剛剛格式化的卷,對這個NTFS卷的BITMAP做分析,得知大小約為1.8T(全部空間),前部占用部分空間,3G左右位置占用部分空間,0.9T附近占用部分空間,但總占用空間不超過100M。
3、針對VMFS卷進行分析,發(fā)現(xiàn)在原1.8TB的磁盤里有2組VMFS分區(qū),第2組是對***組的extend,***組約1.5T,第二組約300GB,因NTFS分區(qū)并未寫數(shù)據(jù)到第二個VMFS分區(qū)里(***一個扇區(qū)的DBR備份沒有覆蓋有用數(shù)據(jù)),所以重點在于***個VMFS分區(qū)。
4、分析***組VMFS,卷頭結(jié)構(gòu)丟失,一級索引、二級索引均存在,NTFS覆蓋的數(shù)據(jù)區(qū)正好是某組虛擬機的臨時內(nèi)存鏡像,損壞也無妨。
[數(shù)據(jù)恢復(fù)過程只要三步]
1、對整個STORAGE進行鏡像備份。
2、分析后,連接兩個VMFS分區(qū),直接按照VMFS分析組織方式提取所有VMDK及配置文件。
3、通過nfs直接遷移回ESX SERVER。
另:本例中因已對故障存儲做了安全備份,修復(fù)中同時直接重建***組VMFS卷頭,索引列表、分區(qū)表等信息,直接附加在ESX SERVER環(huán)境,算是第二個方案。
[數(shù)據(jù)恢復(fù)結(jié)果]
花費2天時間(不計之后的遷移時間),全部數(shù)據(jù)恢復(fù)成功
[其他]
1、本例中依然是因為光纖環(huán)境互斥不當導(dǎo)致的問題,實際上,應(yīng)該是這個卷在WINDOWS系統(tǒng)做了重新分區(qū),并格式化成了NTFS,之后又對分區(qū)做了刪除操作。因ESX VMFS的互斥不依賴于硬件,只依賴于操作系統(tǒng)驅(qū)動層,所以在其他服務(wù)器接入存儲網(wǎng)絡(luò)時一定要小心,盡量考慮好存儲分配權(quán)限。
2、ESX因便捷的信息集中管理,真正使用中往往數(shù)據(jù)特別重要,一定要做好備份工作,并考慮損壞時遷移的方便性。
【編輯推薦】