服務器數據恢復環境:
一臺使用NTFS文件系統的服務器;
7塊硬盤組成了一組raid5磁盤陣列。
服務器故障&初檢:
raid5磁盤陣列磁盤故障離線導致服務器癱瘓。用戶在處理掉線磁盤時只添加新的硬盤rebuild,并沒有將掉線的3塊硬盤從陣列中拔掉。
硬件工程師對故障服務器中所有硬盤進行了物理檢測,沒有發現硬盤物理故障,只好交由服務器數據恢復工程師對所有硬盤做全盤鏡像&分析。
服務器數據恢復過程:
1、對所有硬盤鏡像備份后,服務器數據恢復工程師分析服務器raid結構。故障服務器中的硬盤每512字節多加了一個8字節的校驗,也就是說每扇區520字節。北亞數據恢復工程師編寫了一個小程序將8字節的校驗去掉,方便后續的數據恢復。
2、完成磁盤轉換后開始分析RAID的結構。由于多了3塊離線盤(故障離線后沒有拔出),需要比較每塊磁盤。因為其中會有兩塊磁盤前面的一部分相同,這兩塊前面部分相同的磁盤中有一個是舊盤,舊盤數據量沒有新盤多,可以排除舊盤。
3、由于故障服務器使用的是NTFS文件系統,使用MFT就可以找到RAID結構。搞清楚RAID結構后發現這不是一個普通的RAID5,而是一個雙循環,無法通過常規手段重組RAID。
4、通過其他方法重組RAID后發現數據不是新的。推測可能是RAID5掉線第一塊硬盤時用戶沒有及時發現,沒有及時添加新的硬盤做rebuild,服務器運行一段時間后又有一塊硬盤掉線了,造成整個RAID不可用。
5、服務器數據恢復工程師使用窮舉+校驗的方法進行分析:假設某個磁盤掉線,踢掉該磁盤后重組RAID,不用生成全部的數據,只生成前面幾個G的數據,然后通過查看這個索引表的位圖信息是否正確就可以判斷此RAID是否正確。如果索引表的位圖信息正確,生成此RAID數據即可完成RAID的重組。
6、數據恢復完成后由用戶親自核檢,數據完整可用,本次數據恢復完成。
Tips:
1、服務器發生故障后,切忌對服務器進行操作;也不要隨意取出硬盤,以免弄亂盤序。
2、如果需要取出硬盤,標記好硬盤的順序之后再取出。
3、服務器陣列癱瘓后應該立即斷電,不要做同步或強制上線操作,防止數據進一步破壞。
審核編輯 黃昊宇
-
數據恢復
+關注
關注
10文章
585瀏覽量
17564
發布評論請先 登錄
相關推薦
評論