服務器數據恢復環境:
一臺服務器中有一組由數塊SAS硬盤組建的RAID5陣列,陣列中有1塊熱備盤,上層部署OA以及Oracle數據庫。
服務器故障:
該磁盤陣列中有2塊硬盤出現故障先后離線,RAID5陣列癱瘓,上層LUN無法正常使用。經過檢測發現硬盤無物理故障,無壞道。
服務器數據恢復過程:
1、將故障服務器中所有磁盤編號后取出,以只讀方式做全盤鏡像,備份完成后將磁盤按照編號還原到原服務器中。后續的數據分析和數據恢復操作都基于鏡像文件進行,避免對原始磁盤數據造成二次破壞。
北亞企安數據恢復——vxfs數據恢復
2、基于鏡像文件分析底層數據獲取RAID條帶大小、磁盤順序及數據走向等RAID相關信息,根據獲取到RAID信息重組RAID5。
3、分析LUN在RAID中的分配情況和LUN分配的數據塊MAP。提取每一個LUN的數據塊分布MAP,北亞企安數據恢復工程師編寫程序解析所有LUN的數據MAP,根據數據MAP導出所有LUN的數據。
北亞企安數據恢復——vxfs數據恢復
4、對導出的LUN的數據進行分析,發現所有LUN中均包含HP-Unix的LVM信息。通過解析每個LUN中的LVM信息,發現共有三套LVM:一個LVM劃分了一個LV來存放OA服務器端的數據;第二個LVM中也劃分了一個LV來存放臨時備份數據;剩下的4個LUN組建了一個LVM,劃分了一個LV來存放Oracle數據庫文件。5、北亞企安數據恢復工程師編寫程序解釋每套LVM中的LV卷,但在解釋的過程中程序報錯。經過分析發現報錯原因是raid5癱瘓導致LVM信息損壞。人工修復損壞區域后,同步修改解釋程序后成功解釋LVM邏輯卷。
6、搭建HP-Unix環境,將解釋出來的LV卷映射到HP-Unix并嘗試掛載文件系統。但是掛載文件系統時出錯,嘗試使用“fsck –F vxfs” 命令修復vxfs文件系統,但修復完成后還是無法掛載。
7、分析解釋出來的LV,根據VXFS文件系統的底層結構校驗此文件系統的完整性。經過分析發現VXFS文件系統果然有問題,出現問題的原因是:當raid5癱瘓時VXFS文件系統正在執行IO操作,導致部分文件系統元文件沒有更新以及損壞。手工修復這些損壞的元文件直至能夠正常解析VXFS文件系統。
8、將修復好的LV卷掛載到HP-Unix小機上,嘗試Mount文件系統,這次沒有報錯,成功掛載。
9、在HP-Unix小機上成功mount文件系統后,將所有用戶數據均備份至指定的磁盤空間。部分文件目錄截圖如下:
北亞企安數據恢復——vxfs數據恢復
10、使用Oracle數據庫文件檢測工具檢測數據庫文件的完整性,檢測無誤后使用北亞企安自主研發的Oracle數據庫檢測工具進行檢測,經過檢測發現部分數據庫文件和日志文件校驗不一致。數據庫工程師對這部分文件進行修復后并再次校驗,直至所有數據庫文件均通過校驗。
11、將恢復出來的Oracle數據庫附加到原始生產環境中,嘗試啟動Oracle數據庫,啟動成功。
北亞企安數據恢復——vxfs數據恢復
數據驗證:
在用戶方的配合下啟動Oracle數據庫和OA服務端。在本地電腦上安裝OA客戶端,通過OA客戶端驗證新舊數據記錄,安排不同部門人員進行遠程驗證。經過反復驗證確認數據完整無誤。本次數據恢復工作完成。
-
數據恢復
+關注
關注
10文章
585瀏覽量
17577 -
RAID5
+關注
關注
0文章
122瀏覽量
12750 -
文件系統
+關注
關注
0文章
287瀏覽量
19937
發布評論請先 登錄
相關推薦
評論