服務(wù)器數(shù)據(jù)恢復(fù)環(huán)境:
一臺(tái)infortrend存儲(chǔ),有一組由12塊硬盤組建的RAID6,RAID6的所有空間劃分給一個(gè)LUN并映射到WINDOWS系統(tǒng)上,WINDOWS系統(tǒng)上劃分了一個(gè)GPT分區(qū)。
服務(wù)器故障&分析:
存儲(chǔ)無法訪問,經(jīng)過檢查發(fā)現(xiàn)存儲(chǔ)中有3個(gè)磁盤離線。工作人員通過一系列操作讓存儲(chǔ)掉線磁盤上線并開始rebuild,但是這個(gè)時(shí)候發(fā)現(xiàn)分區(qū)打不開,所有數(shù)據(jù)無法訪問。為避免情況進(jìn)一步惡化,工作人員中止了rebuild并關(guān)機(jī)。
經(jīng)過當(dāng)?shù)氐臄?shù)據(jù)恢復(fù)機(jī)構(gòu)進(jìn)行恢復(fù)后,還是有大量數(shù)據(jù)丟失和無法打開。
RAID6可以支持兩塊硬盤同時(shí)掉線,但如果有第三塊磁盤離線,RAID6便無法正常工作了。最常見的一種情況是RAID6離線硬盤不是同時(shí)離線,而是每間隔一段時(shí)間就有一塊磁盤離線。在這種情況下,如果將早掉線的盤上線,便會(huì)與還在線的盤進(jìn)行RAID6算法同步,導(dǎo)致數(shù)據(jù)出現(xiàn)問題,無法正常讀取數(shù)據(jù)。
本案例應(yīng)該就是屬于這種情況。因?yàn)閞ebuild時(shí)間較短,本案例存儲(chǔ)中的文件數(shù)量非常多,文件系統(tǒng)前部分存放老舊數(shù)據(jù)的可能性比較大大,一些較新的文件的目錄及節(jié)點(diǎn)索引很大可能性存放于文件系統(tǒng)后部分,所以推測(cè)同步操作對(duì)存儲(chǔ)中的數(shù)據(jù)影響不大,破壞程度有限。
服務(wù)器數(shù)據(jù)恢復(fù)過程:
1、將故障存儲(chǔ)中所有磁盤編號(hào)后取出(應(yīng)在關(guān)機(jī)狀態(tài)下插拔硬盤,對(duì)硬盤原位置進(jìn)行標(biāo)注。在硬盤離開存儲(chǔ)后,不要再對(duì)存儲(chǔ)加電。確保所有操作盡可能可回溯。),以只讀方式做扇區(qū)級(jí)別的鏡像備份。對(duì)于部分存在物理故障的硬盤,交由硬件工程師處理后利用專業(yè)工具進(jìn)行鏡像。備份完成后將所有硬盤按照編號(hào)還原到原存儲(chǔ)中,后續(xù)的數(shù)據(jù)分析和數(shù)據(jù)恢復(fù)操作都基于鏡像文件進(jìn)行,避免對(duì)原始磁盤數(shù)據(jù)造成二次破壞。
2、基于鏡像文件分析該infortrend存儲(chǔ)所使用的的RAID6算法,按算法對(duì)12塊硬盤做C(12,2)共66種可能的缺2盤的情況組合,找出可能性最大的缺盤組合。
3、通過北亞R企安自研的RAID數(shù)據(jù)恢復(fù)程序重構(gòu)虛擬RAID,按分析出的缺盤狀態(tài)、盤序、塊大小、校驗(yàn)方向、RAID6算法構(gòu)建進(jìn)行附加。
4、對(duì)虛擬RAID進(jìn)行GPT分區(qū)結(jié)構(gòu)解釋,然后對(duì)文件系統(tǒng)進(jìn)行解釋,確定算法是否正確。如不正確,調(diào)整算法,直到得到最佳結(jié)構(gòu)。
5、按文件或扇區(qū)方式遷移數(shù)據(jù)到準(zhǔn)備好的存儲(chǔ)中,由用戶方對(duì)恢復(fù)出來的數(shù)據(jù)進(jìn)行檢測(cè)。經(jīng)過反復(fù)檢測(cè),用戶方工程師確認(rèn)恢復(fù)出來的數(shù)據(jù)完整有效。本次服務(wù)器數(shù)據(jù)恢復(fù)工作完成。
審核編輯 黃宇
-
服務(wù)器
+關(guān)注
關(guān)注
12文章
9272瀏覽量
85809 -
WINDOWS
+關(guān)注
關(guān)注
4文章
3556瀏覽量
89061 -
數(shù)據(jù)恢復(fù)
+關(guān)注
關(guān)注
10文章
585瀏覽量
17564
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論