01什么是框級冗余策略
普通RAID模式(盤級冗余)是把CHUNK打散到不同的硬盤上,支持不超過RAID冗余能力的硬盤故障,不能直接支持硬盤框故障。
金融核心交易系統(tǒng)等核心業(yè)務(wù)場景對存儲系統(tǒng)的可靠性提出了更為苛刻的訴求,要求存儲設(shè)備能容忍單個硬盤框故障。
基于此,存儲系統(tǒng)的框級冗余策略應(yīng)運而生。當存儲池具備框級冗余能力時,可以實現(xiàn):
RAID 6和RAID 10支持單硬盤框故障,業(yè)務(wù)不中斷、數(shù)據(jù)不丟失。
RAID-TP支持單硬盤框故障后,其他硬盤框再故障單塊硬盤,業(yè)務(wù)不中斷、數(shù)據(jù)不丟失。
故障的單盤在熱備重構(gòu)完成后,支持再故障單個硬盤框。
故障硬盤框恢復(fù)后,自動恢復(fù)框級冗余的能力。
02框級冗余策略的實現(xiàn)原理
框級冗余是在滿足盤級冗余的前提下,考慮硬盤和框的歸屬關(guān)系。這里,我們以系統(tǒng)配有4個框,每個框配置3塊硬盤為例進行介紹。
框級冗余策略的實現(xiàn)原理如圖1所示。圖中,相同顏色的CK組成一個CKG。
為了支持單硬盤框故障不斷業(yè)務(wù),在選盤組RAID時,需要保證每個CKG的CK盡量來自于不同的框,并且來自每個框的CK列數(shù)不能超過RAID冗余。因此,配置RAID6時每框最多選2列,這樣即使框故障后,每個CKG只丟失2份數(shù)據(jù),未超出CKG的冗余數(shù)量,業(yè)務(wù)不中斷。同時,為了使RAID-TP能支持單框故障后再故障單塊硬盤,我們讓RAID-TP每框最多也只能選2列。
即存儲系統(tǒng)在組CKG時會優(yōu)先跨框分配Block,保證CKG在每框選盤不超過2盤。
為了支持故障的單盤在重構(gòu)完成后不縮列,還能繼續(xù)支持單框故障,我們讓CKG的分條長度再減一,即RAID列數(shù)(N+M) = 2*K - 1。其中,K為組成存儲池的硬盤所屬的框(控制框+硬盤框)的個數(shù)。例如,上圖中的RAID列數(shù) = 2*4 - 1 = 7,即每個CKG的分條長度為7。
03存儲池的冗余能力
存儲池為框級冗余策略時,存儲池的冗余能力狀態(tài)可以是框級冗余、盤級冗余和無冗余。
框級冗余能力
框級冗余策略的存儲池在正常運行時,具備框級冗余能力,支持單硬盤框故障,業(yè)務(wù)不中斷、數(shù)據(jù)不丟失。
盤級冗余能力
由于框掉電、多盤故障等導致存儲池不能繼續(xù)保持框級冗余能力時,存儲池將變?yōu)楸P級冗余能力,此時支持不超過RAID冗余能力的盤故障。
當故障恢復(fù)且存儲系統(tǒng)完成冗余恢復(fù)后臺任務(wù)后,存儲池將恢復(fù)具備框級冗余能力,重新支持單硬盤框故障,業(yè)務(wù)不中斷、數(shù)據(jù)不丟失。
無冗余能力
處于盤級冗余能力的存儲池,若盤故障再超過RAID冗余能力,存儲池將變?yōu)闊o冗余能力。
原文標題:閃存存儲如何通過框級冗余策略提升設(shè)備可靠性
文章出處:【微信公眾號:華為產(chǎn)品資料】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
審核編輯:湯梓紅
-
硬盤
+關(guān)注
關(guān)注
3文章
1313瀏覽量
57366 -
存儲
+關(guān)注
關(guān)注
13文章
4325瀏覽量
85939 -
冗余
+關(guān)注
關(guān)注
1文章
111瀏覽量
20243 -
RAID
+關(guān)注
關(guān)注
0文章
278瀏覽量
35113
原文標題:閃存存儲如何通過框級冗余策略提升設(shè)備可靠性
文章出處:【微信號:huaweidoc,微信公眾號:華為產(chǎn)品資料】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論