如何介紹選擇適當(dāng)?shù)腟3類別以改進(jìn)存儲(chǔ)策略,了解成本和適合度的差異,例如哪些層提供頻繁訪問,哪些層更適合歸檔。
企業(yè)依靠云基礎(chǔ)架構(gòu)進(jìn)行數(shù)據(jù)備份,歸檔和備災(zāi)。例如,由于AWS運(yùn)營的是高度分散,靈活和安全的基礎(chǔ)架構(gòu)及存儲(chǔ)服務(wù),因此許多組織已經(jīng)開始對(duì)AWS感興趣,作為長期數(shù)據(jù)存檔的異地磁帶存儲(chǔ)的替代方案。
與許多亞馬遜服務(wù)一樣,S3對(duì)象存儲(chǔ)有多種變體,具有不同的性能特征和價(jià)格點(diǎn),包括與異地磁帶存儲(chǔ)最接近的新Glacier Deep Archive服務(wù)。
當(dāng)AWS用戶考慮這一系列存儲(chǔ)選項(xiàng)時(shí),可能很難為該作業(yè)選擇最佳工具。我們?cè)谶@篇文章中的目標(biāo)是明確各種AWS對(duì)象存儲(chǔ)服務(wù),并專注于低成本,長期存檔。我們將研究它們的功能和限制,每個(gè)適合的數(shù)據(jù)類型和應(yīng)用程序,以及使用AWS進(jìn)行長期存儲(chǔ)與傳統(tǒng)替代方案的權(quán)衡。
AWS對(duì)象存儲(chǔ)組合
AWS在其S3產(chǎn)品組合中提供了六個(gè)對(duì)象存儲(chǔ)類別。在用戶選擇之前,他們需要考慮這六個(gè)數(shù)據(jù)存儲(chǔ)維度:
在單個(gè)或多個(gè)AWS區(qū)域和可用區(qū)域(AZ)中存儲(chǔ)數(shù)據(jù)的持久性和冗余性;
可用性和正常運(yùn)行時(shí)間;
性能,由檢索數(shù)據(jù)的第一個(gè)字節(jié)的延遲定義;
持續(xù)時(shí)間或持續(xù)時(shí)間;
訪問頻率;
容量。
S3服務(wù)成本取決于在各層之間如何定義這些參數(shù)。例如,更多冗余,更低的訪問延遲或更長的正常運(yùn)行時(shí)間可以轉(zhuǎn)化為更高的價(jià)格。
以下是六個(gè)Amazon S3存儲(chǔ)類,按成本和訪問頻率的降序列出,以及它們的顯著特征:
Standard:Standard S3是一種通用對(duì)象存儲(chǔ)平臺(tái),專為必須立即持續(xù)可用的應(yīng)用程序數(shù)據(jù)而設(shè)計(jì)。
Intelligent-Tiering:許多應(yīng)用程序都有大量數(shù)據(jù)集,具有一系列訪問模式。這些模式取決于數(shù)據(jù)類型,季節(jié)性變化和內(nèi)部業(yè)務(wù)需求等因素。Intelligent-Tiering可自動(dòng)識(shí)別并將不常訪問的數(shù)據(jù)(30天內(nèi)未訪問的數(shù)據(jù))移動(dòng)到成本較低的基礎(chǔ)架構(gòu)中。當(dāng)訪問不頻繁層中的對(duì)象時(shí),它會(huì)自動(dòng)移回更高性能層,并且30天時(shí)鐘重新啟動(dòng)。
Standard Infrequent Access (IA):一些數(shù)據(jù)很少被訪問,但在用戶需要時(shí)需要快速性能。Standard-IA以此方案為目標(biāo),提供與標(biāo)準(zhǔn)S3類似的性能,但可用性較低。
One Zone-IA:與Standard-IA不同,此類別不會(huì)自動(dòng)在至少三個(gè)AZ上存儲(chǔ)數(shù)據(jù)。但是,One Zone-IA都提供與Standard S3相同的毫秒級(jí)數(shù)據(jù)延遲。
Glacier:雖然它使用對(duì)象存儲(chǔ),但Glacier與其他S3版本不同,因?yàn)樗菍閿?shù)據(jù)存檔而設(shè)計(jì)的。AWS從未透露過Glacier的基礎(chǔ)技術(shù)。無論Glacier使用低性能硬盤驅(qū)動(dòng)器,磁帶,光盤還是其他產(chǎn)品,其性能和可用性參數(shù)都與企業(yè)磁帶庫類似。但是,與磁帶庫不同,Glacier用戶可以指定數(shù)據(jù)檢索的最長時(shí)間,范圍從幾分鐘到幾小時(shí)不等。
Glacier Deep Archive:Deep Archive專為長期存檔而設(shè)計(jì),考慮到常年存儲(chǔ),并且在12小時(shí)內(nèi)不經(jīng)常訪問數(shù)據(jù)。
S3存儲(chǔ)類的性能和價(jià)格
AWS文檔中的下表總結(jié)了每個(gè)Amazon S3存儲(chǔ)類的性能,可靠性,可用性和定價(jià)。
AWS S3存儲(chǔ)類別比較
這些對(duì)象存儲(chǔ)類中的每一個(gè)都設(shè)計(jì)為持久性,值為99.99到11個(gè)9,并支持生命周期轉(zhuǎn)換。這種持久性水平尤其值得注意,因?yàn)楫?dāng)存儲(chǔ)十億個(gè)對(duì)象時(shí),它每100年轉(zhuǎn)化為一個(gè)對(duì)象的預(yù)期損失,或者1000萬個(gè)對(duì)象中每10,000年一個(gè)對(duì)象。 除了One Zone-IA之外,每個(gè)類別的設(shè)計(jì)可用性為99.99%。
使用提示
大多數(shù)AWS用戶依賴多個(gè)S3層。 希望在各種Amazon S3存儲(chǔ)類之間平衡使用的組織可以使用生命周期策略,該策略根據(jù)對(duì)象年齡,上次訪問時(shí)間,存儲(chǔ)桶,對(duì)象類型,標(biāo)記或前綴等因素自動(dòng)將數(shù)據(jù)移動(dòng)到成本較低的層。
One Zone-IA,Glacier和Glacier Deep Archive是最適合長期存檔的Amazon S3存儲(chǔ)類。由于稅法和監(jiān)管準(zhǔn)則,Glacier是最好的信息存儲(chǔ)方式,可以保留多年。Glacier Deep Archive比Standard S3便宜約95%,因此大型存儲(chǔ)庫的成本節(jié)省可能非常顯著。
S3對(duì)象存儲(chǔ)與本地存儲(chǔ)或異地磁帶存檔對(duì)比
使用Glacier而不是異地磁帶存儲(chǔ)服務(wù)的決定是多方面的。 以下是每種方法的優(yōu)點(diǎn)和挫折。
磁帶存檔
利用許多公司已經(jīng)部署的備份技術(shù)和軟件投資。
在發(fā)生災(zāi)難時(shí),不依賴網(wǎng)絡(luò)連接來恢復(fù)數(shù)據(jù)。
對(duì)于較大的檔案,可以更便宜。
需要增加管理開銷和支持合同。
AWS:Amazon Glacier 和 Glacier Deep Archive
不需要資本支出。
恢復(fù)數(shù)據(jù)的第一個(gè)字節(jié)的時(shí)間更快。
使用戶能夠權(quán)衡價(jià)格和恢復(fù)時(shí)間。
取決于私有AWS線路,直連,共址服務(wù)交叉連接,以獲得最佳性能。
對(duì)于大型檔案來說可能更昂貴,特別是對(duì)于已經(jīng)擁有當(dāng)代磁帶庫的公司而言。
需要Snowball才能查看大型存儲(chǔ)庫的初始存檔。
-
存儲(chǔ)
+關(guān)注
關(guān)注
13文章
4353瀏覽量
86068 -
AWS
+關(guān)注
關(guān)注
0文章
433瀏覽量
24453
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論