大數據時代對存儲和處理提出了越來越高的要求。相應地,需要更快的數據傳輸速度。
根據數據表的聲明選擇系統時,陷阱等待著
大數據時代對存儲和處理提出了越來越高的要求。相應地,需要更快的數據傳輸速度。
當客戶選擇固態硬盤 (SSD) 時,他們通常會參考數據表的性能數據。但是,數據表中的數字并不能準確代表典型的 SSD 性能。通常認為,從處理器和存儲設備獲得的實際性能與數據表和基準測試中聲稱的性能有很大不同。因此,根據夸大的數字選擇設備可能會導致系統不符合其要求。
使用CrystalDiskMark來衡量實際性能
數據表中的開箱即用聲明與現實世界的穩態基準測試之間的差異有多大?
為了測量開箱即用和穩態性能之間的差異,我們使用 CrystalDiskMark 基準測試工具,然后運行一系列隨機寫入 72 小時,然后再次測量 CrystalDiskMark 性能。
我們仔細測量了閃存控制器的實際性能,并與競爭對手的性能進行了對比。
實際性能與數據表聲明
實際性能和數據表性能之間的差異令人震驚。
在我們基準測試的某些設備中,穩態速度可能只有開箱即用性能的 1%。更令人驚訝的是性能下降的速度有多快。在幾乎所有測試的驅動器中,使用約1.5分鐘后性能急劇下降。
我們的發現表明,在閃存的情況下,除了不切實際的峰值數字和應用程序性能之間的通常差異之外,即使是原始性能數字在實踐中也可能經不起審查。
數據表聲明和實際基準之間有什么區別?
為了提高閃存的存儲密度,制造商現在每個存儲單元存儲多個位。三級單元 (TLC) 存儲器存儲三位,而較新的四級單元 (QLC) 存儲器每個單元存儲四位。
但是,高密度存儲是有代價的。
當閃存充滿數據時,閃存控制器必須執行各種后臺任務。例如,垃圾回收、磨損均衡、動態數據刷新和校準在后臺進行。控制器可以通過確定 I/O 操作的優先級和調度,在短時間內“隱藏”這些影響。但是,對于較長的傳輸,這些任務不可避免地會對性能產生一些影響。從長遠來看,磨損均衡和垃圾收集等后臺任務變得更加耗時。
數據涌入閃存也會對順序和隨機訪問造成影響。用于表征 SSD 的兩個主要測量方法是順序訪問,其中大量連續數據傳輸到存儲設備或從存儲設備傳輸大量連續數據,以及隨機訪問,其中少量數據被讀取或寫入非連續地址。順序訪問通常以兆字節/秒 (MB/s) 為單位,而隨機訪問通常以每秒輸入/輸出操作數 (IOPS) 為單位。
隨著緩存被數據填滿,閃存上的可用空間會減少。因此,緩存在長時間的順序或隨機訪問后開始失去其有效性。隨著時間的推移,緩存可能會變得越來越低效,因為某些區域可能會由于不可恢復的錯誤而被標記為不可用。
因此,隨著閃存老化,高密度閃存中的原始錯誤率會變高,內存壽命也會縮短。軟錯誤解碼技術用于最大限度地減少隨著內存老化而增加的錯誤率。它們多次讀取數據,需要復雜的處理才能計算出正確的數據,這兩者都會降低整體性能。
隨著時間的推移,器件也會對在與寫入數據的溫度不同的溫度下讀取數據而引起的交叉溫度效應變得更加敏感。SSD在使用過程中會變得更熱,因此為了防止過熱,采用了“熱節流”。熱節流可降低功耗并降低設備溫度。但是,熱限制也會限制設備性能。熱限制的影響取決于環境溫度、環境的熱設計和設備工作負載。影響熱限制的變量數量使得很難預測實際的性能水平。
總之,由于許多因素,SSD 的性能級別在其生命周期內會發生變化,將其初始的開箱即用級別降至穩定狀態級別。
主要要點
在評估性能會影響整體系統性能的設備時,使用真實數據至關重要。任何基于夸大數字的選擇都有可能導致系統無法按預期執行。
實現的實際性能將取決于數據使用模式、環境和閃存控制器的有效性。了解可能影響性能的因素至關重要,但更重要的是使用真實數據而不是不切實際的性能聲明。
因此,在選擇數據存儲設備時,請記住,設備數據表通常會顯示峰值數字,這些峰值數字只能通過新設備在特定條件下實現,并且只能在短時間內實現。
審核編輯:郭婷
-
SSD
+關注
關注
21文章
2870瀏覽量
117583 -
固態硬盤
+關注
關注
12文章
1468瀏覽量
57458
發布評論請先 登錄
相關推薦
評論