Storage Class Memory (SCM)是非易失性內(nèi)存,該類介質(zhì)的存取速度略比內(nèi)存慢,但是遠快于NAND類介質(zhì)。本文對該類介質(zhì)的特性及使用方法做了簡單總結(jié)和介紹。
目前在研的新型SCM介質(zhì)種類繁多,但是比較主流的有PCM、ReRAM、PCRAM、RRAM、MRAM和NRAM幾大類產(chǎn)品。 ?
PRAM(Phase-Change RAM)利用特殊合金材料在晶態(tài)和非晶態(tài)下的導電性差異來表示0或者1數(shù)據(jù)。其優(yōu)點是結(jié)構簡單,容易實現(xiàn)大容量、同時具備低成本等特點。
主要用于Cache加速和Cache內(nèi)存應用,考慮到PRAM的成熟度、對熱度敏感和寫穿透等因素,在應用中一般搭配DRAM或SRAM一起使用,在填補RAM和Storage之間的性能、容量差距的同時,形成具有分級能力的高速Cache應用資源池;其典型代表為Intel的3D Xpoint。
ReRAM(Resistive RAM)通過在上下電極間施加不同的電壓,控制Cell內(nèi)部導電絲的形成和熔斷的狀態(tài)對外呈現(xiàn)不同的阻抗(憶阻器)值來表示數(shù)據(jù);目前典型代表廠商為HPE和Crossbar。
HPE提出了憶阻器內(nèi)存技術,并計劃在新型計算機架構The Machine中使用,未來成為取代SRAM、DRAM形成通用內(nèi)存(Universal Memory),主流的SCM技術如下:
隨著大數(shù)據(jù)時代的到來,以及多核、分布式、內(nèi)存計算、云等技術的不斷發(fā)展,應用場景對存儲系統(tǒng)的要求越來越高,SCM技術的出現(xiàn)為存儲系統(tǒng)的發(fā)展提供了新的路徑。在未來,新型非易失存儲介質(zhì)將進一步在計算機存儲系統(tǒng)中嶄露頭角,特別是當前Intel已經(jīng)推出了它的SCM技術——3D XPoint,而針對以此為代表的SCM介質(zhì)在系統(tǒng)級的應用,仍有很多挑戰(zhàn)性的問題需要深入研究,這些研究,將可能從以下幾個方面展開,特此交流探討,以啟發(fā)我們對未來存儲系統(tǒng)以及未來上層應用的思考(本文中討論的研究方向不涉及介質(zhì)自身的研究和芯片級別的研究):
MRAM(Magnetic RAM)磁性隨機存儲器通過電流磁場改變電子自旋方向來表示不同數(shù)據(jù)狀態(tài)。比較適用于CPU的高速緩存(如L2 Cache),代表廠商為Toshiba和Everspin。
在新興的非易失性二進制存儲器中,自旋轉(zhuǎn)矩傳遞RAM (STT-MRAM)、自旋軌道轉(zhuǎn)矩RRAM (SOT MRAM)和壓控MRAM (VC MRAM)因其工作電壓低、速度快和耐用性以及先進的CMOS技術兼容性而特別具有吸引力。
臺積電研發(fā)STT-MRAM解決方案主要是用來克服嵌入式閃存技術的擴展限制。在2021年IEEE會議上,臺積電展示了嵌入16nm FinFET CMOS工藝的STT-MRAM的可靠性和抗磁性。
此外,臺積電還在積極探索SOT-MRAM和VC-MRAM,并與外部研究實驗室、財團和學術合作伙伴合作。臺積電的SOT-MRAM探索由高速(<2ns)二進制內(nèi)存解決方案驅(qū)動,該解決方案比傳統(tǒng)的6T-SRAM解決方案密度要大得多,同時也更節(jié)能。2022年6月,臺灣工研院宣布,其與臺積電合作開發(fā)的低壓電流SOT-MRAM,具有高寫入效率和低寫入電壓的特點。工研院表示,其SOT-MRAM實現(xiàn)了0.4納秒的寫入速度和7萬億次讀寫的高耐久度,還可提供超過10年的數(shù)據(jù)存儲壽命。
NRAM(Nantero’s CNT RAM)碳納米管隨機存儲器采用碳納米管作為開關,控制電路通斷表示不同的數(shù)據(jù)狀態(tài)。由于碳納米管尺寸非常小并且具備極強的韌性,因此NRAM密度可以很高、壽命也比較長,理論功耗也比較低。
RRAM:臺積電認為,AI和IoT所組成的強大組合AIoT,可能會在未來幾年推動半導體行業(yè)的增長。高能效機器學習需要具有低功耗的大容量片上存儲器。它可以同時支持 1T1R(1 個晶體管 + 1RRAM)和 1S1R(1 個選擇器 + 1RRAM)陣列架構。與傳統(tǒng)的1T1R架構相比,1S1R架構可以實現(xiàn)更高的密度并實現(xiàn)3D集成。2020年臺積電開始生產(chǎn)28nm電阻隨機存取存儲器(RRAM),這是臺積電為價格敏感的物聯(lián)網(wǎng)市場所開發(fā)的低成本解決方案。
2022年11月25日,英飛凌和臺積電宣布,兩家公司準備將臺積電的RRAM非易失性存儲器 (NVM) 技術引入英飛凌的下一代AURIX微控制器 (MCU),首批基于28納米 RRAM 技術的樣品將于2023年底提供給客戶。目前,市場上的大多數(shù) MCU系列都基于嵌入式閃存技術。RRAM的引入對MCU來說是一項新的革新,RRAM NVM可以進一步擴展到 28 納米及以上。臺積電和英飛凌成功為在汽車領域引入RRAM奠定了基礎。
臺積電還在繼續(xù)探索新的RRAM材料堆棧及其密度驅(qū)動集成,以及可變感知電路設計和編程結(jié)構,以實現(xiàn)面向AIoT應用的高密度嵌入式RRAM解決方案選項。
PCRAM:相變隨機存儲器(PCRAM)是一種基于硫化物玻璃的非易失性存儲器。通過控制焦耳加熱和淬火,PCRAM在非晶態(tài)(高電阻)和晶體態(tài)(低電阻)之間過渡的電阻。存儲器的電阻狀態(tài)在很大程度上與非晶態(tài)區(qū)域的大小及其可控性和穩(wěn)定性有關。這使得PCRAM細胞獨特地能夠存儲多個狀態(tài)(電阻),從而具有比傳統(tǒng)二進制存儲器更高的有效細胞密度的潛力。PCRAM可以支持陣列配置,包括一個晶體管和一個存儲器(1T1R)陣列和密度更大的一個選擇器和一個存儲器(1S1R)陣列。
相變存儲器具有很有前途的多級單元 (MLC) 功能,可滿足神經(jīng)形態(tài)和內(nèi)存計算應用中不斷增長的片上存儲器容量需求。臺積電一直在探索PCRAM材料、電池結(jié)構和專用電路設計,以實現(xiàn)AI和ML的近內(nèi)存和內(nèi)存計算。臺積電的一篇論文中指出,他們提出了三種新穎的 MLC PCM 技術:1)設備需求平衡,2)基于預測的MSB偏置參考,3)位優(yōu)先布局,以解決神經(jīng)網(wǎng)絡應用中的 MLC 設備挑戰(zhàn)。使用測量的 MLC 誤碼率,所提出的技術可以將 MLC PCM 保留時間提高105倍,同時將ResNet-20推理精度下降保持在3%以內(nèi),并在存在時間阻力漂移的情況下,將CIFAR-100數(shù)據(jù)集的精度下降減少 91% (10.8X)。如下圖所示。
1、基于SCM的存儲系統(tǒng)的組織結(jié)構方法研究
當前存儲系統(tǒng)的組織結(jié)構是專為易失、讀寫差異小、幾乎無壽命問題的DRAM以及傳統(tǒng)的硬盤、NAND等存儲介質(zhì)而設計的,這種系統(tǒng)組織結(jié)構對于SCM而言是不適用的,無論是當前的內(nèi)存管理方法、訪問接口設計,還是I/O請求調(diào)度等都沒有充分考慮SCM的缺點,比如典型的SCM介質(zhì)PCRAM(相變存儲器),其壽命、性能、讀寫不均衡等問題,都會導致當前技術不能夠充分發(fā)揮介質(zhì)的特性,同時還可能會將介質(zhì)的弱點放大,不利于構建面向未來大數(shù)據(jù)和內(nèi)存計算環(huán)境的高性能低功耗、大容量的存儲系統(tǒng)。
如上所述,從SCM、DRAM、NAND Falsh等多種介質(zhì)的優(yōu)缺點出發(fā),研究SCM在異構混合存儲系統(tǒng)中的組織方法,合理組合多種存儲介質(zhì),構建多介質(zhì)的異構混合存儲環(huán)境,建立可以充分發(fā)揮各存儲介質(zhì)特性的體系結(jié)構,解決多介質(zhì)異構混合存儲時的系統(tǒng)優(yōu)化設計問題,實現(xiàn)新型非易失存儲器與現(xiàn)有存儲技術和系統(tǒng)的完美融合。
2、基于SCM的存儲系統(tǒng)的訪問方法研究
傳統(tǒng)存儲系統(tǒng)中的訪問方法是立足于DRAM、NAND Falsh等設計的,它將不再適用于具有可字節(jié)編址和位修改等特性的SCM和DRAM,部分SCM介質(zhì)的讀寫不對稱使其難以按流水線方式執(zhí)行讀寫混合I/O請求,且當前SCM與現(xiàn)有內(nèi)存系統(tǒng)在訪問特性上有顯著差異,與此同時SCM支持本地修改等異于NAND Falsh的特性也使得當前外存領域的訪問方式需要優(yōu)化和改進。
研究基于SCM存儲系統(tǒng)的多接口適配的訪問方法,以匹配新型非易失存儲器的特性,從而隱藏多介質(zhì)在訪問粒度、延遲、帶寬及壽命等方面的差距,提升存儲系統(tǒng)的性能。未來研究將可能包括:
①研究SCM在內(nèi)存環(huán)境中字節(jié)粒度尋址的讀寫訪問方法,充分挖掘SCM通道間、芯之間以及芯片內(nèi)部的多層次訪問并行性;
②研究在外存環(huán)境中塊粒度尋址的高效讀寫訪問方法,并遵循業(yè)界針對非易失存儲器的接口標準(如NVMe協(xié)議);
③優(yōu)化訪問路徑,減少系統(tǒng)I/O調(diào)用給性能帶來的影響;
④利用SCM的讀寫特點來優(yōu)化讀寫操作和流程,以此減少訪問延遲;
⑤立足SCM特性優(yōu)化系統(tǒng)中的數(shù)據(jù)結(jié)構,減少對SCM無用的寫操作和寫入數(shù)據(jù)量,以提升系統(tǒng)性能和壽命。
3、基于SCM的存儲系統(tǒng)數(shù)據(jù)可靠性研究
隨著工藝制程的降低,非易失存儲器的存儲單元不斷變小,當SCM采用更小制程、提供更高存儲密度和更大容量時,其存儲單元的錯誤率隨之升高.同時,SCM存儲單元的可擦寫次數(shù)有限(108~1012),頻繁的擦寫會導致芯片單元很快到達壽命極限.這些將使存儲系統(tǒng)面臨數(shù)據(jù)發(fā)生錯誤、損壞以及丟失的風險,對數(shù)據(jù)可靠性造成了極大的威脅。
未來的研究將立足于SCM的特性,通過多種途徑來保障數(shù)據(jù)的可靠性,研究將可能在以下幾個方面展開:
①研究降低當前已有的糾錯機制(軟硬件)所需的開銷;
②研究可配置、適應數(shù)據(jù)集屬性的組合校驗算法,即區(qū)別不同屬性的數(shù)據(jù)集,根據(jù)其所需的可靠性需求采用不同糾錯能力和開銷的校驗算法,以平衡其糾錯強度和校驗開銷;
③研究新的通過減少寫操作次數(shù)、寫入數(shù)據(jù)量來提升SCM的壽命的策略;
④研究新穎、可用范圍廣的磨損均衡策略,在現(xiàn)有磨損均衡基礎上進行創(chuàng)新、優(yōu)化,設計出可應用于不同需求環(huán)境下的磨損均衡策略,提升SCM壽命;
⑤研究基于SCM的壞塊復用和數(shù)據(jù)容錯機制,進一步增加SCM的使用壽命,提高數(shù)據(jù)可靠性;
⑥研究數(shù)據(jù)一致性的保障和維護,根據(jù)存儲系統(tǒng)數(shù)據(jù)一致性需求、訪問接口粒度等因素,設計低開銷、多路徑的數(shù)據(jù)更新策略和數(shù)據(jù)一致性維護方法。
4、基于SCM的存儲系統(tǒng)數(shù)據(jù)安全性保障研究
由于SCM具有非易失性,即當系統(tǒng)斷電時,SCM存儲的數(shù)據(jù)并不會消失,從而通過惡意修改數(shù)據(jù)所導致的執(zhí)行狀態(tài)可能是持久的,即使設備斷電,系統(tǒng)也會存在冷啟動攻擊的風險.因此非易失特性會使系統(tǒng)被入侵和數(shù)據(jù)被盜竊的風險增大.所以當采用SCM構建內(nèi)存子系統(tǒng)時,需要考慮數(shù)據(jù)的安全性保障機制。
對此,未來該領域還需要研究針對操作系統(tǒng)的加密機制,通過加密模塊對寫入SCM的數(shù)據(jù)進行加密,防止存儲數(shù)據(jù)被竊取或泄密的情況發(fā)生;研究利用訪問權限控制等策略來保證數(shù)據(jù)的訪問安全性;特別針對PCM中的系統(tǒng)關鍵數(shù)據(jù),需采用強度更高的加密、上鎖等算法,防止惡意的入侵修改所引起的系統(tǒng)安全問題,保障基于SCM的存儲系統(tǒng)的數(shù)據(jù)安全性。
5、基于SCM的存儲系統(tǒng)軟件優(yōu)化研究
由于SCM異于傳統(tǒng)存儲介質(zhì)的特性,使得SCM存儲技術不能良好地兼容當前存儲系統(tǒng)的內(nèi)存管理、文件系統(tǒng)等軟件架構。基于SCM的存儲系統(tǒng),在軟件層仍然需要改進,以進一步優(yōu)化和提升存儲系統(tǒng)的性能。
未來基于SCM的存儲系統(tǒng)軟件優(yōu)化研究將可能包括:
①結(jié)合各存儲介質(zhì)的特性,基于SCM存儲管理架構,研究冷熱數(shù)據(jù)識別算法和數(shù)據(jù)熱度分級管理等軟件策略,降低存儲系統(tǒng)中的讀寫操作開銷,實現(xiàn)負載均衡;
②立足于SCM在存儲系統(tǒng)中的應用場景(如統(tǒng)一內(nèi)外存),針對SCM支持本地修改、位修改和可字節(jié)編址等特性,研究適應于SCM的文件系統(tǒng),從而提升文件系統(tǒng)乃至存儲系統(tǒng)的性能;
③研究基于SCM的內(nèi)存分配機制及其優(yōu)化策略,從操作系統(tǒng)層入手面向文件系統(tǒng)、虛擬內(nèi)存等進行優(yōu)化,降低頁面分配等多種內(nèi)存管理開銷,充分地利用SCM的非易失性提高系統(tǒng)性能;
④研究設計新的軟件調(diào)度算法,通過調(diào)度策略的設計和優(yōu)化,達到系統(tǒng)性能的提升。
6、基于SCM的存儲硬件原型系統(tǒng)的研究
由于真正的SCM芯片還沒實現(xiàn)市場的量產(chǎn),目前也就只有Intel的ColdStream問世,因此現(xiàn)有的研究還面臨著幾乎沒有可用的基于SCM的真實硬件原型平臺的尷尬局面,絕大多數(shù)研究均是在軟件模擬器上進行的,當前比較成熟的模擬器有PCRAMsim、Simics、M5和DRAMsim以及近些年備受學者青睞的全系統(tǒng)模擬器GEM5。
由于SCM技術研究還處于起步階段,其應用場景和價值尚未完全開發(fā)實現(xiàn);而且目前市面上的主流存儲器仍然不是SCM,適合于當前存儲環(huán)境的大容量、高性能的SCM物理芯片稀貴,這些都導致當前系統(tǒng)級的研究幾乎全都是基于軟件模擬器進行的,從而無法獲取最真實的實驗數(shù)據(jù)以進行更加專業(yè)、深入的研究。
利用SCM物理芯片,實現(xiàn)真實的存儲硬件原型系統(tǒng),包括基于SCM的內(nèi)存原型系統(tǒng)和外存原型系統(tǒng),甚至于搭建基于SCM的專用硬件系統(tǒng),比如基于SCM的DIMM條,基于SCM的全新硬件框架,基于SCM的高速通信通道等等,以解決目前相關研究沒有原型平臺的尷尬局面,通過在平臺上獲得最真實的數(shù)據(jù),展開更有說服力、有數(shù)據(jù)依據(jù)的相關研究,將對當前內(nèi)/外存儲系統(tǒng)架構的研究工作起到積極作用。
7、基于SCM的事務性存儲系統(tǒng)研究
事物存儲技術作為存儲領域最為關鍵的技術之一,幾乎被應用于所有數(shù)據(jù)庫系統(tǒng)與文件系統(tǒng)。隨著閃存等介質(zhì)的廣泛應用,存儲體系結(jié)構正面臨著較大的變革,在這種背景下;因此在SCM技術的到來的背景下,研究基于SCM的事務性存儲系統(tǒng)比較迫切。
針對目前SCM介質(zhì)應用于事務處理技術,如下幾個問題還需要進一步探索和研究:
①事務存儲接口:如何提高實用性且支持不同特性事務的設備接口;
②數(shù)據(jù)可用性:如何高效迅速的進行故障恢復;
③系統(tǒng)可擴展性:分布式環(huán)境下,如何利用SCM提供高效的事務處理,多核環(huán)境下的分布式系統(tǒng)中如何提供更加優(yōu)秀的日志等技術能力;
④數(shù)據(jù)可靠性:如何保證新介質(zhì)中數(shù)據(jù)的可靠性持久化能力等等。
8、基于SCM的上層應用研究
在上述研究內(nèi)容的背景下,顯而易見可以看出SCM的多種優(yōu)勢都將會給未來的存儲系統(tǒng)以及計算機其他技術領域帶來變革,那么,面向SCM技術的內(nèi)存數(shù)據(jù)庫、面向SCM技術的實時分析應用、面向SCM技術的內(nèi)存計算技術、面向SCM的大數(shù)據(jù)服務等等,都將可能會因為SCM的到來,有了新的機會和變革窗口。
這些領域的研究,最直接的,比如考慮將當前的存儲介質(zhì)全部換成SCM后,在性能得到收益的同時,應該如何應對新的問題,將是未來的研究重點。
編輯:黃飛
?
評論
查看更多