挑戰傳統,打破限制,勇攀高峰,打破常規者們在尋求開創性解決方案的過程中重塑規則。繼SK海力士品牌短片《誰是打破常規者》播出后,將推出一系列文章,展示公司在重塑技術、重新定義行業標準方面采取的各種“打破常規”的創新舉措。本系列第七篇文章將深入探討SK海力士在CXL技術領域的研發進展。
當今世界離不開數據的運轉——網絡中不斷涌動的1和0的數據浪潮,為從流媒體服務到人工智能等各類應用提供了源源不斷的動力。為了應對這場數據洪流,數據中心必須采用更先進的存儲解決方案,以滿足日益增長的性能需求。
然而,傳統的存儲器擴展方法面臨諸多局限。處理器和存儲技術的限制,加之數據中心成本和能耗的不斷攀升,愈發凸顯了對革命性方法的迫切需求。因此,CXL(Compute Express Link)應運而生,這是一項具有變革意義的存儲器互聯技術,旨在解決人工智能時代所帶來的挑戰。
本篇Rulebreakers’ Revolutions系列文章將介紹SK海力士在CXL解決方案領域的研發歷程,詳細講述公司如何克服行業規格缺失等挑戰,并為CXL生態系統做出重要貢獻,最終確立其在CXL領域的領先地位。
使命:利用新型互聯技術擴展存儲容量
在人工智能時代,數據中心亟需不斷擴展其存儲容量,以應對日益增長的數據量。然而,采用傳統方法擴展存儲容量的成本過高且效率低下。例如,在單個CPU系統中添加太字節(TB)級存儲容量,將顯著增加總體擁有成本(TCO)1和功耗。試圖通過增加存儲通道或集成更大容量的存儲器來解決這一問題,往往會導致能耗和熱量的大幅上升,從而增加冷卻系統和管理成本。這些現象凸顯了設計創新型存儲系統的必要性,這些系統能夠以更快、更高效和更具成本效益的方式處理數據。
1總體擁有成本(TCO, Total Cost of Ownership):購置、安裝和維護產品的過程中產生的所有成本,其中包括了采買、能耗及維護費用。
數據中心亟需增加存儲容量,
以滿足人工智能時代日益增長的需求
過去十年間,為了滿足市場需求,業界持續致力于開發新的存儲器互聯技術。這一技術是指處理器和存儲器之間交換數據的方法,在數據處理速度和效率方面起到至關重要的決定性作用。在傳統的存儲架構中,存儲器與附近的單個處理器通過物理方式連接,當應用程序未充分使用存儲器時,往往會導致存儲資源供應過剩。而如CXL等的新興存儲器互聯技術,則可以通過允許多個處理器共享存儲容量來提高效率,從而解決這一問題。
這引發了業界對CXL的極大關注,然而,由于此項技術沒有先例可循,且初期缺乏行業制定的規格,所以其開發過程面臨諸多挑戰。JEDEC固態技術協會(JEDEC Solid State Technology Association)2所制定的規格通常是為DRAM產品而設,在缺失此類行業規格的情況下,CXL的開發過程從根本上而言,比一般情況更為復雜。
2JEDEC固態技術協會(JEDEC Solid State Technology Association):一個擁有超過350家成員公司,負責制定全球微電子行業公開標準的領導機構。
在缺乏行業規格指導的情況下,SK海力士面臨著開發全新CXL產品以突破存儲器擴展壁壘的挑戰。為了應對這一挑戰,公司充分發揮其深厚的內部專業知識,并積極與行業合作伙伴攜手并進。
探索未知:從零開始開發開創性CXL技術
自2019年CXL問世以來,SK海力士迅速意識到該技術能夠滿足日益增長的存儲容量擴展需求。作為一種開放性的行業互聯技術,CXL統一了存儲器、存儲裝置和處理器等不同系統設備的接口,支持存儲容量共享等功能,使多個處理器能夠訪問同一存儲器,從而提升數據共享效率。同時,它還支持存儲池化(Memory Pooling),將來自共同存儲池的存儲器分配給不同處理器,以提高效率。此外,CXL還實現了存儲器切換功能,允許數百個設備(如處理器)在獨立處理數據的同時共享存儲資源。
除了這些創新功能外,SK海力士在觀察到市場和客戶對CXL技術認可度不斷增加,并意識到其在解決技術和成本挑戰方面的潛力后,對該技術的前景愈加堅定。然而,公司必須克服一個重大阻礙才能啟動項目,即首先解決行業規格缺失的問題。因此,在參與CXL標準化工作并與客戶合作確定規格后,SK海力士迅速著手制定了內部基本需求文件。公司還與CXL控制器制造商合作,為規格文件制定了控制器要求。此外,SK海力士還與JEDEC固態技術協會和CXL聯盟(CXL Consortium)3合作,積極推動業內CXL標準中DRAM相關規范的完善。
3CXL聯盟(CXL Consortium):一個致力于制定CXL技術規格的開放性行業標準組織。
通過擴展系統存儲容量和帶寬,SK海力士的CXL技術客服了存儲器擴展難題
在協助制定行業標準和開發相關規格后,SK海力士加快了CXL技術的研發。在此過程中,SK海力士確定了滿足客戶需求的關鍵標準,即成本效益、高容量、優化帶寬和可靠性。
首先,成本效益在CXL研發過程中至關重要。抵消CXL控制器高昂成本的關鍵在于將模塊等存儲介質的費用降至最低。鑒于高容量對促進大規模數據處理非常重要,公司認為CXL存儲器的存儲容量應達到現有DDR產品的2到4倍。此外,必須優化帶寬設計,以充分發揮CXL模塊的性能潛力。最后,可靠性和數據完整性須與主機存儲器的高標準相匹配,從而贏得客戶的信任。
為了滿足這些標準,SK海力士的多個部門正在協同努力,致力于將TB級存儲器打造成更加經濟高效的解決方案。一方面,公司開創性地研發了存儲池化技術,以實現多個設備之間的資源共享。另一方面,還成功開發了近內存處理(NMP, Near-Memory Processing)4技術,從而在數據源附近進行數據處理。這些創新技術有望為高性能計算(HPC)、存儲器內數據庫和人工智能等領域帶來顯著優勢。
4近內存處理(NMP, Near-memory processing):一種在數據存儲附近執行計算的技術,能夠降低延遲并提升人工智能和高性能計算(HPC)等高帶寬任務的性能。
通過這些不懈的努力,SK海力士已成功推進了開創性CXL產品的研發,這些產品將徹底顛覆存儲器市場。
SK海力士不斷壯大的產品陣容推動CXL的未來發展
自2022年開發出首款基于DDR5的CXL樣品以來,SK海力士不斷加強其CXL產品陣容,其中包括創新型CMM-DDR5(CXL Memory Module-Double Data Rate 5)。采用第五代高速PCIe連接,CMM-DDR5可確保流暢、快速的數據處理。同時,CMM-DDR5提供高達128GB的容量,可滿足當今人工智能和高性能計算應用對高容量的需求。此外,該模塊還具有高水平的電源效率和安全性。
真實性能測試突顯了CMM-DDR5所帶來的變革性影響。與僅搭載DDR5 DRAM的系統相比,該產品可將系統帶寬提升82%,容量提升100%。測試結果進一步表明,在人工智能運行時,每秒令牌性能(Token Per Second Performance)提升高達31%。而在高性能計算領域,其吞吐量效率更是躍升33%。CMM-DDR5不僅展現出卓越的性能表現,同時符合JEDEC固態技術協會和CXL聯盟的標準。目前,隨著CMM-DDR5產品逐步邁向量產階段,客戶正在積極開展對其進行驗證和認證的工作。
SK海力士基于CXL的CMM-DDR5,可有效提升人工智能和高性能計算的性能
SK海力士的其他CXL解決方案還包括Niagara 2.0,這是一款集成硬件和軟件的綜合性解決方案,允許多臺主機高效共享大型存儲池,從而最大限度地減少未利用或未被充分利用的存儲容量。此外,CMM-Ax(CXL Memory Module-Ax)則是一種針對計算工作負載而優化設計的高性能內存模塊,在提高人工智能和數據中心效率方面表現突出。
除了在硬件領域的顯著進步,SK海力士還開發了異構存儲器軟件開發套件(HMSDK,Heterogeneous Memory Software Development Kit),以最大限度地發揮其CXL存儲器的潛力。該軟件工具包已成功集成到Linux操作系統中,進一步提高了其可訪問性和實用性。硬件和軟件解決方案的協同開發及其標準化工作,彰顯了SK海力士對致力于創建一個蓬勃發展的CXL生態系統的不懈追求。
打破常規者專訪:下一代存儲器與存儲裝置部,崔源夏(Thomas)
本文采訪了下一代存儲器與存儲裝置部門的杰出工程師(DE,Distinguished Engineer)5崔源夏(Thomas),深入探討了公司在CXL技術開發方面取得的突破性思維。崔源夏負責JEDEC固態技術協會和CXL聯盟的標準化工作,并為CXL等下一代存儲器開辟道路,采訪中他詳細闡述了CXL的發展歷程以及其未來可能帶來的影響。
5杰出工程師(DE, Distinguished Engineer):是SK海力士的資深工程師,在各自領域出類拔萃,負責解決技術難題并指導下一代人才。
Q在研發行業領先的CXL技術時,您和您的團隊如何展現出打破常規的思維?
A“在CXL研發過程中,我們秉持SK海力士VWBE6理念的工作原則,并借鑒DRAM和NAND閃存產品的豐富研發經驗,主動向客戶提出工作方法和初步的CXL需求設想。提前明確需求為我們深入探索CXL技術創造了更多機會,最終成功研發出首款CXL存儲器產品。”
6自覺自愿地發揮才智(VWBE, Voluntarily and Willing Brain Engagement):是SK管理體系(SKMS)中強調的員工價值觀之一。
“對我而言,我構想了一種將標準化和驗證方法相結合,以融合DRAM和NAND閃存的創新方法論,并在CXL聯盟中獨立提出并完善了與DRAM相關的功能。通過這些努力,我深感自豪能夠為公司最初的CXL部署戰略貢獻一份力量。這表明,即便像探索CXL那樣踏入未知領域,我們也可以憑借自身的創新精神和堅韌毅力,找到解決新問題的答案。”
“此外,我自愿在JEDEC固態技術協會和CXL聯盟中擔任要職,以此助力公司在標準化工作領域的地位不斷提升。”
Q您如何看待CXL在未來人工智能生態系統中的發展?
A“CXL有望被構建成一個能夠實現超大存儲容量共享的生態系統。若要在人工智能時代進一步拓展其應用,CXL亟需支持計算節點,以確保1TB以上的高性價比存儲器可以按需提供帶寬,并在存儲層面保持可靠性和安全性。這將有助于降低總體擁有成本,提高系統平臺內的存儲器利用率。”
“構建如此龐大的生態系統,絕非SK海力士一己之力所能實現。這需要GPU和CPU制造商、CXL控制器和交換機供應商,以及CXL知識產權(IP)公司的緊密協作。我們計劃與這些機構攜手合作,以進一步推動和壯大CXL生態系統。”
-
處理器
+關注
關注
68文章
19404瀏覽量
230761 -
存儲器
+關注
關注
38文章
7528瀏覽量
164176 -
人工智能
+關注
關注
1794文章
47642瀏覽量
239612 -
SK海力士
+關注
關注
0文章
973瀏覽量
38634
原文標題:[Rulebreakers’ Revolutions] CXL技術如何在人工智能時代擴展數據中心存儲容量的極限
文章出處:【微信號:SKhynixchina,微信公眾號:SK海力士】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論