我是誰?我從哪里來?要到哪里去?要回答關于數據中心的靈魂三問,得從上個世紀60年代說起。 那時,一些“大塊頭”的計算機喜歡“扎堆兒”,最原始的機房就出現了。后來又有了小型機,PC和服務器也聯袂亮相,“數據中心”概念逐漸浮出水面——只不過冠以“數據”多少有些名不副實,機房更像是“設備中心”。
到了新技術風起云涌的90年代,互聯網數據中心(Internet Data Center,簡稱IDC)開始大行其道,其定位是為有互聯網與通信需求的用戶,提供托管維護、場地出租、帶寬租賃等服務,此刻的數據中心相當于“服務中心”。 接下來登場的是從本世紀初一直活躍至今的云計算、科學計算,它們徹底改變了傳統的IT基礎設施構建模式和運行方式,引發數據中心“大干快上”的熱潮。當然,很多新落成的IDC已不再叫“數據中心”,“算力”、“智算”等名稱更契合計算當道的局面。 故事演繹到這里,數據中心似乎總是“名不正、言不順”,而真正的轉折點雖遲但到。人工智能和數據要素聯袂出擊,前者以數據為“燃料”并激活數據潛能,后者重構數據底座且打造數據空間,二者共同驅動數據中心向“數據型”中心加速蛻變,延遲了半個世紀的“正名時刻”終于到來。 當“數據型”中心站到歷史舞臺的中央,最靠近數據的存力自然地位擢升,存儲架構乃至整個存力基礎設施的變革更是備受矚目——過往的容量、性能等指標已難以適應新的需求,圍繞多元混合負載和數據全生命周期重塑存儲基座迫在眉睫。 新型工作負載引領存儲基座的演進方向 從某種意義上講,工作負載的不斷變化是數據中心持續進化的最大動力,也是存儲基座謀求變革的核心基石。人工智能和數據要素是“數據型”中心的兩類新型負載,透過其演進軌跡可以找到存儲迭代升級的最佳路徑。
在生成式AI加速滲透的背景下,人工智能工作負載主要涵蓋模型訓練、微調、推理和應用等環節。伴隨大模型技術步入相對“穩態”,以數據驅動模型優化及應用落地變得尤為重要。存儲在AIGC場景中也不再是簡單的數據容器,而是推動人工智能發展的核心組件。 與風光無限的生成式AI相比,已升格為五大生產要素之一的數據要素絲毫不落下風。數據要素工作負載包括數據基礎設施的建設、數據空間的生成與應用等,以數據為中心達成“人機物”智聯融合,打造資源利用率最優的“數據型”中心是其預期目標。不難看出,新型工作負載不約而同地將數據托舉到“C”位,這對存儲基座帶來了前所未有的挑戰:一方面,人工智能對多類型數據的快速歸集、海量EB數據的混合負載、高維向量數據的組織形式和數據的全命周期管理寄予更高期望;另一方面,可信數據空間作為數據要素的資源中心,要求存儲在數據跨域管理、高效流通共享、數據安全調用及節能降耗等維度再上臺階。
針對存儲基座面臨的諸多痛點,產學研各界都在積極探索破局之道。近日,由中國電子技術標準化研究院、存儲產業技術創新戰略聯盟等數十家產學研機構聯合發布的《AIGC數據存儲研究報告》新鮮出爐,歸納出新環境下存儲能力的“六位一體”畫像,即要在處理、容納、管理、安全、共享、數據流動等方面協同發力,為存儲基座的演進指明了方向。 除了方法論的指引,在實踐層面尋找突圍路徑同樣至關重要。浪潮信息存儲認為,“數據型”中心迫切需要構建數據近計算存儲和數據全生命周期存儲兩大能力,而當前的存儲架構無法滿足新興場景的多元需求,亟需打造面向未來數據中心的存儲平臺。 新型存儲平臺演繹“121”協奏曲 目前,市場中主要存在4種存儲架構,即集中式、分布式、超融合和云存儲。每種架構各有優劣勢,但都難以完全匹配數據近計算和數據全生命周期兩種關鍵場景。 以集中式存儲為例:其具有IO性能高、時延低等優點,可以在近計算存儲領域施展身手,但受制于域擴展能力不足,無法滿足全生命周期存儲要求。此外,超融合存儲在性能和擴展能力上均短板明顯,云存儲擴展能力雖強卻有性能欠缺之憾,都難以承擔存儲架構變革的重任。 相對而言,更具擴展能力和靈活性的分布式存儲有機會挑起大梁,但也要以創新思路打破既有的桎梏。浪潮信息存儲首席架構師孫斌認為,“數據型”中心需要一套心邊一體、存算分離、服務融合的新型存儲架構,可組合分布式融合存儲(CDFS)即是典型代表。它以全IP互聯為基礎,通過機柜級存儲底座(BoR)和數據中心級存儲底座(BoD),實現機柜內、數據中心級的存算分離,提升存算協同、數據共享及流轉效率,進而借助場景共同體驅動存儲平臺完成躍遷。
筆者將其濃縮為“121”協奏曲——1套可組合架構×2種底座模式×1個生態包容的場景共同體。三個部分互為依托、相輔相成,形成強大的新型存儲基座,為“數據型”中心發展保駕護航。 開創先河的可組合分布式融合存儲CDFS為存儲架構創新樹立了新標桿。它分為三層三面兩體,堪稱全方位、立體式解決方案。其中,數據編織層建立數據跨地域、跨系統的流通技術規范,微服務化功能層推進控制面軟件定義、數據面鏈路加速、智能面感知調度,硬件資源層則致力于實現存算資源按需彈性組合。BoR和BoD兩種存儲底座模式為化解不同負載場景的難題找到了最優解。機柜級存儲底座由一臺存儲應對單個機柜計算節點的存儲性能、容量、時延訴求,擁有近計算高性能和極致性價比,可滿足邊緣數據中心或小型數據中心的xPU高效IO需求;數據中心級存儲底座則包含跨云跨域跨系統的統一智能數據管理平臺、融合多種協議多樣算力多類介質的分布式存儲融合架構和全局全域的數據編織存儲能力,主要為大規模、超大規模數據中心的AI數據就緒奠定根基。 新存儲架構的場景化落地與生態共建 如果說可組合分布式融合架構和面向不同工作負載的底座模式為“數據型”中心重構存儲平臺創造了必要條件,那么以產品利器深入真實場景,并構建富有活力的生態體系,則是“數據型”中心行穩致遠的根本保障。 早在今年5月,浪潮信息就發布為大模型專門優化的分布式全閃存儲AS13000G7-N系列,其后又重磅推出基于新一代分布式存儲平臺AS13000G7的AIGC存儲解決方案——在國際權威MLPerf AI存儲基準評測中,AS13000G7勇奪8項測試中5項性能全球第一,并在高校科研、自動駕駛等場景贏得高度認可。據孫斌透露,明年3月,還將發布新一代分布式存儲新品,并會融入新存儲架構的核心技術,CDFS有望落地生根。 站在更開闊的視角,打造以“場景共同體”為核心的生態圈,更有助于存儲基座的持續進化。浪潮信息通過技術整合、產品定制、方案聯合、服務外包、市場協同等新機制,聯合SI、ISV、CSP、服務、方案、產品、技術等產業鏈合作伙伴,構建起以用戶為中心、以應用為導向的場景共同體。據了解,場景共同體已催生出技術領先、一站式服務、商業敏捷等獨特價值,千行百業的沃土正綻放生態繁花。 顯而易見,“121”既是存儲平臺變革圖新的協奏曲,也是“數據型”中心奔赴未來的腳步聲。這條路的探路者并不孤單,攜手共建的美好前景值得期待。
-
存儲
+關注
關注
13文章
4337瀏覽量
85994 -
數據中心
+關注
關注
16文章
4830瀏覽量
72248 -
人工智能
+關注
關注
1792文章
47497瀏覽量
239202
原文標題:從數據中心到“數據型”中心:存儲平臺演繹“121”協奏曲
文章出處:【微信號:inspurstorage,微信公眾號:浪潮存儲】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論