原文發布于 DOIT 傳媒,轉載已獲授權。
站得高才能夠看得遠,作為“藍色巨人”,IBM 數據存儲領域擁有足夠多的積累和榮耀,無論何時何地, IBM 對存儲的洞察都應該引起我們高度關注。不僅如此,IBM 存儲產品和解決方案也總會帶來意想不到的驚喜和收獲。
2023 存儲峰會 (FMW) 期間,存儲在線總編宋家雨特邀IBM 副總裁、大中華區存儲及中國區 Power 業務總經理候淼結合閃存技術市場的熱點進行了專訪。
存儲在線總編宋家雨(左一)與 IBM 副總裁、大中華區存儲及中國區 Power 業務總經理候淼(右一)新聞會客廳訪談
宋家雨:最近 IBM 存儲在品牌方面有些調整,把原來 IBM Spectrum 調整為 IBM Storage,這個動作的背后是怎樣的一個戰略布局?
侯淼:IBM 存儲剛剛調整了整個產品線命名,從 IBM Spectrum 調整為 IBM Storage,精簡了。IBM 存儲產品線比以前更加專注了,通過命名的改變,希望能夠使品牌更加突出,突出 IBM+Storage。因為我們看到,數據增長變得越來越快,數據量越來越大,IBM Storage 業務會成為重要的業務發展領域。
IBM 存儲品牌戰略調整,跟 IBM 公司整體戰略是分不開的。
IBM 在 2019 年收購了 Red Hat,今年我們剛剛發布了 watsonx, IBM 整個公司戰略圍繞兩大主線來展開,一個代表混合云,一個代表人工智能。
混合云主要是圍繞紅帽 OpenShift 底座,為客戶打造一個端到端的混合云策略,上可以支持微服務,對下可以支持容器,這樣把客戶的硬件、軟件資源統一結合起來,這是 IBM 很重要的策略。
針對人工智能,特別是今年 7 月份 IBM 剛剛推出的 watsonx,它分為 watsonx.ai、watsonx.data 和 watsonx.governance。其中,watsonx.ai 主要是作為 AI 開發平臺,為客戶生成模型提供相關的底座和支持,包括模型的訓練、驗證、調優和部署。watsonx.data 是湖倉一體的結構,跟存儲也是緊密相關的。watsonx.governance 為整個人工智能應用提供監管,包括管理的平臺。這三個產品會支撐 IBM 戰略的另外一個主線,也就是人工智能。
IBM 現在有基礎架構和軟件業務,還有企業咨詢服務,所有這些部門的產品和解決方案都是圍繞以上兩個主線來展開,我們會比以前更加專注。圍繞這個主線,IBM 對存儲整個產品線進行了調整,以前我們是以盤(閃盤)、帶(磁帶)、閃存這樣的語言進行描述,未來我們的產品線會圍繞三塊: 第一塊是人工智能存儲;第二塊是混合云存儲;第三塊是數據保護存儲。我們實際上把硬件、軟件結合,首先會有一個軟件的平臺和引擎作為關鍵的組成部分;然后是相關硬件,包括盤和帶,為客戶提供針對 AI 場景、混合云場景以及數據保護場景的解決方案。
宋家雨:您能否結合這兩個場景,介紹一下 IBM 存儲的一些獨特思考?
侯淼:如果把數據源的數據分成兩類,一類是結構化的,一類是非結構化的,實際上你會發現非結構化數據增長是非??斓模@里包括像文件、對象、聲音、圖像等數據,對此,我們投入技術、研發力量幫助客戶去尋找這種這種非結構化數據的價值,提供相應的管理方案。
人工智能處理的數據大部分 (80%-90%) 都是非結構化數據,針對這些數據的管理和應用,IBM 存儲的一個主要解決方案就是 IBM Storage Scale 的產品家族,來優化和簡化數據的訪問和存儲。
還有一個角度是幫助客戶去實現數據的云化,這里最核心的就是容器化。所以我們的混合云存儲,特別是我們推出的閃存產品,針對容器化去支持紅帽 OpenShift 混合云平臺,滿足客戶在混合云和私有云構建。
現在混合云應用有一個比較大的變化,就是很多客戶開始逐漸將應用容器化,對于硬件來講,容器化的好處在于能夠大幅度地去提高硬件的利用率,因為以前一個機器支持幾百個虛機就可以了,但是容器化能支持上千規模,使利用率能夠大幅度提高,減少客戶在硬件上的購買成本,這是它的重要價值。
隨著軟件應用變得更加敏捷,部署也能夠越來越快,不需要花很多周期和時間。圍繞這樣一個改變,很多客戶使用容器化軟件去實現生產系統。對于生產系統,不可避免會談到備份、容災,包括恢復的功能,而這也是 IBM 最強的部分。
通過我們的軟件跟 OpenShift 相結合,能夠支持客戶實現生產系統的容器化,然后做容災備份一整套解決方案。換句話來講,我們是為企業客戶在做混合云時,提供端到端的架構,使它能夠不單單能滿足容器化帶來的好處,而且也能滿足生產系統所具有的可靠性、穩定性和安全性的要求。
宋家雨:圍繞 watsonx,在 AIGC 領域,IBM 存儲有哪些獨特的優勢和思考,能不能分享一下?
侯淼:實際上人工智能這幾年是一個高潮,GPU 被大量在 AI 中使用。IBM 在人工智能方面,倡導從 +AI 到 AI+,就是以前是在原有系統上加一些人工智能的功能,今天要做的是用人工智能去替代原有的系統,使它更加自動化。
我們有一個基本的框架,這個框架就是數據、模型、算力和存力。針對基礎構架去支持大模型,通過生成式的大模型,支持數據的分析和提煉,其中基礎架構是最主要的平臺。它有兩個關鍵支柱,一個是算力,一個是存力,我覺得這個說法可能只在中國有,因為在國外都叫做 computing、Storage,中國語言則體現出一個“力”。
存力包括兩部分:一是要有一個存儲平臺,是能夠進行數據的存取;二是“力”,代表一種能力,這個能力能夠支持人工智能的模型和算力能力的發揮,所以在人工智能存力里,對存儲有不一樣的要求。一方面是要求高性能,因為現在 GPU 會越來越快,而且 GPU 對存儲的要求是吞吐量越來越大,想要數據的話能及時提供 I/O。GPU 資源越來越貴,存儲的價值就在于怎么能夠減少 GPU 的等待時間,減少 GPU 等待帶來的浪費,這很關鍵,所以人工智能存儲第一個特點就是要高性能。為了做到高性能,這類存儲要支持英偉達的 GPU 直連,通過支持 DGS 協議,使企業的數據和性能能夠提升一倍以上,這是第一個高性能。
第二個就能夠進行線性水平擴展,你很難能夠去預測未來的增長,所以所有這類系統都是分布式的。要求存儲也要是分布式,能夠線性擴展,但是分布式跟線性擴展是兩個概念。分布式是能夠擴展到上百、上千個節點,但是當你擴展到上百、上千個節點時,它的性能是否能跟得上?IBM Storage Scale 軟件能解決分布式存儲擴展時的性能問題,實現線性水平擴展。
安全性、備份、可靠性則是第三個需求。我覺得這三個結合起來,這個存力就能夠支持企業在人工智能領域所需要的基礎存儲要求了。
宋家雨:您能不能具體介紹一下 IBM 存儲和英偉達算力解決方案的合作?
侯淼:IBM 跟英偉達公司的合作由來已久,就在近幾年,2018 年 IBM 和英偉達一起聯合支持美國能源部的項目,當時是用 IBM 的 Power CPU,采用英偉達 NVLink 總線進行互聯,英偉達選中了 Tesla GPU 加 IBM Storage Scale System(下文簡稱為 SSS,原 ESS)產品,這三款產品結合在一起。因為人工智能計算跟高性能計算是類似,都需要很強的算法,無論是浮點(運算)還是整型(運算)。英偉達在它的一些方案,包括 DGX SuperPOD 都是采用 IBM 的 SSS 產品作為存儲的存力。
IBM 現在所發布的 SSS 產品也拿到了英偉達的官方認證,支持 DGX SuperPOD 的 GPU 直連,而且有完整的測試,從兩個節點,到 4~8 個節點,我們推薦不同類型的產品組合。IBM 單模塊能夠去支持 125 GB/s 的帶寬傳輸能力,這是現在業內最快的。同時我們能夠實現上百、上千個模塊的水平線性擴展,所以這個方案能滿足英偉達 GPU 對數據存儲的需要。
回到剛才我談三個能力,有一個是高性能,包括剛才我談到支持 GPU 直連,包括最快速的單模塊 125 GB/s 傳輸能力。另外一個能力是線性擴展,IBM 現在的一個主要解決方案是 IBM Storage Scale 存儲軟件,以前叫 GPFS,這個軟件是分布式文件系統,客戶比較多,它的特點在于:第一,它是全域命名管理,能夠支持不同存儲協議的數據能夠交互,包括像云原生 S3、NFS 等,它有特殊的本地緩存的算法,能夠在你訪問遠程之前提前去預測這個數據是不是在遠程,能夠先拿到數據。通過這種方式,即使水平擴展上百個節點、上千個,它能夠通過預測提高性能,盡可能少衰減,這也是它非常大的優勢,也是國內包括國外很多分布式存儲用它作為核心數據底座的原因。
第三,很多客戶用人工智能進行訓練之后,特別是進行推理和使用,數據會越增長越快。這些增長的數據,要考慮歸檔和備份的問題。IBM 較其他存儲的廠家,我們有比較深的、完整的一個存儲產品解決方案,我們通過 IBM SSS 3500 產品作為一級存儲,去跟英偉達的 DGX 服務器配合使用。
同時,當數據變得越來越多,很多數據使用頻度降低時,數據開始從熱數據變成溫數據和冷數據,我們就開始考慮后面的歸檔,包括備份方案,這里包括文件歸檔、目標存儲的歸檔,還有系統通過自帶歸檔,我們有一整套的方案去滿足客戶對人工智能存力的要求。
宋家雨:在未來 IBM 存儲的規劃之中,生成式 AI 部分會更加依賴于 Watson 嗎?
侯淼:我覺得您說了一個很好的題目,Watson 這個名稱來自 IBM 的創始人老沃森,后來也成為了 IBM 研發實驗室的名稱——IBM Watson 實驗室。今天,Watson 已經成為 IBM 人工智能的統一品牌。
現在我們提出叫 watsonx,之所以是 X 的話,是希望我們有各種不同的場景,不同的方案,能解決客戶更多的問題。圍繞 watsonx 它的三個組成部分,第一個是支持生成式 AI 的開發平臺,叫 watsonx.ai,第二個是 watsonx.data,把數據湖和數據倉庫結合起來,也就是“湖倉一體”架構。第三個是 watsonx.governance,跟整個監管包括合規相關的。
跟存儲有比較大關系的是 watsonx.data,這里牽扯到不單單是要解決人工智能對存儲的要求,而且也要解決數據的管理,數據的訪問,整套解決方案。圍繞這塊,用到了不單單是人工智能存儲,也會用到云,用到數據備份、數據保護。IBM watsonx 希望針對企業級的人工智能應用提供端到端的技術支持和行業專長。
現在市面上有一些工具可能只是工具,用在企業的話,會有很多問題。包括這些工具的使用,數據的產生,數據的保護,包括維護以及監管的要求。
IBM 的理念是,我們提供 watsonx 產品家族是滿足端到端的需要,特別是企業客戶,當你不具備那么強 AI 的研發能力,通過 IBM 產品組合,能夠從生成式的 AI 模型,到最后滿足監管的要求以及數據被保護等各個方面,這是我們提出 watsonx 整個的想法。
watsonx 是 7 月初剛剛開始上市的產品,國內現在在推廣階段,現在有一些國外的案例,主要是客戶通過生成式AI模型解決行業一些問題。比如:制造業生產線中缺陷的判別,醫療影像的識別,呼叫中心對客戶訴求的自動化應對和回復。我們現在看到針對這類行業應用,所有模型都有它的行業特點,發生很多交互關系,往往要跟客戶業務緊密結合,去產生一個合理、可落地的一個模型。
關于數據,我們發現,不單單是企業對 AI 的使用要求,這些客戶本身的海量數據,比如,一個銀行的呼叫中心可能也有銀行帳戶的信息,包括信用的信息,而這些信息往往存在數據庫里,所以 IBM watsonx.data 面對的數據對象不單單是非結構化的,還有一些結構化的,對數據的保護要求也不一樣,可能你跟客戶的通話本身是敏感的,要保護。但是跟客戶銀行帳戶的信息相比,可能這里要求的保護級別更高。怎么樣把這些結合在一起,就變得非常重要了。
我們現在看到 watsonx.data 對存儲的要求,會比單一的系統來得要復雜,因為除了牽扯到模型所產生的,跟 GPU 配合所需要的存儲結構以外,還需要后臺其他的存儲連接,包括跟它的數據庫存儲,包括怎么樣整體上為客戶去做備份,做數據保護。我們針對人工智能 AI 的核心軟件 Storage Scale,后臺既可以接閃存,也可以接對象存儲,也可以接磁帶,這樣跟客戶整個系統相結合,不單單是提供 AI 存儲的本身,而且提供湖倉一體的存儲架構。
宋家雨:最后一個問題想問一下侯總,除了目前我們講的混合云、AI 存儲之外,安全也是一個特別需要關注的話題。IBM Storage 也有一個產品叫 Defender,這樣一個產品是不是能夠抵御勒索病毒攻擊呢?
侯淼:IBM 有一類產品,我們叫它數據彈性存儲,這里核心軟件就是 IBM Storage Defender。實際上是兩個層面的事情,一個叫做數據安全,一個叫數據保護,這兩個是不一樣的。
數據安全很大程度上是主動的,它要去防止被黑客所襲擊,怎么樣能夠進行主動探測,它是一個主動行為。數據保護相對來說是被動行為,怎樣能夠在同時情況下保護我的數據,能夠盡可能減少損失。IBM 是把這兩塊結合在一起了,就是 Defender 所要解決的問題。
關于 IBM
IBM 是全球領先的混合云、人工智能及企業服務提供商,幫助超過 175 個國家和地區的客戶,從其擁有的數據中獲取商業洞察,簡化業務流程,降低成本,并獲得行業競爭優勢。金融服務、電信和醫療健康等關鍵基礎設施領域的超過 4000 家政府和企業實體依靠 IBM 混合云平臺和紅帽 OpenShift 快速、高效、安全地實現數字化轉型。IBM 在人工智能、量子計算、行業云解決方案和企業服務方面的突破性創新為我們的客戶提供了開放和靈活的選擇。對企業誠信、透明治理、社會責任、包容文化和服務精神的長期承諾是 IBM 業務發展的基石。
了解更多信息,請訪問:https://www.ibm.com/cn-zh
→IBM:以強大存力與算力夯實 AI 基礎架構,讓技術真正轉化為業務價值
→IBM 2023技術交流大會將展示 watsonx 全新升級,watsonx.governance 技術預覽版及新模型等一一亮相
點擊“閱讀原文”,獲取更多內容
原文標題:媒體觀察:相信“藍色巨人”,IBM 存儲永遠在線
文章出處:【微信公眾號:IBM中國】歡迎添加關注!文章轉載請注明出處。
-
IBM
+關注
關注
3文章
1758瀏覽量
74723
原文標題:媒體觀察:相信“藍色巨人”,IBM 存儲永遠在線
文章出處:【微信號:IBMGCG,微信公眾號:IBM中國】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論