繼 軟 件 定 義 存 儲 (分布式存儲的定義與分類)之 后, 一 種 被 稱 為 超 融 合 的 系 統 快 速 發 展, 超 融 合 的 全 稱 是“ 超 融 合 基 礎 架 構(HCI)”,它集計算、存儲和網絡于一身,在簡化部署、管理的同時,還可以透過增加或者減少節點,追求計算和存儲資源橫向擴展,具有彈性伸縮的能力。
對于超融合基礎架構而言,計算資源彈性伸縮完全可以借助服務器虛擬化技術實現,當時虛擬化技術已經非常成熟,比較難以實現的是存儲資源的彈性調度和伸縮,也可以理解為存儲虛擬化,但是從技術的演進發展來看,當時存儲虛擬化的主要用途在于實現不同品牌存儲陣列的集中管理和調度,以 IBM 為首,提供多種存儲虛擬化的設備,連接不同時期、不同品牌的存儲陣列產品。所以當初存儲虛擬化強調的并不是存儲資源池的概念,但是隨著軟件定義存儲技術的發展,存儲節點透過網絡連接、橫向擴展、全局單一命名存儲空間技術成為了現實,也為超融合基礎架構創造了條件,出現了超融合一體機的產品形式。
也因為超融合一體機主要突破的是存儲資源池的技術,所以很多分析機構將超融合一體機歸類到存儲的范疇,成為軟件定義存儲的一個分支。對外提供存儲資源服務的是軟件定義存儲,與此同時,利用存儲節點自身的計算能力,對于上層應用提供支撐的就是超融合,這成為了當時一種普遍的共識。
超融合一體機易部署、易管理、彈性伸縮,與同樣流行的云計算的特點完全吻合,因此當時也有觀點認為超融合更像是云,并以此與軟件定義存儲進行區分。最初超融合一體機并不支持作為存儲系統來使用,強調兼容計算,但是隨著市場的發展,也開始支持純存儲的單一應用形式,這就是后話了。
最初,超融合系統的分析、比較的對象并不是軟件定義存儲,而是一種被稱為融合基礎架構(Converged Infrastructure)的系統,后者是一個工廠定制,整機柜交付的產品設備形式,通過這種方式,簡化系統的部署和管理,實現系統的快速上線。融合基礎架構(Converged Infrastructure)的價值在于系統集成服務,與超融合系統強調的資源池建設,特別是存儲資源池的實現,還是有本質區別的。簡單說,融合基礎架構(Converged Infrastructure)中所集成的存儲,完全有可能是傳統存儲陣列,不是超融合所強調的軟件定義存儲。這是二者的主要差別。
超融合一體機還是存算分離?
超融合基礎架構最初是以一體機的形式交付的,具有易部署、易管理和彈性伸縮的云計算服務的特征,這也是超融合一體機也被稱為云的原因,從單一應用的角度,通過超融合一體機來構建的應用,就相當于云的應用。超融合一體機也可以用來支持多個應用,前提是,其計算資源能夠滿足多業務應用的需求。
超融合一體機云化的特征完美切合中小企業技術能力有限,管理和運維能力不足的問題,超融合一體機的出現,毫無疑問降低了用戶業務應用云化的門檻,在市場得到了普遍使用和歡迎。
超融合一體機可以幫助業務實現云化,但是無法從根本上替代云計算,換句話說,超融合一體機不能夠作為企業私有云建設的基石。原因很簡單,云計算基礎設施需要集中承載企業的所有業務,動輒成百上千,超融合一體機可以承載少量的應用,如果作為企業云計算基礎設施來使用,難免出現小馬拉大車的局面,勉為其難。
云計算基礎設施承載的業務應用更加復雜,類型也更加多樣,有計算密集型和存儲密集型應用的區分,以節點為單元橫向擴展的超融合一體機的方式,相比就不夠靈活。云計算所追求的計算、存儲資源分離的形式,可以根據不同應用的需要,靈活進行擴充,計算不足擴計算,存儲不足擴存儲。
云計算應用最初的重點是計算資源的虛擬化,這也是為什么服務器虛擬化被稱為云操作系統的原因。云計算發展到存算分離階段,為了和已有產品方案進行區分,有廠商提出了“云計算發展下半場”的概念,并借用了超融合 2.0 的概念,賦予了超融合嶄新的含義。相比于超融合 1.0 的超融合一體機,超融合 2.0 在市場上遠沒有得到普及和流行,很多人的認知還停留在于超融合 1.0的階段。
從超融合到混合云?
企業私有云建設的首要問題是計算資源池化,服務器虛擬化技術滿足資源動態調度的需求,這也是為什么服務器虛擬化被稱為云操作系統的原因。在眾多私有云開源解決方案中,OpenStack 最終脫穎而出,OpenStack 最初提供的主要功能主要集中在計算資源的調度、監控、協同和管理。
云計算下半場強調存算分離,并借用了超融合 2.0 的概念。
云計算的發展經歷了從 IaaS、PaaS、SaaS 到公有云、私有云和混合云的變化,在國內,用 OpenStack 構建私有云得到用戶的普遍認同,國外更加青睞使用公有云。與公有云相比,私有云更能滿足數據合規的要求,但在規模和成本上存在差距,混合云就成為國內用戶的目標,相比之下,國外更側重多云的管理。
如何構建混合云?幫助用戶實現業務目標?
對于混合云應用而言,以 OpenStack、vSphere、Hyper-V 為主構建的私有云,與公有云在本質上是異構系統,要實現混合應用是一件非常困難的事情。分步驟、分階段實施混合云就成為了現實的目標。
作為混合云應用的第一步,數據上云被提了出來,最初是備份數據上云,鑒于備份數據的特殊格式,不易造成數據泄露,且可以很好利用云存儲成本低的特點,類似冷數據上云就成為了最初的應用。在這個基礎之上,合理利用公有云的計算資源,就可以實現業務應用的容災。
數據上云的核心是數據管理,這是容災備份廠商的專長,也是數據存儲廠商的強項。數據存儲的核心,條帶化、RAID 也好,本質就是數據管理的問題。在數據管理的基礎上,數據存儲廠商推出了類似近云存儲的解決方案。
與此同時,通過與 AWS、Google 等公有云廠商合作,采用 IBM、VMware 所提供的混合云解決方案,用戶可以使用所熟悉的技術,在私有云、公有云之間靈活使用資源。另外一方面,公有云廠商也面向大型行業企業用戶提供了專屬云解決方案,其本質也是一種同構、非異構環境的解決方案。
數據與混合云應用需求,為數據存儲廠商提供新的用武之地,他們也從存儲廠商上升為混合多云解決方案的供應商。為了區分,這里也借用了超融合,提出了超融合 3.0,HCI 也從 Hyper-Converged Infrastructure(超融合基礎設施)升級為 Hybrid Cloud Infrastructure ( 混合云基礎設施 ),實現了概念到內容的升華。
但是對于很多對技術缺乏了解的用戶而言,從一體機到混合多云的跨度有點大,讓他們很難跟上技術發展的步伐。
什么是 SDS 一體機?與分布式存儲、軟件定義存儲、云存儲有什么區別和聯系?
還是堅持百易存儲研究院的一個原則:不拘泥于定義和概念,而是從實際上應用需求出發,SDS 一體機所能夠解決的具體問題。
從應用角度,可以劃分為需求如下:為 OpenStack 云提供后端存儲、為虛擬化提供所需的塊數據存儲服務、面向傳統架構的統一存儲、以及面向海量數據的對象存儲。
目前 SDS 一體機強調的是開箱即用,能夠提供 iSCSI、FC、NFS、CIFS、FTP 等全協議支持的支持,顯然這比較適合中小企業使用。未來會不會有其他形式的 SDS 一體機出現,應該說一切皆有可能。
X86 還是專用設備?
這個問題產生還是來自于分布式存儲沒有普遍接受的定義,在實踐中就出現了認知偏差,類似盲人摸象,每個人都從各自角度闡述對問題的理解。
實際上,x86 還是專用設備在市場上是并存的,此外還有其他的形式。如果從利用的角度,傳統存儲陣列是不是也可以作為節點存在呢?所以,問題的分析并不是 x86 vs 專用設備,不同的方案特點不一樣,需要用戶根據自己的需要靈活加以選擇。
性能上的高低上下,可以透過 PoC 測試來解決。可靠性和運維的問題,需要專業人員結合實踐給出專業的判斷。對于用戶而言,重要的不是站隊,重要的是視野。
分布式存儲是否適用于“關鍵業務”應用?
分布式存儲是否可以應用在關鍵業務應用的場景?市場上之所以有這樣的疑問,主要的原因在于缺乏分布式存儲的實踐。與集中式存儲陣列相比,分布式存儲還屬于新生事物,沒有更多的經驗作為參考。
對于新生事物的應用,有一個逐步探索和實踐的過程,用戶不會貿然從關鍵業務入手,往往會選擇邊緣業務,不斷積累實踐應用的經驗,這是一個審慎穩妥的做法。
關鍵業務應用對于可靠性、穩定性有著極致的需求,強調業務應用的穩定和連續,所以能夠用于關鍵業務應用的產品,在可靠性、穩定性方面采取了非常多的措施,以存儲陣列為例,從前端網絡連接、控制器、到后端的磁盤連接,全部采用冗余設計,確保系統沒有任何單一故障點,這也是存儲陣列價格昂貴的主要原因,但是這種極致的可靠性、穩定性能夠確保關鍵業務應用的需求。
與之相比,分布式存儲陣列也采取了非常多措施來確保系統的可靠性、穩定性,確保存儲數據不丟失,利用 x86 通用服務器的成本優勢,分布式存儲采用多副本、糾刪碼的技術確保數據的穩定、可靠性和安全,多副本數據被分散到不同的節點、機柜、機架,確保不會因為單一硬件故障,造成數據的丟失和不可逆。但出現單一節點故障之后,分布式存儲系統會調用所有的節點,參與數據的恢復,可以確保系統始終處于多副本或者糾刪碼的保護之下。
如今,x86 通用服務器等節點的性能和質量不斷提升,已經具備運行關鍵業務應用的能力,在很多計算應用的場景已經得到了證實,這也為分布式存儲奠定了穩定、堅實的基礎。此外,分布式存儲橫向擴展的能力更加有助于用戶應對海量數據存儲帶來的挑戰。
云原生成為了應用軟件發展的主要趨勢,透過容器 + 微服務化設計,云原生應用在適應容器的調度、故障隔離的能力極大增強,也更加能夠適應迭代更新的需要,云原生應用的發展也降低了對于單一硬件可靠性的依賴,這種發展趨勢,也有助于分布式存儲的推廣和應用。
編輯:黃飛
評論
查看更多