過去十年來,計算成本一直在趨于平緩,網絡和存儲負載同時在增加。最重要的是,網絡性能和計算性能之間的差距正在擴大。面對摩爾定律關于CPU的增長放緩,將網絡,存儲和其他功能從服務器處理器卸載到支持計算的網絡接口的SmartNIC有望產生一定的作用。
關于所謂的SmartNIC的討論越來越多,其實原因很簡單。在過去的幾年中,該行業正在從單個網絡設備中的復雜配置轉向集中管理的控制器中的更簡單配置。在擴展規模時,抽象出復雜性是關鍵。通過將網絡配置轉移到服務器NIC而不是機架(ToR)頂部交換機,物理網絡結構可以變得更加簡單,實際上可以充當傳輸層。SmartNIC將能夠使用常規的靜態路由或使用BGP或MPLS的動態路由連接到網絡。
SmartNIC架構
微軟擁有一百萬基于FPGA SmartNIC的“Catapult”,而Amazon Web Services具有基于其自己的Arm處理器的“Nitro”,Google和Facebook尚未部署SmartNIC,國內的阿里巴巴正在使用其X-Dragon處理器進行概念驗證,但百度或騰訊都尚未部署任何數量的SmartNIC。
SmartNIC到底是什么,為什么它如此重要?開發最初是從AWS作為其云的內部項目開始的,從而簡化了網絡操作,并使物理網絡設備更簡單,更省力且更易于管理。
簡而言之,SmartNIC是具有通用CPU,帶外管理和虛擬設備功能的NIC。
通用CPU:擁有一個通用CPU可以使一個人直接在NIC上運行任意代碼和應用程序,例如網絡和存儲服務,這既可以提高性能(由于可以快速訪問網絡I/O路徑),又可以節省成本和核心CPU周期。
帶外管理:SmartNIC上的CPU復合體可以獨立于服務器的CPU進行管理,這意味著LCM可以獨立,并可以為云層面提供操作和管理的新控制點。
虛擬設備功能:SmartNIC可以將PCI總線上的“虛擬”設備公開給核心CPU OS和應用程序,就好像它們是實際的硬件設備一樣。這提供了以前沒有的軟件驅動的硬件靈活性。
本質上,NIC上面有一個計算層,從而可以在NIC本身上運行自定義軟件。計算層可以控制為網絡流量提供服務并可以執行特定網絡功能的可編程ASIC。ASIC還為物理網絡電纜和常規服務器OS之間提供了額外的安全層,因為NIC內置了一個可編程的網絡設備(而不是在ToR交換機中安裝該設備)。所以我相信SmartNIC確實是一種轉型技術,它將推動硬件架構和設計的拐點。
重新定義混合云架構
VMware最近宣布了Monterey項目,他們正在與NVIDIA,Pensando和Intel合作。蒙特雷計劃(Project Monterey)提供了一種更為簡單的解決方案:因為SmartNIC不僅可以將虛擬設備公開到其本地主機,還可以將這些虛擬設備公開到遠程主機。
想象一下有一個四節點主機的集群,其中在其兩個沒有加速器的主機上運行應用程序,而另外兩個主機具有加速器(在這種情況下為FPGA)。通常,這兩個應用程序將無法訪問FPGA,因為本地主機上沒有。目前實際上只需將硬件加速器公開給群集中的所有主機,即可使群集中的所有應用程序都能利用這些加速器。
越來越多的客戶正在尋求在其混合云(數據中心,電信云和邊緣)中降低TCO,Vmware正在與眾多SmartNIC供應商和服務器OEM合作,以為客戶提供集成解決方案。眾所周知這種混合云的方案有以下好處:
網絡性能和安全性:有一個并行層運行虛擬設備功能,通過將網絡和安全功能轉移到SmartNIC,而不是將流量轉發到服務器OS,這樣可以保證在沒有核心CPU開銷的情況下實現線速性能,并提供具有L4-7安全性的分布式防火墻,而不會影響網絡性能!
云規模的存儲和分布式:由于NIC通常與服務器內部的存儲是同一總線的一部分,因此SmartNIC也可以直接與服務器中的存儲通信。這樣就可以實現在不影響性能的情況下實現諸如壓縮,加密和擦除編碼等存儲功能的加速。它還可以提供提供動態存儲配置文件(用于iops和容量)和按需遠程存儲訪問。
裸機和可組合性:核心CPU組件上運行的功能是可以轉移到SmartNIC組件上的,那我們就可以為該裸機OS提供存儲和網絡服務,這樣就能滿足企業和CSP客戶對裸機和機架級功能特殊架構的需求。
重新定義可觀察性
良好的可見性和監控是分布式網絡的關鍵。當不能僅登錄到單個設備并進行數據包捕獲時,很難確切地知道發生了什么。幸運的是,SmartNIC具有內置的可觀察性和令人印象深刻的功能。諸如NetFlow(添加了有關段大小,應用程序信息,防火墻規則操作的字段),獲取L4到L7信息的數據包檢查,流日志記錄,往返時間延遲跟蹤之類的東西都已存在。大多數數據也可以通過SmartNIC API獲得,因此其他兼容性的產品都可以可以使用它。
參考鏈接:https://pensando.io/wp-content/uploads/2020/03/Deep-Observability-with-the-Pensando-Distributed-Services-Platform.pdf
重新定義服務網格
從目前產業應用范圍看,各個主流云廠商都提供了自己的網格服務,并且越來越多的用戶也在一起探索網格技術對已有系統的遷移和可替換性。新興互聯網公司規模相較于一些大型互聯網公司體量都不是很大,服務網格中的資源占用與性能降低的問題變成了網格技術能否大規模使用推廣的關鍵。SmartNIC是其中一項關鍵技術,可以實現更高級別的性能,加密操作以及接近資源利用的方式。
原圖來源于容器魔方:華為云原生團隊
節點主機與SmartNIC內通過RDMA等技術進行數據雙向通信,并通過主機側出流量攔截層的EBPF模塊結合硬件卡內的自研用戶態協議棧對傳輸層數據進行封裝,這樣對于數據面代理本身可以做到網絡處理代碼部分最大的兼容性,同時對于外發網絡請求可以將現有租戶隔離等功能與用戶態協議棧進行進一步融合,減少網絡處理消耗。
Tetrate首席執行官兼創始人Varun Talwar說:“SmartNIC具有三個方面的優勢。按順序分別是性能,安全性和可以卸載的數據負載。這將導致諸如服務網格之類的技術得到更多采用。預計自己兩年之內對SmartNIC會有更深的需求和興趣。”
總結
這些SmartNIC的性能,安全性和可擴展性將使其成為未來網絡發展的下一步。將網絡功能從中央網絡設備直接移動到分布式服務器上。將網絡和存儲功能從主CPU和OS轉移到NIC硬件,將獲得驚人的性能提升并減少主CPU的負載。傳統的混合云架構、固有的可觀察性、以及不被大規模使用的服務網格技術,這些都將因SmartNIC的出現,使CPU更加專注于核心計算,而不是網絡和存儲繁忙的工作。
回歸到SmartNIC本身,實際上其他服務提供商對制造自己的SmartNIC的需求為零,這就是為什么業界像Solarflare/Xilinx,Broadcom擁有Stingray,Mellanox Technologies擁有Bluefield(CPU)和Innova(FPGA),Marvell擁有LiquidIO,Silicom擁有FB系列(FPGA)都在追尋SmartNIC的機會,而Vmware正在與NVIDIA,Pensando和Intel合作,將完整的解決方案推向市場。
參考鏈接:
1.https://lostdomain.org/2020/11/16/smartnic-the-next-step-in-networking/
2.https://www.nextplatform.com/2020/03/03/a-flare-for-smartnics/
3.https://thenewstack.io/where-service-mesh-and-smartnics-meet/
責任編輯:xj
原文標題:SmartNIC是混合云架構和服務網格的必然?
文章出處:【微信公眾號:存儲社區】歡迎添加關注!文章轉載請注明出處。
-
計算
+關注
關注
2文章
451瀏覽量
38840 -
混合云
+關注
關注
1文章
187瀏覽量
11137 -
SmartNIC
+關注
關注
0文章
19瀏覽量
3216
原文標題:SmartNIC是混合云架構和服務網格的必然?
文章出處:【微信號:TopStorage,微信公眾號:存儲加速器】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論