隨著云平臺虛擬化技術的發展,智能網卡的發展基本可以分為三個階段(如下圖所示):
圖 智能網卡發展的三個階段
第一階段:基礎功能網卡
基礎功能網卡(即普通網卡)提供2x10G或2x25G帶寬吞吐,具有較少的硬件卸載能力,主要是Checksum,LRO/LSO等,支持SR-IOV,以及有限的多隊列能力。在云平臺虛擬化網絡中,基礎功能網卡向虛擬機(VM)提供網絡接入的方式主要是有三種:由操作系統內核驅動接管網卡并向虛擬機(VM)分發網絡流量;由OVS-DPDK接管網卡并向虛擬機(VM)分發網絡流量;以及高性能場景下通過SR-IOV的方式向虛擬機(VM)提供網絡接入能力。
第二階段:硬件卸載網卡
可以認為是第一代智能網卡,具有豐富的硬件卸載能力,比較典型的有OVS Fastpath硬件卸載,基于RoCEv1和RoCEv2的RDMA網絡硬件卸載,融合網絡中無損網絡能力(PFC,ECN,ETS等)的硬件卸載,存儲領域NVMe-oF的硬件卸載,以及安全傳輸的數據面卸載等。這個時期的智能網卡以數據平面的卸載為主。
第三階段:DPU智能網卡
可以認為是第二代智能網卡,在第一代智能網卡基礎上加入CPU,可以用來卸載控制平面的任務和一些靈活復雜的數據平面任務。目前DPU智能網卡的特點首先是支持PCIe Root Complex模式和Endpoint模式,在配置為PCIe Root Complex模式時,可以實現NVMe存儲控制器,與NVMe SSD磁盤一起構建存儲服務器;另外,由于大規模的數據中心網絡的需要,對無損網絡的要求更加嚴格,需要解決數據中心網絡中Incast流量、“大象”流等帶來的網絡擁塞和時延問題,各大公有云廠商紛紛提出自己的應對方法,比如阿里云的高精度擁塞控制(HPCC,High Precision Congestion Control),AWS的可擴展可靠數據報(SRD,Scalable Reliable Datagram)等。DPU智能網卡在解決這類問題時將會引入更為先進的方法,如Fungible的TrueFabric,就是在DPU智能網卡上的新式解決方案。還有,業界提出了Hypervisor中的網絡,存儲和安全全棧卸載的發展方向,以Intel為代表提出了IPU,將基礎設施的功能全部卸載到智能網卡中,可以全面釋放之前用于Hypervisor管理的CPU算力。
未來的DPU智能網卡硬件形態
隨著越來越多的功能加入到智能網卡中,其功率將很難限制在75W之內,這樣就需要獨立的供電系統。所以,未來的智能網卡形態可能有三種形態:
(1)獨立供電的智能網卡,需要考慮網卡狀態與計算服務之間低層信號識別,在計算系統啟動的過程中或者啟動之后,智能網卡是否已經是進入服務狀態,這些都需要探索和解決。
(2)沒有PCIe接口的DPU智能網卡,可以組成DPU資源池,專門負責網絡功能,例如負載均衡,訪問控制,防火墻設備等。管理軟件可以直接通過智能網卡管理接口定義對應的網絡功能,并作為虛擬化網絡功能集群提供對應網絡能力,無需PCIe接口。
(3)多PCIe接口,多網口的DPU芯片。例如Fungible F1芯片,支持16個雙模PCIe控制器,可以配置為Root Complex模式或Endpoint模式,以及8x100G網絡接口。通過PCIeGen3 x8接口可以支撐8個Dual-Socket計算服務器,網絡側提供8x100G帶寬的網口。
圖未來智能網卡的硬件形態
DPU作為一種新型的專用處理器,隨著需求側的變化,必將在未來計算系統中成為一個重要組成部分,對于支撐下一代數據中心起到至關重要的作用。
來源:專用數據處理器(DPU)技術白皮書,中國科學院計算技術研究所,鄢貴海等
-
DPU
+關注
關注
0文章
358瀏覽量
24182
發布評論請先 登錄
相關推薦
評論