我們生活在一個每天都會產生大量數據的數字信息時代。隨著物聯網設備、自動駕駛汽車、聯網家庭和聯網工作場所數量的不斷增加,數據中心的數據愈加趨向飽和。因此,需要一種解決方案,使數據中心能夠處理不斷增加的進出和通過數據中心傳輸的數據量。
數據處理單元,通常稱為DPU,是一種新型可編程的高性能處理器,優化執行和加速由數據中心服務器執行的網絡和存儲功能。DPU 就像 GPU 一樣插在服務器的 PCIe 插槽上,它們允許服務器將網絡和存儲功能從 CPU 卸載到DPU上 ,從而使 CPU 專注于運行操作系統和系統應用程序。DPU 通常使用可重新編程的 FPGA 與網卡相結合來加速網絡流量。
DPU是由三個主要元件組成的片上系統。首先,數據處理單元通常有一個軟件可編程的多核 CPU 。第二個元件是高性能網絡接口,它使 DPU 能夠解析、處理并在網絡中有效地傳輸數據。第三個元件是一組豐富的靈活、可編程的加速引擎,它將網絡和存儲功能從 CPU 卸載到 DPU。
此外,DPU 可用于處理包括網絡安全、防火墻任務、加密和基礎設施管理在內的功能。
DPU 最常見的特性是什么?
DPU 具有很多功能,以下是最常見的功能:
1)通過一個或多個 100 Gigabit 到 200 Gigabit 接口的高速連接
2)高速數據包處理
3)基于 ARM 或 MIPS 的 CPU多核處理處理器(8個64位Arm CPU內核)
5)加速器
6)PCI Express Gen 4 支持
7)安全功能
8)自定義操作系統與主機系統的操作系統分離
常見的 DPU 解決方案有哪些?
2021年4月,英偉達發布了新一代數據處理器BlueField-3 DPU。BlueField-3是首款為AI和加速計算而設計的DPU,相比上一代產品,它具有10倍加速計算能力、16個Arm A78 CPU核,和4倍的加密速度。BlueField-3利用英偉達 DOCA(集數據中心于芯片的架構)軟件開發包的優勢,為開發者提供一個完整、開放的軟件平臺,開發在BlueField DPU上開發軟件定義和硬件加速的網絡、存儲、安全和管理等應用。BlueField-3預計將于2022年第一季度發布樣品。
賽靈思和英特爾的一些產品被稱為SmartNIC ,利用FPGA 來加速網絡和存儲功能。智能網卡的工作原理與數據處理單元相同,它們將網絡功能從CPU 卸載到 SmartNIC,通過將網絡和存儲功能智能地委托給 SmartNIC ,從而釋放處理能力。FPGA 的可重新編程特性,為數據路徑帶來了并行性和定制化。
例如,賽靈思提供帶各種產品的 ALVEO 系列SmartNIC,英特爾及其合作伙伴提供了多種基于 FPGA 的 SmartNIC 解決方案,以加速大型數據中心的數據處理工作負載。英特爾稱其 SmartNIC“通過將交換、存儲和安全功能卸載到集成了英特爾 FPGA 和英特爾至強處理器的單一 PCIe 平臺上來提高數據中心的性能水平。” 英特爾提供了第二個更新的 SmartNIC解決方案,稱為 Silicom FPGA SmartNIC N5010,它結合了英特爾 Stratix 10 FPGA 和英特爾以太網 800 系列適配器,為組織提供 4個100 Gigabit 以太網端口,為數據中心提供充足的帶寬。
Fungible是一家位于加利福尼亞的組合式系統初創公司。該公司聲稱其技術能為每100美元的數據中心網絡中的網絡、計算和存儲資源節省67美元。針對以數據為中心(data-centric)應用的處理,Fungible研發了F1 DPU處理器和TrueFabric互聯技術。TrueFabric是由Fungible首先提出的新型大規模數據中心網絡互聯標準,這種Fabric互聯協議基于標準的UDP/IP/Ethernet協議棧構建。
Fungible F1 DPU 外殼
RoCEv2是一種當前數據中心網絡中主流的互聯網絡協議,該協議同樣基于UDP/IP/Ethernet搭建,對終端提供高性能的RDMA Read/Write服務,而TrueFabric對接入點提供高性能的Send/Receive服務。Fungible F1 DPU原生支持TrueFabric,因此F1 DPU可以用于大規模TrueFabric數據中心網絡,不同類型的服務器都可以將Fungible DPU作為網絡接入點。
還有哪些其他性能加速器?
下面是數據中心中經常使用的一些性能加速器,包括 GPU、CSD和 FPGA。
1. GPU
GPU通常部署在數據中心的高性能服務器上,以加速工作負載。服務器通常會將復雜的數學計算卸載到 GPU。因為GPU 采用了一種并行架構,該架構由許多比 CPU 更小的內核組成,使它們能夠并行處理許多任務,從而使組織能夠從服務器中提取更多性能。
來源:英偉達
例如,CPU平均有四到十個核心,而 GPU 有數百或數千個較小的核心,它們一起運行以并行處理復雜的計算。CPU更適合順序數據處理。
安裝在數據中心服務器上的 GPU 非常適合加速深度學習訓練和機器學習訓練,這些訓練需要大量的計算能力,而CPU無法提供。組織使用 GPU 來訓練深度學習和機器學習模型,數據集越大,神經網絡越大,復雜的計算需要很長時間。在某些情況下,深度學習訓練需要幾個小時,但若使用 CPU 執行相同的任務可能需要幾天到幾周的時間。
此外,將GPU 添加到數據中心服務器可顯著提高數據吞吐量,并提供以盡可能低的延遲處理和分析數據的能力。(延遲是指完成給定任務所需的時間量,數據吞吐量是指單位時間內完成的任務數。)
2.計算存儲驅動器(CSD)
計算存儲已經作為性能加速器進入數據中心,在存儲設備級別處理數據,減少了CPU 和存儲設備之間的數據傳輸。計算存儲支持實時數據分析,并通過減少輸入/輸出瓶頸來提高系統性能。CSD看起來與常規存儲驅動器相同,但它們包含一個多核處理器,用于執行一些功能,例如在數據進入存儲設備時對數據進行索引,并在存儲設備中搜索特定條目。
來源:AnandTech
由于實時處理和分析數據的需求不斷增長,CSD越來越受歡迎。數據不再需要在存儲設備和 CPU 之間傳輸。相反,數據在存儲設備本身上進行處理,在數據所在的確切位置為存儲介質提供計算能力,從而實現實時分析和決策。
3. FPGA
FPGA是一種集成電路,由邏輯塊、I/O單元和其他資源組成,允許用戶根據需要執行的工作負載的特定要求以不同的方式重新編程和重新配置芯片。FPGA在執行深度學習推理處理和機器學習推理方面也越來越受歡迎。
來源:Xilinx
在英偉達的帶領下,DPU的概念非常火爆。總體而言,由于數據中心中存儲的數據量不斷增加,需要一種能夠加速高性能數據中心服務器執行的存儲和網絡功能的解決方案,而DPU 可以為現有服務器注入新的活力,發展市場非常巨大,預測到2025年僅中國市場就能達到每年40億美元的規模,估計全球將超過120億美元。
審核編輯 :李倩
-
cpu
+關注
關注
68文章
10863瀏覽量
211786 -
數據中心
+關注
關注
16文章
4778瀏覽量
72130 -
DPU
+關注
關注
0文章
358瀏覽量
24182
原文標題:淺談DPU產業發展現狀
文章出處:【微信號:AI_Architect,微信公眾號:智能計算芯世界】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論