最近一段時間,DPU成為越來越熱的一個話題。芯啟源智能網卡是目前國內唯一的基于SoC架構的成熟DPU(Data Processing Unit,數據處理單元)完整解決方案,并擁有自主知識產權,已成熟量產,可提供從芯片、板卡、驅動軟件和全套云網解決方案產品,已獲得了中國移動蘇研院的首批智能網卡訂單。
最近英特爾發布了一款IPU,這可以說是對英偉達DPU的一個回應。因為從英特爾對IPU介紹的字面意思來看,“釋放CPU開銷”、“可編程”、“智能網卡”這幾個特性與當下火熱的DPU的作用如出一轍。
在Nvidia以及Marvell、Broadcom和 VMware等其他制造商中,智能網卡被稱為數據處理單元 (DPU),并且已經出現了好幾代,如 Nvidia的BlueField。其實不止國外,國內DPU的創新市場也不斷有玩家涌現,諸如芯啟源、中科馭數、星云智聯等本土DPU企業也正在排兵布陣。不過隨著英特爾的加入,這個新戰場將更加熱鬧無比。
DPU走上歷史舞臺
去年10月,由于Nvidia 將基于Mellanox的SmartNIC卡命名為“DPU”,DPU這一概念一炮而紅。其實DPU這個概念是Fungible最先提的,然后被NVIDIA發揚光大。不到一年時間,DPU成為業界追逐的話題、資本界青睞的細分賽道、廠商們競相研發的技術。
為何DPU這么受追捧,或者說我們為什么需要DPU呢?
現在除了主內存和輔助內存之外的所有計算都是在CPU上完成的,面對超大規模數據處理的需求,CPU的算力已經達到瓶頸,所以就需要硬件加速。但數據中心服務器上運行有這么多性能的敏感任務,又不可能為每一個任務分配一張加速卡。所以就需要一個通用的加速平臺來整合這些加速任務。
DPU正是這樣一個存在,它被定位為完成性能敏感的并且通用的工作任務加速處理。由DPU完成基礎的工作任務,構建強大的基礎設施層,上層的CPU和GPU來完成其他更有價值的工作。
那么,究竟什么是DPU?相比CPU和GPU,DPU究竟為何與眾不同?
DPU 是一種新型的可編程處理器,DPU 是一種片上系統或 SoC,它結合了3個關鍵因素:
(1)行業標準、高性能、軟件可編程的多核 CPU,通常基于廣泛使用的 Arm 架構,與其他SoC組件緊密耦合。
(2)一種高性能網絡接口,能夠以線速或網絡其余部分的速度解析、處理和有效地將數據傳輸到 GPU 和 CPU。
(3)一組豐富的靈活可編程加速引擎,可為 AI 和機器學習、安全、電信和存儲等卸載并提高應用程序性能。
DPU最核心的任務是IO數據的預處理和后處理,如網絡類任務(虛擬網絡、IPSec等)、存儲類任務(分布式存儲、數據加解密、數據壓縮、數據冗余算法等)、虛擬化加速(虛擬化整體Offload,業務管理分離)、安全和認證類的任務(Root of Trust 等)。
或者,從云計算業務的角度看,我們可以看做是,DPU是把整個IaaS的服務完整的Offload到硬件來做加速。
如此看來,關于DPU的應用上,一線的云運營商對DPU的需求會更強烈。因為,數據中心規模足夠大的緣故,任何一個任務的Offload到硬件都意味著非常顯著的成本降低,這些都是最直接的利潤。隨著整個軟硬件技術棧的演進,DPU的采用會逐步擴展到所有的云運營商,以及其他各類數據中心。
看到了DPU如此重要且具有意義的作用,目前在國際上參與DPU研發設計的廠商既有Intel、Broadcom、Marvall、Nvidia等巨頭,也有Fungible、Pensando等初創公司。
各家的打法也不太相同,不過兩個在數據中心領域一直虎狼之斗的兩大巨頭英特爾和英偉達,還是很有看點的,他們是如何應對當下以及未來復雜數據處理問題的?
英偉達的DPU產品先行
英特爾的IPU理念超前
如今,數據中心已經成為英特爾、英偉達、AMD這些老牌芯片巨頭未來爭奪的主戰場,而且英偉達收購Arm的意圖,也是想能進一步占據數據中心服務器市場,其DPU就是集成了Arm的核,這可以說是取代英特爾的X86 CPU的一個切入點。
在DPU領域,英偉達可以說是先行者,且這幾年其BlueField系列產品迭代速率也很快。英偉達在DPU上的技術突破,來自于收購以色列芯片制造公司Mellanox之后,英偉達在這家公司的硬件基礎上開發出BlueField系列的兩款DPU——英偉達BlueField-2 DPU與BlueField-2X DPU。
Nvidia于今年春季發布的BlueField-3 DPU承諾可卸載多達 300 個 CPU 內核的 I/O 任務。目前其技術路線圖已經到了BlueField-4。
此外,英偉達還推出了DOCA的軟件開發套件,這是一種集數據中心功能于芯片的架構,可助力開發者輕松地對 BlueField DPU 進行編程。DOCA是為DPU量身定做的軟件框架,目的在于支持廣大開發者在 BlueField DPU上進行軟件開發。
DOCA與DPU之間就如 CUDA與GPU的關系。向上,DOCA 可以給程序員提供簡單的開發接口,同時向下平滑兼容與支持每一代 BlueField DPU 的產品。據英偉達稱,DOCA能實現從單芯片級數據中心到3U(CPU、GPU、DPU)一體超大規模數據中心統一架構。
而就在6月15日的Six Five峰會上,英特爾推出了全新的基礎設施處理器(IPU)。首先要明確的是,英特爾的IPU不應與英特爾自己的成像處理單元 (IPU) 或英特爾平臺更新 (IPU) ,還有來自Mellanox(現在是NVIDIA)的IPU和Graphcore IPU所混淆,他們所定義的IPU意思都不一樣。
其實細細看來,英特爾的IPU不是什么新鮮事物,跟當下主流的DPU作用類似。據英特爾官方的說法,IPU是一種可編程網絡設備,旨在使云和通信服務提供商減少在中央處理器(CPU)方面的開銷,并充分釋放性能價值。
利用IPU,客戶能夠部署安全穩定且可編程的解決方案,從而更好地利用資源,平衡數據處理與存儲的工作負載。它擴展了英特爾的智能網卡功能,旨在應對當下復雜的數據中心,并提升效率。
英特爾的IPU能干啥呢?其IPU可以通過專用協議加速器來加速基礎設施功能,包括存儲虛擬化、網絡虛擬化和安全;通過把軟件中的存儲和網絡虛擬化功能從CPU轉移到IPU,從而釋放CPU核心。還能允許靈活的工作負載分配,提高數據中心利用率。
據英特爾稱,目前英特爾已經使用 FPGA 部署了 IPU,微軟、百度、京東云和 VMWare是買家。通過特定功能,IPU可對數據中心中基于微服務架構的現代應用程序進行加速。谷歌和Facebook的研究表明,微服務通信開銷可消耗22%到80%的CPU性能。
據了解,英特爾將推出更多基于FPGA的IPU平臺和專用 ASIC,不過這些最終會是什么樣子以及它們將實現什么都尚未說明。無論 IPU 最終變成什么樣,這都是朝著分解邁出的明確一步,也是未來形成組件化“至強平臺”的巨大飛躍。
那么如何看待兩家的發展的思路呢?關于這點,筆者有幸采訪到了軟硬件融合技術理念倡導者、(前)Ucloud芯片及硬件研發負責人黃朝波,對于英特爾此次推出的IPU,黃朝波認為其理念超前,但實際的產品,現在還是FPGA,要看后面芯片的版本會怎么樣。
而在其《軟硬件融合》一書中對于超大規模云計算架構的創新上已有很深的見解,在他看來,在數據中心軟硬件結合的發展全貌是:
第一階段:智能網卡(SmartNIC)。管理側網絡后臺任務是最先遇到資源消耗挑戰問題的,典型的如Os,在25bit/s下占用的CPU資源已經非常顯著。智能網卡就是為卸載網絡相關工作任務而設計的。
第二階段:數據處理器(DPU)。從本質上來說,在智能網卡的基礎上行,不僅僅是網絡,而是整個I/O相關的工作任務處理都會面臨資源消耗的挑戰問題,因此DPU在網絡卸載的基礎上,加入了存儲卸載及虛擬化卸載的解決方案。
更進一步的:基礎設施處理器(Infrastructure Process Unit,IPU)。從云計算公司的角度來看,基礎設施處理器平臺不僅承載網絡、存儲及虛擬化的卸載,還需要承擔安全、管理、監控等各種管理面的功能,更為關鍵的是物理隔離業務和管理:業務在CPU和GPU,管理在DPU(或者更準確地稱為IPU)。
更貼合用戶需求的:彈性的基礎設施處理器(elastic IPU,eIPU)。隨著業務規模的進一步擴大,云計算公司對底層芯片提出了新的需求。
在傳統芯片需求的基礎上,新的需求體現在:差異化的產品開發、高效的業務卸載及快速迭代。對功能擴展而言,傳統的解決方案都是基于集成或獨立CPU實現的軟件功能擴展。
在云計算場景中,需要更加極致的性能,基于CPU的軟件方案已經無法滿足要求,這就需要通過硬件方式(eIPU方案)來實現高性能的功能擴展,提供性能強大、開發低門檻的硬件功能彈性。
國內DPU玩家入局
在DPU這個創新的市場上,國內這幾年不乏有玩家提早布局,而且現在資本市場也非常青睞DPU這個細分賽道,據投中網的報道,現在頭部的DPU項目已經呈現出了熱火烹油的機構爭搶態勢。國內的DPU初創企業正迎來發展的大好時機。
中科馭數算是國內布局較早的一家DPU企業,其創始團隊來自于中科院計算所體系結構國家重點實驗室。而且其DPU基于自主研發的KPU架構,KPU(Kernel Processing Unit)架構是中科馭數基于軟件定義加速器技術路線自主研發的芯片架構。以KPU架構為核心,2019年其設計了業界首顆數據庫與時序數據處理融合加速芯片,已經成功流片。
今年初,中科馭數宣布了其下一顆DPU芯片研發計劃,功能層面包括完善的L2/ L3/L4層的網絡協議處理,可處理高達200G網絡帶寬數據。該顆芯片預計將于2021年底流片。
截至目前,中科馭數已經布局126項發明專利,其中47項已獲得授權,馭數圍繞KPU(Kernel Processing Unit)芯片架構、基礎軟件和計算系統,建立了較完善的知識產權體系。
在應用領域方面,中科馭數從金融行業入手,除了深耕金融領域,2021年中科馭數產品的商業應用還將逐步拓展到混合云、數據中心、電信通信等領域。前段時間剛與中移物聯網達成戰略合作,雙方將在邊緣端網絡處理、異構算力基礎設施領域建立合作。
6月11日消息,DPU芯片企業“芯啟源”宣布完成數億元Pre-A3輪融資,本輪融資由SIG海納亞洲、浦東科創、晶晨半導體、熠美投資(市北高新大數據基金)等聯合投資,既有股東軟銀中國在本輪繼續追加投資。本輪融資將用于吸引研發人才與管理人才加入團隊,并啟動DPU芯片下一階段技術研發和市場拓展。
芯啟源成立于2015年,芯啟源是一家針對超大規模電信和企業級的智能網絡提供核心芯片和系統的高科技公司,擁有兩大板塊核心產品。
據其官微介紹,芯啟源智能網卡是目前國內唯一的基于SoC架構的成熟DPU(Data Processing Unit,數據處理單元)完整解決方案,并擁有自主知識產權,已成熟量產,可提供從芯片、板卡、驅動軟件和全套云網解決方案產品,已獲得了中國移動蘇研院的首批智能網卡訂單。
據企查查顯示,另外一家DPU芯片企業星云智聯成立于2021年3月22日,該公司專注于數據中心基礎互聯通信架構和DPU芯片研發。今年4月份,珠海星云智聯宣布完成數億元天使輪融資,由高瓴創投(GL Ventures)領投,鼎暉VGC(鼎暉創新與成長基金)、華登國際中國基金參與跟投。
據介紹,其正在研發的DPU將在 IAAS和PAAS之間形成獨立的CAAS(通信服務層),實現物理資源的“多虛一”和近乎裸金屬性能的“一虛多”,簡化IAAS,提升資源利用率;
卸載PAAS中與通信數據流相關的處理,提升應用的通信效率和性能。從而實現數據中心架構的跨越式發展,有力支撐云計算、HPC、AI等業務的指數級增長,形成一個超300億美元的新市場。
就目前形勢來看,不論各家公司如何發揮各自專長去設計DPU芯片,都將推動整體行業的向前發展。
結語
據IDC統計,近10年來全球算力增長明顯滯后于數據增長。全球算力的需求每3.5個月就會翻一倍,遠遠超過了當前算力的增長速度。而算力源于芯片,業內人士預測,DPU將成為繼CPU和GPU之后重要的算力芯片。
以數據為中心的計算架構成為了趨勢,網絡計算和DPU成為以數據為中心計算架構的核心。黃朝波認為:“未來所有的服務器都會配備1-2塊DPU/IPU卡”。DPU作為算力新型基礎設施中的新物種,將在數據傳輸、存儲、運算等方面扮演越來越重要的角色,算力時代DPU可以讓不可能成為可能。
編輯:jq
-
cpu
+關注
關注
68文章
10863瀏覽量
211786 -
soc
+關注
關注
38文章
4165瀏覽量
218273 -
DPU
+關注
關注
0文章
358瀏覽量
24182 -
可編程處理器
+關注
關注
0文章
5瀏覽量
6691
原文標題:巨頭們開辟DPU“芯”戰場
文章出處:【微信號:corigine,微信公眾號:芯啟源】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論