DPU這個概念最近一年多才出現的,被英偉達的 Mellanox 帶火,英偉達和邁威爾這個業務的增速都很高,市場也高看一眼。所幸大廠和中小廠商同一起跑線,國內也能參與競爭。老規矩,按照市場最關心的問題,分如下部分:
1、DPU是什么?
2、DPU解決什么問題?
3、DPU市場空間有多大?
4、DPU能不能成為獨立主流芯片?
5、海內外玩家有哪些?
6、最后會不會一家獨大,贏家通吃?
1、DPU是什么
Data Processing Unit,即數據處理器。DPU最直接的作用是作為CPU的卸載引擎,接管網絡虛擬化、硬件資源池化等基礎設施層服務,釋放CPU的算力到上層應用。以網絡協議處理為例,要線速處理10G的網絡需要的大約4個Xeon CPU的核,也就是說,單是做網絡數據包處理,就可以占去一個8核高端CPU一半的算力。Amazon 把這些開銷都稱之為“Datacenter Tax”,DPU就是把“Datacenter Tax”從CPU 上卸去,轉移到一張專門的加速卡上,DPU。
DPU可以成為新的數據網關,將安全隱私提升到一個新的高度,網絡接口一般是網絡加密,解密的重要邊界,所以海內外都有網絡安全公司做DPU的例子。DPU也可以成為存儲的入口,將分布式的存儲和遠程訪問本地化。
DPU誕生之初,就是一顆異構芯片。DPU不是一顆固化的ASIC,在CXL、CCIX等標準組織倡導CPU、GPU與DPU等數據一致性,DPU編程障礙掃清。國內一些互聯網大廠用FPGA的方式開發DPU,海外飛塔這家公司用的ASIC方式,將DPU的性能加到網安組件里面。
上一個硬件圖吧
國內中科馭數的系統架構:
2、DPU解決什么問題
DPU為什么能火?算力荒!DPU解決的主要是帶寬提速之后,CPU算力被占用,進而卡頓的問題。它的角色是在以前網卡的基礎上再升級,不斷寫入功能在里面,自身優化線路,協議等,慢慢成型的一個玩意。IDC的數據顯示,全球數據量在過去10年年均復合增長率接近50%,并進一步預測每四個月對于算力的需求就會翻一倍。與此相對的是CPU性能每年提升3%,巨大的差距面前,加速芯片獨立了。參照下圖:
數據來源:IDC
DPU 的前身,可以延續到智能網卡。早期智能網卡就是一張高速網卡+FPGA芯片擴展,目的也是加速,但這種組合沒有成為絕對主流。這類智能網卡只被當作FPGA加速卡,有FPGA優勢,也繼承了所有FPGA的局限性。當下DPU是對現有的SmartNIC的一個整合,能看到很多以往SmartNIC的影子,但明顯高于之前任何一個SmartNIC的定位.以后DPU可能不限于75W的控制中,會有獨立的供電系統。
DPU可以應用到很多場景,大的就有三個:網絡功能卸載,儲存功能卸載,安全功能卸載。網絡功能卸載是伴隨云計算網絡而產生的,主要是對云計算主機上的虛擬交換機的能力做硬件卸載,從而減少主機上消耗在網絡上的CPU算力,提高可售賣計算資源;儲存功能卸載,NVMe over Fabric是一個相對較新的協議規范,使用NVMe通過網絡結構將主機連接到存儲,支持對數據中心的計算和存儲進行分解。
NVMe-oF協議定義了使用各種通用的輸協議來實現NVMe功能的方式;安全功能卸載,在傳統的網卡上做云平臺虛擬化,Hypervisor以及對應的虛擬化網絡的實現,都是在主機操作系統上實現的。
引入DPU智能網卡之后,將虛擬化網絡的控制平面完全卸載到智能網卡上,與主機操作系統相隔離。即使黑客攻陷了Hypervisor,獲取了主機操作系統的root權限,也無法篡改虛擬化網絡的配置,這樣可以將黑客的攻擊范圍限制在主機操作系統上,不會影響到虛擬化網絡以及其它主機,做到有效隔離。
3、DPU市場空間有多大
按照海外投行的說法,DPU的潛在市場非常巨大,預測到2025年僅中國市場就能達到每年40億美元的規模,估計全球將超過120億美元,但挑戰與機遇并存。IaaS在國內云服務市場占比約60%,支撐了目前最重要的PaaS的容器云技術。未來幾年,我國仍將維持IaaS為主的云計算結構,預計市場占比將逐上升到70%。
4、DPU能不能成為獨立主流芯片
前面說了,DPU是智能網卡演化而來,能不能成為獨立主流芯片,當下技術還在競爭發展中。
前面說了,DPU是智能網卡演化而來,能不能成為獨立主流芯片,當下技術還在競爭發展中。DPU目前主流形態是外掛”CPU和FPGA會封裝到一個芯片中,形成一個奇怪的通過PCIe總線互聯的兩個CPU系統。這個架構非常簡潔,但同時IPU引發了一個架構性的問題,這個架構到底IPU是中心,還是host CPU是中心?”。因為這方面的技術還在猛烈革新中,所以這三顆大芯片最后的架構怎么樣,誰勝出,還要看。但趨勢是直線向上的。
5、海內外玩家有哪些
從技術流派來講,援引賽迪發布的《2021中國DPU行業發展白皮書》內容:DPU方案分為三種:一是以通用眾核處理器為基礎,以多核ARM為核心,以眾取勝,可編程靈活性較好,但是應用針對性不夠,對于特殊算法和應用的支持與通用CPU相比并無太顯著優勢;二是以專用核為基礎的異構核陣列,針對性較強、性能較好,但是犧牲了部分靈活性;第三種路線結合了前二者優勢,即將通用處理器的可編程靈活性與專用的加速引擎相結合,正在成為最新的產品趨勢。
說的有點抽象,用公司來舉例,以英偉達,英特爾為例, 基于GPU + FPGA技術經驗,數據處理**** ; 賽靈思 被認為是智能網卡玩家 ,基礎的技術線路和方案比較接近。 現在一些FPGA+NP等技術源于這里,有人把這類歸于白皮書里的第三類,折中方案。
通信玩家,博通, Marvell****就是這個路子,他們以數據交換,網絡通信起家,他們的解決方案主要**** 基于ARM內核方案。 新玩家 Fungible思科 **出身,更傾向于 網絡技術 , ARM內核方案。
目前海內外玩家的競爭都集中在服務器網卡, AI加速計算,智能計算和算力的概念聯系上,被上升到計算架構的高度,被一級市場 吹噓到突破摩爾定律。誰知道呢?
具體講講各公司情況,附國內創業公司:
英偉達:NVIDIA收購Mellanox后(intel關注洽談這家很久),在ConnectX系列高速網卡技術基礎上,推出其BlueField系列DPU,DPU定名!Mellanox和intel在阿里項目上歷時十幾個月的PK,累趴對手,成為國內大互聯網廠首個DPU簽約主體。Mellanox以前的產品主要應用在超算,后來技術部門研究可以進入服務器市場。英偉達增速最快的業務就是服務器業務,由于虛擬機和容器(containers)等的流行,應用程序在多臺終端運行,應對數據中心流量爆炸的問題而Mellanox是專家。目前Mellanox的產品在其財報里面數據中心一項,按照最新的電話會議說法,不是受制于產能,增速應該能超過整個數據中心增長。
Xilinx:被AMD收購,早前出了Alveo系列加速卡。
Intel :2015年底收購了Xilinx的競爭對手——Altera,進一步開發硬件加速能力。2021年6月發布IPU產品(名字不一樣),將FPGA與Xeon D系列處理器集成,成為了DPU賽道有力的競爭者。
Marvall:2021 年發布OCTEON 10 DPU產品,不僅具備強大的轉發能力,還具有突出的AI處理能力。
還有一些參與主體:互聯網廠商,內部也有改善服務器速度的開發自研計劃。Google、Amazon,阿里巴巴等。
注:Fungible成立于2015年,目前擁有約200名員工,總籌資超過3億美元。其他投資者包括Battery Ventures,Mayfield Fund,Redline Capital和Walden Riverwood Ventures。其新資本將用于加速產品開發。
國內的玩家都是初創期,擁有一個大的客戶,或者行業熟悉客戶,打磨自己的DPU產品,因為現在海內外同一起跑線,所以看起各家融資ppt都賊牛逼。
6、最后會不會一家獨大、贏家通吃
目前要解決DPU標準化應用,還存在一定挑戰。由于數據中心本身的復雜性,各大廠商一方面采用COTS組件來構建系統,追求低成本,一方面又設法分層服務化(IaaS,PaaS,SaaS),打造面向不用類型客戶的標準化產品。內容方AWS有Nitro,阿里云有MOC,反正就是五花八門——有的廠商強化IO能力、有的關注路由轉發、有的重視存儲卸載、有的關注安全加密。
至于有沒有贏家通吃,一家獨大,類似CPU,GPU這樣的格局出現,目前暫時看不到,只能說,數據爆發的階段,大家都有碗飯吃。
首先,DPU是一種專用處理器,與通用CPU的發展路徑有所不同。專用計算重點放在數據平面,而通用計算重點放在控制平面。作為專用處理器,DPU的功能是收斂的,不用太多考慮多元化,代際兼容等問題。典型的“先垂直深耕,再水平擴展”的路徑,所以在初期,會有針對不同領域,不同類型甲方的異構產品出現。
需求不同,產品就容易碎片化,例如各大公有云廠商、電信運營商等都有比較完整、也比較封閉的底層架構和應用生態。上層負載不同,必然對底層架構有各異的需求,這也許是目前DPU標準化面臨的最大的挑戰
當然這里的碎應該不是貶義詞,應該指“?!?,畢竟DPU不是一個人人都能進入的賽道。由其專用性,需要長期行業“Knowhow”持續打磨迭代產品,這對于行業內初創公司才有更大的生存空間,大家同一起跑線。DPU當下類似于工業軟件,需要上下游企業,甲方乙方共同來構建良性、開放的生態環境。
傳統的“one-size-fit-all”的ASIC商業模式,通過上量來攤薄芯片研發的巨額NRE成本本身還是有效的。所以專用DPU最終也要謀求“水平擴展”來覆蓋更多的場景,還是要盡可能把各異的需求整合起來,并且適應不同廠商。
也許十年后,在競爭合作中博弈出了滿足各種行業需求的產品,兼顧靈活性與成本。也許十年后的DPU能解決復雜網絡、安全、存儲、虛擬化等方面的問題,真真正正成為舉足輕重的“第三顆大芯片”。
-
cpu
+關注
關注
68文章
10863瀏覽量
211767 -
DPU
+關注
關注
0文章
358瀏覽量
24181 -
數據處理器
+關注
關注
0文章
26瀏覽量
8654
發布評論請先 登錄
相關推薦
評論