得數(shù)據(jù)中心者的天下,擁有海量數(shù)據(jù)中心的企業(yè),像亞馬遜、英特爾等外企都有自己領(lǐng)先的產(chǎn)品,國(guó)內(nèi)阿里云、騰訊、字節(jié)跳動(dòng)等互聯(lián)網(wǎng)巨頭都在自研DPU產(chǎn)品,此外還有很多DPU創(chuàng)業(yè)公司如云豹智能、星云智聯(lián)、云脈芯聯(lián)、中科馭數(shù)、大禹智芯、益思芯、芯啟源等。
一時(shí)間DPU市場(chǎng)異常火爆,當(dāng)然,這是2020年的情況。
在2020年被英偉達(dá)CEO黃仁勛稱為“數(shù)據(jù)中心第三顆主力芯片”后,DPU就以驚人的速度崛起,成為整個(gè)行業(yè)甚至整個(gè)社會(huì)的關(guān)注重點(diǎn)。
幾年過(guò)去了,國(guó)內(nèi)DPU的分布和格局怎么樣了呢?這篇文章就來(lái)簡(jiǎn)單介紹梳理一下。
先簡(jiǎn)單介紹一下DPU為什么出現(xiàn),解決哪些問(wèn)題。
DPU 處理器是一種低功耗、低成本的專(zhuān)用處理單元,處理數(shù)據(jù)的效率遠(yuǎn)高于同類(lèi)處理器,它出現(xiàn)的底層邏輯是為了提高CPU的處理效率,釋放CPU算力,同時(shí)為CPU和GPU提供基礎(chǔ)數(shù)據(jù)服務(wù)。
由于每個(gè)數(shù)據(jù)中心都具有不同的架構(gòu)和要求,因此 DPU 必須是高度可編程的。所以在DPU技術(shù)路線上,有不同的選擇。DPU有ASIC、FPGA和SoC三種實(shí)現(xiàn)路徑,在成本、編程簡(jiǎn)易性和靈活性方面各有利弊,目前DPU主流的市場(chǎng)方案包括以Arm核為主的架構(gòu)、FPGA+CPU架構(gòu),以及SoC架構(gòu),前兩者已經(jīng)在云計(jì)算廠商得到批量部署,整體看SoC方案則是今后的趨勢(shì)。
DPU需要分擔(dān)數(shù)據(jù)中心其他處理器的工作(可以是網(wǎng)絡(luò)卸載、計(jì)算卸載或數(shù)據(jù)服務(wù)卸載)來(lái)節(jié)省成本,尤其是降低進(jìn)入數(shù)據(jù)中心的資本成本和降低數(shù)據(jù)中心的運(yùn)營(yíng)成本。
DPU的核心作用
DPU最直接的作用是作為CPU的卸載引擎,接管網(wǎng)絡(luò)虛擬化、硬件資源池化等基礎(chǔ)設(shè)施層服務(wù),釋放CPU的算力到上層應(yīng)用。
DPU可以成為新的數(shù)據(jù)網(wǎng)關(guān),將安全隱私提升到一個(gè)新的高度。在網(wǎng)絡(luò)環(huán)境下,網(wǎng)絡(luò)接口是理想的隱私邊界,但是加密、解密算法開(kāi)銷(xiāo)都很大,如果用CPU來(lái)處理,會(huì)消耗掉大量的CPU算力。而這些都可以通過(guò)將其固化在DPU中來(lái)實(shí)現(xiàn)。
DPU也可以成為存儲(chǔ)的入口,將分布式的存儲(chǔ)和遠(yuǎn)程訪問(wèn)本地化。隨著SSD性價(jià)比逐漸可接受,部分存儲(chǔ)遷移到SSD器件上已經(jīng)成為可能,傳統(tǒng)的面向機(jī)械硬盤(pán)的SATA協(xié)議并不適用于SSD存儲(chǔ),所以,將SSD通過(guò)本地PCIe或高速網(wǎng)絡(luò)接入系統(tǒng)就成為必選的技術(shù)路線。
NVMe(Non Volatile Memory Express)就是用于接入SSD存儲(chǔ)的高速接口標(biāo)準(zhǔn)協(xié)議,可以通過(guò)PCIe作為底層傳輸協(xié)議,將SSD的帶寬優(yōu)勢(shì)充分發(fā)揮出來(lái)。同時(shí),在分布式系統(tǒng)中,還可通過(guò)NVMe over Fabrics(NVMe-oF)協(xié)議擴(kuò)展到InfiniBand、Ethernet、或Fibrechannel節(jié)點(diǎn)中,以RDMA的形式實(shí)現(xiàn)存儲(chǔ)的共享和遠(yuǎn)程訪問(wèn)。
這些新的協(xié)議處理都可以集成在DPU中以實(shí)現(xiàn)對(duì)CPU的透明處理。進(jìn)而,DPU將可能承接各種互連協(xié)議控制器的角色,在靈活性和性能方面達(dá)到一個(gè)更優(yōu)的平衡點(diǎn)。
隨著云平臺(tái)虛擬化技術(shù)的發(fā)展,智能網(wǎng)卡的發(fā)展基本可以分為三個(gè)階段
上面簡(jiǎn)單介紹了DPU的發(fā)展背景和概念,下面看看一些在DPU上布局的公司和產(chǎn)品,不完全統(tǒng)計(jì)。
圖片來(lái)源(SDNLAB醬公眾號(hào))
我們挑幾個(gè)熟悉的DPU公司進(jìn)行簡(jiǎn)單介紹
阿里:CIPU
2017年阿里云推出神龍架構(gòu),2022年又發(fā)布了全新的云數(shù)據(jù)中心專(zhuān)用處理器—CIPU,不同于傳統(tǒng)的以CPU為中心的架構(gòu)設(shè)計(jì),CIPU被定義為云計(jì)算的控制和核心性能加速中心。
CIPU向下云化管理數(shù)據(jù)中心硬件,加速計(jì)算、存儲(chǔ)和網(wǎng)絡(luò)資源;向上接入飛天云操作系統(tǒng),將全球上百萬(wàn)臺(tái)服務(wù)器變成一臺(tái)“超級(jí)計(jì)算機(jī)”。
總體來(lái)說(shuō),CIPU主要有兩大功能:一是具備對(duì)底層基礎(chǔ)設(shè)施資源的虛擬化管理能力,二是能承載飛天對(duì)這些資源的編排和調(diào)度需求,并具備計(jì)算、網(wǎng)絡(luò)、存儲(chǔ)、安全等硬件加速能力。
騰訊:水杉、銀衫
2020年9月,騰訊第一代基于FPGA的自研智能網(wǎng)卡正式上線,命名為“水杉”。水杉投入應(yīng)用后,“銀杉”的研發(fā)工作也緊鑼密鼓地啟動(dòng),并于2021年10月正式上線,關(guān)于騰訊芯片的更多細(xì)節(jié),我們?cè)谥耙黄恼掠薪榻B過(guò)(騰訊芯片)。
2021 年 11 月,騰訊發(fā)布了“玄靈”智能網(wǎng)卡芯片,將原來(lái)運(yùn)行在主CPU上的虛擬化、網(wǎng)絡(luò)/存儲(chǔ)IO等功能下移到DPU芯片,實(shí)現(xiàn)了主CPU的零占用,相比業(yè)界產(chǎn)品性能提升了4倍。
這一芯片的目標(biāo)或許和云計(jì)算有關(guān),更進(jìn)一步或許和云游戲相關(guān),游戲業(yè)務(wù)對(duì)騰訊至關(guān)重要,而云游戲則面向未來(lái),通過(guò)玄靈智能網(wǎng)卡芯片,騰訊或?qū)⑦M(jìn)一步完成其在云游戲領(lǐng)域的深入布局。
百度:太行DPU2.0
百度智能云對(duì) DPU2.0的核心定位是“Cloud Native IO Engine”。解決在多租戶、細(xì)粒度算力形態(tài)、后端解耦的硬件資源池架構(gòu)下,海量的 IO 數(shù)據(jù)搬移、通信、處理、安全等等問(wèn)題。
百度太行 DPU2.0主要包含有軟件定義虛擬化,支持萬(wàn)級(jí)虛擬設(shè)備;網(wǎng)絡(luò)硬件加速,由軟件轉(zhuǎn)發(fā)變成硬件轉(zhuǎn)發(fā);高性能的 RDMA 網(wǎng)絡(luò),用自研協(xié)議解決流控留空、擁塞等問(wèn)題;存算分離硬件加速,通過(guò)超大資源池打平本地和遠(yuǎn)程的區(qū)別;云管控硬件通道,保證各形態(tài)計(jì)算實(shí)例共池,實(shí)現(xiàn)熱遷移、熱升級(jí)、熱插拔等特性,支持千億級(jí)模型訓(xùn)練等。
百度太行DPU大致發(fā)展路徑如下所示:
字節(jié)跳動(dòng):DPU
字節(jié)跳動(dòng)擁有海量的數(shù)據(jù),根據(jù)亞馬遜成功的案例來(lái)看,做DPU變得順理成章,為數(shù)據(jù)中心的網(wǎng)絡(luò)、存儲(chǔ)和計(jì)算加速,一方面對(duì)內(nèi)業(yè)務(wù)提供硬件加速服務(wù),另一方面通過(guò)火山引擎產(chǎn)品的方式對(duì)外服務(wù)。關(guān)于字節(jié)的DPU官方信息對(duì)外同步的比較少,感興趣的朋友可以私聊了解內(nèi)部情況。
天翼云:紫金DPU 2.0
天翼云紫金DPU 2.0采用FPGA+SoC架構(gòu),依托于FPGA超高的性能和靈活的可編程特性,將數(shù)據(jù)面全卸載到FPGA,實(shí)現(xiàn)業(yè)務(wù)的直接硬件卸載加速,支持網(wǎng)絡(luò)虛擬化、存儲(chǔ)虛擬化、IO虛擬化、RDMA、高可用等關(guān)鍵技術(shù)。
天翼云紫金DPU主要為天翼云自身產(chǎn)品提供底層和技術(shù)支撐,通過(guò)彈性裸金屬、云主機(jī)、容器等產(chǎn)品進(jìn)行整體售賣(mài),目前已經(jīng)在天翼云部分資源池推廣部署2000+臺(tái)服務(wù)器,后續(xù)將在整個(gè)云數(shù)據(jù)中心全面推廣部署。
新華三:赤霄
新華三自研的赤霄智能加速卡實(shí)現(xiàn)了網(wǎng)絡(luò)無(wú)損、存儲(chǔ)無(wú)損、計(jì)算無(wú)損和安全無(wú)損的全無(wú)損能力。
UIS赤霄智能加速架構(gòu)的核心是實(shí)現(xiàn)了網(wǎng)絡(luò)加速和存儲(chǔ)加速。采用加速卡加速以后,在主機(jī)上僅需運(yùn)行虛擬化平臺(tái),承擔(dān)CPU、內(nèi)存及少量外設(shè)的虛擬化,而網(wǎng)絡(luò)訪問(wèn),存儲(chǔ)訪問(wèn)及存儲(chǔ)的處理邏輯全部下沉到加速卡上去處理。
DPU市場(chǎng)目前進(jìn)入了深水區(qū),考驗(yàn)的就是各家商業(yè)落地和變現(xiàn)能力,互聯(lián)網(wǎng)企業(yè)在這方面有著天然的優(yōu)勢(shì),像亞馬遜、谷歌等就是典型的案例,由于篇幅原因,下一章會(huì)專(zhuān)門(mén)介紹國(guó)內(nèi)專(zhuān)注做DPU的芯片設(shè)計(jì)公司,如云豹智能、星云智聯(lián)、云脈芯聯(lián)、中科馭數(shù)、大禹智芯、益思芯、芯啟源等
-
處理器
+關(guān)注
關(guān)注
68文章
19286瀏覽量
229843 -
網(wǎng)絡(luò)接口
+關(guān)注
關(guān)注
0文章
86瀏覽量
17216 -
DPU
+關(guān)注
關(guān)注
0文章
358瀏覽量
24181
原文標(biāo)題:風(fēng)靡一時(shí)的DPU市場(chǎng),現(xiàn)在怎么樣了?(上)
文章出處:【微信號(hào):IC學(xué)習(xí),微信公眾號(hào):IC學(xué)習(xí)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論