在計(jì)算架構(gòu)和負(fù)載變得愈發(fā)復(fù)雜和多樣的情況下,處理器廠商紛紛開始了自己的造詞之路。要想體現(xiàn)產(chǎn)品定位,又要讓大家對(duì)其縮寫印象深刻,所以PU成了最常見的后綴。現(xiàn)在的處理器家族中已經(jīng)有了不少成員,除了常見的CPU、GPU、APU之外,按照處理對(duì)象的不同,在人工智能和深度學(xué)習(xí)的崛起下,NPU和TPU也紛紛出現(xiàn)。
DPU模糊的定義
不過這些已經(jīng)定義明確的處理單元并不是我們今天的主角,而是找到了全新定義的xPU。什么是xPU,其實(shí)很難定義,這其中有DPU(數(shù)據(jù)處理單元)、IPU(基礎(chǔ)設(shè)施處理單元)和FAC(功能加速卡),這些剛冒頭的產(chǎn)品就是xPU,它們代表了從SmartNIC演化過來并超越其定位的新時(shí)代加速器硬件。除了SmartNIC以外,這些xPU雖然命名不同,但其實(shí)很多時(shí)候,它們是完全重合的,現(xiàn)在為了方便,很多時(shí)候也以DPU統(tǒng)稱。
BlueField-3 DPU / 英偉達(dá)
這樣說DPU的定義還是很模糊,我們就從其特點(diǎn)來看。SmartNIC往往需要主CPU來完成管理工作,DPU雖然往往也屬于一個(gè)主系統(tǒng)中的部件,但卻可以做到完全獨(dú)立,可以部署到邊緣、JBOF存儲(chǔ)和網(wǎng)關(guān)上,并為它們提供網(wǎng)絡(luò)接口和虛擬功能。它的另一項(xiàng)職責(zé)就是幫CPU減輕負(fù)擔(dān),節(jié)省服務(wù)器上有限的處理器核心。
因此,盡管DPU看起來和一些PCIe智能網(wǎng)卡或GPU差不多,但它本質(zhì)上就是一個(gè)為數(shù)據(jù)流和數(shù)據(jù)包處理提供加速、卸載和本地服務(wù)的微型服務(wù)器,在服務(wù)器中提供一個(gè)獨(dú)立單元的同時(shí),又不乏協(xié)助其他單元的處理能力。
什么樣的任務(wù)需要DPU?
至于為什么要用到DPU,這就不得不談到日益增加的數(shù)據(jù)密集型任務(wù)了,短視頻、實(shí)時(shí)金融交易的興起,高帶寬的數(shù)據(jù)流要求數(shù)據(jù)中心對(duì)網(wǎng)絡(luò)、存儲(chǔ)、安全和AI/ML進(jìn)行高效的處理。比如谷歌在數(shù)年前就提到,在他們的數(shù)據(jù)中心里,有三分之一的任務(wù)都是數(shù)據(jù)密集型的,這些都是交由底層基礎(chǔ)設(shè)施完成的,而且這類任務(wù)的占比是在逐步增加的。因?yàn)镃PU和GPU這樣的通用計(jì)算單元并不擅長(zhǎng),所以專門針對(duì)這類任務(wù)優(yōu)化的DPU就得出來?yè)?dān)此大任了。其次就是企業(yè)數(shù)據(jù)中心和公共數(shù)據(jù)中心也想獲得超大規(guī)模巨頭廠商那樣的效率,做到這一點(diǎn)就必須解聚那些昂貴的硬件資源,比如SSD、GPU等,DPU為數(shù)據(jù)中心的解聚提供了極高的效率,優(yōu)化了擁有成本、占用面積和安全性。
DPU可以完成各個(gè)方面的卸載與加速,尤其是在網(wǎng)絡(luò)、安全和存儲(chǔ)這三大塊。在網(wǎng)絡(luò)端,DPU可以有效實(shí)現(xiàn)虛擬路由器,輔助數(shù)據(jù)包交換、定義交換規(guī)則等工作,減少延遲的同時(shí)還能夠提高吞吐量;在安全上,DPU可以用于下一代防火墻(NGFW)的加速,完成數(shù)據(jù)包過濾、內(nèi)容檢測(cè)和報(bào)頭檢測(cè)與重寫,將性能提高數(shù)倍以上;在存儲(chǔ)上,DPU可以卸載高速NVMe/TCP,進(jìn)一步提升存儲(chǔ)性能。最關(guān)鍵的是,這三者都能有效地接管CPU控制面的負(fù)載,節(jié)省CPU本身的計(jì)算核心。
基于DPU的服務(wù)器存儲(chǔ)方案 / Fungible
以上是DPU為服務(wù)器提供的加強(qiáng),主要以PCIe加速卡的形式來提供,此外,還有單獨(dú)的DPU存儲(chǔ)產(chǎn)品。傳統(tǒng)的CPU存儲(chǔ)方案中,整個(gè)系統(tǒng)由DRAM、x86 CPU、SmartNIC、加速器和PCIe接口組成,而在未來的存儲(chǔ)方案,比如高性能存儲(chǔ)、計(jì)算型存儲(chǔ)和軟件定義網(wǎng)絡(luò)應(yīng)用的存儲(chǔ)中,單片集成的方案更能滿足要求,這就是與DRAM結(jié)合的DPU存儲(chǔ)產(chǎn)品。這種方案不僅可以提升IOPS,也能進(jìn)一步降低能耗。
正因如此,數(shù)據(jù)中心會(huì)用DPU來完成數(shù)據(jù)密集型任務(wù),從而減少功耗、擁有成本和占用空間。此外,他們也會(huì)用到基于DPU的存儲(chǔ)、GPU/TPU資源池和主機(jī)卡,來高效地完成高成本硬件資源的解聚。
DPU市場(chǎng)混戰(zhàn)
在不少?gòu)S商對(duì)DPU的宣傳中,往往都會(huì)提到這將是除了CPU和GPU之外的第三大硬件。大家可能覺得類似的承諾,好像一些AI處理器也有提到,但市面上還是GPU占據(jù)主導(dǎo)地位,DPU又會(huì)有何不同呢?事實(shí)證明,市場(chǎng)對(duì)DPU的信心很足,這我們從入局DPU的廠商就能看出。
云霄DPU / 云豹智能
如今制造DPU的企業(yè)分為三種,一是初創(chuàng)公司,比如:云豹智能、星云智聯(lián)、中科馭數(shù)、云脈芯聯(lián)、芯啟源、大禹智芯、Fungible等;二是市面上一些已有的服務(wù)器巨頭,比如AMD/Xilinx、英特爾、Marvel、英偉達(dá);三是CSP(云服務(wù)供應(yīng)商)廠商,比如亞馬遜AWS、微軟Azure、阿里云等等。后者更多是負(fù)責(zé)設(shè)計(jì)或者聯(lián)合設(shè)計(jì)這些xPU,好專用于自己的云服務(wù)器。最終售賣這些DPU的除了DPU廠商外,還有基礎(chǔ)設(shè)施的OEM和ODM,增值分銷商和集成方案廠商,CSP廠商在售賣服務(wù)器的時(shí)候,自然也會(huì)以間接的方式來體現(xiàn)DPU的價(jià)值。
隨著Mellanox被英偉達(dá)收購(gòu),Pensando被AMD收購(gòu),而Fungible的DPU主要針對(duì)存儲(chǔ)加速和卸載,雖然沒有被收購(gòu),但也收獲了軟銀的主導(dǎo)的融資。國(guó)內(nèi)的DPU廠商同樣備受青睞,比如騰訊屢次投資的云豹智能,字節(jié)跳動(dòng)投資的云脈芯聯(lián),美團(tuán)和百度投資的星云智聯(lián)等,這些投資方要么是CSP,要么擁有超大規(guī)模的數(shù)據(jù)中心,他們不像其他CSP大廠,硬件設(shè)計(jì)能力缺乏或有限,卻也看到了DPU的前景。
DPU并不完美
即便大廠看好,但從現(xiàn)狀來看,部署DPU對(duì)某些中小企業(yè)來說依然是雙刃劍。固然,DPU可以卸載基礎(chǔ)設(shè)施的任務(wù),減輕其負(fù)擔(dān),讓服務(wù)器的CPU空出來專注在應(yīng)用本身,更高的效率、更低的擁有成本和更高的安全性也都隨之而來,這些優(yōu)點(diǎn)是幾乎每個(gè)服務(wù)器都能享受到的。
但在部分服務(wù)器中,引入DPU不免增加了服務(wù)器的資本投入,而且相較于CPU、GPU這類硬件來說,它只能卸載和加速特定的負(fù)載,并不是一個(gè)通用加速單元。此外,部分服務(wù)器在增加DPU的情況下還是會(huì)導(dǎo)致功耗提升,在服務(wù)器、數(shù)據(jù)中心紛紛開始節(jié)能減排的當(dāng)下,如何權(quán)衡各個(gè)組件的功耗無疑會(huì)是一個(gè)大問題。還有就是相關(guān)的開發(fā),DPU的靈活性體現(xiàn)在可編程上,但這需要進(jìn)行一定的編程能力,加上目前每家廠商都在單干,也沒有一個(gè)標(biāo)準(zhǔn)的接口,所以在適配上絕對(duì)不輕松,這也是不少DPU選擇Arm作為核心架構(gòu)的原因,就是為了減少其編程的難度。
也正是因?yàn)橐陨线@些理由,從市場(chǎng)滲透率上來看,DPU主要是還是大規(guī)模的CSP廠商用的更多一點(diǎn),加上托管應(yīng)用的增加,這一塊未來也會(huì)驅(qū)動(dòng)DPU產(chǎn)品的銷售。對(duì)于自研DPU的CSP來說,他們肯定會(huì)繼續(xù)加大這方面的投入,進(jìn)一步降低成本,而對(duì)于第三方廠商來說,英偉達(dá)、AMD和英特爾這些服務(wù)器CPU、GPU廠商無疑會(huì)更有優(yōu)勢(shì),因?yàn)樗麄兲峁└?jìng)爭(zhēng)力更強(qiáng)的集成方案。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。
舉報(bào)投訴
-
服務(wù)器
+關(guān)注
關(guān)注
12文章
9231瀏覽量
85625 -
DPU
+關(guān)注
關(guān)注
0文章
365瀏覽量
24213 -
英偉達(dá)
+關(guān)注
關(guān)注
22文章
3791瀏覽量
91313
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
具有邊沿速率加速器的TXB和TXS電壓電平轉(zhuǎn)換器的注意事項(xiàng)
電子發(fā)燒友網(wǎng)站提供《具有邊沿速率加速器的TXB和TXS電壓電平轉(zhuǎn)換器的注意事項(xiàng).pdf》資料免費(fèi)下載
發(fā)表于 09-04 09:52
?0次下載
利用邊沿速率加速器和自動(dòng)感應(yīng)電平轉(zhuǎn)換器
電子發(fā)燒友網(wǎng)站提供《利用邊沿速率加速器和自動(dòng)感應(yīng)電平轉(zhuǎn)換器.pdf》資料免費(fèi)下載
發(fā)表于 09-02 11:58
?1次下載
IaaS+on+DPU(IoD)+下一代高性能算力底座技術(shù)白皮書
數(shù)據(jù)中心的第三顆“主力芯片”,主要通過其專用處理器優(yōu)化數(shù)據(jù)中心的網(wǎng)絡(luò)、存儲(chǔ)、安全等處理性能,助力服務(wù)器運(yùn)行效率顯著提升,有效降低成本。因此,在新型數(shù)據(jù)中心建設(shè)時(shí),圍繞 DPU 構(gòu)建數(shù)據(jù)中心網(wǎng)絡(luò)的基礎(chǔ)設(shè)施
發(fā)表于 07-24 15:32
什么是神經(jīng)網(wǎng)絡(luò)加速器?它有哪些特點(diǎn)?
神經(jīng)網(wǎng)絡(luò)加速器是一種專門設(shè)計(jì)用于提高神經(jīng)網(wǎng)絡(luò)計(jì)算效率的硬件設(shè)備。隨著深度學(xué)習(xí)技術(shù)的快速發(fā)展和廣泛應(yīng)用,神經(jīng)網(wǎng)絡(luò)模型的復(fù)雜度和計(jì)算量急劇增加,對(duì)計(jì)算性能的要求也越來越高。傳統(tǒng)的通用處理器(CPU
西門子推出Catapult AI NN軟件,賦能神經(jīng)網(wǎng)絡(luò)加速器設(shè)計(jì)
西門子數(shù)字化工業(yè)軟件近日發(fā)布了Catapult AI NN軟件,這款軟件在神經(jīng)網(wǎng)絡(luò)加速器設(shè)計(jì)領(lǐng)域邁出了重要一步。Catapult AI NN軟件專注于在專用集成電路(ASIC)和芯片級(jí)系統(tǒng)(SoC)上實(shí)現(xiàn)神經(jīng)網(wǎng)絡(luò)的高層次綜合(HLS),為機(jī)器學(xué)習(xí)應(yīng)用提供了硬件
Arm發(fā)布新一代Ethos-U AI加速器 Arm旨在瞄準(zhǔn)國(guó)產(chǎn)CPU市場(chǎng)
Arm發(fā)布的新一代Ethos-U AI加速器確實(shí)在業(yè)界引起了廣泛關(guān)注。
中科馭數(shù)DPU技術(shù)開放日秀“肌肉”:云原生網(wǎng)絡(luò)、RDMA、安全加速、低延時(shí)網(wǎng)絡(luò)等方案組團(tuán)亮相
DPU技術(shù)開放日既是對(duì)DPU技術(shù)應(yīng)用的典型方案展示,也是DPU技術(shù)在重要細(xì)分場(chǎng)景走向成熟的標(biāo)志。
Hitek Systems開發(fā)基于PCIe的高性能加速器以滿足行業(yè)需求
Hitek Systems 使用開放式 FPGA 堆棧 (OFS) 和 Agilex 7 FPGA,以開發(fā)基于最新 PCIe 的高性能加速器 (HiPrAcc),旨在滿足網(wǎng)絡(luò)、計(jì)算和高容量存儲(chǔ)應(yīng)用的需求。
瑞薩發(fā)布下一代動(dòng)態(tài)可重構(gòu)人工智能處理器加速器
瑞薩最新發(fā)布的動(dòng)態(tài)可重構(gòu)人工智能處理器(DRP-AI)加速器,在業(yè)界引起了廣泛關(guān)注。這款加速器擁有卓越的10 TOPS/W高功率效率,相比傳統(tǒng)技術(shù),效率提升了驚人的10倍。其獨(dú)特之處在于,它能在低功耗的傳統(tǒng)嵌入式處理
家居智能化,推動(dòng)AI加速器的發(fā)展
電子發(fā)燒友網(wǎng)報(bào)道(文/黃山明)AI加速芯片,也稱為人工智能加速器(AI Accelerator),是一種專為執(zhí)行機(jī)器學(xué)習(xí)和深度學(xué)習(xí)任務(wù)而設(shè)計(jì)的ASIC或定制化處理器。在智能家居中,AI加速
回旋加速器原理 回旋加速器的影響因素
回旋加速器(Cyclotron)是一種用于加速帶電粒子的可再生粒子加速器。它的工作原理基于帶電粒子在恒定強(qiáng)磁場(chǎng)中的運(yùn)動(dòng)。本文將詳細(xì)介紹回旋加速器的原理以及影響因素。 一、回旋
回旋加速器中粒子的最大動(dòng)能與什么有關(guān)
回旋加速器是一種用于加速粒子的裝置,通過不斷變化的磁場(chǎng)和電場(chǎng)來不斷加速粒子,使其達(dá)到極高的速度和能量。粒子的最大動(dòng)能取決于幾個(gè)關(guān)鍵因素。 首先,回旋加速器的設(shè)計(jì)和性能對(duì)粒子的最大動(dòng)能有
Wakefield激光加速器 - 能量里程碑
由The University of Texas at Austin物理學(xué)副教授比約恩·“曼努埃爾”·赫格利希(Bjorn “Manuel” Hegelich)領(lǐng)導(dǎo)的國(guó)際研究小組最近展示了一種長(zhǎng)度不到20米的小型粒子加速器,該加速器產(chǎn)生的電子束能量為100億電子伏特(10
評(píng)論