在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

DPU 技術(shù)發(fā)展概況系列(三) DPU的發(fā)展背景

中科馭數(shù)(北京)科技有限公司 ? 2022-04-06 14:20 ? 次閱讀

DPU的出現(xiàn)是異構(gòu)計算的又一個階段性標(biāo)志。摩爾定律放緩使得通用CPU性能增長的邊際成本迅速上升,數(shù)據(jù)表明現(xiàn)在CPU的性能年化增長(面積歸一化之后)僅有3%左右,但計算需求卻是爆發(fā)性增長,這幾乎是所有專用計算芯片得以發(fā)展的重要背景因素。以AI芯片為例,最新的GPT-3等千億級參數(shù)的超大型模型的出現(xiàn),將算力需求推向了一個新的高度。DPU也不例外。隨著2019年我國以信息網(wǎng)絡(luò)等新型基礎(chǔ)設(shè)施為代表的“新基建”戰(zhàn)略帷幕的拉開,5G、千兆光纖網(wǎng)絡(luò)建設(shè)發(fā)展迅速,移動互聯(lián)網(wǎng)、工業(yè)互聯(lián)網(wǎng)、車聯(lián)網(wǎng)等領(lǐng)域發(fā)展日新月異。云計算、數(shù)據(jù)中心、智算中心等基礎(chǔ)設(shè)施快速擴容。網(wǎng)絡(luò)帶寬從主流10G朝著25G、40G、100G、200G甚至400G發(fā)展。網(wǎng)絡(luò)帶寬和連接數(shù)的劇增使得數(shù)據(jù)的通路更寬、更密,直接將處于端、邊、云各處的計算節(jié)點暴露在了劇增的數(shù)據(jù)量下,而CPU的性能增長率與數(shù)據(jù)量增長率出現(xiàn)了顯著的“剪刀差”現(xiàn)象。所以,尋求效率更高的計算芯片就成為了業(yè)界的共識。DPU芯片就是在這樣的趨勢下提出的。

一、帶寬性能增速比(RBP)失調(diào)

摩爾定律的放緩與全球數(shù)據(jù)量的爆發(fā)這個正在迅速激化的矛盾通常被作為處理器專用化的大背景,正所謂硅的摩爾定律雖然已經(jīng)明顯放緩,但“數(shù)據(jù)摩爾定律”已然到來。IDC的數(shù)據(jù)顯示,全球數(shù)據(jù)量在過去10年年均復(fù)合增長率接近50%,并進一步預(yù)測每四個月對于算力的需求就會翻一倍。因此必須要找到新的可以比通用處理器帶來更快算力增長的計算芯片,DPU于是應(yīng)運而生。這個大背景雖然有一定的合理性,但是還是過于模糊,并沒有回答DPU之所以新的原因是什么,是什么“量變”導(dǎo)致了“質(zhì)變”?

從現(xiàn)在已經(jīng)公布的各個廠商的DPU架構(gòu)來看,雖然結(jié)構(gòu)有所差異,但都不約而同強調(diào)網(wǎng)絡(luò)處理能力。從這個角度看,DPU是一個強IO型的芯片,這也是DPU與CPU最大的區(qū)別。CPU的IO性能主要體現(xiàn)在高速前端總線(在Intel的體系里稱之為FSB,F(xiàn)ront Side Bus),CPU通過FSB連接北橋芯片組,然后連接到主存系統(tǒng)和其他高速外設(shè)(主要是PCIe設(shè)備)。目前更新的CPU雖然通過集成存儲控制器等手段弱化了北橋芯片的作用,但本質(zhì)是不變的。CPU對于處理網(wǎng)絡(luò)處理的能力體現(xiàn)在網(wǎng)卡接入鏈路層數(shù)據(jù)幀,然后通過操作系統(tǒng)(OS)內(nèi)核態(tài),發(fā)起DMA中斷響應(yīng),調(diào)用相應(yīng)的協(xié)議解析程序,獲得網(wǎng)絡(luò)傳輸?shù)臄?shù)據(jù)(雖然也有不通過內(nèi)核態(tài)中斷,直接在用戶態(tài)通過輪詢獲得網(wǎng)絡(luò)數(shù)據(jù)的技術(shù),如Intel的DPDK,Xilinx的Onload等,但目的是降低中斷的開銷,降低內(nèi)核態(tài)到用戶態(tài)的切換開銷,并沒有從根本上增強IO性能)。可見,CPU是通過非常間接的手段來支持網(wǎng)絡(luò)IO,CPU的前端總線帶寬也主要是要匹配主存(特別是DDR)的帶寬,而不是網(wǎng)絡(luò)IO的帶寬。

相較而言,DPU的IO帶寬幾乎可以與網(wǎng)絡(luò)帶寬等同,例如,網(wǎng)絡(luò)支持25G,那么DPU就要支持25G。從這個意義上看,DPU繼承了網(wǎng)卡芯片的一些特征,但是不同于網(wǎng)卡芯片,DPU不僅僅是為了解析鏈路層的數(shù)據(jù)幀,而是要做直接的數(shù)據(jù)內(nèi)容的處理,進行復(fù)雜的計算。所以,DPU是在支持強IO基礎(chǔ)上的具備強算力的芯片。簡言之,DPU是一個IO密集型的芯片;相較而言,GPU還是一個計算密集型芯片。

進一步地,通過比較網(wǎng)絡(luò)帶寬的增長趨勢和通用CPU性能增長趨勢,能發(fā)現(xiàn)一個有趣的現(xiàn)象:帶寬性能增速比(RBP,Ratioof Bandwidth and Performance growth rate)失調(diào)。RBP定義為網(wǎng)絡(luò)帶寬的增速比上CPU性能增速,即RBP=BW GR/Perf. GR如下圖所示,以Mellanox的ConnectX系列網(wǎng)卡帶寬作為網(wǎng)絡(luò)IO的案例,以Intel的系列產(chǎn)品性能作為CPU的案例,定義一個新指標(biāo)“帶寬性能增速比”來反應(yīng)趨勢的變化。

pYYBAGJNCUuADcc9AAUNDJD5fX0561.png

圖 帶寬性能增速比(RBP)失調(diào)

2010年前,網(wǎng)絡(luò)的帶寬年化增長大約是30%,到2015年微增到35%,然后在近年達到45%。相對應(yīng)的,CPU的性能增長從10年前的23%,下降到12%,并在近年直接降低到3%。在這三個時間段內(nèi),RBP指標(biāo)從1附近,上升到3,并在近年超過了10!如果在網(wǎng)絡(luò)帶寬增速與CPU性能增速近乎持平,RGR~1,IO壓力尚未顯現(xiàn)出來,那么當(dāng)目前RBP達到10倍的情形下,CPU幾乎已經(jīng)無法直接應(yīng)對網(wǎng)絡(luò)帶寬的增速。RBP指標(biāo)在近幾年劇增也許是DPU終于等到機會“橫空出世”的重要原因之一。

二、異構(gòu)計算發(fā)展趨勢的助力

DPU首先作為計算卸載的引擎,直接效果是給CPU“減負(fù)”。DPU的部分功能可以在早期的TOE(TCP/IP Offloading Engine)中看到。正如其名,TOE就是將CPU的處理TCP協(xié)議的任務(wù)“卸載”到網(wǎng)卡上。傳統(tǒng)的TCP軟件處理方式雖然層次清晰,但也逐漸成為網(wǎng)絡(luò)帶寬和延遲的瓶頸。軟件處理方式對CPU的占用,也影響了CPU處理其他應(yīng)用的性能。TCP卸載引擎(TOE)技術(shù),通過將TCP協(xié)議和IP協(xié)議的處理進程交由網(wǎng)絡(luò)接口控制器進行處理,在利用硬件加速為網(wǎng)絡(luò)時延和帶寬帶來提升的同時,顯著降低了CPU處理協(xié)議的壓力。具體有三個方面的優(yōu)化:1)隔離網(wǎng)絡(luò)中斷,2)降低內(nèi)存數(shù)據(jù)拷貝量,3)協(xié)議解析硬件化。這三個技術(shù)點逐漸發(fā)展成為現(xiàn)在數(shù)據(jù)平面計算的三個技術(shù),也是DPU普遍需要支持的技術(shù)點。例如,NVMe協(xié)議,將中斷策略替換為輪詢策略,更充分的開發(fā)高速存儲介質(zhì)的帶寬優(yōu)勢;DPDK采用用戶態(tài)調(diào)用,開發(fā)“Kernel-bypassing”機制,實現(xiàn)零拷貝(Zeor-Copy);在DPU中的面向特定應(yīng)用的專用核,例如各種復(fù)雜的校驗和計算、數(shù)據(jù)包格式解析、查找表、IP安全(IPSec)的支持等,都可以視為協(xié)議處理的硬件化支持。所以,TOE基本可以被視為DPU的雛形。

延續(xù)TOE的思想,將更多的計算任務(wù)卸載至網(wǎng)卡側(cè)來處理,促進了智能網(wǎng)卡(SmartNIC)技術(shù)的發(fā)展。常見的智能網(wǎng)卡的基本結(jié)構(gòu)是以高速網(wǎng)卡為基本功能,外加一顆高性能的FPGA芯片作為計算的擴展,來實現(xiàn)用戶自定義的計算邏輯,達到計算加速的目的。然而,這種“網(wǎng)卡+FPGA”的模式并沒有將智能網(wǎng)卡變成一個絕對主流的計算設(shè)備,很多智能網(wǎng)卡產(chǎn)品被當(dāng)作單純的FPGA加速卡來使用,在利用FPGA優(yōu)勢的同時,也繼承了所有FPGA的局限性。DPU是對現(xiàn)有的SmartNIC的一個整合,能看到很多以往SmartNIC的影子,但明顯高于之前任何一個SmartNIC的定位。

Amazon的AWS在2013研發(fā)了Nitro產(chǎn)品,將數(shù)據(jù)中心開銷(為虛機提供遠(yuǎn)程資源,加密解密,故障跟蹤,安全策略等服務(wù)程序)全部放到專用加速器上執(zhí)行。Nitro架構(gòu)采用輕量化Hypervisor配合定制化的硬件,將虛擬機的計算(主要是CPU和內(nèi)存)和I/O(主要是網(wǎng)絡(luò)和存儲)子系統(tǒng)分離開來,通過PCIe總線連接,節(jié)省了30%的CPU資源。阿里云提出的X-Dragon系統(tǒng)架構(gòu),核心是MOC卡,有比較豐富的對外接口,也包括了計算資源、存儲資源和網(wǎng)絡(luò)資源。MOC卡的核心X-Dragon SOC,統(tǒng)一支持網(wǎng)絡(luò),IO、存儲和外設(shè)的虛擬化,為虛擬機、裸金屬、容器云提供統(tǒng)一的資源池。

可見,DPU其實在行業(yè)內(nèi)已經(jīng)孕育已久,從早期的網(wǎng)絡(luò)協(xié)議處理卸載,到后續(xù)的網(wǎng)絡(luò)、存儲、虛擬化卸載,其帶來的作用還是非常顯著的,只不過在此之前DPU“有實無名”,現(xiàn)在是時候邁上一個新的臺階了。

來源:專用數(shù)據(jù)處理器(DPU)技術(shù)白皮書,中國科學(xué)院計算技術(shù)研究所,鄢貴海等

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • DPU
    DPU
    +關(guān)注

    關(guān)注

    0

    文章

    358

    瀏覽量

    24182
收藏 人收藏

    評論

    相關(guān)推薦

    直流高壓電源技術(shù)發(fā)展淺析

    直流高壓電源是產(chǎn)生直流高壓電能的裝置,由市電或相電輸入,經(jīng)過變換產(chǎn)生數(shù)千伏到百萬伏直流電壓輸出,可穩(wěn)壓或穩(wěn)流。 直流高壓電源作為現(xiàn)代電力電子技術(shù)的重要組成部分,廣泛應(yīng)用于工業(yè)控制、醫(yī)療器械、電加熱
    發(fā)表于 11-28 18:20

    無線充電技術(shù)發(fā)展趨勢

    目前無線充電技術(shù)還處于發(fā)展階段,距離方案的成熟尚需不斷探索和完善!降低熱損耗,提升效率縮短充電時間,改良充電曲線以更好的保護負(fù)載設(shè)備(終端或者電池等)。
    發(fā)表于 08-03 14:26

    中科馭數(shù)分析DPU在云原生網(wǎng)絡(luò)與智算網(wǎng)絡(luò)中的實際應(yīng)用

    CCF Chip 2024,精彩不能停!7月21日下午,中科馭數(shù)在第二屆中國計算機學(xué)會(CCF)芯片大會的“馭數(shù)專屬時刻”仍在繼續(xù),馭數(shù)組織承辦“DPU技術(shù)趨勢和應(yīng)用——DPU在云原生與智算網(wǎng)絡(luò)中
    的頭像 發(fā)表于 08-02 11:21 ?710次閱讀

    IaaS+on+DPU(IoD)+下一代高性能算力底座技術(shù)白皮書

    了可觀的經(jīng)濟效益。這種正向循環(huán)促進了相關(guān)技術(shù)棧的快速迭代與成熟,也幫助他們發(fā)展成為云計算業(yè)務(wù)領(lǐng)域的領(lǐng)軍企業(yè)。 隨著眾多芯片廠商投身到 DPU 技術(shù)領(lǐng)域后,業(yè)界對
    發(fā)表于 07-24 15:32

    中科馭數(shù)發(fā)布第DPU芯片K2 Pro,較上一代能耗降低30%

    基于該芯片的自研芯片架構(gòu)和專用的指令集技術(shù)。 ? 該公司表示,之所以發(fā)布一整套技術(shù)而非單顆芯片,是因為它們相互依賴、相互增強,共同構(gòu)成了一個高效、靈活且功能強大的DPU解決方案。 ? 中科馭數(shù) 已完成
    的頭像 發(fā)表于 07-01 07:32 ?3566次閱讀

    中科馭數(shù)CEO鄢貴海:從計算系統(tǒng)的個視角重新審視DPU的核心價值

    在信息技術(shù)日新月異的浪潮中,DPU正逐漸嶄露頭角。當(dāng)前,DPU發(fā)展的核心驅(qū)動力來自于什么?DPU技術(shù)
    的頭像 發(fā)表于 06-28 14:27 ?483次閱讀
    中科馭數(shù)CEO鄢貴海:從計算系統(tǒng)的<b class='flag-5'>三</b>個視角重新審視<b class='flag-5'>DPU</b>的核心價值

    芯片軟件全上陣 DPU“全家桶”來了!中科馭數(shù)成功舉辦2024產(chǎn)品發(fā)布會

    6月19日,中科馭數(shù)2024產(chǎn)品發(fā)布會在北京中關(guān)村展示中心正式舉辦。聚焦自研DPU核心技術(shù),中科馭數(shù)重磅發(fā)布最新一代DPU芯片K2 Pro、軟件開發(fā)平臺HADOS、以及一系列針對數(shù)據(jù)中
    的頭像 發(fā)表于 06-23 11:09 ?854次閱讀
    芯片軟件全上陣 <b class='flag-5'>DPU</b>“全家桶”來了!中科馭數(shù)成功舉辦2024產(chǎn)品發(fā)布會

    中科馭數(shù)發(fā)布高性能DPU芯片K2-Pro

    在信息技術(shù)領(lǐng)域,每一次芯片技術(shù)的突破都代表著行業(yè)的一次飛躍。近日,DPU領(lǐng)域的領(lǐng)軍企業(yè)中科馭數(shù)宣布,成功研發(fā)并發(fā)布了其第DPU芯片——“
    的頭像 發(fā)表于 06-21 11:41 ?779次閱讀

    芯啟源DPU賦能綠色數(shù)據(jù)中心,助力實現(xiàn)雙碳戰(zhàn)略

    近日,深圳市計算機行業(yè)協(xié)會在南山區(qū)前海自貿(mào)區(qū)的博大數(shù)據(jù)深圳前海智算中心成功舉辦了“新質(zhì)生產(chǎn)力產(chǎn)品與AIPC應(yīng)用與挑戰(zhàn)技術(shù)交流會”。芯啟源助理副總裁顧宏波受邀分享《DPU賦能綠色數(shù)據(jù)中心,助力實現(xiàn)雙碳戰(zhàn)略》主題演講,深度闡釋芯啟源DPU
    的頭像 發(fā)表于 06-13 09:53 ?591次閱讀

    NVIDIA DPU編程入門開課儀式在澳門科技大學(xué)成功舉辦

    5 月 24 日,NVIDIA DPU 編程入門開課儀式在澳門科技大學(xué)成功舉辦。作為首個在中國開設(shè) NVIDIA DPU 編程相關(guān)課程的高校,來自澳門科技大學(xué)不同院系的師生共同見證了本次儀式。
    的頭像 發(fā)表于 05-28 09:40 ?397次閱讀

    DPU技術(shù)賦能下一代AI算力基礎(chǔ)設(shè)施

    4月19日,在以“重構(gòu)世界 奔赴未來”為主題的2024中國生成式AI大會上,中科馭數(shù)作為DPU新型算力基礎(chǔ)設(shè)施代表,受邀出席了中國智算中心創(chuàng)新論壇,發(fā)表了題為《以網(wǎng)絡(luò)為中心的AI算力底座構(gòu)建之路》主題演講,勾勒出在通往AGI之路上,DPU
    的頭像 發(fā)表于 04-20 11:31 ?854次閱讀

    明天線上見!DPU構(gòu)建高性能云算力底座——DPU技術(shù)開放日最新議程公布!

    技術(shù)在不同行業(yè)中的應(yīng)用解決方案有哪些?能帶來怎樣的業(yè)務(wù)效果? 3月29日本周五,中科馭數(shù)集結(jié)產(chǎn)品大咖及解決方案專家團,誠邀您參加以“DPU構(gòu)建高性能云算力底座”為主題的線上DPU技術(shù)
    的頭像 發(fā)表于 04-03 18:12 ?1005次閱讀

    中科馭數(shù)DPU技術(shù)開放日秀“肌肉”:云原生網(wǎng)絡(luò)、RDMA、安全加速、低延時網(wǎng)絡(luò)等方案組團亮相

    DPU技術(shù)開放日既是對DPU技術(shù)應(yīng)用的典型方案展示,也是DPU技術(shù)在重要細(xì)分場景走向成熟的標(biāo)志。
    的頭像 發(fā)表于 04-01 11:48 ?789次閱讀
    中科馭數(shù)<b class='flag-5'>DPU</b><b class='flag-5'>技術(shù)</b>開放日秀“肌肉”:云原生網(wǎng)絡(luò)、RDMA、安全加速、低延時網(wǎng)絡(luò)等方案組團亮相

    FPGA-Based DPU網(wǎng)卡的發(fā)展和應(yīng)用

    采用單芯片的SoC形態(tài),兼顧性能和功耗。FPGA-Based DPU在硬件設(shè)計上的挑戰(zhàn)主要來自芯片面積和功耗。
    發(fā)表于 02-23 14:40 ?2083次閱讀
    FPGA-Based <b class='flag-5'>DPU</b>網(wǎng)卡的<b class='flag-5'>發(fā)展</b>和應(yīng)用

    中科馭數(shù)自研第二代DPU芯片K2獲得行業(yè)認(rèn)可

    近日,中科馭數(shù)自研第二代DPU芯片K2在眾多云生態(tài)創(chuàng)新應(yīng)用技術(shù)產(chǎn)品中脫穎而出,成功入選由中國云產(chǎn)業(yè)聯(lián)盟暨中關(guān)村云計算產(chǎn)業(yè)聯(lián)盟發(fā)布的“2023年中國云生態(tài)創(chuàng)新應(yīng)用技術(shù)產(chǎn)品”。這一殊榮既是對中科馭數(shù)第二代
    的頭像 發(fā)表于 01-18 09:20 ?1085次閱讀
    主站蜘蛛池模板: 狠狠色丁香久久婷婷| 永久国产| 天天操天天摸天天爽| 久久这里只有精品1| 午夜资源站| 成人最新午夜免费视频| 婷婷在线影院| 国产一级特黄aa大片爽爽| 伊在线视频| 免费人成网ww44kk44| 午夜性爽快| 欧美一级免费片| 国产成人永久免费视频| 天天搞天天色| 啪啪在线视频| 在线免费视频国产| 韩剧天堂| 夜夜操天天射| 亚洲天堂二区| 午夜欧美日韩| 免费观看成人毛片| 久久免费香蕉视频| 中文字幕一区二区三区 精品| 亚洲伊人久久大香线蕉结合| 好男人社区在线观看www| 成人理伦| 一区二区三区影院| 国产欧美综合在线| 久久亚洲精选| 性大特级毛片视频| 永久免费在线看| 欧美精品人爱a欧美精品| 色操网| 国产色婷婷免费视频| 2016天天干| 日本5级床片全免费| 91青草视频| 日本xxxxxxxx69| 日本人的色道免费网站| 夜夜夜夜曰天天天天拍国产| 性欧美bbbbbb|