2022年上半年 NVIDIA DOCA 1.3版本發(fā)布,對于開發(fā)者們更好地使用DPU,尤其是新一代的英偉達(dá)BlueField DPU進(jìn)行簡單靈活的軟件開發(fā),有著更好的幫助。7月5日,英偉達(dá)的相關(guān)技術(shù)專家和首屆NVIDIA DPU中國黑客松優(yōu)秀開發(fā)者一起線上作了精彩的分享。
DOCA是 Data-Center-Infrastructur e-On-A-Chip-Architectur e的縮寫,也就是“線上數(shù)據(jù)中心基礎(chǔ)設(shè)施體系結(jié)構(gòu)”。它是一個為BlueField DPU量身定做的軟件開發(fā)平臺,主要的目的是為開發(fā)者打造一個全面開放的開發(fā)平臺,支持廣大開發(fā)者可以在BlueField DPU上進(jìn)行簡單靈活的軟件開發(fā),讓開發(fā)者可以快速地創(chuàng)建BlueField DPU,加速高性能的一些應(yīng)用程序和服務(wù)。DOCA是依托于面向未來的API驅(qū)動的思維模式來構(gòu)建的,可以讓BlueField DPU硬件加速變得更加易用,從而實現(xiàn)非凡的數(shù)據(jù)中心的性能、效率,還有安全性。DOCA使開發(fā)者能夠利用行業(yè)標(biāo)準(zhǔn)的API,在BlueField DPU上做快速的創(chuàng)建 應(yīng)用程序和服務(wù),類似于我們GPU上的CUDA,它能夠解鎖數(shù)據(jù)中心里的 創(chuàng)新功能, 并且能夠更好地向下一代或者未來新一代BlueField DPU來做兼容性和進(jìn)一步的持續(xù)支持。DOCA可以加快應(yīng)用程序和服務(wù)的上市時間,讓合作伙伴和客戶在各自競爭領(lǐng)域里獲得成功。并基于BlueField DPU服務(wù)場景發(fā)揮關(guān)鍵的靈魂作用,可以釋放DPU的潛力。
英偉達(dá)網(wǎng)絡(luò)技術(shù)專家崔巖先介紹了NVIDIA DOCA 的前幾代軟件版本的歷史來源。
最早的DOCA 1.0是在2020年GTC秋季大會上,與BlueField-2 DPU一同發(fā)布的,后面持續(xù)演進(jìn)到DOCA 1.1版本,更加完善了整個DOCA軟件棧,提供了DOCA SDK、運(yùn)行時、以及DOCA 服務(wù)。到了DOCA1.2版本,也就是在1.3之前使用的版本,在這個版本上更加加強(qiáng)了在零信任 分布式安全解決方案上的支持,直到我們這次5月份新發(fā)布的DOCA 1.3,它提供了121個新的API開發(fā)接口,也提供了一些全新和增強(qiáng)的功能,包括優(yōu)化數(shù)據(jù)流插入的DOCA Flow庫、 通信通道庫、 正則表達(dá)式庫、 我們App Shield SDK、 基于OVN的IPSec 加密的完全卸載,以及新增的一些DOCA服務(wù),比如HBN,就是我們在DPU上實現(xiàn)了三層的路由功能。
從DOCA軟件開發(fā)套件來看,它主要是為了來創(chuàng)建和構(gòu)建應(yīng)用程序所需的所有組件,包括驅(qū)動程序、抽象的API庫、 各種開發(fā)工具、參考源代碼、示例程序和開發(fā)所需相關(guān)的文檔,現(xiàn)在到了DOCA 1.3版本,它已經(jīng)是比較完善的軟件棧,開發(fā)者可以輕松地基于這個軟件棧在本地 BlueField DPU 上或X86的開發(fā)容器中 搭建開發(fā)環(huán)境,來快速地開發(fā)自己想要實現(xiàn)的應(yīng)有程序或服務(wù)。
DOCA框架能夠給開發(fā)者提供一個一致的開發(fā)體驗,既可以統(tǒng)一訪問BlueField DPU上各種硬件資源,從而簡化網(wǎng)絡(luò)存儲安全和基礎(chǔ)設(shè)施管理服務(wù)相關(guān)的開發(fā),開發(fā)者也不用擔(dān)心開發(fā)環(huán)境的 構(gòu)建和 部署復(fù)雜程度,基本上DOCA是個即插即用 的方式,可以讓開發(fā)者很容易地來使用這個軟件棧。
同時,還為開發(fā)者提供了基于底層API抽象封裝的高級API庫,這樣對于開發(fā)者來講,可以大大地節(jié)省他的開發(fā)時間,更早或更快地來使大的開發(fā)應(yīng)用投入到市場,獲得更大的投資收益。當(dāng)然,DOCA還提供了相應(yīng)的容器化的DOCA服務(wù),可以在BlueField DPU上直接進(jìn)行部署,來提供相應(yīng)的應(yīng)用和解決方案。客戶不需要在DOCA服務(wù)上再做進(jìn)一步的開發(fā)。
在線上分享會,專家崔巖特別著重介紹了三個DOCA 1.3上的新功能或增強(qiáng)功能。
圖:NVIDIA DOCA 1.3的主要新功能介紹
第一個要介紹的是正則表達(dá)式庫,這個正則表達(dá)式也稱為Regular Expression(RegEx),是許多腳本語言使用標(biāo)準(zhǔn)模式匹配的工具,有了它可以創(chuàng)建與文本模式匹配的一些過濾器,而不僅是單個單詞或短語的匹配。正則表達(dá)式是專為高吞吐量、低延時、深度包檢測的應(yīng)用程序而設(shè)計,這些應(yīng)用程序需要數(shù)據(jù)包,可以進(jìn)行負(fù)載 檢測和 異常 監(jiān)測,通過正則表達(dá)式模式匹配字符串來實現(xiàn)相應(yīng)的應(yīng)用功能。這個正則表達(dá)式還可以做一個安全遙測的功能,可以在DOCA1.3上更好地提供一些安全方面的應(yīng)用,比如 應(yīng)用 識別、 入侵防御的系統(tǒng)、 URL的過濾、 文件的掃描、 深度數(shù)據(jù)包檢測,以及App Shield的內(nèi)存掃描。這些都會用到正則表達(dá)式庫的相應(yīng)功能,能為這些安全軟件開發(fā)提供底層的API支持。
第二個需要強(qiáng)調(diào)的或者需要介紹的,是我們基于OVN的數(shù)據(jù)路徑加密功能。在我們之前的1.2版本 能將主機(jī)內(nèi)的IPsec相應(yīng)的功能卸載到DPU之上,構(gòu)建 IPsec的控制平面,在vSwitch 控制平面上實現(xiàn) IPsec加密和解密。新的增強(qiáng)版本上,我們把這個功能相當(dāng)于擴(kuò)展到整個OVN范疇之內(nèi),不同主機(jī)之間都可以用這個IPsec的方式來創(chuàng)建不同的通道,進(jìn)行數(shù)據(jù)的加密,保證數(shù)據(jù)在不同主機(jī)之間傳遞的時候,它是一個加密的狀態(tài)。當(dāng)這個數(shù)據(jù)達(dá)到某個主機(jī)時,DPU會把它解密成明文,把這些明文數(shù)據(jù)再傳遞給主機(jī)側(cè)來為 業(yè)務(wù)應(yīng)用 提供數(shù)據(jù)。這是OVN數(shù)據(jù)路徑加密的,在DOCA1.3上的一個新增功能。
最后一個要介紹的是DOCA基于主機(jī)的網(wǎng)絡(luò),我們簡稱為“HBN”。這個功能是在NVIDIA BlueField DPU上基于主機(jī)的網(wǎng)絡(luò)上可以進(jìn)行管理和監(jiān)控同一節(jié)點上虛擬機(jī)和容器之間的流量,也就是說我們在一個服務(wù)器主機(jī)上可能創(chuàng)建了多個虛擬機(jī)或多個容器,在它們之間會有一些數(shù)據(jù)流量,不僅是轉(zhuǎn)發(fā)二層數(shù)據(jù)流量,還要實現(xiàn)三層 路由 功能,我們也把它實現(xiàn)在了BlueField的DPU之上,通過基于主機(jī)網(wǎng)絡(luò)的DOCA服務(wù)。而且它還可以做加密和解密,進(jìn)行節(jié)點流量的監(jiān)控,同時也會把一些原來是依賴以TOR交換機(jī)上面的功能也在DPU上面得到了實現(xiàn),這種方式會徹底改變客戶構(gòu)建和思考整個數(shù)據(jù)中心網(wǎng)絡(luò)構(gòu)建的方式。
隨著BlueField DPU智能化程度的提高,在整個網(wǎng)絡(luò)里把功能都會集中在BlueField DPU之上去做相應(yīng)的實現(xiàn),這樣就會降低對TOR交換機(jī)的相關(guān)要求,BlueField DPU還可以 提供一個隔離的環(huán)境,這樣可以做更好的安全性的部署。
歸根到底,基于主機(jī)的網(wǎng)絡(luò)HBN它是一個DOCA的服務(wù),像我前面介紹的那樣,它實際不需要客戶再在上面做過多的開發(fā),直接就可以通過容器的方式可以直接在BlueField DPU上面做部署,通過作為BGP的路由器來使用,可以做主機(jī)內(nèi)的虛擬機(jī)或容器之間的三層數(shù)據(jù)轉(zhuǎn)發(fā)路由,也可以對主機(jī)外相應(yīng)的其他節(jié)點上的數(shù)據(jù)進(jìn)行三層轉(zhuǎn)發(fā),使二層網(wǎng)絡(luò)和三層網(wǎng)絡(luò)都得以擴(kuò)展。當(dāng)然,也會擴(kuò)展到云計算里多租戶的環(huán)境之下。
在整個BlueField DPU上實現(xiàn)了這些動態(tài)的路由協(xié)議之后,可以大大地加速整個網(wǎng)絡(luò)數(shù)據(jù)流量處理性能,同時BlueField DPU還可以提供相應(yīng)的安全保障,這是HBN會給BlueField DPU和未來客戶在數(shù)據(jù)中心網(wǎng)絡(luò)部署的時候會帶來全新的方式。
分享會上首屆NVIDIA DPU中國黑客松亞軍團(tuán)隊、優(yōu)秀開發(fā)者代表胡效赫也很高興地分享了他及其團(tuán)隊 使用DOCA 的開發(fā)經(jīng)驗與心得。
胡效赫是一位來自高校的DPU開發(fā)者,其黑客松參賽團(tuán)隊是由一位博士后和兩位博士生組成的,研究方向是云計算和分布式系統(tǒng)。“從2020年NVIDIA發(fā)布BlueField DPU開始,我們就在關(guān)注相關(guān)的學(xué)術(shù)界和業(yè)界的信息。今年通過微信上的活動推送,我們得知并有機(jī)會參與了首屆NVIDIA DPU中國黑客松,并獲得了亞軍。”
圖:胡效赫(右一)所在的亞軍團(tuán)隊的參賽過程中的記錄
圖:黑客松參賽項目的開發(fā)設(shè)計圖
圖:系統(tǒng)運(yùn)行結(jié)果的示意圖
在開發(fā)過程中通過專家的指導(dǎo)充分地了解了DPU的硬件特性,DOCA良好的可編程性讓開發(fā)者可以快速實現(xiàn)并驗證創(chuàng)新的想法。同時開發(fā)者也可以對DOCA的API進(jìn)行深度、定制化開發(fā),實現(xiàn)更好的性能和更豐富的功能。
胡效赫介紹說:“我們開發(fā)團(tuán)隊提出了DeepTrace項目,面向DPU驅(qū)動的基礎(chǔ)設(shè)施的網(wǎng)包級函數(shù)粒度業(yè)務(wù)可觀測性。我們以DOCA提供的網(wǎng)流及粗粒度可觀測性為基礎(chǔ),對應(yīng)的是DOCA中的Netflow API庫,結(jié)合DPU的高性能網(wǎng)絡(luò)處理功能,對應(yīng)的是DPU的ASAP2網(wǎng)包分類引擎,以及DOCA中的Flow API庫,以及數(shù)據(jù)平面和控制平面的可編程能力,將可觀測性的力度提升至網(wǎng)包級,并精確到每個函數(shù)功能。同時,我們也做到了幾乎可以忽略不計的性能損耗。”
“通過DOCA和項目開發(fā)來具體介紹我們是如何創(chuàng)新地設(shè)計DeepTrace項目的。業(yè)務(wù)流量首先經(jīng)過DeepTrace預(yù)選器,再經(jīng)由原始的GPU程序進(jìn)行處理,在D PU程序中會調(diào)用DeepTrace的觸發(fā)器來實現(xiàn)相應(yīng)點位的觀測,然后被觀測的數(shù)據(jù)會被匯總收集至分析器,通過數(shù)據(jù)的重組和分析得到相應(yīng)的結(jié)果,比如得到異常流量的檢測以及業(yè)務(wù)問題的定位等。基于DOCA開發(fā)DeepTrace的整體編程模式和在CPU上進(jìn)行DPDK網(wǎng)絡(luò)功能的開發(fā)功能類似,這種模式提高了我們的開發(fā)效率。”
“具體來看,其中觸發(fā)器部分的挑戰(zhàn)是如何以最小的代價收集鏈?zhǔn)胶瘮?shù)和網(wǎng)包的信息,我們采用的方案是以統(tǒng)一化、輕量化的函數(shù)內(nèi)觸發(fā)器實現(xiàn),具體在開發(fā)過程中,我們將DOCA的NetFlow庫修改為網(wǎng)包粒度,而需要觀測的函數(shù)以API的形式調(diào)用觸發(fā)器即可。”
“在預(yù)選器部分的挑戰(zhàn)是如何處理大規(guī)模原始流量,并在函數(shù)鏈中記錄網(wǎng)包。我們采用的方案是通過硬件卸載的預(yù)選器進(jìn)行標(biāo)記和過濾。具體在開發(fā)過程中我們調(diào)用DOCA的Flow庫配置所需預(yù)選的顆粒 規(guī)則即可實現(xiàn),因為預(yù)選功能實際由硬件卸載完成。所以,方案帶來的性能損耗幾乎可以忽略不計劃。在分析器部分,我們由運(yùn)行在ARM控制平面的開源開放工程實現(xiàn)。”
對于DOCA 開發(fā)者免費使用 卓越中心的DOCA開發(fā)環(huán)境的開放時間和規(guī)則,主辦方也在線上作了解釋。具體可以參考以下的兩張PPT截圖,供NVIDIA的DPU開發(fā)者參考。
卓越中心的運(yùn)營方仍然還是之前所授權(quán)的兩家公司:麗臺信息和信弘智能科技。
NVIDIA網(wǎng)絡(luò)與AI產(chǎn)品的最新進(jìn)展,元宇宙最火的硬件平臺原來是它!
NVIDIA網(wǎng)絡(luò)市場總監(jiān)孟慶也在分享會上順便介紹了一下公司網(wǎng)絡(luò)產(chǎn)品最新進(jìn)展,包括在眾多開源聯(lián)盟參與標(biāo)準(zhǔn)建設(shè)、開放網(wǎng)絡(luò)軟件等方面的進(jìn)展,以及NVIDIA成為Linux基金會OPI項目創(chuàng)始成員等。
也提到了NVIDIA在全球Top 500超級計算機(jī)互連中占主導(dǎo)地位的成就,如上圖所示。有197個 Top 500強(qiáng)系統(tǒng)中采用了NVIDIA InfiniBand 網(wǎng)絡(luò)。
圖:NVIDIA SPECTRUM-4以太網(wǎng)平臺
孟慶還介紹了Spectrum-4 400Gbps 端到端以太網(wǎng)平臺,其中包括 Spectrum-4 交換機(jī)、ConnectX-7智能網(wǎng)卡、BlueField-3 DPU及相關(guān)軟件可以有力支撐炙手可熱的元宇宙(Omniverse) 。“在數(shù)字孿生里,Omniverse標(biāo)準(zhǔn)的OVX SuperPod,我們采用的方案必須得是Spectrum-4 400G這套網(wǎng)絡(luò)平臺這樣才能更好的實現(xiàn)您所需的數(shù)字孿生,由數(shù)字人-數(shù)字機(jī)器-物理世界做相應(yīng)的互聯(lián),”孟慶說。
DOCA是 Data-Center-Infrastructur e-On-A-Chip-Architectur e的縮寫,也就是“線上數(shù)據(jù)中心基礎(chǔ)設(shè)施體系結(jié)構(gòu)”。它是一個為BlueField DPU量身定做的軟件開發(fā)平臺,主要的目的是為開發(fā)者打造一個全面開放的開發(fā)平臺,支持廣大開發(fā)者可以在BlueField DPU上進(jìn)行簡單靈活的軟件開發(fā),讓開發(fā)者可以快速地創(chuàng)建BlueField DPU,加速高性能的一些應(yīng)用程序和服務(wù)。DOCA是依托于面向未來的API驅(qū)動的思維模式來構(gòu)建的,可以讓BlueField DPU硬件加速變得更加易用,從而實現(xiàn)非凡的數(shù)據(jù)中心的性能、效率,還有安全性。DOCA使開發(fā)者能夠利用行業(yè)標(biāo)準(zhǔn)的API,在BlueField DPU上做快速的創(chuàng)建 應(yīng)用程序和服務(wù),類似于我們GPU上的CUDA,它能夠解鎖數(shù)據(jù)中心里的 創(chuàng)新功能, 并且能夠更好地向下一代或者未來新一代BlueField DPU來做兼容性和進(jìn)一步的持續(xù)支持。DOCA可以加快應(yīng)用程序和服務(wù)的上市時間,讓合作伙伴和客戶在各自競爭領(lǐng)域里獲得成功。并基于BlueField DPU服務(wù)場景發(fā)揮關(guān)鍵的靈魂作用,可以釋放DPU的潛力。
英偉達(dá)網(wǎng)絡(luò)技術(shù)專家崔巖先介紹了NVIDIA DOCA 的前幾代軟件版本的歷史來源。
最早的DOCA 1.0是在2020年GTC秋季大會上,與BlueField-2 DPU一同發(fā)布的,后面持續(xù)演進(jìn)到DOCA 1.1版本,更加完善了整個DOCA軟件棧,提供了DOCA SDK、運(yùn)行時、以及DOCA 服務(wù)。到了DOCA1.2版本,也就是在1.3之前使用的版本,在這個版本上更加加強(qiáng)了在零信任 分布式安全解決方案上的支持,直到我們這次5月份新發(fā)布的DOCA 1.3,它提供了121個新的API開發(fā)接口,也提供了一些全新和增強(qiáng)的功能,包括優(yōu)化數(shù)據(jù)流插入的DOCA Flow庫、 通信通道庫、 正則表達(dá)式庫、 我們App Shield SDK、 基于OVN的IPSec 加密的完全卸載,以及新增的一些DOCA服務(wù),比如HBN,就是我們在DPU上實現(xiàn)了三層的路由功能。
從DOCA軟件開發(fā)套件來看,它主要是為了來創(chuàng)建和構(gòu)建應(yīng)用程序所需的所有組件,包括驅(qū)動程序、抽象的API庫、 各種開發(fā)工具、參考源代碼、示例程序和開發(fā)所需相關(guān)的文檔,現(xiàn)在到了DOCA 1.3版本,它已經(jīng)是比較完善的軟件棧,開發(fā)者可以輕松地基于這個軟件棧在本地 BlueField DPU 上或X86的開發(fā)容器中 搭建開發(fā)環(huán)境,來快速地開發(fā)自己想要實現(xiàn)的應(yīng)有程序或服務(wù)。
DOCA框架能夠給開發(fā)者提供一個一致的開發(fā)體驗,既可以統(tǒng)一訪問BlueField DPU上各種硬件資源,從而簡化網(wǎng)絡(luò)存儲安全和基礎(chǔ)設(shè)施管理服務(wù)相關(guān)的開發(fā),開發(fā)者也不用擔(dān)心開發(fā)環(huán)境的 構(gòu)建和 部署復(fù)雜程度,基本上DOCA是個即插即用 的方式,可以讓開發(fā)者很容易地來使用這個軟件棧。
同時,還為開發(fā)者提供了基于底層API抽象封裝的高級API庫,這樣對于開發(fā)者來講,可以大大地節(jié)省他的開發(fā)時間,更早或更快地來使大的開發(fā)應(yīng)用投入到市場,獲得更大的投資收益。當(dāng)然,DOCA還提供了相應(yīng)的容器化的DOCA服務(wù),可以在BlueField DPU上直接進(jìn)行部署,來提供相應(yīng)的應(yīng)用和解決方案。客戶不需要在DOCA服務(wù)上再做進(jìn)一步的開發(fā)。
在線上分享會,專家崔巖特別著重介紹了三個DOCA 1.3上的新功能或增強(qiáng)功能。
圖:NVIDIA DOCA 1.3的主要新功能介紹
第一個要介紹的是正則表達(dá)式庫,這個正則表達(dá)式也稱為Regular Expression(RegEx),是許多腳本語言使用標(biāo)準(zhǔn)模式匹配的工具,有了它可以創(chuàng)建與文本模式匹配的一些過濾器,而不僅是單個單詞或短語的匹配。正則表達(dá)式是專為高吞吐量、低延時、深度包檢測的應(yīng)用程序而設(shè)計,這些應(yīng)用程序需要數(shù)據(jù)包,可以進(jìn)行負(fù)載 檢測和 異常 監(jiān)測,通過正則表達(dá)式模式匹配字符串來實現(xiàn)相應(yīng)的應(yīng)用功能。這個正則表達(dá)式還可以做一個安全遙測的功能,可以在DOCA1.3上更好地提供一些安全方面的應(yīng)用,比如 應(yīng)用 識別、 入侵防御的系統(tǒng)、 URL的過濾、 文件的掃描、 深度數(shù)據(jù)包檢測,以及App Shield的內(nèi)存掃描。這些都會用到正則表達(dá)式庫的相應(yīng)功能,能為這些安全軟件開發(fā)提供底層的API支持。
第二個需要強(qiáng)調(diào)的或者需要介紹的,是我們基于OVN的數(shù)據(jù)路徑加密功能。在我們之前的1.2版本 能將主機(jī)內(nèi)的IPsec相應(yīng)的功能卸載到DPU之上,構(gòu)建 IPsec的控制平面,在vSwitch 控制平面上實現(xiàn) IPsec加密和解密。新的增強(qiáng)版本上,我們把這個功能相當(dāng)于擴(kuò)展到整個OVN范疇之內(nèi),不同主機(jī)之間都可以用這個IPsec的方式來創(chuàng)建不同的通道,進(jìn)行數(shù)據(jù)的加密,保證數(shù)據(jù)在不同主機(jī)之間傳遞的時候,它是一個加密的狀態(tài)。當(dāng)這個數(shù)據(jù)達(dá)到某個主機(jī)時,DPU會把它解密成明文,把這些明文數(shù)據(jù)再傳遞給主機(jī)側(cè)來為 業(yè)務(wù)應(yīng)用 提供數(shù)據(jù)。這是OVN數(shù)據(jù)路徑加密的,在DOCA1.3上的一個新增功能。
最后一個要介紹的是DOCA基于主機(jī)的網(wǎng)絡(luò),我們簡稱為“HBN”。這個功能是在NVIDIA BlueField DPU上基于主機(jī)的網(wǎng)絡(luò)上可以進(jìn)行管理和監(jiān)控同一節(jié)點上虛擬機(jī)和容器之間的流量,也就是說我們在一個服務(wù)器主機(jī)上可能創(chuàng)建了多個虛擬機(jī)或多個容器,在它們之間會有一些數(shù)據(jù)流量,不僅是轉(zhuǎn)發(fā)二層數(shù)據(jù)流量,還要實現(xiàn)三層 路由 功能,我們也把它實現(xiàn)在了BlueField的DPU之上,通過基于主機(jī)網(wǎng)絡(luò)的DOCA服務(wù)。而且它還可以做加密和解密,進(jìn)行節(jié)點流量的監(jiān)控,同時也會把一些原來是依賴以TOR交換機(jī)上面的功能也在DPU上面得到了實現(xiàn),這種方式會徹底改變客戶構(gòu)建和思考整個數(shù)據(jù)中心網(wǎng)絡(luò)構(gòu)建的方式。
隨著BlueField DPU智能化程度的提高,在整個網(wǎng)絡(luò)里把功能都會集中在BlueField DPU之上去做相應(yīng)的實現(xiàn),這樣就會降低對TOR交換機(jī)的相關(guān)要求,BlueField DPU還可以 提供一個隔離的環(huán)境,這樣可以做更好的安全性的部署。
歸根到底,基于主機(jī)的網(wǎng)絡(luò)HBN它是一個DOCA的服務(wù),像我前面介紹的那樣,它實際不需要客戶再在上面做過多的開發(fā),直接就可以通過容器的方式可以直接在BlueField DPU上面做部署,通過作為BGP的路由器來使用,可以做主機(jī)內(nèi)的虛擬機(jī)或容器之間的三層數(shù)據(jù)轉(zhuǎn)發(fā)路由,也可以對主機(jī)外相應(yīng)的其他節(jié)點上的數(shù)據(jù)進(jìn)行三層轉(zhuǎn)發(fā),使二層網(wǎng)絡(luò)和三層網(wǎng)絡(luò)都得以擴(kuò)展。當(dāng)然,也會擴(kuò)展到云計算里多租戶的環(huán)境之下。
在整個BlueField DPU上實現(xiàn)了這些動態(tài)的路由協(xié)議之后,可以大大地加速整個網(wǎng)絡(luò)數(shù)據(jù)流量處理性能,同時BlueField DPU還可以提供相應(yīng)的安全保障,這是HBN會給BlueField DPU和未來客戶在數(shù)據(jù)中心網(wǎng)絡(luò)部署的時候會帶來全新的方式。
分享會上首屆NVIDIA DPU中國黑客松亞軍團(tuán)隊、優(yōu)秀開發(fā)者代表胡效赫也很高興地分享了他及其團(tuán)隊 使用DOCA 的開發(fā)經(jīng)驗與心得。
胡效赫是一位來自高校的DPU開發(fā)者,其黑客松參賽團(tuán)隊是由一位博士后和兩位博士生組成的,研究方向是云計算和分布式系統(tǒng)。“從2020年NVIDIA發(fā)布BlueField DPU開始,我們就在關(guān)注相關(guān)的學(xué)術(shù)界和業(yè)界的信息。今年通過微信上的活動推送,我們得知并有機(jī)會參與了首屆NVIDIA DPU中國黑客松,并獲得了亞軍。”
圖:胡效赫(右一)所在的亞軍團(tuán)隊的參賽過程中的記錄
圖:黑客松參賽項目的開發(fā)設(shè)計圖
圖:系統(tǒng)運(yùn)行結(jié)果的示意圖
在開發(fā)過程中通過專家的指導(dǎo)充分地了解了DPU的硬件特性,DOCA良好的可編程性讓開發(fā)者可以快速實現(xiàn)并驗證創(chuàng)新的想法。同時開發(fā)者也可以對DOCA的API進(jìn)行深度、定制化開發(fā),實現(xiàn)更好的性能和更豐富的功能。
胡效赫介紹說:“我們開發(fā)團(tuán)隊提出了DeepTrace項目,面向DPU驅(qū)動的基礎(chǔ)設(shè)施的網(wǎng)包級函數(shù)粒度業(yè)務(wù)可觀測性。我們以DOCA提供的網(wǎng)流及粗粒度可觀測性為基礎(chǔ),對應(yīng)的是DOCA中的Netflow API庫,結(jié)合DPU的高性能網(wǎng)絡(luò)處理功能,對應(yīng)的是DPU的ASAP2網(wǎng)包分類引擎,以及DOCA中的Flow API庫,以及數(shù)據(jù)平面和控制平面的可編程能力,將可觀測性的力度提升至網(wǎng)包級,并精確到每個函數(shù)功能。同時,我們也做到了幾乎可以忽略不計的性能損耗。”
“通過DOCA和項目開發(fā)來具體介紹我們是如何創(chuàng)新地設(shè)計DeepTrace項目的。業(yè)務(wù)流量首先經(jīng)過DeepTrace預(yù)選器,再經(jīng)由原始的GPU程序進(jìn)行處理,在D PU程序中會調(diào)用DeepTrace的觸發(fā)器來實現(xiàn)相應(yīng)點位的觀測,然后被觀測的數(shù)據(jù)會被匯總收集至分析器,通過數(shù)據(jù)的重組和分析得到相應(yīng)的結(jié)果,比如得到異常流量的檢測以及業(yè)務(wù)問題的定位等。基于DOCA開發(fā)DeepTrace的整體編程模式和在CPU上進(jìn)行DPDK網(wǎng)絡(luò)功能的開發(fā)功能類似,這種模式提高了我們的開發(fā)效率。”
“具體來看,其中觸發(fā)器部分的挑戰(zhàn)是如何以最小的代價收集鏈?zhǔn)胶瘮?shù)和網(wǎng)包的信息,我們采用的方案是以統(tǒng)一化、輕量化的函數(shù)內(nèi)觸發(fā)器實現(xiàn),具體在開發(fā)過程中,我們將DOCA的NetFlow庫修改為網(wǎng)包粒度,而需要觀測的函數(shù)以API的形式調(diào)用觸發(fā)器即可。”
“在預(yù)選器部分的挑戰(zhàn)是如何處理大規(guī)模原始流量,并在函數(shù)鏈中記錄網(wǎng)包。我們采用的方案是通過硬件卸載的預(yù)選器進(jìn)行標(biāo)記和過濾。具體在開發(fā)過程中我們調(diào)用DOCA的Flow庫配置所需預(yù)選的顆粒 規(guī)則即可實現(xiàn),因為預(yù)選功能實際由硬件卸載完成。所以,方案帶來的性能損耗幾乎可以忽略不計劃。在分析器部分,我們由運(yùn)行在ARM控制平面的開源開放工程實現(xiàn)。”
對于DOCA 開發(fā)者免費使用 卓越中心的DOCA開發(fā)環(huán)境的開放時間和規(guī)則,主辦方也在線上作了解釋。具體可以參考以下的兩張PPT截圖,供NVIDIA的DPU開發(fā)者參考。
卓越中心的運(yùn)營方仍然還是之前所授權(quán)的兩家公司:麗臺信息和信弘智能科技。
NVIDIA網(wǎng)絡(luò)與AI產(chǎn)品的最新進(jìn)展,元宇宙最火的硬件平臺原來是它!
NVIDIA網(wǎng)絡(luò)市場總監(jiān)孟慶也在分享會上順便介紹了一下公司網(wǎng)絡(luò)產(chǎn)品最新進(jìn)展,包括在眾多開源聯(lián)盟參與標(biāo)準(zhǔn)建設(shè)、開放網(wǎng)絡(luò)軟件等方面的進(jìn)展,以及NVIDIA成為Linux基金會OPI項目創(chuàng)始成員等。
也提到了NVIDIA在全球Top 500超級計算機(jī)互連中占主導(dǎo)地位的成就,如上圖所示。有197個 Top 500強(qiáng)系統(tǒng)中采用了NVIDIA InfiniBand 網(wǎng)絡(luò)。
圖:NVIDIA SPECTRUM-4以太網(wǎng)平臺
孟慶還介紹了Spectrum-4 400Gbps 端到端以太網(wǎng)平臺,其中包括 Spectrum-4 交換機(jī)、ConnectX-7智能網(wǎng)卡、BlueField-3 DPU及相關(guān)軟件可以有力支撐炙手可熱的元宇宙(Omniverse) 。“在數(shù)字孿生里,Omniverse標(biāo)準(zhǔn)的OVX SuperPod,我們采用的方案必須得是Spectrum-4 400G這套網(wǎng)絡(luò)平臺這樣才能更好的實現(xiàn)您所需的數(shù)字孿生,由數(shù)字人-數(shù)字機(jī)器-物理世界做相應(yīng)的互聯(lián),”孟慶說。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。
舉報投訴
-
NVIDIA
+關(guān)注
關(guān)注
14文章
4991瀏覽量
103136 -
元宇宙
+關(guān)注
關(guān)注
13文章
1397瀏覽量
11460
發(fā)布評論請先 登錄
相關(guān)推薦
Meta發(fā)布新AI模型Meta Motivo,旨在提升元宇宙體驗
Meta在人工智能領(lǐng)域邁出了重要一步。通過這款模型,Meta希望能夠為用戶提供更加自然、流暢的元宇宙交互體驗。數(shù)字代理在元宇宙中的動作將更加逼真,從而增強(qiáng)用戶的沉浸感和參與度。 除了M
NVIDIA DOCA 2.9版本的亮點解析
NVIDIA DOCA通過為開發(fā)者提供全面的軟件框架以利用硬件加速來增強(qiáng) NVIDIA 網(wǎng)絡(luò)平臺的功能,從而提高性能、安全性和效率。其 API、庫和工具生態(tài)系統(tǒng)簡化了數(shù)據(jù)中心基礎(chǔ)設(shè)施的
NVIDIA DOCA-OFED的主要特性
NVIDIA DOCA 軟件平臺釋放了 NVIDIA BlueField 網(wǎng)絡(luò)平臺的潛力,并為NVIDIA BlueField和ConnectX設(shè)備提供了所需的所有主機(jī)驅(qū)動程序。
NVIDIA Parabricks v4.3.1版本的新功能
會(ESHG)上發(fā)布,其加入了新的體細(xì)胞數(shù)據(jù)變異檢測功能,并將業(yè)內(nèi)領(lǐng)先的工具升級到最新版本。這個版本是繼在 NVIDIA GTC 2024 大會上發(fā)
NVIDIA JetPack 6.0版本的關(guān)鍵功能
NVIDIA JetPack SDK 支持 NVIDIA Jetson 模塊,為構(gòu)建端到端加速 AI 應(yīng)用提供全面的解決方案。JetPack 6 通過微服務(wù)和一系列新功能,擴(kuò)展了 Jetson 平臺的靈活性和可擴(kuò)展性,是 2024 年截至目前下載量最高的 JetPack
IB Verbs和NVIDIA DOCA GPUNetIO性能測試
NVIDIA DOCA GPUNetIO 是 NVIDIA DOCA SDK 中的一個庫,專門為實時在線 GPU 數(shù)據(jù)包處理而設(shè)計。它結(jié)合了 GPUDirect RDMA 和 GPUD
芯科科技發(fā)布Matter Simplicity SDK Extension v2.3.0版本
Extension v2.3.0版本,通過軟件更新來幫助開發(fā)人員基于Simplicity Studio加速構(gòu)建Matter 1.3應(yīng)用程序。新版本SDK支持面向Thread和Wi-F
新款Nvidia Titan GPU正在開發(fā)中?或?qū)魯∥?b class='flag-5'>發(fā)布的RTX 5090
ABSTRACT摘要最近有消息透露,NVIDIA正在開發(fā)一款名為TITANAI的新顯卡。該顯卡基于即將推出的BlackwellGPU。在Nvidia選擇不發(fā)布其RTX40系列
Matter進(jìn)化至1.3版本!支持更多芯片平臺、終端,產(chǎn)業(yè)鏈玩家加速布局
電子發(fā)燒友網(wǎng)報道(文/莫婷婷)距離2022年發(fā)布Matter1.0版本后,Matter標(biāo)準(zhǔn)在2年后已經(jīng)進(jìn)化到Matter 1.3版本。今年5月,連接標(biāo)準(zhǔn)聯(lián)盟(CSA)
聯(lián)想發(fā)布國內(nèi)首個軟硬一體元宇宙平臺:聯(lián)想晨星元宇宙平臺
在科技浪潮翻涌的當(dāng)下,元宇宙的概念正在逐漸從科幻走向現(xiàn)實。近日,在備受矚目的2024年上海MWC大會上,聯(lián)想集團(tuán)憑借其前瞻性的科技視野和深厚的研發(fā)實力,正式發(fā)布了國內(nèi)首個軟硬一體的元
借助NVIDIA DOCA 2.7增強(qiáng)AI 云數(shù)據(jù)中心和NVIDIA Spectrum-X
NVIDIA DOCA 加速框架為開發(fā)者提供了豐富的庫、驅(qū)動和 API,以便為 NVIDIA BlueField DPU 和 SuperNIC 創(chuàng)建高性能的應(yīng)用程序和服務(wù)。
基于NVIDIA DOCA 2.6實現(xiàn)高性能和安全的AI云設(shè)計
作為專為 NVIDIA? BlueField? 網(wǎng)絡(luò)平臺而設(shè)計的數(shù)據(jù)中心基礎(chǔ)設(shè)施軟件框架,NVIDIA? DOCA? 使廣大開發(fā)者能夠利用其行業(yè)標(biāo)準(zhǔn) API 在
鴻蒙原生應(yīng)用元服務(wù)實戰(zhàn)-發(fā)布時多設(shè)備選擇注意事項
在可公開可獲取DevEco Studio最新版本,Stage模型ArkTSAPI9開發(fā)元服務(wù)HarmonyOS4現(xiàn)不支持平板等;但是元服務(wù)在發(fā)布
發(fā)表于 02-21 10:22
上海工業(yè)元宇宙賦能新型工業(yè)化,推動工業(yè)制造業(yè)數(shù)字化轉(zhuǎn)型發(fā)展#智能制造#上海#工業(yè)元宇宙#數(shù)字孿生#三維可視
數(shù)字孿生元宇宙
巨蟹數(shù)字科技
發(fā)布于 :2024年01月23日 15:25:18
評論