DPU自2019年開始由英偉達正式提出,如今已被大家逐漸接受,并且把它變成行業術語繼續去使用。誕生3年之久,DPU行業的應用度逐漸上升,在DPU的行業應用方面,最先部署DPU的是一些云服務商,如BAT、京東、頭條、微軟等等公司,他們大量的數據需要DPU來幫助其提前處理和做安全問題。而且英偉達預計,明年開始將會有更多類型的企業加大對DPU的采用。
在DPU領域,英偉達正在攜手行業合作伙伴不斷構建完好的開發者生態。而一大利器就是其DOCA軟件,沒有軟件的芯片就是沒有靈魂的沙子,這幾年英偉達的DOCA軟件為其NVIDIA BlueField DPU注入了靈魂,也幫助英偉達DPU解鎖了更多的應用空間。
數據中心面臨的四大挑戰
據NVIDIA 網絡技術專家崔巖的介紹,當下數據中心主要面臨四大挑戰:
一是如AI工作負載等現代應用程序將持續產生和處理大量數據,這對數據中心的性能和數據的處理能力提出了巨大的挑戰。
二是現在很多應用對分布式基礎設施的需求不斷增加,它們的部署并不是運行在數據中心中的某一臺服務器,會運行在多臺服務器上,甚至分布在不同的物理位置的微服務給客戶提供應用。不僅僅部署在數據中心,在網絡邊緣和多云架構里也是非常普遍的現象。這對數據中心基礎設施運營也會有比較大的挑戰。
三是基礎設施服務消耗了大量的CPU容量,使得CPU服務于客戶應用的資源減少。
四是東西向流量不斷增加,安全攻擊面成為威脅。所謂東西向流量,主要是很多應用程序會由分布在數據中心甚至不同物理位置上的微服務程序提供,他們之間就會產生相應的數據流的數據交互。由于相互之間的流量增多,就會導致存在跨服務器或者數據中心內部的橫向攻擊和一些威脅,甚至有的客戶會把一個網絡上的應用程序下載到數據中心里應用,這些都會有潛在的安全風險帶入到數據中心中,如果安全策略或者安全方式模型不能有效的抵御這種攻擊, 會造成比較大的威脅和相應的損失。
為了解決數據中心的這些挑戰,英偉達與VMware近年來一直保持緊密合作,以期借助VMware的軟件架構一起重新構想虛擬的基礎設施。基于NVIDIA BlueField DPU可以實現如下三大方面的功能:1)簡化基礎設施和工作負載管理2)提高基礎設施運行效率,主要體現在性能和功能增強上3)借助零信任安全模式加強基礎設施安全性。
Project Monterey重構一個現代的數據中心
在今年的VMware Explore大會上,NVIDIA、VMware和戴爾聯合發布Project Monterey的平臺。Project Monterey將vSphere 8企業工作負載平臺、NVIDIA BlueField DPU進行結合,在戴爾Power Edge服務器或VxRail超融合架構一體機上做運行,這樣就可以有效的把NVIDIA BlueField DPU、GPU和NVIDIA Enterprise AI軟件,針對vSphere 8做負載優化,在運行一些AI軟件時,也可以把vSphere 8的一些功能,卸載、加速和隔離到NVIDIA BlueField DPU,Project Monterey為未來的AI和現代應用程序工作負載重新構建一個現代的數據中心。它既有用于GPU的vSphere 8上的新功能來去支持更強大的AI和機器學習的模型,更快的訓練速度,同時也能夠簡化云和邊緣環境上的管理。
下圖是完整的Project Monterey的架構。最底下是VMware Hypervisor整個虛擬化管理軟件系統,相當于把vSphere中NSX的網絡和安全相關的服務,還有vSAN存儲服務、主機管理服務這些原來需要CPU干預介入的基礎設施的操作,卸載到NVIDIA BlueField DPU之上。由于DPU的介入會在主機CPU和DPU之間形成一個隔離層,來去保障主機內部的安全性。如果有主機上層被應用程序進行黑客攻擊,它不會通過隔離層、通過DPU攻擊到其他的服務器。所以,它會對多租戶、多虛機環境有很有效的幫助。后續在Linux系統或者Windows系統的裸金屬服務器上進行進一步的開發。
Project Monterey架構
目前該項目還在進行之中,現在只是把vSphere 里面Cloud Foundation的功能卸載到了NVIDIA BlueField DPU上,同時支持VMware NSX下一代防火墻技術,未來可能還會有一些安全策略的功能會在日后的版本中支持。后面還會支持vSAN數據存儲功能,這些都正在緊密研發之中。
那么,NVIDIA BlueField DPU在vSphere體系中運行的情況。在傳統的服務器中,對基礎設施管理、存儲、安全、網絡都是CPU承擔工作負載的。當采用了DPU之后,CPU可以零介入基礎設施的部分,上述講的四大功能就卸載到了DPU。這里主要和vSphere配合的是有軟件定義的安全、軟件定義的網絡和整體性能加速的部分,將給上層應用提供更好的基礎設施的支撐。因此,CPU資源會更好的支撐客戶業務應用,有更多支持虛機和容器的能力。
除了很好的支持vSphere8之外,NVIDIA BlueField DPU在NSX網絡和安全的組件上也有很好的支撐,現在已經實現了將NSX下一代防火墻功能卸載到了DPU之上,后續的入侵檢測、入侵防御等安全策略功能也會逐漸在DPU上實現,這將和VMware整個多云架構、企業應用有更加緊密的解決方案,能夠讓企業用戶直接采用,享受DPU帶來的性能上的回報。
DPU:用的越多,省的越多
那么,DPU采用和不采用在收益和效果上有何差異呢?對此,英偉達通過兩個案例對NVIDIA BlueField DPU進行了網絡基準測試:
案例一:下圖是在VMware體系上運行NGINX Web服務器的應用,如果傳統用標準智能網卡和CPU介入的方式下,需要有8個CPU內核管理跟運營基礎設施的相關操作。當采用了DPU之后,這8個內核完全被釋放了,不需要CPU的任何介入,DPU就會把這些基礎設施管理相關的加速能力直接體現出來。
案例二:在NVIDIA BlueField和VMware體系之上跑Redis內存鍵值存儲,是非SQL數據庫的基準測試,如果采用CPU和標準智能網卡上跑應用需要12個CPU內核介入,當采用DPU之后這12個內核完全被釋放,直接由DPU承擔這些工作負載。從吞吐量的角度來看,原來是8.8,當采用DPU后性能得到加速,會變成12,整體有12個內核的減少,相當于減少CPU 20%的內核釋放;而且在不使用任何CPU資源的情況下性能將提升36%。對客戶而言,既節省了CPU上的資源消耗,可以拿更多CPU資源支撐業務應用,同時在整個網絡性能上也得到了提升。
所以總體來看,能得出的結論是,在NVIDIA BlueField DPU上運行vSphere,用的越多,省的越多。在整個服務器效率方面會整體提升22%,在3年Roi角度測算帶來5倍的投資回報率。780臺安裝有NVIDIA BlueField DPU的服務器,相當于1000臺安裝有標準智能網卡的服務器。每臺服務器的TCO(總體投入)可節省8,200美元,3年內通過提升效率可節省180萬美元。所以,這對于企業用戶來講,雖然可能在DPU采用上做一定投入,但實際上,在CPU資源占用和性能提升上將帶來長期穩定的回報。
通過 NVIDIA LaunchPad試用在NVIDIA BlueField DPU上運行vSphere現已開放。在NVIDIA托管環境中已可用:介紹和現場演示Introduction & Live Demo;通過 LaunchPad 體驗 Monterey。點擊文末“閱讀原文”申請LaunchPad 試用。
2022 秋季NVIDIA DPU中國黑客松競賽即將開幕
在人工智能和機器學習的熱潮技術驅動下,有很多從業者對人工智能就緒的數據中心基礎設施產生了濃厚的興趣,尤其是學生。NVIDIA DPU黑客松活動從開辦以來受到學生和創業者等的歡迎。DPU黑客松活動會介紹NVIDIA BlueField DPU、NVIDIA DOCA軟件框架的最新進展和基礎開發的知識,介紹跟競賽有關的用例和應用場景,這些都會讓學生和行業的開發者能夠盡快的熟悉這些硬件和軟件的部分,同時掌握相應的開發技能,通過參加競賽,他們可以進行實操體驗。
2022 秋季NVIDIA DPU中國黑客松競賽將于10月19日開帷幕。此次黑客松和上次不同的是,題目聚焦在“使用NVIDIA BlueField DPU和NVIDIA DOCA實現RDMA加速的存儲與AI 解決方案”。這是基于InfiniBand上實現的RDMA技術,能夠很容易的通過NVIDIA BlueField DPU去訪問CPU和GPU的內存,而不需要CPU和操作系統的干預,這會大大提高整個數據移動的效率,能夠更好的支撐未來的科學計算、人工智能、機器學習需要大規模數據搬運和計算的工作負載。
在10月19日有賽前訓練營。上午有精彩的關于NVIDIA BlueField DPU和NVIDIA DOCA軟件開發套件的介紹和用例的展示。下午將有一些更深入的開發環境和開發方式的介紹,展示幾個應用案例,能夠讓開發者更容易理解DOCA的開發如何進行,用什么樣的步驟,用例及運行方式是什么樣的。最后會有一個跟開發者的技術答疑。
和上一屆的安排一樣,仍然會有一個開幕式和訓練營的活動,之后會進入到24小時的比賽環節,比賽中各個團隊將投入到創新應用的開發之中,到第二天10月23日上午,是每個團隊現場比賽的演示,他們將對自己做的課題做一個整體展示,后面會有中國的本地評委和國際評委對他們的比賽結果進行評分,將在24日周一公布比賽結果。
英偉達會請到本地5位評委,從基礎架構、軟件開發、行業應用角度來看待這些開發團隊所做的項目和呈現的結果。整個結果最后會提交給國際評委,他們從創新角度和其他應用的角度做一個評分,大概是五個方面,訓練營參與度(15分)、項目完成度(15分)、項目創新價值(20分)及題目匹配度(30分),最后是現場演示的效果(20分)。
NVIDIA網絡市場總監孟慶表示,雖然今年對所有半導體行業客戶和廠商來說都是不容易的一年,但是去年英偉達DOCA社區發展仍然超出預期。現在全球DOCA開發者中超過一半來自中國,這是我們有底氣去辦黑客松的原因。
結語
綜上可以看出,無論是Project Monterey還是黑客松競賽,都是英偉達在DPU領域傾注的心血,也代表著英偉達對DPU的看重。英偉達預期DPU將在數據中心中扮演非常重要的角色,而且越來越重要。
審核編輯 :李倩
-
數據中心
+關注
關注
16文章
4790瀏覽量
72161 -
DPU
+關注
關注
0文章
364瀏覽量
24200 -
英偉達
+關注
關注
22文章
3778瀏覽量
91177
原文標題:英偉達:DPU用的越多,總成本省的越多
文章出處:【微信號:芯長征科技,微信公眾號:芯長征科技】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論