BlueField SuperNIC 是面向 AI 云數(shù)據(jù)中心的一種網(wǎng)絡(luò)加速器,可在 GPU 服務(wù)器之間提供可靠、無(wú)縫的連接。
生成式 AI 是快速變化的數(shù)字領(lǐng)域的新轉(zhuǎn)折。在此領(lǐng)域的一個(gè)突破性創(chuàng)新技術(shù)是一個(gè)新術(shù)語(yǔ):BlueField SuperNIC。
什么是 BlueField SuperNIC?
BlueField SuperNIC 是一類(lèi)新型網(wǎng)絡(luò)加速器,旨在為基于以太網(wǎng)的 AI 云上運(yùn)行的超大規(guī)模 AI 工作負(fù)載提供強(qiáng)效助力。它為 GPU 到 GPU 通信提供快速的網(wǎng)絡(luò)連接,使用基于以太網(wǎng)的遠(yuǎn)程直接內(nèi)存訪(fǎng)問(wèn)(RoCE)技術(shù)實(shí)現(xiàn) 400Gb/s 的速度。
BlueField SuperNIC 結(jié)合了以下獨(dú)特屬性:
-
高速數(shù)據(jù)包重排序可確保數(shù)據(jù)包的接收和處理順序與源端發(fā)送的順序相同。這可保持?jǐn)?shù)據(jù)流的順序完整性。
-
使用實(shí)時(shí)遙測(cè)數(shù)據(jù)和網(wǎng)絡(luò)感知算法進(jìn)行高級(jí)擁塞控制,以管理和預(yù)防 AI 網(wǎng)絡(luò)中的擁塞。
-
輸入/輸出 (I/O) 路徑上的可編程計(jì)算,可實(shí)現(xiàn) AI 云數(shù)據(jù)中心網(wǎng)絡(luò)基礎(chǔ)設(shè)施的自定義和可擴(kuò)展性。
-
節(jié)能高效的半高設(shè)計(jì),可在有限的功率預(yù)算范圍內(nèi)高效適應(yīng) AI 工作負(fù)載。
-
全棧 AI 優(yōu)化,包括計(jì)算、網(wǎng)絡(luò)、存儲(chǔ)、系統(tǒng)軟件、通信庫(kù)和應(yīng)用框架。
NVIDIA 最近推出了全球首款專(zhuān)為 AI 計(jì)算定制的 BlueField SuperNIC,基于 BlueField-3 網(wǎng)絡(luò)平臺(tái)。它是 NVIDIA Spectrum-X 平臺(tái)的一部分,與 Spectrum-4 以太網(wǎng)交換機(jī)系統(tǒng)無(wú)縫集成。
NVIDIA BlueField-3 SuperNIC 和 Spectrum-4 交換機(jī)系統(tǒng)共同構(gòu)成專(zhuān)為優(yōu)化 AI 工作負(fù)載而設(shè)計(jì)的加速計(jì)算架構(gòu)。Spectrum-X 始終如一地提供極高網(wǎng)絡(luò)效率水平,遠(yuǎn)超傳統(tǒng)的以太網(wǎng)環(huán)境。
NVIDIA DPU 和網(wǎng)卡產(chǎn)品副總裁 Yael Shenhav 表示:“AI 正在推動(dòng)新一波的技術(shù)創(chuàng)新,BlueField-3 SuperNIC 是其中至關(guān)重要的一個(gè)齒輪。BlueField SuperNIC 可確保您的 AI 工作負(fù)載得到高效和快速的執(zhí)行,必將成為實(shí)現(xiàn) AI 計(jì)算未來(lái)的基礎(chǔ)組件。”
不斷發(fā)展的 AI 和網(wǎng)絡(luò)格局
AI 領(lǐng)域正在經(jīng)歷一場(chǎng)地震級(jí)轉(zhuǎn)變,這要?dú)w功于生成式 AI 和大語(yǔ)言模型,這些強(qiáng)大的技術(shù)釋放了新的可能性,使計(jì)算機(jī)能夠處理新任務(wù)。
AI 的成功很大程度上依賴(lài)于 GPU 加速計(jì)算來(lái)處理海量數(shù)據(jù)、訓(xùn)練大型 AI 模型并實(shí)現(xiàn)實(shí)時(shí)推理。這種新的計(jì)算能力開(kāi)辟了新的可能性,但也對(duì)以太網(wǎng)云網(wǎng)絡(luò)提出了挑戰(zhàn)。
傳統(tǒng)以太網(wǎng)是互聯(lián)網(wǎng)基礎(chǔ)設(shè)施的基礎(chǔ)技術(shù),旨在提供廣泛的兼容性和連接松耦合的應(yīng)用程序。它的設(shè)計(jì)并不是為了滿(mǎn)足現(xiàn)代 AI 工作負(fù)載的苛刻計(jì)算需求,這些工作負(fù)載涉及緊耦合的并行處理、快速數(shù)據(jù)傳輸和獨(dú)特的通信模式,所有這些都需要優(yōu)化的網(wǎng)絡(luò)連接。
傳統(tǒng)網(wǎng)絡(luò)接口卡(NIC)為通用計(jì)算、通用數(shù)據(jù)傳輸和互操作性而設(shè)計(jì),并沒(méi)有為 AI 工作負(fù)載計(jì)算強(qiáng)度帶來(lái)的獨(dú)特挑戰(zhàn)進(jìn)行優(yōu)化設(shè)計(jì)。
標(biāo)準(zhǔn)網(wǎng)卡(NIC)缺乏必要的特性和功能來(lái)實(shí)現(xiàn)高效的數(shù)據(jù)傳輸、低延遲和對(duì) AI 任務(wù)至關(guān)重要的確定性能。而 BlueField SuperNIC 則專(zhuān)為現(xiàn)代 AI 工作負(fù)載而構(gòu)建。
AI 計(jì)算環(huán)境中的 BlueField SuperNIC 優(yōu)勢(shì)
數(shù)據(jù)處理器(DPU)提供豐富的高級(jí)功能,可提供高吞吐量、低延遲的網(wǎng)絡(luò)連接等。自 2020 年推出以來(lái),DPU 在云計(jì)算領(lǐng)域越來(lái)越受歡迎,主要是因?yàn)槠淠軌蛐遁d、加速和隔離數(shù)據(jù)中心基礎(chǔ)設(shè)施處理。
盡管 DPU 和 BlueField SuperNIC 具有一系列相同的特性和功能,但 BlueField SuperNIC 針對(duì) AI 加速網(wǎng)絡(luò)進(jìn)行了獨(dú)特的優(yōu)化。下圖顯示了它們的對(duì)比情況:
分布式 AI 訓(xùn)練和推理通信流很大程度上取決于網(wǎng)絡(luò)帶寬的可用性。BlueField SuperNIC 以其獨(dú)特的設(shè)計(jì)而引人注目,其擴(kuò)展比 DPU 更有效,每個(gè) GPU 可提供驚人的 400Gb/s 網(wǎng)絡(luò)帶寬。
系統(tǒng)內(nèi) GPU 與 BlueField SuperNIC 的 1:1 配比可以顯著提高 AI 工作負(fù)載效率,從而提高企業(yè)的生產(chǎn)力和卓越成果。
BlueField SuperNIC 的唯一目的是加速 AI 云計(jì)算的網(wǎng)絡(luò)。因此,它比 DPU 消耗更少的計(jì)算能力,而 DPU 需要大量計(jì)算資源來(lái)卸載主機(jī) CPU 中的應(yīng)用程序。
計(jì)算需求的降低也轉(zhuǎn)化為功耗的降低,這在包含多達(dá) 8 個(gè) BlueField SuperNIC 的系統(tǒng)中尤為重要。
BlueField SuperNIC 的其他顯著特性包括其專(zhuān)用的 AI 網(wǎng)絡(luò)功能。當(dāng)與為 AI 優(yōu)化的 NVIDIA Spectrum-4 交換機(jī)緊密集成時(shí),它提供了自適應(yīng)路由、亂序數(shù)據(jù)包處理和優(yōu)化的擁塞控制。這些高級(jí)功能有助于加速以太網(wǎng) AI 云環(huán)境。
革新 AI 云計(jì)算
NVIDIA BlueField-3 SuperNIC 具有多項(xiàng)優(yōu)勢(shì),是 AI 基礎(chǔ)設(shè)施就緒的關(guān)鍵:
-
AI 工作負(fù)載峰值效率:BlueField-3 SuperNIC 專(zhuān)為網(wǎng)絡(luò)密集型大規(guī)模并行計(jì)算而構(gòu)建,是 AI 工作負(fù)載的理想選擇。它可確保 AI 任務(wù)高效運(yùn)行,消除通信瓶頸。
-
一致且可預(yù)測(cè)的性能:在同時(shí)處理大量任務(wù)的多租戶(hù)數(shù)據(jù)中心,BlueField-3 SuperNIC 可確保每個(gè)作業(yè)和租戶(hù)的性能都是隔離的、可預(yù)測(cè)的,并且不受其他網(wǎng)絡(luò)活動(dòng)的影響。
-
安全的多租戶(hù)云基礎(chǔ)設(shè)施:安全是重中之重,尤其是在處理敏感信息的數(shù)據(jù)中心。BlueField-3 SuperNIC 保持極高的安全級(jí)別,使多個(gè)租戶(hù)能夠共存,同時(shí)保持?jǐn)?shù)據(jù)和處理隔離。
-
可擴(kuò)展的網(wǎng)絡(luò)基礎(chǔ)設(shè)施:BlueField-3 SuperNIC 的范圍并不受限,它高度靈活,可適應(yīng)各種其他網(wǎng)絡(luò)基礎(chǔ)設(shè)施需求。
-
廣泛的服務(wù)器制造商支持:BlueField-3 SuperNIC 無(wú)縫適用于大多數(shù)企業(yè)級(jí)服務(wù)器,無(wú)需額外供電,為數(shù)據(jù)中心實(shí)現(xiàn)高效節(jié)能。
掃描下方二維碼,閱讀白皮書(shū),詳細(xì)了解 NVIDIA BlueField-3 SuperNIC,包括它們?nèi)绾慰?NVIDIA 數(shù)據(jù)中心平臺(tái)進(jìn)行集成:新一代網(wǎng)絡(luò),迎接新一波 AI 浪潮。
?
更多精彩內(nèi)容 利用 NVIDIA DOCA Flow 實(shí)現(xiàn) DPU 加速數(shù)據(jù)包轉(zhuǎn)向邏輯
使用 NVIDIA BlueField DPU 加速 Suricata IDS / IPS
使用 NVIDIA BlueField-3 DPU 驅(qū)動(dòng)下一波應(yīng)用程序 ? ?
GTC 2024 將于 2024 年 3 月 18 至 21 日在美國(guó)加州圣何塞會(huì)議中心舉行,線(xiàn)上大會(huì)也將同期開(kāi)放。掃描下方海報(bào)二維碼,立即注冊(cè) GTC 大會(huì)。
原文標(biāo)題:什么是 BlueField SuperNIC?
文章出處:【微信公眾號(hào):NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
-
英偉達(dá)
+關(guān)注
關(guān)注
22文章
3800瀏覽量
91348
原文標(biāo)題:什么是 BlueField SuperNIC?
文章出處:【微信號(hào):NVIDIA_China,微信公眾號(hào):NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論