在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

AI時代,你需要了解的GPU互聯技術:NVLink、IB、ROCE

sakobpqhz ? 來源:算力基建 ? 2023-12-13 16:26 ? 次閱讀

AI 時代 GPU 成為核心處理器,分布式訓練訴求提升。GPU 采用并行計算方式,擅長處理大量、簡單的運算,因此多適用于圖像圖形處理和 AI 推理。但是大模型復雜度日益提升,單卡 GPU 顯存有限,無法滿足訓練需求,比如百度文心一言大模型有 2600 億個參數,但是實際上一個 80G 顯存的 A800,算上訓練中間的計算狀態,只能存放 10-20 億參數,存放 2600 億的模型就需要 100-200 塊 GPU;此外,后續大模型訓練需要更多參數和更多計算,由此產生的 GPU 需求更為龐大。為適應算力需求,需要聯合多張 GPU 甚至多臺服務器協同工作,分布式訓練成為核心訓練方式。

網絡連接在分布式系統中擔任重要角色。網絡在分布式系統中提供了連接作用,可以根據連接層級區分為單卡、多卡、多機互聯,單卡內的網絡為計算用的神經網,多卡之間的連接(即 GPU 互聯)通常采用 PCIe 或各種高帶寬通信網絡,多機之間的連接(即服務器互聯)通常采用 RDMA 網絡。

總線是數據通信必備管道,PCIe 是最泛使用的總線協議。總線是服務器主板上不同硬件互相進行數據通信的管道,對數據傳輸速度起到決定性作用,目前最普及的總線協議為英特爾 2001 年提出的 PCIe(PCI-Express)協議,PCIe 主要用于連接 CPU 與其他高速設備如 GPU、SSD、網卡、顯卡等,2003 年 PCIe1.0 版本發布,后續大致每過三年會更新一代,目前已經更新到6.0版本,傳輸速率高達64GT/s,16通道的帶寬達到256GB/s,性能和可擴展性不斷提高。

PCIe 總線樹形拓撲和端到端傳輸方式限制了連接數量和速度,PCIe Switch 誕生。PCIe采用端對端數據傳輸鏈路,PCIe 鏈路的兩端只能各接入一個設備,設備識別數量有限,無法滿足有大量設備連接或需要高速數據傳輸的場景,因此 PCIe Switch 誕生。PCIe Switch 具備連接和交換雙重功能,可以讓一個 PCIe 端口識別和連接更多設備,解決通道數量不夠的問題,并可以將多條 PCIe 總線連接在一起,從而形成一個高速網絡,實現多設備通信,簡言之 PCIe Switch 相當于 PCIe 的拓展器。

f0b2d81e-9990-11ee-8b88-92fbcf53809c.png

GPU 互 聯 時 代 , PCIe 傳 輸 速 率 和 網 絡 延 遲 無 法 滿 足 需 求 ,NVLINK、CAPI、GenZ、CCIX、CXL 等“百家爭鳴”時代開啟。AIGC 的發展極大刺激算力需求的增加,GPU 多卡組合成為趨勢,GPU 互聯的帶寬通常需要在數百 GB/S以上,PCIe 的數據傳輸速率成為瓶頸,鏈路接口的串并轉換會網絡延時,影響 GPU 并行計算效率,還由于 GPU 發出的信號需要先傳遞到 PCIe Switch,PCIe Switch 涉及到數據的處理又會造成額外的網絡延時,此外 PCIe 總線與存儲器地址分離,每次訪問內存會加重網絡延遲,因此 PCIe 協議在 GPU 多卡通信中效率并不高。為了將總線通信效率提升,降低延時,各家紛紛推出替代協議:

CAPI 協議:由 IBM 最早推出,后逐漸演化成 Open CAPI,本質是現有高速 I/O 標準之上的應用程序擴展,添加了緩存一致性和更低延遲等內容,但由于 IBM 服務器份額的持續下降,CAPI 協議缺少用戶基礎,最終未能廣泛流傳。

GenZ 協議:GenZ 是不依賴于任何芯片平臺的開放性組織,眾多廠家參與其中包括AMDARM、IBM、Nvidia、Xilinx 等,GenZ 將總線協議拓展成交換式網絡并加入GenZSwitch 提高了拓展性。

CXL 協議(陸續兼并上述兩個協議):2019 年由 Intel 推出,與 CAPI 協議思路類似,2021 年底吸收 GenZ 協議共同發展,2022 年兼并 Open CAPI 協議,CXL 具備內存接口,逐漸成長為設備互連標準的重要主導協議之一。

CCIX 協議:ARM 加入的另一個開放協議,功能類似 GenZ 但未被吸收兼并。

NVLINK 協議:英偉達提出的高速 GPU 互聯協議,對比傳統 PCIe 總線協議,NVLINK主要在三個方面做出較大改變:1)支持網狀拓撲目,解決通道有限問題;2)統一內存,允許 GPU 共享公共內存池,減少 GPU 之間復制數據的需要,從而提高效率;3)直接內存訪問,不需要 CPU 參與,GPU 可直接讀取彼此的內存,從而降低網絡延遲。此外,為解決 GPU 之間通訊不均衡問題,英偉達還引入 NVSwitch,一種類似交換機 ASIC 的物理芯片,通過 NVLink 接口將多個 GPU 高速互聯,創建高帶寬多節點 GPU 集群。2023 年 5 月 29 日,英偉達推出 AI 超級計算機 DGX GH200,通過 NVLink 和 NVSwitch 連接 256 個 GH200 芯片,所有 GPU 連接成一個整體協同運行,可訪問內存突破 100TB。

f0c5f778-9990-11ee-8b88-92fbcf53809c.png

多機互聯:IB 網絡與以太網絡并存

分布式訓練下 RDMA 網絡成為最佳選擇,包含 IB 網絡和以太網絡。傳統的 TCP/IP 網絡通信是通過內核發送消息,涉及較多數據移動和數據復制,不適用高性能計算、大數據分析等需要 IO 高并發、低時延的場景。RDMA 是一種計算機網絡技術,可以直接遠程訪問內存數據,無需操作系統內核介入,不占用 CPU 資源,可以顯著提高數據傳輸的性能并且降低延遲,因此更適配于大規模并行計算機集群的網絡需求。目前有三種 RDMA:Infiniband、RoCE、iWARP,后兩者是基于以太網的技術:

f0e0d372-9990-11ee-8b88-92fbcf53809c.png

Infiniband:是專為 RDMA 設計的網絡,從硬件級別保證可靠傳輸,具備更高的帶寬和更低的時延。但是成本高,需要配套 IB 網卡和 IB 交換機。

RoCE:基于以太網做 RDMA,可以使用普通的以太網交換機,成本較低,但是需要支持 RoCE 的網卡。

iWARP:基于 TCP 的 RDMA 網絡,利用 TCP 達到可靠傳輸。相比 RoCE,在大型組網的情況下,iWARP 的大量 TCP 連接會占用大量的內存資源,對系統規格要求更高。可以使用普通的以太網交換機,但是需要支持 iWARP 的網卡。

f0ef8c96-9990-11ee-8b88-92fbcf53809c.png

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 數據傳輸
    +關注

    關注

    9

    文章

    1919

    瀏覽量

    64673
  • gpu
    gpu
    +關注

    關注

    28

    文章

    4752

    瀏覽量

    129055
  • AI
    AI
    +關注

    關注

    87

    文章

    31097

    瀏覽量

    269429

原文標題:AI時代,你需要了解的GPU互聯技術:NVLink、IB、ROCE

文章出處:【微信號:算力基建,微信公眾號:算力基建】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    GPU集群組網技術詳解

    ? 流行的GPU/TPU集群網絡組網,包括:NVLink、InfiniBand、ROCE以太網Fabric、DDC網絡方案等,深入了解它們之間的連接方式以及如何在LLM訓練中發揮作用
    的頭像 發表于 12-25 10:11 ?5250次閱讀
    <b class='flag-5'>GPU</b>集群組網<b class='flag-5'>技術</b>詳解

    AI訓練,為什么需要GPU

    隨著由ChatGPT引發的人工智能熱潮,GPU成為了AI大模型訓練平臺的基石,甚至是決定性的算力底座。為什么GPU能力壓CPU,成為炙手可熱的主角呢?要回答這個問題,首先需要了解當前人
    的頭像 發表于 04-24 08:05 ?1075次閱讀
    <b class='flag-5'>AI</b>訓練,為什么<b class='flag-5'>需要</b><b class='flag-5'>GPU</b>?

    RoCEIB對比分析(一):協議棧層級篇

    AI 算力建設中, RDMA 技術是支持高吞吐、低延遲網絡通信的關鍵。目前,RDMA技術主要通過兩種方案實現:Infiniband和RoCE(基于RDMA的以太網
    的頭像 發表于 11-15 13:58 ?1190次閱讀
    <b class='flag-5'>RoCE</b>與<b class='flag-5'>IB</b>對比分析(一):協議棧層級篇

    進一步解讀英偉達 Blackwell 架構、NVlink及GB200 超級芯片

    1.8TB的GPUGPU互連速度、InfiniBand網絡和NVIDIA Magnum IO?軟件的第五代NVLink技術,GB200 NVL72性能顯著提升。 此外,GB200 N
    發表于 05-13 17:16

    吳霽虹:AI時代是否會變成「數據奴隸」?

    什么是「數據奴隸」?AI時代創新者通過先進算法、大數據等相關技術,為城市管理、公安、醫療、客服等眾多領域注入了新鮮的活力,帶來了翻天覆地的變化。伴隨著AI
    發表于 06-27 20:42

    特斯拉V100 Nvlink是否支持v100卡的nvlink變種的GPU直通?

    /4029/SYS-4029GP-TVRT.cfm)我們正試圖做pci將GPU直接傳輸到VM中但是當我們通過pci設備并安裝驅動程序時,我們會從nvidia-nvlink模塊中獲得錯誤。是否支持v100卡的nvlink
    發表于 09-12 16:25

    SAW和BAW濾波器需要了解這些

    SAW和BAW濾波器需要了解這些
    發表于 05-24 06:41

    為什么要了解電機的工作原理

    ,家里的電器基本都會癱瘓,所以即使不是電子行業從業人員,也有必要了解電機,知道電機為什么能夠運轉。本文力求用簡潔易懂的圖片和動畫演示,來說明電機的工作原理,相信看完本篇文章,電機就不再是那個,
    發表于 08-27 06:49

    英偉達GPU卡多卡互聯NVLink,系統累積的公差,是怎么解決的?是連接器吸收的?

    英偉達不斷推出GPU卡,并且實現多卡互聯NVLink,實際整個系統會累積到一個較大的公差,而目前市面上已有的連接器只能吸收較少的公差,這個是怎么做到匹配的呢?
    發表于 03-05 16:17

    需要了解的嵌入式Linux

    需要了解的嵌入式Linux 今天,Linux 正廣泛應用于各種嵌入式設備的開發中,如數字電視、機頂盒、DVR播放器、xDSL/有線/PON調制解調器、家用路由器和網關。它尤其適
    發表于 01-18 16:19 ?709次閱讀
    <b class='flag-5'>你</b><b class='flag-5'>需要了解</b>的嵌入式Linux

    替換滾珠螺桿需要了解哪些參數?

    替換滾珠螺桿需要了解哪些參數?
    的頭像 發表于 09-08 17:47 ?903次閱讀
    替換滾珠螺桿<b class='flag-5'>需要了解</b>哪些參數?

    我們為什么需要了解一些先進封裝?

    我們為什么需要了解一些先進封裝?
    的頭像 發表于 11-23 16:32 ?592次閱讀
    我們為什么<b class='flag-5'>需要了解</b>一些先進封裝?

    NVLink的演進:從內部互聯到超級網絡

    NVLink是NVIDIA開發的一種高速、低延遲的互聯技術,旨在連接多個GPU以實現高性能并行計算。與傳統的PCIe總線相比,NVLink
    的頭像 發表于 04-13 11:22 ?1160次閱讀
    <b class='flag-5'>NVLink</b>的演進:從內部<b class='flag-5'>互聯</b>到超級網絡

    全面解讀英偉達NVLink技術

    NVLink是一種解決服務器內GPU之間通信限制的協議。與傳統的PCIe交換機不同,NVLink帶寬有限,可以在服務器內的GPU之間實現高速直接互連。第四代
    發表于 04-22 11:01 ?1373次閱讀
    全面解讀英偉達<b class='flag-5'>NVLink</b><b class='flag-5'>技術</b>

    RoCEIB對比分析(二):功能應用篇

    在上一篇中,我們對RoCEIB的協議棧層級進行了詳細的對比分析,二者本質沒有不同,但基于實際應用的考量,RoCE在開放性、成本方面更勝一籌。本文我們將繼續分析RoCE
    的頭像 發表于 11-15 14:03 ?325次閱讀
    <b class='flag-5'>RoCE</b>與<b class='flag-5'>IB</b>對比分析(二):功能應用篇
    主站蜘蛛池模板: 中文字字幕码一二区| 免费日韩毛片| 操日本美女视频| 国产在线操| 午夜毛片免费观看视频| 国产性片在线| 成人在色线视频在线观看免费大全| xvideos国产| 午夜看片网| 久久久久久久国产免费看| 午夜神马影院| 人人干免费| 奇米7777| 大美女久久久久久j久久| 国产色片| 免费啪视频在线观看| 福利区在线观看| 黄色大片网站| 六月丁香深爱六月综合激情| 亚洲一区二区三区不卡视频| 欧美色淫| 日本68xxxxxxxxx老师| 成片免费的禁v影片| 成人欧美网站| 在线伊人网| 精品国产免费观看久久久| 4455亚洲| 曰本女人一级毛片看一级毛| 日本三级在线| 欧美成人免费| 成人亚洲网| 美女黄色一级毛片| 欧美成年网站| 一级一片免费视频播放| 青草国内精品视频在线观看| 成人亚洲欧美| 国产真实灌醉美女疯狂弄| 免费亚洲一区| 亚洲婷婷影院| 农村女人的一级毛片| 狠狠色噜噜狠狠狠狠奇米777 |