在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

英偉達(dá)GPU Direct不可或缺的RMDA技術(shù)到底有多厲害?

SSDFans ? 來源:楊湘祁 ? 作者:電子發(fā)燒友 ? 2019-03-01 13:48 ? 次閱讀

和娛樂圈的明星八卦一樣,IT行業(yè)里面的各種并購也是非常有市場的。畢竟,像EMC,Cisco,Broadcom 這樣的公司都是一路并購成長起來的。最近比較熱門的應(yīng)該是Mellanox說自己準(zhǔn)備賣自己了。在25G/50G/100G市場上占據(jù)了69%的市場份額,2018年前三個季度,出貨了2.1M的網(wǎng)絡(luò)端口。[1] 這么好的標(biāo)的,一時各種傳聞都出來了。Xilinx[2],Microsoft[3],Intel[4],估計還有Broadcom[5]都在準(zhǔn)備,以色列人的確有水平,已經(jīng)從5.5B到了6B。陳福陽在華爾街籌錢的能力,估計還有大招。

Mellanox是個什么公司,一句話,就是目前RDMA技術(shù)的事實的技術(shù)定義者。雖然海有很多公司也有RDMA技術(shù),但是在IB和Ethernet兩個市場都能夠呼風(fēng)喚雨,只有它了。

Remote DMA技術(shù)在Ethernet上的應(yīng)用不能不提微軟,目前微軟是目前在數(shù)據(jù)中心大規(guī)模部署RDMA的第一家HyperScale公司。微軟在2015/6/7/8年的Sigcomm [6]有大量的論文來講RDMA在數(shù)據(jù)中心的部署,很多人講微軟的風(fēng)格是自己做了100分,但是對外只講1分。因此可以想象Microsoft對于Mellanox準(zhǔn)備賣身的關(guān)注,自己的技術(shù)投入不能打水漂,不僅自己下手,而且鼓勵合作伙伴一起團購。

RDMA的技術(shù)是在一個有Mellanox主導(dǎo)的行業(yè)組織OFA[7]主導(dǎo)的。目前的成員如下圖,可以看到還是集中在HPC的專業(yè)領(lǐng)域。

英偉達(dá)GPU Direct必不可少的RMDA技術(shù)到底有多厲害?

OFA是2004年成立的工業(yè)組織,在整個HPC行業(yè)從Myrinet[8]轉(zhuǎn)換到IB的時候成立的。在2005年, Myrinet在TOP500的市場份額占到了28%,之后就一路下降,被IB替換掉了。對于誕生于HPC專業(yè)的領(lǐng)域,可用性一直是個大問題,HPC一切為了性能,不要虛擬化,不要通用操作系統(tǒng)和架構(gòu),每臺超算恨不得自成一臺體系。大家看看Mellanox的Linux 驅(qū)動的家族就知道這個有多復(fù)雜了。[7]

這路吐一個槽,作為Mellanox卡的資深用戶,我很早就自己畫了一份他們的OFED驅(qū)動的加載流程,作為Mellanox,這么基本的文檔在2018年12月才發(fā)布,而且很多模塊沒有upstream,讓人無奈的是,到現(xiàn)在為止我還沒有找到卸載rdma_cm ( connection mangament ) 的有效方法。每次都需要重啟

因此看到AWS說要發(fā)布他們的EFA的時候,覺得他們還是真有勇氣,但是仔細(xì)一看,原來和AWS的HPC業(yè)務(wù)緊密結(jié)合,而且利用了libfabric 的生態(tài)[8]

很明顯,libfabric在網(wǎng)路傳輸層和流行的HPC編程框架之間做了一個統(tǒng)一。更重要的是,對于原來OFA的功能定義做了一個大大減法。俺曾經(jīng)自己研究總結(jié)了Mellanox CX系列網(wǎng)卡的功能。大家可以自己看看這個復(fù)雜度。

對于像AWS這樣的Hyperscale公司也要部署RDMA,這個做法和之前的微軟有很大的不同。對于微軟,他們從40G開始規(guī)模部署RDMA,就是為了Azure的云環(huán)境的低延時網(wǎng)絡(luò),目前微軟的網(wǎng)絡(luò)還是天下第一。[9]當(dāng)然微軟為了大規(guī)模部署RoCEv2的所作的各種流控算法以及應(yīng)用的優(yōu)化對于整個業(yè)界都是非常有用的,但是他們主要停留在傳統(tǒng)的網(wǎng)絡(luò)上面。

AWS則不同,對于低延時網(wǎng)絡(luò)來講,在2014年之前,大部分的場景就是SDS,太多的存儲startup公司,使用PCIE Flash和RDMA 網(wǎng)卡來構(gòu)建自己的分布式存儲系統(tǒng),比較典型就是EMC收購的ScaleI/O了。[10]

2014年之后,由于ALexnet的出色表現(xiàn),RMDA和Nvidia有了深度合作,利用GPU Direct,在GPU集群中快速傳遞數(shù)據(jù)成了RDMA的另一個

大眾應(yīng)用。[11]

GPU+RDMA也是目前在TOP500部署量最大的應(yīng)用,因此可以很明確地看出AWS使用Nitro做EFA的目的了。

貌似只有一款機型部署了EFA。[12] 對于這個機型,定位很清楚,HPC和分布式機器學(xué)習(xí)的訓(xùn)練,因此功能實現(xiàn)也非常有目的,不要指望EFA會和Mellanox一樣功能強大。

因此,可以看出,傳統(tǒng)的Nitro芯片在升級了25G的Serdes之后,利用libfabric的生態(tài)實現(xiàn)了部分的RDMA的功能,可以滿足AWS上的HPC和ML的業(yè)務(wù)需求。這個和國內(nèi)的大廠的想法類似。

因此,對于未來RDMA在數(shù)據(jù)中心的使用場景,存儲和HPC是兩個比較明確的方向。對于存儲,如何和NVMe這樣的存儲介質(zhì),以及NVMeoF和Cephover RDMA這樣的存儲后端結(jié)合是一個方向,在這個方向上,是不是要支持IB的編程框架并不重要。對于HPC的方向,則是如何和GPU這樣的計算引擎結(jié)合,簡單數(shù)據(jù)傳輸?shù)难訒r,和上層的ML的框架緊密結(jié)合。

廣告時間: Xilinx在2018.1 中就推出了自己的RDMA的實現(xiàn),目前主要關(guān)注在存儲應(yīng)用這個方向。[13]實現(xiàn)了對10G/25G/40G/100G的網(wǎng)絡(luò)速率的支持,在Vivado 2019.1中會在延時上有進一步的提升,在512Byte上和標(biāo)準(zhǔn)的Mellanox類似,當(dāng)然我們也是兼容Mellanox。歡迎大家垂詢。

[1]https://www.businesswire.com/news/home/20181025005197/en/Mellanox-Ships-2.1-Million-Ethernet-Adapters-Quarters

[2]https://www.cnbc.com/2018/11/07/xilinx-working-with-barclays-to-buy-mellanox-possible-december-deal.html

[3]https://www.cbronline.com/news/microsoft-mellanox

[4]https://www.hpcwire.com/2019/01/30/intel-reportedly-in-6b-bid-for-mellanox/

[5]https://en.globes.co.il/en/article-mellanox-acquisition-fits-broadcom-like-a-glove-1001258241

[6]http://www.sigcomm.org/

[7]https://community.mellanox.com/s/article/mellanox-linux-driver-modules-relationship--mlnx-ofed-x

[8]https://ofiwg.github.io/libfabric/

[9]https://mspoweruser.com/report-microsoft-azure-beats-google-cloud-and-amazon-aws-in-network-performance/

[10]https://en.wikipedia.org/wiki/Dell_EMC_ScaleIO

[11]https://devblogs.nvidia.com/benchmarking-gpudirect-rdma-on-modern-server-platforms/

[12]https://aws.amazon.com/cn/ec2/instance-types/

[13]https://www.xilinx.com/products/intellectual-property/etrnic.html

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 英偉達(dá)
    +關(guān)注

    關(guān)注

    22

    文章

    3815

    瀏覽量

    91492

原文標(biāo)題:深度好文:RDMA,到底有多厲害?

文章出處:【微信號:SSDFans,微信公眾號:SSDFans】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    BGA芯片封裝:現(xiàn)代電子產(chǎn)業(yè)不可或缺技術(shù)瑰寶

    不可或缺的一部分。本文將深入探討B(tài)GA芯片的定義、特點以及BGA封裝工藝的詳細(xì)流程,為讀者揭開這一先進封裝技術(shù)的神秘面紗。
    的頭像 發(fā)表于 12-13 11:13 ?716次閱讀
    BGA芯片封裝:現(xiàn)代電子產(chǎn)業(yè)<b class='flag-5'>不可或缺</b>的<b class='flag-5'>技術(shù)</b>瑰寶

    高鐵站網(wǎng)約車數(shù)智出行到底有智能?

    在當(dāng)今這個科技飛速發(fā)展的時代,智能出行已成為我們?nèi)粘I钪?b class='flag-5'>不可或缺的一部分,而高鐵站網(wǎng)約車數(shù)智出行更是將這一理念推向了新的高度。那么,這種數(shù)智出行方式到底有智能呢? 首先,從預(yù)約叫車開始,高鐵站網(wǎng)
    的頭像 發(fā)表于 11-14 14:48 ?247次閱讀

    軟銀升級人工智能計算平臺,安裝4000顆英偉達(dá)Hopper GPU

    軟銀公司宣布,其正在擴展的日本頂級人工智能計算平臺已安裝了約4000顆英偉達(dá)Hopper GPU。這一舉措顯著提升了平臺的計算能力。據(jù)悉,該平臺自2023年9月開始運行,最初配備了大約2000顆
    的頭像 發(fā)表于 11-04 16:18 ?459次閱讀

    RTOS與Linux到底有什么區(qū)別

    很多做嵌入式開發(fā)的小伙伴都存在這樣的疑惑:RTOS與Linux到底有什么區(qū)別?
    的頭像 發(fā)表于 10-29 09:53 ?525次閱讀

    挑戰(zhàn)英偉達(dá):聚焦本土GPU領(lǐng)軍企業(yè)崛起

    達(dá)在全球圖形處理單元(GPU)市場的霸主地位,特別是其關(guān)鍵硬件對訓(xùn)練大型AI模型(如ChatGPT背后的OpenAI模型)的不可或缺性,中國正積極尋求突破。盡管英偉
    的頭像 發(fā)表于 09-18 15:24 ?732次閱讀

    英偉達(dá)將全面轉(zhuǎn)向開源GPU內(nèi)核模塊

    英偉達(dá)公司近期宣布了一項重大決策,即全面轉(zhuǎn)向開源GPU內(nèi)核模塊,并計劃最終以此取代閉源驅(qū)動程序。這一戰(zhàn)略轉(zhuǎn)變標(biāo)志著英偉達(dá)在開源領(lǐng)域邁出了重要
    的頭像 發(fā)表于 07-19 15:26 ?581次閱讀

    英偉達(dá)數(shù)據(jù)中心GPU出貨量飆升,市場份額持續(xù)領(lǐng)跑

    在全球半導(dǎo)體和計算技術(shù)不斷革新的浪潮中,英偉達(dá)(NVIDIA)再次憑借其卓越的技術(shù)實力和市場洞察力,在數(shù)據(jù)中心GPU領(lǐng)域取得了令人矚目的成績
    的頭像 發(fā)表于 06-13 17:08 ?1155次閱讀

    英偉達(dá)GPU新品規(guī)劃與HBM市場展望

    在COMPUTEX 2024主題演講中,英偉達(dá)(NVIDIA)公布了其GPU產(chǎn)品的未來規(guī)劃。據(jù)英偉達(dá)透露,B100、B200和GB200系列
    的頭像 發(fā)表于 06-13 09:44 ?846次閱讀

    進一步解讀英偉達(dá) Blackwell 架構(gòu)、NVlink及GB200 超級芯片

    計算工作負(fù)載、釋放百億億次計算能力和萬億參數(shù)人工智能模型的全部潛力提供關(guān)鍵基礎(chǔ)。 NVLink釋放數(shù)萬億參數(shù)AI模型的加速性能,顯著提升大型GPU系統(tǒng)的可擴展性。每個英偉達(dá)Black
    發(fā)表于 05-13 17:16

    英偉達(dá)、AMD、英特爾GPU產(chǎn)品及優(yōu)勢匯總

    電子發(fā)燒友網(wǎng)報道(文/李彎彎)隨著人工智能技術(shù)的快速發(fā)展,GPU的市場規(guī)模在全球范圍內(nèi)持續(xù)提升。目前,GPU市場主要由英偉達(dá)、AMD和英特爾
    的頭像 發(fā)表于 05-10 00:59 ?5379次閱讀

    國內(nèi)GPU新勢力:能否成為英偉達(dá)的“終結(jié)者”?

    在當(dāng)今的信息技術(shù)時代,圖形處理器(GPU)和人工智能(AI)加速卡在計算領(lǐng)域中扮演著至關(guān)重要的角色。英偉達(dá)(NVIDIA),作為全球GPU
    的頭像 發(fā)表于 04-24 11:07 ?482次閱讀
    國內(nèi)<b class='flag-5'>GPU</b>新勢力:能否成為<b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b>的“終結(jié)者”?

    印度政府考慮購買英偉達(dá)GPU以發(fā)展人工智能生態(tài)系統(tǒng)

    關(guān)于GPU的購買方式,政府正在考慮兩種方案。其一,由印度電子和信息技術(shù)部直接購入英偉達(dá)GPU,再分發(fā)給各用戶;另一種則是市場化模式,鼓勵企業(yè)
    的頭像 發(fā)表于 04-18 17:08 ?585次閱讀

    英偉達(dá)發(fā)布新一代AI芯片架構(gòu)Blackwell GPU

    近日,英偉達(dá)首席執(zhí)行官黃仁勛在GTC 2024會議上發(fā)表主題演講,重磅推出全新AI芯片架構(gòu)Blackwell GPU。這一創(chuàng)新技術(shù)的首款芯片產(chǎn)品命名為GB200,標(biāo)志著
    的頭像 發(fā)表于 03-26 11:19 ?911次閱讀

    英偉達(dá)在英受審,業(yè)績創(chuàng)新高

    英偉達(dá)解釋,諸國政府相關(guān)部門的調(diào)查將涵蓋GPU銷量、供應(yīng)鏈堅韌度與公司投資等重要環(huán)節(jié)。據(jù)預(yù)測,未來隨著更多信息披露訴求陸續(xù)出現(xiàn),而英偉達(dá)尚未
    的頭像 發(fā)表于 02-22 11:42 ?548次閱讀

    AMD將推新GPU,效能媲美英偉達(dá)RTX 4080

    據(jù)悉,AMD正努力研制新品級GPU,性能堪比英偉達(dá)的RTX 4080,而售價卻只有后者的一半。據(jù)多個在線社區(qū)反映,AMD即將發(fā)布的Radeon RX 8000系列GPU效能與NVIDI
    的頭像 發(fā)表于 01-31 10:00 ?3062次閱讀
    主站蜘蛛池模板: 国产一卡二卡≡卡四卡无人| 九色福利| 婷婷久久综合网| 成人伊人亚洲人综合网站222| 亚洲97| 无限国产资源| 日本免费人成在线网站| 欧美 在线播放| 狠狠色丁香婷婷综合橹不卡| 国产乱人视频免费播放| 伊人网综合在线观看| 天天躁狠狠躁| 国产一区二区三区波多野吉衣| www五月| 亚州一级毛片在线| 亚洲综合色一区| 日本午夜大片| 国产婷婷色一区二区三区深爱网 | 性欧美大战久久久久久久野外 | bt天堂资源在线种子| 偷操| 成人精品综合免费视频| 亚洲丝袜一区二区| 亚洲国产精品综合久久2007| 日本韩国做暖暖小视频| 国产三级播放| 天天插天天干| 午夜精品在线观看| 久久精品免费看| 亚洲乱码卡一卡二卡三永久| 亚洲丰满熟妇毛片在线播放| 欧美午夜片| se视频在线观看| 国产精品午夜国产小视频| 九色亚洲| 亚洲综合涩| 五月激情久久| 簧 色 成 人| 天堂资源最新版在线官网| 免费高清在线视频色yeye| 一级毛片aaa片免费观看|