在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

計(jì)算高速鏈路互連內(nèi)存和GPU以實(shí)現(xiàn)高性能

星星科技指導(dǎo)員 ? 來(lái)源:嵌入式計(jì)算設(shè)計(jì) ? 作者:Saumitra Jagdale ? 2022-10-24 16:29 ? 次閱讀

隨著云計(jì)算技術(shù)的進(jìn)步,數(shù)據(jù)中心的架構(gòu)內(nèi)存安排發(fā)生了重大變化。為了增強(qiáng)計(jì)算能力和廣泛的數(shù)據(jù)處理,需要集成擅長(zhǎng)處理特定工作負(fù)載的加速器。雖然這些設(shè)備已經(jīng)通過(guò)PCI Express連接,但計(jì)算快速鏈路可以進(jìn)一步改善優(yōu)化,因?yàn)樗试S對(duì)各種系統(tǒng)組件進(jìn)行異構(gòu)處理。

PCI Express是用于將主機(jī)處理器連接到加速器設(shè)備的最常見(jiàn)技術(shù)。它是一種高性能、行業(yè)標(biāo)準(zhǔn)的串行 I/O 接口,專為在企業(yè)、桌面和嵌入式應(yīng)用中使用而開(kāi)發(fā)。

同時(shí),PCIe在具有大型共享內(nèi)存池和大量需要高帶寬的設(shè)備的系統(tǒng)中存在局限性。由于每個(gè) PCIe 層次結(jié)構(gòu)都使用單個(gè) 64 位地址空間,因此 PCIe 未提供支持一致性的技術(shù),并且無(wú)法充分維護(hù)單獨(dú)的內(nèi)存池。此外,PCIe 鏈路具有太多的延遲,無(wú)法有效地管理系統(tǒng)中多個(gè)設(shè)備之間的共享內(nèi)存。

因此,計(jì)算密集型工作負(fù)載需要與更快的數(shù)據(jù)流連接,以有效地?cái)U(kuò)展數(shù)據(jù)中心中的異構(gòu)計(jì)算。計(jì)算高速鏈路 (CXL) 通過(guò)利用 PCI 高速 5.0 的物理和電氣接口來(lái)挑戰(zhàn)一些限制。這項(xiàng)新技術(shù)提高了內(nèi)存容量和帶寬,并降低了延遲。它是高速通信的接口,因?yàn)榧铀倨髟絹?lái)越多地用于補(bǔ)充CPU以支持新興應(yīng)用。

什么是斷續(xù)器?

計(jì)算高速鏈路 (CXL) 是一種開(kāi)放的行業(yè)標(biāo)準(zhǔn)內(nèi)存互連。它旨在為當(dāng)今數(shù)據(jù)中心中使用的許多類型的內(nèi)存提供高性能連接,例如CPU,TPU,GPU和其他處理器類型。

CXL 利用 PCIe 5.0 的物理層基礎(chǔ)架構(gòu)在主機(jī)和所有設(shè)備之間創(chuàng)建公共內(nèi)存空間。緩存一致性標(biāo)準(zhǔn)可確保主機(jī)處理器和 CXL 設(shè)備在訪問(wèn)數(shù)據(jù)時(shí)看到相同的數(shù)據(jù)。CPU 主機(jī)主要負(fù)責(zé)一致性管理,允許 CPU 和設(shè)備共享資源以獲得更高的性能并降低軟件堆棧的復(fù)雜性,從而降低設(shè)備總成本。

除了原始性能外,CXL還有其他優(yōu)勢(shì)。該技術(shù)是開(kāi)源的,不像美光的3D Xpoint,這是迄今為止最接近高性能內(nèi)存互連的方法。美光和英特爾現(xiàn)在正在對(duì)沖他們對(duì)CXL的賭注,而不是專有技術(shù)。NVIDIA 和 AMD 的硬件系統(tǒng)還使用 CXL 來(lái)互連內(nèi)存和外部處理單元,以優(yōu)化性能。NVIDIA的GPU與CXL設(shè)計(jì)相結(jié)合,進(jìn)行了如此廣泛的計(jì)算,并在內(nèi)存設(shè)計(jì)中進(jìn)行了一些更改。

這種轉(zhuǎn)變的最重要結(jié)果將是CXL消除專有內(nèi)存互連。它是必不可少的,因?yàn)橛袔追N類型的企業(yè)存儲(chǔ),每個(gè)處理器都通過(guò)專有連接訪問(wèn)它們。這可能會(huì)使企業(yè)存儲(chǔ)基礎(chǔ)架構(gòu)變得復(fù)雜,并且無(wú)法預(yù)測(cè)其性能。

現(xiàn)在,由于CXL,每個(gè)處理器都將能夠訪問(wèn)所有類型的內(nèi)存。這將允許單獨(dú)的處理器共享相同的內(nèi)存池。它不僅對(duì)于數(shù)據(jù)中心至關(guān)重要,而且對(duì)于開(kāi)發(fā)通常使用CPU,GPU和TPU的AI神經(jīng)網(wǎng)絡(luò)和深度機(jī)器學(xué)習(xí)系統(tǒng)等技術(shù)也至關(guān)重要。

CXL 事務(wù)層協(xié)議

憑借與 PCIe 5.0 相似的帶寬,CXL 使用三種動(dòng)態(tài)多路復(fù)用的事務(wù)層協(xié)議:CXL.io、CXL.緩存和 CXL.內(nèi)存,以在 PCIe 上獲得優(yōu)勢(shì)。

CXL.io 協(xié)議幾乎與 PCIe 5.0 相同。它用于設(shè)備發(fā)現(xiàn)、配置、寄存器訪問(wèn)、中斷、虛擬化和批量 DMA

CXL.cache 是一種可選協(xié)議,用于定義主機(jī)和設(shè)備之間的交互。這允許連接的 CXL 設(shè)備使用請(qǐng)求和響應(yīng)方法以極低的延遲高效緩存主機(jī)內(nèi)存。

CXL.memory 是一種可選協(xié)議,它使用加載和存儲(chǔ)命令為主機(jī)處理器提供對(duì)加速器連接的內(nèi)存的直接訪問(wèn)。加速器連接的內(nèi)存被 CPU、GPU 或 TPU 視為額外的地址空間,從而提高效率并降低延遲。

CXL 對(duì)存儲(chǔ)的影響

CXL依賴于存儲(chǔ),并將對(duì)其產(chǎn)生影響。它將允許存儲(chǔ)系統(tǒng)使用更大的內(nèi)存池進(jìn)行緩存。該技術(shù)有利于使用內(nèi)存作為緩存的存儲(chǔ)應(yīng)用程序或系統(tǒng)。這一點(diǎn)至關(guān)重要,因?yàn)殡m然許多ISP定期限制帶寬,但臨時(shí)數(shù)據(jù)存儲(chǔ)正在成為數(shù)據(jù)中心性能的關(guān)鍵方面。

商用存儲(chǔ)系統(tǒng)中目前可用的最大 DRAM 緩存為 3 TB。盡管使用 MemVerge 或福爾穆盧斯黑色,但特定的軟件定義存儲(chǔ)可以使用英特爾傲騰 PMem 將該緩存擴(kuò)展到 4.5 TB。但是,這對(duì)除最富有的組織之外的所有組織的緩存內(nèi)存施加了硬性限制。幸運(yùn)的是,CXL 通過(guò)允許存儲(chǔ)軟件跨多個(gè)存儲(chǔ)介質(zhì)緩存數(shù)據(jù)來(lái)解決此問(wèn)題。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    19316

    瀏覽量

    230074
  • 云計(jì)算
    +關(guān)注

    關(guān)注

    39

    文章

    7835

    瀏覽量

    137501
  • 數(shù)據(jù)中心
    +關(guān)注

    關(guān)注

    16

    文章

    4792

    瀏覽量

    72180
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    《CST Studio Suite 2024 GPU加速計(jì)算指南》

    問(wèn)題,但會(huì)降低舊GPU硬件性能,可通過(guò)NVIDIA控制面板或命令行工具nvidia - smi管理。 - TCC模式(Windows only):某些GPU計(jì)算需要啟用,可通過(guò)命令行
    發(fā)表于 12-16 14:25

    博威合金亮相互連大會(huì),AI數(shù)字化大模型賦能高速互聯(lián)新材料研發(fā)

    數(shù)據(jù)中心和高性能計(jì)算需求等方面都具有極其重要的意義。但互連設(shè)備的不斷增多和數(shù)據(jù)量的爆發(fā)性增長(zhǎng),對(duì)互連技術(shù)的創(chuàng)新提出了更高要求。面對(duì)日益復(fù)雜的應(yīng)用場(chǎng)景,
    的頭像 發(fā)表于 12-12 15:08 ?344次閱讀
    博威合金亮相<b class='flag-5'>互連</b>大會(huì),AI數(shù)字化大模型賦能<b class='flag-5'>高速</b>互聯(lián)新材料研發(fā)

    《算力芯片 高性能 CPUGPUNPU 微架構(gòu)分析》第3篇閱讀心得:GPU革命:從圖形引擎到AI加速器的蛻變

    對(duì)卷積核優(yōu)化的思考。 GPU的存儲(chǔ)體系采用了獨(dú)特的倒金字塔結(jié)構(gòu),在我看來(lái)這是其計(jì)算性能的關(guān)鍵。大容量寄存器設(shè)計(jì)破解了傳統(tǒng)馮諾依曼架構(gòu)的內(nèi)存瓶頸,合并訪存機(jī)制巧妙解決了
    發(fā)表于 11-24 17:12

    AI高性能計(jì)算平臺(tái)是什么

    AI高性能計(jì)算平臺(tái)不僅是AI技術(shù)發(fā)展的基石,更是推動(dòng)AI應(yīng)用落地、加速產(chǎn)業(yè)升級(jí)的重要工具。以下,是對(duì)AI高性能計(jì)算平臺(tái)的介紹,由AI部落小編為您整理分享。
    的頭像 發(fā)表于 11-11 09:56 ?206次閱讀

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗(yàn)】--了解算力芯片GPU

    每個(gè)CUDA單元在 OpenCL 編程框架中都有對(duì)應(yīng)的單元。 倒金字塔結(jié)構(gòu)GPU存儲(chǔ)體系 共享內(nèi)存是開(kāi)發(fā)者可配置的編程資源,使用門檻較高,編程上需要更多的人工顯式處理。 在并行計(jì)算架構(gòu)中,線程
    發(fā)表于 11-03 12:55

    如何提高GPU性能

    學(xué)習(xí)和機(jī)器學(xué)習(xí)等領(lǐng)域發(fā)揮著重要作用。 1. 硬件升級(jí) a. 更換高性能GPU 最直接的提高GPU性能的方法是升級(jí)到更高性能的顯卡。隨著技術(shù)的
    的頭像 發(fā)表于 10-27 11:21 ?546次閱讀

    GPU高性能服務(wù)器配置

    GPU高性能服務(wù)器作為提升計(jì)算速度和效率的關(guān)鍵設(shè)備,在各大應(yīng)用場(chǎng)景中發(fā)揮著越來(lái)越重要的作用。在此,petacloud.ai小編為你介紹GPU高性能
    的頭像 發(fā)表于 10-21 10:42 ?228次閱讀

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗(yàn)】--了解算力芯片CPU

    本篇結(jié)合第1-5章,梳理了解學(xué)習(xí)CPU流水線、緩存硬件結(jié)構(gòu)、計(jì)算單元、邏輯拓?fù)浣Y(jié)構(gòu)等知識(shí)點(diǎn)。 █本書開(kāi)篇將了TOP500超級(jí)計(jì)算機(jī)。TOP500使用HPL基準(zhǔn)測(cè)試來(lái)評(píng)估超級(jí)計(jì)算機(jī)的性能
    發(fā)表于 10-20 12:03

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗(yàn)】--全書概覽

    技術(shù) 11.1 從DDR到HBM 11.2 PCExpress總線概況 11.3擴(kuò)展技術(shù) 11.4 NVLink互連技術(shù)與GPU超級(jí)計(jì)算
    發(fā)表于 10-15 22:08

    米爾STM32MP2核心板首發(fā)新品上市!高性能+多接口+邊緣算力

    /1USB2.0 HOST/3SDIO3.0/9UART接口/8I2C/4個(gè)I3/8SPI/1
    發(fā)表于 09-20 18:24

    名單公布!【書籍評(píng)測(cè)活動(dòng)NO.43】 算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析

    力,在全球范圍內(nèi),對(duì)于推動(dòng)科技進(jìn)步、經(jīng)濟(jì)發(fā)展及社會(huì)整體的運(yùn)作具有至關(guān)重要的作用。隨著信息技術(shù)的高速發(fā)展,高性能計(jì)算(HPC)和人工智能(AI)等技術(shù)在多個(gè)領(lǐng)域的應(yīng)用變得日益廣泛,芯片算力成為支持這些
    發(fā)表于 09-02 10:09

    存內(nèi)計(jì)算WTM2101編譯工具 資料

    出來(lái)再進(jìn)行計(jì)算,讀取時(shí)間與參數(shù)規(guī)模成正比,計(jì)算芯片的功耗和性能受限,GPU算力利用率甚至不到8%。 存內(nèi)計(jì)算芯片
    發(fā)表于 05-16 16:33

    業(yè)界首創(chuàng)512GB CXL AIC內(nèi)存擴(kuò)展卡,江波龍革新AI與高性能計(jì)算領(lǐng)域內(nèi)存技術(shù)

    人工智能大模型計(jì)算高性能計(jì)算(HPC)以及數(shù)據(jù)中心等行業(yè)的迅猛發(fā)展,對(duì)計(jì)算機(jī)系統(tǒng)內(nèi)存性能的需求
    發(fā)表于 04-17 14:40 ?460次閱讀
    業(yè)界首創(chuàng)512GB CXL AIC<b class='flag-5'>內(nèi)存</b>擴(kuò)展卡,江波龍革新AI與<b class='flag-5'>高性能</b><b class='flag-5'>計(jì)算</b>領(lǐng)域<b class='flag-5'>內(nèi)存</b>技術(shù)

    什么是HPC高性能計(jì)算

    高性能計(jì)算(HighPerformanceComputing,簡(jiǎn)稱HPC),是指利用集群、網(wǎng)格、超算等計(jì)算機(jī)技術(shù),通過(guò)合理地組織計(jì)算機(jī)資源以及運(yùn)用適合的算法和程序,提高
    的頭像 發(fā)表于 02-19 13:27 ?878次閱讀
    什么是HPC<b class='flag-5'>高性能</b><b class='flag-5'>計(jì)算</b>

    從56G到112G,高速互連帶來(lái)的新挑戰(zhàn)

    計(jì)算機(jī)系統(tǒng)中,包含了CPU、GPU內(nèi)存、存儲(chǔ)設(shè)備等組件,這些組件都無(wú)法各自獨(dú)立運(yùn)行,一般需要通過(guò)互連協(xié)議相互連接,進(jìn)行通信和數(shù)據(jù)傳輸,才
    發(fā)表于 01-08 15:39 ?1728次閱讀
    從56G到112G,<b class='flag-5'>高速</b><b class='flag-5'>互連</b>帶來(lái)的新挑戰(zhàn)
    主站蜘蛛池模板: 色偷偷女男人的天堂亚洲网| 免费在线你懂的| 亚洲a网| 色多多在线| 婷婷99| 亚洲成a人片8888kkkk| www永久免费视频| 成年人网站黄色| 一级特黄aaa免费| 欧美色交| 亚洲 欧美 日韩 在线 中文字幕| 中文字幕在线看精品乱码| 91在线免费观看网站| 中文一区二区| 国色天香网在线| 性人久久久久| 日本免费成人| 激情网五月天| 免费的三级网站| 国产中出视频| 久久亚洲国产欧洲精品一| 日本吻胸抓胸激烈视频网站| 欧美三级视频网站| 国产亚洲精品在天天在线麻豆| eeuss久久久精品影院| 天天干网站| 一丝不遮视频免费观看| 天天插天天舔| 4438x全国最大色| 大香线蕉97久久| 久久福利国产| miya亚洲私人影院在线| chinese国产一区二区| 色网站免费在线观看| 久久精品亚瑟全部免费观看| 99精品久久久久久久婷婷| 欧美啊片| 男人天堂资源站| 天天操狠狠干| 亚洲综合精品成人啪啪| 69久久夜色精品国产69小说|