在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

CXL內(nèi)存延遲到底有多糟糕?

芯長(zhǎng)征科技 ? 來(lái)源:半導(dǎo)體行業(yè)觀察 ? 作者:半導(dǎo)體行業(yè)觀察 ? 2022-12-07 15:44 ? 次閱讀

傳統(tǒng)觀點(diǎn)認(rèn)為,如果您非常關(guān)心延遲,那么嘗試將系統(tǒng)內(nèi)存連接到 PCI-Express 總線并不是一個(gè)好主意。因?yàn)閮?nèi)存離 CPU 越遠(yuǎn),延遲就越高,這就是內(nèi)存 DIMM 通常盡可能靠近插槽的原因。

從邏輯上講,PCI-Express 是千里之外的。隨著每一代 PCI-Express 帶寬翻倍,如果沒(méi)有重定時(shí)器的幫助也會(huì)增加延遲,它可以傳輸?shù)木嚯x也會(huì)縮短。對(duì)于我們習(xí)慣于連接到 PCI-Express 的大多數(shù)類(lèi)型的內(nèi)存來(lái)說(shuō),這不是什么大問(wèn)題。閃存存儲(chǔ)的延遲以幾十微秒為單位的情況并不少見(jiàn),這使得互連產(chǎn)生的額外幾百納秒成為一個(gè)有爭(zhēng)議的問(wèn)題。然而,我們對(duì)DDR 和其他形式的易失性存儲(chǔ)器就沒(méi)有那么寬容了。

以前的內(nèi)存擴(kuò)展嘗試都陷入了妥協(xié),特別是在延遲方面。例如,GigaIO 表示其FabreX 架構(gòu)已經(jīng)可以使用 DMA 在 PCI-Express 上進(jìn)行內(nèi)存池化,但這樣做需要應(yīng)用程序能夠容忍 500 納秒到 1.5 微秒的延遲。

同樣,根據(jù) Blocks and Files 的說(shuō)法,在英特爾今年夏天毫不客氣地削減其 Optane 持久內(nèi)存業(yè)務(wù)之前,部署該技術(shù)意味著會(huì)產(chǎn)生大約350 納秒的延遲。雖然可用,尤其是在分層內(nèi)存配置中,但它比直接連接 CPU 的 DDR 內(nèi)存預(yù)期的低于 100 納秒的往返延遲要長(zhǎng)得多。

進(jìn)入 CXL 內(nèi)存生態(tài)系統(tǒng)

這為我們帶來(lái)了使用 Compute Express Link 協(xié)議或 CXL 的第一代內(nèi)存擴(kuò)展模塊。基于 AMD 的Epyc 9004“Genoa”處理器的系統(tǒng)是首批系統(tǒng)之一,擁有 64 條 CXL 連接通道——不同于其 128 至 160 條整體 PCI-Express 通道——最多可分為四到十六個(gè)設(shè)備。至于英特爾將如何在其“Sapphire Rapids”Xeon SP 處理器上實(shí)施 CXL,我們將不得不等到它們明年初問(wèn)世。

與這些服務(wù)器相得益彰的是我們確信的第一個(gè)是許多 CXL 內(nèi)存擴(kuò)展模塊。雖然 CXL 最終將允許完全分解的系統(tǒng),在這些系統(tǒng)中,資源可以通過(guò)高速結(jié)構(gòu)在整個(gè)機(jī)架上共享,但距離那一天還有幾年的時(shí)間。

對(duì)于首次涉足數(shù)據(jù)中心,CXL 直接專(zhuān)注于內(nèi)存擴(kuò)展、分層內(nèi)存和一些早期的內(nèi)存池應(yīng)用程序。目前,我們只關(guān)注內(nèi)存擴(kuò)展,因?yàn)樵谶@個(gè)早期階段,它可以說(shuō)是最簡(jiǎn)單和最實(shí)用的,尤其是在以可用延遲附加內(nèi)存時(shí)。

三星和Astera Labs已經(jīng)展示了 CXL 內(nèi)存模塊,他們說(shuō)只需將它們插入兼容的 PCI-Express 5.0 插槽,即可為系統(tǒng)添加數(shù) TB 的內(nèi)存。從系統(tǒng)的角度來(lái)看,它們的外觀和行為就像通過(guò)內(nèi)存總線連接到相鄰插槽的常規(guī) DDR DRAM 內(nèi)存。

在最長(zhǎng)的時(shí)間里,一旦達(dá)到 CPU 內(nèi)存控制器的限制,添加更多內(nèi)存的唯一方法就是添加更多插槽。如果工作負(fù)載可以利用額外的線程,那就更好了,但如果不能,這將成為一種非常昂貴的添加內(nèi)存的方式。實(shí)際上,額外的插槽只是一個(gè)內(nèi)存控制器,上面附有一堆昂貴的、不需要的內(nèi)核。

內(nèi)存擴(kuò)展模塊的行為方式大致相同,但它不是使用專(zhuān)有的插槽到插槽互連,如英特爾的 UPI 或 AMD 的 xGMI 鏈接,而是 CXL。這意味著您可以擁有這些設(shè)備的整個(gè)生態(tài)系統(tǒng),事實(shí)上,我們已經(jīng)看到一個(gè)相當(dāng)充滿活力,有時(shí)甚至是令人向往的設(shè)備圍繞 CXL 展開(kāi)。

CXL 總裁 Siamak Tavallaei在 SC22上告訴 The Next Platform ,CXL 實(shí)際上包含三種協(xié)議,但并非所有協(xié)議都是延遲的靈丹妙藥。“CXL.io 仍然具有您預(yù)期的相同類(lèi)型的延遲(來(lái)自 PCI-Express),但其他兩個(gè)協(xié)議——CXL.cache 和 CXL.mem——通過(guò)協(xié)議采用更快的路徑,并且它們減少了延遲。”

CXL 內(nèi)存延遲到底有多糟糕?

如果 Astera 值得信任,延遲并不像您想象的那么糟糕。該公司的Leo CXL 內(nèi)存控制器旨在接受高達(dá) 5600 MT/秒的標(biāo)準(zhǔn) DDR5 內(nèi)存 DIMM。他們聲稱(chēng)客戶可以預(yù)期延遲與訪問(wèn)第二個(gè) CPU 上的內(nèi)存大致相當(dāng),一個(gè) NUMA 躍點(diǎn)。這使得它在 170 納秒到 250 納秒附近。事實(shí)上,就系統(tǒng)而言,這正是這些內(nèi)存模塊向操作系統(tǒng)顯示的方式。

Tavallaei 解釋說(shuō),大多數(shù) CXL 內(nèi)存控制器會(huì)增加大約 200 納秒的延遲,額外的重定時(shí)器會(huì)增加或花費(fèi)幾十納秒,具體取決于設(shè)備與 CPU 的距離。這與其他 CXL 早期采用者所看到的一致。GigaIO 首席執(zhí)行官 Alan Benjamin 告訴The Next Platform,它所見(jiàn)過(guò)的大多數(shù) CXL 內(nèi)存擴(kuò)展模塊的延遲都接近 250 納秒,而不是 170 納秒。

然而,正如 Tavallaei 指出的那樣,這仍然是對(duì)四插槽或八插槽系統(tǒng)的改進(jìn),在這些系統(tǒng)中,應(yīng)用程序可能僅僅因?yàn)樾枰獌?nèi)存而不得不應(yīng)對(duì)多個(gè) NUMA 躍點(diǎn)。(不過(guò),公平地說(shuō),IBM 和英特爾在 CPU 之間添加了更多更快的鏈接,以減少跳數(shù)和每跳延遲。)

話雖如此,許多芯片制造商很快指出,CXL 生態(tài)系統(tǒng)現(xiàn)在才剛剛起步。在 CXL 董事會(huì)任職的 AMD 的 Kurtis Bowman 告訴The Next Platform,許多早期的 CXL 概念驗(yàn)證和產(chǎn)品都使用尚未針對(duì)延遲進(jìn)行優(yōu)化的 FPGA 或第一代 ASIC。隨著時(shí)間的推移,他預(yù)計(jì)延遲會(huì)大大改善。

如果 CXL 供應(yīng)商能夠像他們聲稱(chēng)的那樣,在展廳演示之外實(shí)現(xiàn)與多插槽系統(tǒng)同等的延遲,那么它應(yīng)該在很大程度上消除利用它們所需的應(yīng)用程序或操作系統(tǒng)特定定制的需要。好吧,至少就內(nèi)存擴(kuò)展而言。正如我們?cè)?Optane 中看到的那樣,CXL 內(nèi)存分層幾乎肯定需要某種操作系統(tǒng)或應(yīng)用程序支持。

隨著插槽變得越來(lái)越大并且在板上安裝更多 DIMM 變得越來(lái)越難,這再合適不過(guò)了。放置它們的地方更少了。有可容納 32 個(gè) DIMM 的雙插槽系統(tǒng),但隨著芯片制造商增加更多通道以滿足更高核心數(shù)的帶寬需求,這是不可擴(kuò)展的。

我們已經(jīng)在某種程度上在 AMD 的 Genoa 芯片上看到了這一點(diǎn),盡管該芯片將內(nèi)存通道數(shù)量增加到 12 個(gè),但在發(fā)布時(shí)每個(gè)通道僅支持一個(gè) DIMM,將雙插槽配置中的 DIMM 數(shù)量限制為 24 個(gè)。即使您可以為每個(gè)通道連接兩個(gè) DIMM,我們被告知將 48 個(gè) DIMM 安裝到標(biāo)準(zhǔn)機(jī)箱中是不切實(shí)際的。

當(dāng)我們希望在更遠(yuǎn)的距離(例如跨機(jī)架)連接內(nèi)存時(shí),事情會(huì)變得更加復(fù)雜,因?yàn)殡娀蚬饣ミB產(chǎn)生的延遲必須計(jì)入方程式。但對(duì)于機(jī)箱內(nèi) CXL 內(nèi)存擴(kuò)展,延遲似乎并不像許多人擔(dān)心的那么令人頭疼。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • amd
    amd
    +關(guān)注

    關(guān)注

    25

    文章

    5481

    瀏覽量

    134346
  • 內(nèi)存
    +關(guān)注

    關(guān)注

    8

    文章

    3040

    瀏覽量

    74169
  • 生態(tài)系統(tǒng)
    +關(guān)注

    關(guān)注

    0

    文章

    703

    瀏覽量

    20749

原文標(biāo)題:CXL,面臨嚴(yán)峻的延遲問(wèn)題

文章出處:【微信號(hào):芯長(zhǎng)征科技,微信公眾號(hào):芯長(zhǎng)征科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    內(nèi)存擴(kuò)展CXL加速發(fā)展,繁榮AI存儲(chǔ)

    和IO墻的瓶頸。它通過(guò)PCI Express的物理層,提供低延遲和高帶寬的連接,旨在支持下一代數(shù)據(jù)中心的高性能計(jì)算和內(nèi)存密集型工作負(fù)載。 ? CXL主要有CXL.io、
    的頭像 發(fā)表于 08-18 00:02 ?4938次閱讀
    <b class='flag-5'>內(nèi)存</b>擴(kuò)展<b class='flag-5'>CXL</b>加速發(fā)展,繁榮AI存儲(chǔ)

    24位或者說(shuō)高分辨率的AD到底有什么用呢?

    的AD,如24位的AD,其分辨率達(dá)到很低的uV級(jí)別,我們?nèi)绾慰季科渚龋慷褹D的精度受到諸多因素的影響,其中參考源的穩(wěn)定度和供電電源的穩(wěn)定度對(duì)精度影響很大,參考源最低0.05%的精度,那么24位的分辨率所可以達(dá)到的精度卻是要大打折扣的,請(qǐng)問(wèn)在這樣的情況下,24位或者說(shuō)高分辨率的AD到底有什么用呢?
    發(fā)表于 01-07 06:49

    差分輸入和和單端輸入在本質(zhì)上到底有什么區(qū)別?

    和和單端輸入在本質(zhì) 上到底有什么區(qū)別? 因?yàn)椋珹DC采集的信號(hào)說(shuō)到底是AINP - AINN,不管單端還是差分,采集的信號(hào)都是這兩個(gè)pad的差值。 2:將單端信號(hào)接在ADC的差分輸入接口上可以用
    發(fā)表于 12-23 07:31

    TFP401APZP到底有沒(méi)有HSYNC輸出?

    請(qǐng)教下TI的大牛,TFP401APZP這顆IC到底有沒(méi)有HSYNC輸出?實(shí)測(cè)發(fā)現(xiàn)HSYNC無(wú)輸出,是要做什么設(shè)置么?!
    發(fā)表于 12-20 07:28

    高鐵站網(wǎng)約車(chē)數(shù)智出行到底有智能?

    在當(dāng)今這個(gè)科技飛速發(fā)展的時(shí)代,智能出行已成為我們?nèi)粘I钪胁豢苫蛉钡囊徊糠郑哞F站網(wǎng)約車(chē)數(shù)智出行更是將這一理念推向了新的高度。那么,這種數(shù)智出行方式到底有智能呢? 首先,從預(yù)約叫車(chē)開(kāi)始,高鐵站網(wǎng)
    的頭像 發(fā)表于 11-14 14:48 ?246次閱讀

    RTOS與Linux到底有什么區(qū)別

    很多做嵌入式開(kāi)發(fā)的小伙伴都存在這樣的疑惑:RTOS與Linux到底有什么區(qū)別?
    的頭像 發(fā)表于 10-29 09:53 ?521次閱讀

    研華科技推出SQRAM CXL 2.0 Type 3內(nèi)存模塊SQR-CX5N

    10月15日最新消息,研華科技(Advantech)于昨日正式揭曉了其最新研發(fā)的SQRAM CXL 2.0 Type 3 內(nèi)存模塊——SQR-CX5N。該模塊遵循EDSFF E3.S 2T標(biāo)準(zhǔn),擁有
    的頭像 發(fā)表于 10-15 15:28 ?481次閱讀

    CMOS運(yùn)放的輸入阻抗到底有多高呢?

    都說(shuō)CMOS運(yùn)放輸入阻抗高,到底有多高呢?可有一個(gè)量化指標(biāo)?
    發(fā)表于 09-06 06:59

    影響內(nèi)存延遲的因素有哪些

    內(nèi)存延遲是指等待對(duì)系統(tǒng)內(nèi)存中存儲(chǔ)數(shù)據(jù)的訪問(wèn)完成時(shí)引起的延期,它是衡量內(nèi)存響應(yīng)速度的重要指標(biāo)。影響內(nèi)存延遲
    的頭像 發(fā)表于 09-04 11:46 ?1728次閱讀

    求助,這個(gè)電路U1A運(yùn)放同相端的R1電阻到底有什么作用啊?

    想問(wèn)下這個(gè)電路U1A運(yùn)放同相端的R1電阻到底有什么作用啊?很郁悶。
    發(fā)表于 08-27 07:09

    業(yè)界首創(chuàng)512GB CXL AIC內(nèi)存擴(kuò)展卡,江波龍革新AI與高性能計(jì)算領(lǐng)域內(nèi)存技術(shù)

    人工智能大模型計(jì)算、高性能計(jì)算(HPC)以及數(shù)據(jù)中心等行業(yè)的迅猛發(fā)展,對(duì)計(jì)算機(jī)系統(tǒng)內(nèi)存性能的需求日益提升,業(yè)界對(duì)具備高帶寬、低延遲性能且超大容量的內(nèi)存需求也愈發(fā)迫切,以支持CPU和GPU進(jìn)行高速
    發(fā)表于 04-17 14:40 ?490次閱讀
    業(yè)界首創(chuàng)512GB <b class='flag-5'>CXL</b> AIC<b class='flag-5'>內(nèi)存</b>擴(kuò)展卡,江波龍革新AI與高性能計(jì)算領(lǐng)域<b class='flag-5'>內(nèi)存</b>技術(shù)

    FORESEE CXL 2.0內(nèi)存拓展模塊

    ,實(shí)現(xiàn)大規(guī)模量產(chǎn)和交付。隨著AI的快速發(fā)展,計(jì)算密集型工作負(fù)載對(duì)存儲(chǔ)的低延遲、高帶寬提出了前所未有的高要求。ComputeExpressLink(CXL)互連技術(shù)為
    的頭像 發(fā)表于 03-28 08:19 ?740次閱讀
    FORESEE <b class='flag-5'>CXL</b> 2.0<b class='flag-5'>內(nèi)存</b>拓展模塊

    利用CXL技術(shù)重構(gòu)基于RDMA的內(nèi)存解耦合

    本文提出了一種基于RDMA和CXL的新型低延遲、高可擴(kuò)展性的內(nèi)存解耦合系統(tǒng)Rcmp。其顯著特點(diǎn)是通過(guò)CXL提高了基于RDMA系統(tǒng)的性能,并利用RDMA克服了
    發(fā)表于 02-29 10:05 ?3369次閱讀
    利用<b class='flag-5'>CXL</b>技術(shù)重構(gòu)基于RDMA的<b class='flag-5'>內(nèi)存</b>解耦合

    網(wǎng)線到底有多少種連接器

    我們?cè)谡務(wù)摼W(wǎng)線的時(shí)候,聊得最多的,一定是它的連接器,它在連接過(guò)程中扮演著極為重要的角色。網(wǎng)線到底有多少種連接器?本期我們將從工業(yè)級(jí)使用出發(fā),來(lái)看看這根似乎普通的網(wǎng)線,在連接器上有多么努力。
    的頭像 發(fā)表于 01-26 10:06 ?635次閱讀

    NUC123的USB外設(shè)到底有沒(méi)有DMA功能?

    下載最新的TRM 1.07: 在最先前的描述以及USB的寄存器章節(jié)都有DMA相關(guān)的內(nèi)容。但是DMA那一章節(jié)里的框圖沒(méi)有USB外設(shè)。同時(shí)關(guān)于USB外設(shè)DMA的用法也沒(méi)具體說(shuō)明。所以USB外設(shè)到底有沒(méi)DMA功能,若是該怎么用?
    發(fā)表于 01-16 08:26
    主站蜘蛛池模板: 久久综合五月婷婷| 免费的毛片网站| 久久久噜噜噜久久中文字幕色伊伊| 免费视频不卡一区二区三区| 成人拍拍视频| 久久久久久久网站| 久久久久久久网站| 国产精品女人在线观看| 人人成人免费公开视频| 曰本又色又爽又黄三级视频| 午夜国产视频| 国产男人女人做性全过程视频 | 香蕉午夜视频| 国产色婷婷精品综合在线| 欧美sese| 天堂69亚洲精品中文字幕| 免费精品99久久国产综合精品 | 狠狠燥| 天堂中文网| 在线观看免费视频片| 国产一级特黄高清在线大片| 操狠狠| free性日本| www三级免费| 天天操天天摸天天射| 天天操天天干天天操| 久操视频在线| 九九视频只有精品| xvideos69日本hd| 欧美极品在线播放| 俺要操| 1024你懂的国产在线播放| 可以免费看黄的网址| 天天干夜夜谢| 天天玩天天操| 色综合小说天天综合网| 天天拍拍天天爽免费视频| 国产精品福利久久| sss欧美华人整片在线观看| 999精品国产| 国产三级观看久久|