在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

CXL和OMI:競爭還是互補?

芯片半導體 ? 來源:semiengineering ? 作者:芯片半導體 ? 2022-03-25 09:29 ? 次閱讀

系統(tǒng)設(shè)計人員正在尋找所有他們能找到的增加內(nèi)存帶寬和容量的想法,專注于從內(nèi)存改進到新型內(nèi)存的所有內(nèi)容。更高級別的體系結(jié)構(gòu)更改可以幫助滿足這兩種需求,即使內(nèi)存類型是從 CPU 中抽象出來的。

兩種新的協(xié)議正在幫助實現(xiàn)這一目標,即CXL和OMI。但有一個迫在眉睫的問題是,它們是否會共存,或者一個是否會戰(zhàn)勝另一個。

“隨著處理器中CPU內(nèi)核數(shù)量的增長,人們普遍認為希望為CPU內(nèi)核獲得更多的內(nèi)存帶寬和內(nèi)存容量,”Rambus數(shù)據(jù)中心產(chǎn)品營銷副總裁Mark Orthodoxou說?!叭藗円呀?jīng)沒有能力添加DRAM頻道了。

雖然這兩個新協(xié)議在概念上有一些高級的相似之處,但它們并不相同。但是,對于它們是否真的相互競爭,似乎存在很多困惑。甚至還存在廣泛的誤解,特別是關(guān)于OMI的誤解。

如今,每個人都專注于數(shù)據(jù),無論是不斷增長的數(shù)據(jù)量還是如何最好地管理數(shù)據(jù)。

”金融服務(wù)希望為欺詐檢測添加更多數(shù)據(jù)源,以提供即時結(jié)果,“MemVerge的聯(lián)合創(chuàng)始人兼首席執(zhí)行官Charles Fan說。”社交媒體需要更多的數(shù)據(jù)源來分析用戶,但提供即時結(jié)果。電子商務(wù)零售商想要更多的數(shù)據(jù)源,但需要即時建議。芯片正在設(shè)計1萬億個晶體管,但它們需要與前幾代產(chǎn)品在同一時間周期內(nèi)進入市場?;蚪M研究人員想要更多的細胞數(shù)據(jù),但他們希望縮短疫苗發(fā)現(xiàn)的時間。

所有這些都需要更多的內(nèi)存來為更多的計算提供服務(wù)?!霸谖磥韮赡陜?nèi),需要增加一千倍的計算量和一百倍的內(nèi)存,”范說。

內(nèi)存和存儲

現(xiàn)代計算系統(tǒng)具有兩層內(nèi)存結(jié)構(gòu)。有工作內(nèi)存,它是處理器的本地內(nèi)存,用于快速訪問,它通常是某種形式的DRAM。然后是存儲,一種內(nèi)存形式,它在邏輯上并且通常在物理上遠離處理器。這通常是非易失性存儲器,如閃存甚至硬盤驅(qū)動器。

這種安排反映了功能、成本和訪問的混合?!皟?nèi)存”往往是更快的技術(shù),盡管成本高于存儲技術(shù)。即使考慮到速度,它也不夠快,無法跟上現(xiàn)代處理器的步伐,這就是為什么處理器上的SRAM緩存對性能如此重要的原因。

“存儲”往往由非常高容量的存儲器組成,這些存儲器在每位基礎(chǔ)上非常便宜。但是它們的訪問時間可能比DRAM可以提供的時間慢幾個數(shù)量級。

在過去十年中,存儲類內(nèi)存的討論很多,它具有存儲的一些特征,但具有內(nèi)存的性能。MRAM,RMRAM和PCRAM是這種交叉類別的典型代表 - 在研究周期的早期還有其他想法。

將單一技術(shù)同時用于存儲器和存儲的承諾是誘人的,但它將為芯片設(shè)計人員創(chuàng)建需要與存儲器接口IC帶來一些挑戰(zhàn)。大多數(shù)芯片都有用于DRAM的特定接口。如果您可以使用MRAM或RRAM,那么您將CPU連接到哪個接口?這些存儲器可能都具有不同的訪問協(xié)議。

存儲有不同的挑戰(zhàn),但內(nèi)存類型的激增造成了類似的困境。此外,存儲中的數(shù)據(jù)通常必須批量檢索才能實際使用。該復制操作需要時間并消耗能量。

這兩種情況都將受益于一種抽象出所使用的特定存儲器的細節(jié)的方法,這樣芯片設(shè)計人員以及在某種程度上的軟件開發(fā)人員都不必那么關(guān)心特定系統(tǒng)的存儲器細節(jié)。它還可能使軟件在不同系統(tǒng)之間更具可移植性,這在數(shù)據(jù)中心特別有價值。

如今,它需要更高級別的程序或系統(tǒng)來管理和構(gòu)建不同內(nèi)存和存儲資源的池。這種“大內(nèi)存”程序提供了一種增加內(nèi)存帶寬和容量的方法。

“圍繞大內(nèi)存計算的論點是,與其不斷努力使存儲越來越快,不如利用其他新硬件,并輔以正確的軟件集,”范說?!拔覀兛梢詷?gòu)建一個軟件定義的內(nèi)存池,該內(nèi)存池可以成為應(yīng)用程序需要處理的所有活動數(shù)據(jù)的平臺,從而減少或消除活動應(yīng)用程序數(shù)據(jù)的內(nèi)存和存儲之間的數(shù)據(jù)傳輸。

CXL 和 OMI 協(xié)議都提供抽象,盡管級別較低。但作為新興的解決方案,很容易將兩者混淆。OMI在網(wǎng)上幾乎沒有大張旗鼓的方式,對它的認識似乎低于對CXL的認識。根據(jù)你和誰交談,他們做或不做同樣的事情,因此做或不互相競爭。

CXL和/或OMI的出現(xiàn)并不一定影響大內(nèi)存管理系統(tǒng)的使用。相反,它使物理內(nèi)存連接更容易處理?!蔽覀円揽緾PU使用其接口/內(nèi)存管理器訪問內(nèi)存,因此我們的軟件與內(nèi)存互連無關(guān),包括CXL,OMI和DDR4 / 5,“Fan說。

CPU使用的近內(nèi)存和OMI

工作內(nèi)存需要快速。多年來,DRAM一直提供最佳的速度/成本組合,并且隨著技術(shù)的發(fā)展,DRAM似乎可能會繼續(xù)這樣做。即便如此,還是有辦法提高這種性能,但要付出代價。

DRAM的致命弱點是一組驅(qū)使記憶的長線。它們的高電容使得很難繼續(xù)推動更高的內(nèi)存速度并添加更多內(nèi)存。

兩種變體有所幫助。一個是RDIMM,其中地址和控制信號在芯片上緩沖。這加快了這些信號的速度,同時保留了數(shù)據(jù)信號。LRDIMM還通過緩沖數(shù)據(jù)更進一步。這增加了延遲的時鐘周期,但加快了線路速度并允許更多內(nèi)存。

9b3afa6a-aba3-11ec-aa7f-dac502259ad0.png

圖1:RDIMM緩沖地址和控制信號;LRDIMM 還緩沖數(shù)據(jù)信號。其目的是擁有更短,更少的電容線路和更快的訪問,但代價是額外的時鐘周期延遲。

但是用于訪問的端口需要許多引腳 - LRDIMM的每個通道152個,Objective Analysis的Jim Handy在去年的Hot Interconnects會議上的一次演講中說。八個通道將花費1,216個引腳。

”由于引腳數(shù)量非常大,因此驅(qū)動這些引腳所需的面積很大,因為它是并行接口,“Orthodoxou說。

HBM 是另一種提供更高訪問速度的替代方案。雖然價格昂貴,但它提供了最高的帶寬。但它的總線是1000位寬。還有其他挑戰(zhàn),在關(guān)于OMI的白皮書中有所描述。

”雖然HBM是一個幫助,但它比標準DRAM貴得多,并且僅限于不超過12個芯片的堆棧,將其使用限制在低容量內(nèi)存陣列上,“該論文說。”HBM 也很復雜和不靈活。在現(xiàn)場無法升級基于 HBM 的內(nèi)存。因此,HBM 內(nèi)存只在沒有其他解決方案可用的情況下才被采用。

OMI從OpenCAPI世界中出現(xiàn),為了延遲,OMI規(guī)范被分離出來。它旨在通過兩種方式解決這些近內(nèi)存挑戰(zhàn) - 遷移到SerDes,以及使用DIMM控制器。用于 OMI 通道的 DIMM 被稱為差分 DIMM 或 DDIMM。

SerDes連接將取代當前的DDR式接口,以更少的信號提供更高的速度??刂破鞑糠痔峁┡cLRDIMM上的寄存器相同的功能,在此過程中將總內(nèi)存延遲增加約4ns。

“OMI延遲包括通過內(nèi)存本身的延遲,這是從內(nèi)部連接到主機中的傳輸端口回到主機中接收的內(nèi)部連接的往返讀取延遲,”O(jiān)penCAPI聯(lián)盟的技術(shù)總監(jiān)兼董事會顧問Allan Cantle說。

9b4d5f98-aba3-11ec-aa7f-dac502259ad0.png

圖 2:LRDIMM 與 DDIMM 的比較。DDIMM左側(cè)的藍色框是控制器。延遲增加幾納秒。

此外,控制器還可以連接到許多不同類型的內(nèi)存。它充當該內(nèi)存和處理器之間的橋梁。就處理器而言,所有內(nèi)存看起來都像 OMI,除此之外的細節(jié)都在 DDIMM 上處理。

這允許系統(tǒng)構(gòu)建商混合和匹配正在使用的內(nèi)存類型。每個通道都可以是其自己的內(nèi)存類型。事實上,只要控制器支持,單個 DDIMM 就可以混合使用內(nèi)存。

9b634e8e-aba3-11ec-aa7f-dac502259ad0.jpg

圖 3:混合內(nèi)存系統(tǒng)的概念示例,其中每個通道使用不同的內(nèi)存技術(shù)。

然而,目前還不清楚系統(tǒng)是否真的會以這種方式組成。有些人認為,抽象的價值不在于創(chuàng)建異構(gòu)內(nèi)存池,而在于使具有一組接口的單個 CPU 可以訪問由任何這些類型的內(nèi)存構(gòu)建的同構(gòu)池。

“近內(nèi)存將始終是同構(gòu)存儲器的更多選擇,而不需要抽象異構(gòu)存儲器類型,”西門子EDA驗證IP產(chǎn)品經(jīng)理Gordon Allan說。

帶寬將高于標準DRAM接口,盡管HBM仍然會更快。也就是說,擁有更少的引腳意味著SoC上用于存儲器通道所需的硅將小得多,這使得OMI在帶寬/面積上與HBM更具競爭力。由于接口占用空間較小,如果 OMI 可以使用的通道多于其他接口,則聚合帶寬可能會更高。

為了完全出現(xiàn)這種新范式,首先需要控制器芯片,然后需要DDIMM可用。這一進程已經(jīng)開始,但還有很長的路要走。即便如此,到目前為止,OMI的吸收速度一直很慢。

9b73ec6c-aba3-11ec-aa7f-dac502259ad0.png

圖 4:顯示控制器和多個 DRAM 芯片的 DDIMM。還提供2U版本。資料來源:OpenCAPI Consortium

“我們沒有與客戶要求我們提供這項技術(shù),但對于OMI來說,現(xiàn)在還為時尚早,”艾倫說?!斑@是IBM和其他一些公司推廣的相對較新的進入者。它仍然沒有在業(yè)界被廣泛采用,但肯定有很多人對它感興趣,因為它聲稱要擴展DDR的容量優(yōu)勢和HBM的性能帶寬優(yōu)勢。但在這一點上,這仍然是一個大膽的,未經(jīng)證實的說法。

遠內(nèi)存和CXL

遠內(nèi)存的情況更為復雜。除了與特定類型的內(nèi)存相關(guān)的問題之外,頻繁需要復制大塊內(nèi)存也是一個重大問題,特別是對于機器學習等內(nèi)存或存儲密集型應(yīng)用程序,尤其是在數(shù)據(jù)中心。

這些是CXL解決的問題。”CXL 優(yōu)化和虛擬化數(shù)據(jù)傳輸、存儲和計算,“Synopsys 系統(tǒng)設(shè)計組工程總監(jiān) Levent Caglar 說。

這在數(shù)據(jù)中心應(yīng)用程序中很有用?!盚PC領(lǐng)域由大量的計算結(jié)構(gòu)組成,“Cadence知識產(chǎn)權(quán)集團產(chǎn)品營銷集團總監(jiān)Arif Khan說?!盋PU、GPU、加速器、FPGA 等都連接到不斷增長的內(nèi)存池。CXL 滿足了異構(gòu)計算的需求,同時保持了緩存的一致性,并允許內(nèi)存的可擴展性。

但它也很復雜。“我們需要考慮存儲的三個不同方面,”西門子EDA的Allan說?!笆紫仁枪仓锰幚砥骱蛢?nèi)存。在處理管道的另一端,我們有相干的內(nèi)存和存儲鏈接,其中數(shù)據(jù)必須與其他處理和通信元素共享。此外,我們還對數(shù)據(jù)中心的存儲進行了更大規(guī)模的搜索和檢索。CXL位于這些領(lǐng)域的第二和第三位。

9b902396-aba3-11ec-aa7f-dac502259ad0.png

圖 5:CXL 控制器的框圖。CXL 功能依賴于 PCIe 進行物理互連。

CXL在概念上類似于OMI,充當允許處理器與內(nèi)存類型無關(guān)的橋梁。”從系統(tǒng)其余部分的角度來看,該內(nèi)存在邏輯上盡可能接近CPU,“Caglar說。

但CXL的職權(quán)范圍比OMI要廣泛得多,需要涵蓋的用例要多得多?!監(jiān)MI和CXL在它們試圖解決的近內(nèi)存問題方面非常相似,“Orthodoxou說?!彼麄兊牟煌幵谟贑XL試圖解決遠內(nèi)存問題。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 芯片
    +關(guān)注

    關(guān)注

    456

    文章

    51060

    瀏覽量

    425741
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    10892

    瀏覽量

    212478
  • 存儲
    +關(guān)注

    關(guān)注

    13

    文章

    4340

    瀏覽量

    86017

原文標題:CXL和OMI:競爭還是互補?

文章出處:【微信號:TenOne_TSMC,微信公眾號:芯片半導體】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    內(nèi)存擴展CXL加速發(fā)展,繁榮AI存儲

    電子發(fā)燒友網(wǎng)報道(文/黃晶晶)CXL即Compute Express Link,是一種全新的互連協(xié)議,為各種處理器包括CPU、GPU、FPGA、加速器和存儲設(shè)備提供統(tǒng)一接口標準,可以有效解決內(nèi)存墻
    的頭像 發(fā)表于 08-18 00:02 ?4948次閱讀
    內(nèi)存擴展<b class='flag-5'>CXL</b>加速發(fā)展,繁榮AI存儲

    韓國無晶圓廠初創(chuàng)公司Panmnesia展示第一個支持CXL的AI集群

    CXL的AI集群,以加速用于ChatGPT等服務(wù)的下一代人工智能應(yīng)用RAG,擴大其全球客戶群。 AI競爭的加劇
    的頭像 發(fā)表于 11-28 11:04 ?449次閱讀

    研華科技推出SQRAM CXL 2.0 Type 3內(nèi)存模塊SQR-CX5N

    10月15日最新消息,研華科技(Advantech)于昨日正式揭曉了其最新研發(fā)的SQRAM CXL 2.0 Type 3 內(nèi)存模塊——SQR-CX5N。該模塊遵循EDSFF E3.S 2T標準,擁有
    的頭像 發(fā)表于 10-15 15:28 ?485次閱讀

    AMC1210旋轉(zhuǎn)變壓器中輸出PWM1和PWM2為什么不是互補的?

    官方手冊有說輸出PWM應(yīng)當互補,后查到應(yīng)該先給寄存器CLOCK_DIVIDER_REGISTER中PCAL先置0后置一,但是還是沒有變成互補輸出???
    發(fā)表于 09-14 08:17

    如何利用CXL協(xié)議實現(xiàn)高效能的計算架構(gòu)

    Using Compute Express Link》(文末附鏈接)。在這篇文章中,Debendra Das Sharma詳盡地闡述了如何利用CXL(Compute Express Link)技術(shù)
    的頭像 發(fā)表于 09-03 09:14 ?670次閱讀
    如何利用<b class='flag-5'>CXL</b>協(xié)議實現(xiàn)高效能的計算架構(gòu)

    ocl電路是什么電源互補功效

    OCL電路,即互補對稱功率放大電路(Complementary Symmetry Power Amplifier),是一種廣泛使用的功率放大電路,具有高效率、低失真、大輸出功率等特點。 一、OCL
    的頭像 發(fā)表于 08-07 14:57 ?1231次閱讀

    打造異構(gòu)計算新標桿!國數(shù)集聯(lián)發(fā)布首款CXL混合資源池參考設(shè)計

    今日,領(lǐng)先的高速互聯(lián)芯片及方案設(shè)計廠商國數(shù)集聯(lián)發(fā)布業(yè)界首創(chuàng)的CXL混合資源池(Compute Express Link Hybrid Resource Pool ,以下簡稱“CHRP”)參考設(shè)計。該
    的頭像 發(fā)表于 08-06 14:19 ?346次閱讀
    打造異構(gòu)計算新標桿!國數(shù)集聯(lián)發(fā)布首款<b class='flag-5'>CXL</b>混合資源池參考設(shè)計

    新思科技CXL 3.1驗證解決方案

    機器學習和人工智能日益普及,虛擬機和虛擬組件上的工作負載也隨之不斷增加。為此,行業(yè)急需能夠確定工作負載優(yōu)先次序并保障性能的機制。Compute Express Link(CXL)是處理器與加速器
    的頭像 發(fā)表于 08-02 14:43 ?634次閱讀
    新思科技<b class='flag-5'>CXL</b> 3.1驗證解決方案

    國數(shù)集聯(lián)發(fā)布業(yè)界首款CXL多級網(wǎng)絡(luò)交換機,IB時代的顛覆者

    今日,領(lǐng)先的高速互聯(lián)芯片及方案設(shè)計廠商國數(shù)集聯(lián)基于自主研發(fā)的CXL ( Compute Express Link )協(xié)議 IP,成功研發(fā)了業(yè)界第一款CXL多級網(wǎng)絡(luò)交換機(CXL
    的頭像 發(fā)表于 07-31 16:35 ?896次閱讀
    國數(shù)集聯(lián)發(fā)布業(yè)界首款<b class='flag-5'>CXL</b>多級網(wǎng)絡(luò)交換機,IB時代的顛覆者

    國數(shù)集聯(lián)研發(fā)出首款CXL多級網(wǎng)絡(luò)交換機

    今日,全球頂級高速互聯(lián)芯片及解決方案設(shè)計專家——國數(shù)集聯(lián)公司,憑借自主研發(fā)的CXL(Compute Express Link)協(xié)議IP,引領(lǐng)行業(yè)前沿,成功研發(fā)出全球首款CXL多級網(wǎng)絡(luò)交換機(又名CXL Multi-level N
    的頭像 發(fā)表于 07-31 13:04 ?660次閱讀

    三星攜手紅帽成功構(gòu)建全球首個CXL認證基礎(chǔ)設(shè)施

    近日,三星電子宣布了一個重要的里程碑事件:其首個經(jīng)過全球領(lǐng)先的開源解決方案提供商紅帽(Red Hat)認證的Compute Express Link(CXL)基礎(chǔ)設(shè)施已成功構(gòu)建。這一成果的取得
    的頭像 發(fā)表于 06-25 17:57 ?1106次閱讀

    采用STM32F030K6T6作互補PWM輸出時,互補通道沒有波形輸出是為什么?

    各路大神指教,采用STM32F030K6T6作互補PWM輸出時,配置什么的都檢查了基本沒問題,但是只有主通道有輸出,互補通道沒有波形輸出,請教一下是軟件問題還是這款I(lǐng)C不支持互補輸出?
    發(fā)表于 04-22 07:50

    三星研發(fā)CXL混合存儲模組,實現(xiàn)閃存與CPU數(shù)據(jù)直傳

    據(jù)三星展示的圖片顯示,此模組可以通過CXL接口在閃存部分及CPU之間進行I/O塊傳輸,也可以運用DRAM緩存和CXL接口達到64字節(jié)的內(nèi)存I/O傳輸。
    的頭像 發(fā)表于 03-21 14:31 ?900次閱讀

    利用CXL技術(shù)重構(gòu)基于RDMA的內(nèi)存解耦合

    本文提出了一種基于RDMA和CXL的新型低延遲、高可擴展性的內(nèi)存解耦合系統(tǒng)Rcmp。其顯著特點是通過CXL提高了基于RDMA系統(tǒng)的性能,并利用RDMA克服了CXL的距離限制。
    發(fā)表于 02-29 10:05 ?3448次閱讀
    利用<b class='flag-5'>CXL</b>技術(shù)重構(gòu)基于RDMA的內(nèi)存解耦合

    FPGA中競爭與冒險的前世今生

    競爭冒險:在組合電路中,當邏輯門有兩個互補輸入信號同時向相反狀態(tài)變化時,輸出端可能產(chǎn)生過渡干擾脈沖的現(xiàn)象,稱為競爭冒險。那么 FPGA 產(chǎn)生競爭冒險的原因是什么呢? 信號在 FPGA
    發(fā)表于 02-21 16:26
    主站蜘蛛池模板: zzji国产精品视频| 久久99免费| 2018国产精品| 亚洲第一视频网| 午夜国产精品理论片久久影院| 美女骚网站| 久久精品男人的天堂| 国产成人小视频| 精品四虎免费观看国产高清| 久久这里只有精品免费播放| 日本国产视频| 看毛片网| 99久久综合精品免费| 国产美女作爱| 亚洲黄色网址| 免费观看成年欧美1314www色| 午夜视频1000| 最近在线视频免费观看2019| 狠狠色成色综合网| sihu永久在线播放地址| 五月天丁香婷婷综合| 国产又爽又黄又粗又大| 黄色国产| 视频一区中文字幕| 一级毛片无毒不卡直接观看| 精品国产成人三级在线观看| 日本一区二区视频| 亚洲精品播放| 亚洲最新| 亚洲区一二三四区2021| 91麻豆麻豆| 日本三级欧美三级香港黄| 国产一级做a爰大片免费久久 | 日本污视频| 失禁h啪肉尿出来高h受| 操操插插| 抽搐一进一出gif免费男男| 日韩免费| 综合丁香| 日本人善交69xxx| 好黄好硬好爽好刺激|