隨著云計(jì)算技術(shù)的進(jìn)步,數(shù)據(jù)中心的架構(gòu)內(nèi)存安排發(fā)生了重大變化。為了增強(qiáng)計(jì)算能力和廣泛的數(shù)據(jù)處理,需要集成擅長(zhǎng)處理特定工作負(fù)載的加速器。雖然這些設(shè)備已經(jīng)通過(guò)PCI Express連接,但計(jì)算快速鏈路可以進(jìn)一步改善優(yōu)化,因?yàn)樗试S對(duì)各種系統(tǒng)組件進(jìn)行異構(gòu)處理。
PCI Express是用于將主機(jī)處理器連接到加速器設(shè)備的最常見(jiàn)技術(shù)。它是一種高性能、行業(yè)標(biāo)準(zhǔn)的串行 I/O 接口,專為在企業(yè)、桌面和嵌入式應(yīng)用中使用而開(kāi)發(fā)。
同時(shí),PCIe在具有大型共享內(nèi)存池和大量需要高帶寬的設(shè)備的系統(tǒng)中存在局限性。由于每個(gè) PCIe 層次結(jié)構(gòu)都使用單個(gè) 64 位地址空間,因此 PCIe 未提供支持一致性的技術(shù),并且無(wú)法充分維護(hù)單獨(dú)的內(nèi)存池。此外,PCIe 鏈路具有太多的延遲,無(wú)法有效地管理系統(tǒng)中多個(gè)設(shè)備之間的共享內(nèi)存。
因此,計(jì)算密集型工作負(fù)載需要與更快的數(shù)據(jù)流連接,以有效地?cái)U(kuò)展數(shù)據(jù)中心中的異構(gòu)計(jì)算。計(jì)算高速鏈路 (CXL) 通過(guò)利用 PCI 高速 5.0 的物理和電氣接口來(lái)挑戰(zhàn)一些限制。這項(xiàng)新技術(shù)提高了內(nèi)存容量和帶寬,并降低了延遲。它是高速通信的接口,因?yàn)榧铀倨髟絹?lái)越多地用于補(bǔ)充CPU以支持新興應(yīng)用。
什么是斷續(xù)器?
計(jì)算高速鏈路 (CXL) 是一種開(kāi)放的行業(yè)標(biāo)準(zhǔn)內(nèi)存互連。它旨在為當(dāng)今數(shù)據(jù)中心中使用的許多類型的內(nèi)存提供高性能連接,例如CPU,TPU,GPU和其他處理器類型。
CXL 利用 PCIe 5.0 的物理層基礎(chǔ)架構(gòu)在主機(jī)和所有設(shè)備之間創(chuàng)建公共內(nèi)存空間。緩存一致性標(biāo)準(zhǔn)可確保主機(jī)處理器和 CXL 設(shè)備在訪問(wèn)數(shù)據(jù)時(shí)看到相同的數(shù)據(jù)。CPU 主機(jī)主要負(fù)責(zé)一致性管理,允許 CPU 和設(shè)備共享資源以獲得更高的性能并降低軟件堆棧的復(fù)雜性,從而降低設(shè)備總成本。
除了原始性能外,CXL還有其他優(yōu)勢(shì)。該技術(shù)是開(kāi)源的,不像美光的3D Xpoint,這是迄今為止最接近高性能內(nèi)存互連的方法。美光和英特爾現(xiàn)在正在對(duì)沖他們對(duì)CXL的賭注,而不是專有技術(shù)。NVIDIA 和 AMD 的硬件系統(tǒng)還使用 CXL 來(lái)互連內(nèi)存和外部處理單元,以優(yōu)化性能。NVIDIA的GPU與CXL設(shè)計(jì)相結(jié)合,進(jìn)行了如此廣泛的計(jì)算,并在內(nèi)存設(shè)計(jì)中進(jìn)行了一些更改。
這種轉(zhuǎn)變的最重要結(jié)果將是CXL消除專有內(nèi)存互連。它是必不可少的,因?yàn)橛袔追N類型的企業(yè)存儲(chǔ),每個(gè)處理器都通過(guò)專有連接訪問(wèn)它們。這可能會(huì)使企業(yè)存儲(chǔ)基礎(chǔ)架構(gòu)變得復(fù)雜,并且無(wú)法預(yù)測(cè)其性能。
現(xiàn)在,由于CXL,每個(gè)處理器都將能夠訪問(wèn)所有類型的內(nèi)存。這將允許單獨(dú)的處理器共享相同的內(nèi)存池。它不僅對(duì)于數(shù)據(jù)中心至關(guān)重要,而且對(duì)于開(kāi)發(fā)通常使用CPU,GPU和TPU的AI神經(jīng)網(wǎng)絡(luò)和深度機(jī)器學(xué)習(xí)系統(tǒng)等技術(shù)也至關(guān)重要。
CXL 事務(wù)層協(xié)議
憑借與 PCIe 5.0 相似的帶寬,CXL 使用三種動(dòng)態(tài)多路復(fù)用的事務(wù)層協(xié)議:CXL.io、CXL.緩存和 CXL.內(nèi)存,以在 PCIe 上獲得優(yōu)勢(shì)。
CXL.io 協(xié)議幾乎與 PCIe 5.0 相同。它用于設(shè)備發(fā)現(xiàn)、配置、寄存器訪問(wèn)、中斷、虛擬化和批量 DMA。
CXL.cache 是一種可選協(xié)議,用于定義主機(jī)和設(shè)備之間的交互。這允許連接的 CXL 設(shè)備使用請(qǐng)求和響應(yīng)方法以極低的延遲高效緩存主機(jī)內(nèi)存。
CXL.memory 是一種可選協(xié)議,它使用加載和存儲(chǔ)命令為主機(jī)處理器提供對(duì)加速器連接的內(nèi)存的直接訪問(wèn)。加速器連接的內(nèi)存被 CPU、GPU 或 TPU 視為額外的地址空間,從而提高效率并降低延遲。
CXL 對(duì)存儲(chǔ)的影響
CXL依賴于存儲(chǔ),并將對(duì)其產(chǎn)生影響。它將允許存儲(chǔ)系統(tǒng)使用更大的內(nèi)存池進(jìn)行緩存。該技術(shù)有利于使用內(nèi)存作為緩存的存儲(chǔ)應(yīng)用程序或系統(tǒng)。這一點(diǎn)至關(guān)重要,因?yàn)殡m然許多ISP定期限制帶寬,但臨時(shí)數(shù)據(jù)存儲(chǔ)正在成為數(shù)據(jù)中心性能的關(guān)鍵方面。
商用存儲(chǔ)系統(tǒng)中目前可用的最大 DRAM 緩存為 3 TB。盡管使用 MemVerge 或福爾穆盧斯黑色,但特定的軟件定義存儲(chǔ)可以使用英特爾傲騰 PMem 將該緩存擴(kuò)展到 4.5 TB。但是,這對(duì)除最富有的組織之外的所有組織的緩存內(nèi)存施加了硬性限制。幸運(yùn)的是,CXL 通過(guò)允許存儲(chǔ)軟件跨多個(gè)存儲(chǔ)介質(zhì)緩存數(shù)據(jù)來(lái)解決此問(wèn)題。
審核編輯:郭婷
-
處理器
+關(guān)注
關(guān)注
68文章
19316瀏覽量
230074 -
云計(jì)算
+關(guān)注
關(guān)注
39文章
7835瀏覽量
137501 -
數(shù)據(jù)中心
+關(guān)注
關(guān)注
16文章
4792瀏覽量
72180
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論