在過去的幾年里,英特爾一直專注于其消費者酷睿臺式機CPU,如果你認為英特爾已經忘記了他們的至強高端工作站處理器陣容,這是可以理解的。在英特爾臺式機級至強W-1x00系列產品實際上已經退役,而Intel當前一代用于服務器的大型芯片(基于Sapphire Rapids的第四代Xeon Scalable系列)也一再推遲,過去幾年英特爾在工作站領域并沒有太多的聲音。但是現在針對服務器的Sapphire Rapids終于推出了,英特爾產品路線圖中的僵局終于被打破了,英特爾終于可以繼續將他們最新的芯片集成到新的工作站中。近期,英特爾宣布了他們的第一個從上到下更新的工作站處理器,至強W-3400和至強W-2400系列。針對英特爾大致劃分為專家工作站和主流工作站的市場,這些芯片系列旨在用于高性能工作站的設置,特別是那些需要更多CPU內核、更多PCle通道、更多內存帶寬或三者結合的設置。基于與英特爾最近推出的服務器相同的Sapphire Rapids芯片,新的至強W SKU將降低許多(但不是所有)定義Intel領先服務器芯片的功能,以及更適合在高性能工作站中使用的新芯片組(W790)和主板。與新的至強可擴展部件一樣,這里的三大新增功能是轉向英特爾的Golden Cove CPU架構——具有所有的IPC和時鐘速度優勢——以及對DDR5內存和用于I/O連接的PCle 5的支持。所有這些都是對構成英特爾之前產品堆棧的Cascade Lake和Ice Lake部件組合的重大升級。與此同時,與英特爾現有的臺式機處理器陣容相比,這些都是2021年底在Alder Lake(第12代酷睿)上率先推出的功能,專注于工作站的Xeon W部件將在更大程度上進行構建。
至強W-3400系列(Sapphire Rapids-112L)將從12核到56核不等,且都包括112個PCle 5.0通道,支持8個內存通道最多4 TB的DDR5-4800內存、ECC內存(僅RDIMM)、Intel vPro和Intel標準可管理性(ISM)。7個W-3400 SKU(X系列)中的4個得益于解鎖成熟,因此正式支持超頻。與此同時,Xeon W-2400系列(Sapphire Rapids-64L)將提供6到24個CPU內核,搭配減少的64通道PCle 5.0連接,支持多達2TB的DDR5-4800內存跨四個內存通道,以及所有其余的Xeon W配件,如ECC內存。
新的至強W系列將取代英特爾之前的至強產品。雖然英特爾確實在2021年推出了一些基于Ice lake的至強產品—至強W-3300系列—這些是對英特爾至強陣容的補充更新,針對需要額外CPU內核或PCIe帶寬的特定客戶。對于其他人來說,即將推出的至強W系列產品,即大約2019年的W-3200和W-2200系列,都是基于英特爾的Cascade Lake芯片的,這本身是對英特爾Skylake部件的適度更新。因此,推出至強W-3400/2400系列對英特爾工作站陣容的重要性不言而喻:這是英特爾至強系列的一次重大升級。
新的至強W系列將與AMD的Threadripper Pro 5000 WX競爭,后者基于AMD的Zen 3架構。最近的Threadripper Pro于去年春天推出,從那時起,AMD在CPU性能方面基本上占據了市場的主導地位,這要歸功于內核數量和IPC方面的顯著優勢。即使有了他們的新部件,英特爾在技術上仍然沒有完全縮小內核數量的差距,但IPC、內核數量和時鐘速度的提升應該有助于在整體CPU性能方面達到公平的競爭環境,但具體程度還有待觀察。
英特爾至強W-3400系列:“專家”平臺,最多56核,112個PCIe 5.0通道,8通道內存
英特爾至強的W-3400和W-2400系列工作站處理器基于英特爾的Golden Cove CPU架構,與英特爾的Alder Lake(第12代)臺式機處理器相同。W-3400系列代表了英特爾第4代至強Scalable Sapphire Rapids高級工作站產品的首要產品線,總共有7個SKU。至強W-3400的范圍從普通的12核/24線程部件(w5-3425)到備受期待的56核/112線程部件,旗艦w9-3495X。
特別是至強W-3400系列,基于英特爾Sapphire Rapids Extreme Core Count (XCC)芯片,該芯片目前用于英特爾高端至強服務器部件。XCC芯片依賴于4個計算模塊,使用英特爾最新的EMIB互連連接在一起,這是至強工作站處理器的第一個互連。
Sapphire Rapids XCC芯片的各個區塊都是相同或對稱的,因此每個磁片提供整個芯片四分之一的CPU內核、I/O和內存通道。因此,每個tile最多可以提供32個PCle 5.0通道(w9-3495X上總共有112個),而每個tile還包括兩個內存控制器,在W-3400系列上提供8通道內存。
專注于至強W-3400系列的高端SKU Intel Xeon w9-3495X,它與英特爾上一代巨無霸至強W-3175X有著類似的共鳴,后者于2019年發布,并提供了超頻的官方支持。與基于skylake的至強W-3175X一樣,最新的至強w9-3495X也有用于超頻的解鎖乘法器。
英特爾至強w9-3495X有56個核,112個線程,不像英特爾的臺式機處理器,每一個都是性能(P)內核。此外,還提供了總計105 MB的英特爾智能L3緩存,官方支持8通道DDR5-4800 ECC RDIMM內存,最大容量高達4 TB。
w9-3495X的TDP額定值相當高,為350瓦。在實際操作中,啟用英特爾Turbo Boost和Turbo Boost Max 3.0技術的情況下,滿載時的峰值功耗可能會高得多,特別是在56-unlocked內核上。雖然它的56個Golden Cove內核的基本頻率為1.9 GHz,但它的turbo頻率高達4.6 GHz,而且由于turbo Boost Max 3.0(英特爾最青睞的核心技術),少數內核可以進一步提高到4.8 GHz。
至強W-3400系列的其他SKU從36核到12核不等,如w9-3475X (36C/72T)和w5-3425 (12C/24T)。最終,所有至強W-3400系列都提供相同數量的DDR5內存通道和PCIe通道,因此區分不同SKU的是CPU核心數、最大內存時鐘速度、L3緩存,當然還有價格。
與此同時,如前所述,四款至強W-3400 SKU——w9-3495X、w9-3475X、w7-3465X和w5-3435X——都是“unlocked”處理器。這是英特爾幾年來在至強W系列上沒有提供的功能,并帶來了一些有趣的現象。除了最基本的改變CPU時鐘速度乘法器的能力外,“unlocked”處理器還可以調整其AVX和AMX偏移量,以防止處理器在沉重的SIMD負載下下降太多。最后,它們還為網狀互連提供了一些調優選項,盡管英特爾沒有說具體可以在這里進行調整。
英特爾至強W-3400系列的起售價為1189美元,Intel提供每單位1K的定價(托盤),而不是單獨購買的零售SKU。至強w9-3495X的1KPU價格為5889美元,這使得頂級SKU和后續的每個W-3400 SKU比上一代的至強W-3300芯片更貴,但它們確實具有更多的內核,更快的頻率,更多的L3緩存,并支持DDR5-4800。
值得指出的是,英特爾所有的W-3400 SKU都支持高達4TB的八通道DDR54800 ECC內存,即使是最底層的SKU,即w5-3425 (12C/24T)。因此,對于那些需要大量DRAM,但不一定需要大量CPU內核的系統,可以在至強的產品系列中找到合適的選擇。但是,請注意,實際達到4TB需要每個通道使用2個DIMM(DPC),這需要回退到DDR5-4400內存速度。
由于CPU提供112個PCle 5通道(芯片組提供更多通道),至強W-3400芯片可以支持大量的I/O設備。這相當于7個獨立的x16顯卡,或高達28個x4高速存儲設備。這一點,以及內核數和內存通道,是與較低級別的至強W-2400系列的主要區別之一,對于那些被英特爾早期至強W部件的一小部分I/O帶寬所困擾的英特爾平臺用戶來說,應該是一個受歡迎的特點。
有趣的是,112個PCle 5通道實際上比英特爾Sapphire Rapids服務器部件提供的要多。至強可擴展陣容最多只有80個通道。造成這種差異的原因是英特爾僅為其服務器部件啟用了7個根端口中的5個,還有2個端口(32個通道)未使用。然而,由于工作站Sapphire Rapids部件不需要分配任何引腳來支持英特爾的多插槽UPI鏈路,因此Intel似乎已將這些引腳分配給為工作站部件提供額外的PCIe通道。值得注意的是,英特爾在這里為服務器和工作站芯片使用了相同的插槽——LGA 4677——但隨著引腳的變化,它們可能不兼容。
同時,在英特爾的另一個首次發布活動中,該公司表示,他們將支持RDIMM的DDR5 XMP 3.0內存超頻配置文件。關于這個公告的細節非常少,但從高層次上講,這將為運行在W790上的未鎖定處理器用戶提供嘗試從內存中擠出更多空間的選項。一般來說,內存超頻和RDIMM堅如磐石的穩定性是截然相反的目標,因此,看看這在市場上的表現會很有趣。DRAM的時鐘速度可能高于DDR5-4800,但注冊的時鐘驅動器(RCD)可以嗎?
此外,所有這些關于RDIMM的討論都是有意的:與以前的Xeon W平臺相比,Sapphire Rapids Xeon工作站平臺將不支持UDIMM。這是DDR5規范的一個限制,它要求UDIMM和RDIMM使用不同的電壓。UDIMM為5伏,RDIMM為12伏,因此不兼容。如果您曾經有機會親眼看到DDR5 RDIMM,您可能會注意到它們的鍵控與UDIMM不同,因此它們在物理和電氣上都不兼容。
這意味著用戶將不得不將這些處理器和W790主板與更昂貴、但質量更高的ECC支持DDR5 RDIMM配對。對于羊毛染色工作站用戶來說,這不太可能是一個問題,甚至不是一個能引起注意的差異,但任何希望以低廉的價格構建HEDT風格的系統或低端工作站的人都會發現,Xeon W系統的最終價格將高于W-3200/2200系列的價格。
加速計算:AMX和CXL占據優勢,但大多數領域特定加速器無法做到
對于Sapphire Rapids Xeon芯片和相應的服務器部件,英特爾推出了一系列不同的加速塊和其他加速器相關功能。在矩陣擴展(AMX)、各種特定領域的硬件加速塊以及對外部加速器的Compute eXpress Link(CXL)的支持之間,英特爾最終將大量的精力投入到了非CPU任務中。這意味著,特別是針對其Xeon Scalable服務器部件,Intel選擇依靠這些加速器功能,在所有芯片中啟用一個DSA引擎。仍然不支持QAT、DLB和IAA。這取代了原始的x86 CPU性能,以使硬件與其前身及其競爭對手區別開來。
但對于他們的工作站部分,事情就簡單多了,不管是好是壞。簡而言之,并非所有英特爾的加速計算功能都在至強W-3400/2400系列中提供。那么,讓我們來快速瀏覽一下哪些Sapphire Rapids功能適合Xeon W。
也許最關鍵的是,英特爾的高級矩陣擴展(AMX)確實做到了這一點,至強W-3400/2400系列完全支持它們。AMX是英特爾的矩陣數學執行塊,類似于張量核和其他類型的矩陣加速器,這些都是用于有效執行矩陣數學的超高密度塊。AMX不是一個專用的加速器,而是CPU核心的一部分,每個核心都有一個塊,這允許AMX代碼與x86(和AVX)代碼混合,這也是Sapphire Rapids使用超密集代碼時時鐘速度偏移為負的原因。
AMX是英特爾在深度學習市場上的重頭戲,通過使用更密集的數據結構,超越了他們目前使用AVX-512所能實現的吞吐量。雖然英特爾有AMX支持的GPU(英特爾數據中心Max GPU系列),甚至超越了這一點,但對于Sapphire Rapids,英特爾正在尋求解決需要AI推理的客戶群體,這些推理發生在非常接近CPU內核的地方,而不是在一個不太靈活,更專用的加速器中。新的AMX單元還支持Bfloat16,確保英特爾的每一層加速計算塊(AVX和AMX)都支持這種用于深度學習的常見中等精度浮點格式。
Sapphire Rapids的一個新的特定于領域的硬件加速器塊,數據流加速器(DSA)也獲得了成功。此塊用于卸載/加速某些操作,如數據復制和簡單計算,如計算CRC32。DSA塊可用于所有至強W SKU。
然而,你不會發現提到其他的英特爾加速器模塊,如英特爾動態負載均衡器(DLB),英特爾內存分析加速器(IAA)和英特爾快速輔助技術(QAT)。盡管事實上,這些加速器都是藍寶石激流硅片上相同功能塊的一部分。這些加速器塊主要都是針對服務器的,所以沒有看到它們也就不足為奇了,但這確實意味著任何為服務器創建原型代碼的人,如果要使用它們的功能,都需要在實際的至強可擴展服務器上進行測試。
最后,雖然Intel的Xeon W規格表中沒有CXL支持,但Intel已向我們證實,事實上這兩個系列都支持CXL。用于主機到設備連接的基于PCIe標準的內置技術已經出現了幾年,Sapphire Rapids是第一個支持該技術的Intel CPU平臺。與其他一些功能一樣,它主要用于服務器,因此將其引入工作站的動力較小。盡管如此,英特爾還是為希望利用其功能的用戶提供了支持。
英特爾至強W-2400系列:最多24核,64個PCIe 5.0通道,適用于主流工作站
再往下看,我們有Xeon W-2400系列(Sapphire Rapids-64L),它被設計為“主流”工作站平臺。Xeon W-2400提供的PCIe通道數量比W-3400 SKU的一半多一點,有64個PCIe 5.0通道可用,內存通道數量減少了一半,達到四個通道。因此,這意味著W-2400系列的價格低于其更強大的W-3400系列,入門級Xeon w3-2423的價格低至359美元。
總體而言,至強W-2400系列將從6核到24核年不等。英特爾在這里使用了他們的Sapphire Rapids Medium Core Count (MCC)芯片,與XCC芯片不同,它是傳統的單片芯片。這意味著不需要花哨的EMIB封裝來構建芯片,相反,英特爾只需要制造一個相當大的芯片。
至強W-2400系列的高端產品是w7-2495X,它具有24核/48線程,45 MB的Intel Smart L3緩存和225瓦的TDP。英特爾還有三個w5系列SKU,最后是三個w3 SKU。
與專家級同類產品一樣,至強W-2400系列在整個系列中提供一致的內存和I/O配置。這是因為來自CPU的64通道PCIe 5和四通道DDR5內存,允許總內存最大為2 TB。此外,只有w5和w7 SKU提供完整的DDR-4800內存速度;w3部件都以DDR4-4400為上限。在2個DPC配置中,所有SKU都下降到這個速度,因此出于任何原因構建2 TB系統都可以實現。
像至強W-3400系列一樣,W-2400系列中也有一些unlocked X SKU,包括頂級的w7-2495X。其他unlocked乘數的SKU包括具有20個內核和37.5 MB L3緩存的w7-2475X,以及兩個w5 SKU(w5-2465X 16C/32T和w5-2455X 12C/24T)。然而,我們不會發現任何unlocked w3部件,因為所有三個入門級w3 SKU都已完全鎖定。
Intel W790芯片組:支持Xeon W-3400和W-2400平臺
英特爾所有至強W-3400和W-2400系列SKU均受益于英特爾vPro和英特爾的標準可管理性(ISM)技術。Xeon W-2400和W-3400系列都由相關的W790芯片組支持,但CPU特定的功能(如可用的內存通道和PCIe通道的數量)取決于處理器本身。
W790芯片組的一些主要功能包括處理器和芯片組之間的直接媒體接口(DMI) 4.0 x8鏈路,以及多達16個PCIe 4.0通道和支持多達8個SATA 3.0端口。W790還支持5個USB 3.2 Gen2x2 (20Gbps)端口,包括一個Intel Wi-Fi 6E PHY,并可支持2.5 GbE控制器。
雖然沒有提及新的主板,但預計將有來自華碩、GIGABYTE、超微和ASRock等供應商的英特爾W790主板。戴爾、聯想和超微等系統集成商預計將在DIY構建商獲得解決方案和系統之前優先提供解決方案和系統。
ASRock在發布前大概介紹了其W790 WS模型,該模型具有20+2相供電,雙10 GbE控制器,并支持8個插槽中多達2 TB的DDR5-4800 ECC RDIMM。雖然該板同時支持至強W-3400和W-2400處理器,但該板僅支持四通道內存。
關于最新一代主板,值得一提的是W790主板的成本可能高于用于支持至強W-3300系列(Ice Lake)的基于c621的主板。因為W790單板有4個DDR5內存通道和48個PCIe 5通道。雖然我們預計會看到不同級別的主板設計,具有不同的插槽和I/O配置,但英特爾還沒有具體說明這些主板是否支持這兩個系列,或者供應商是否會圍繞Xeon W-3400和W-2400系列設計特定的主板。
英特爾的至強W-3400和W-2400處理器已經開始接受行業合作伙伴的預定,系統預計將在3月初部署。英特爾對Xeon w3-2423的預期和建議定價為359美元起,Xeon w9-3495X的預期和建議價格為5889美元。
編輯:黃飛
?
評論
查看更多