編者按:以云計算為代表的信息化手段對于當下疫情的防控工作有著卓然的成效,無論是遠程視訊、病毒分析、疫情風控分析、視頻監控、前端如體溫和人臉采集分析等都離不開后端數據中心的支持。這勢必牽扯到海量的數據處理能力,而這海量的數據處理能力則依托的是服務器集群所提供的計算能力。
沒有技術能夠一勞永逸地解決所有問題,當年的主機如是,現今的PC Server如是,代表未來的云計算更如是。于是,我們也只能邊用邊改、邊總結邊探索。
雖然我們已經推開了數字時代的門扉,看到了數字技術給商業和社會帶來的巨大改變。但在數字基礎架構層面,問題還遠遠沒有結束。甚至可以說,即使最先進的超大規模數據中心也同樣有著自己的近憂和遠慮。
近憂是數據中心的建設和運維成本;而遠慮則是全新計算類型不斷出現所帶來的架構性挑戰。
成本——數據中心永遠在翻越的山峰
即便將數據中心選址在地價、電價相對便宜的地區,數據中心仍是IT建設中最顯而易見的重資產項目,其建設與運營都需要巨量的資本。由于需要大量土建工程和基礎設備的支持,數據中心內每一平米能夠留給IT設備的面積都需要五位數乃至六位數的價格。
面對堪比北上廣房價的數據中心建設費用,計算的密度就成為了任何數據中心建設者都會關心的核心設備指標。而在對于計算密度的極致追求之下,Olympus、Open19、ODCC天蝎項目、OpenRack等定制服務器項目的不斷出現也就不足為奇了。
當然,除了在設備結構上精雕細琢,對于絕大多數數據中心而言,提升計算密度和效率還有另外一條更直接的道路可選——擁有更多核心、更高性能的計算平臺。
AMD第二代EPYC平臺:巔峰性能且更具性價比
繼2017年推出代號為“那不勒斯”的第一代EPYC處理器后,AMD于2019年發布了代號為“羅馬”的第二代EPYC處理器。
代號為“羅馬”的AMD第二代EPYC系列處理器
作為業界首款基于7nm工藝的處理器,第二代EPYC處理器最高內置64核128線程,256M三級緩存,八通道DDR4-3200內存(單路4TB)、128條PCIe 4.0等一系列新特性。根據AMD公布的數據,其雙倍核心數量加上針對提升周期指令數進行的優化,其浮點性能相較上一代產品提升約4倍。同時,引入7nm制程工藝帶來了更高能效;這也意味著第二代EPYC的能效比是上一代產品的2倍。第二代EPYC處理器在多種業內性能基準測試中領先,迄今為止保持超過了 140項世界紀錄。
得益于Chiplets設計,第二代EPYC平臺在較短的時間內完成了產品的迭代升級。相比較單片SoC的方式,采用Chiplets設計更具靈活性,因為在許多場景下如果將功能都集成在一顆die上,其性能、功耗、面積通常難以做到最優。而采用Chiplets還可以縮短產品的開發周期,并從一定程度上降低設計風險。AMD將其稱為“AMD Infinity”混合多芯片架構,這種架構在第二代EPYC處理器中的應用達到了新的高度。
在第二代EPYC平臺上,AMD采用了最新的7nm工藝設計了Core Chiplet Die(簡稱CCD)部分,而每個CCD部分均包含兩個CPU Complex(簡稱CCX),每個CCX整合了四個core。而在內存、PCI-e以及磁盤控制器等I/O處理的部分,則采用了14nm的工藝來降低成本與開發周期。每個I/O核心最多可與8個CCD核心相連,即最高64核的設計。
在2月份舉行的SSCC2020大會上,AMD方面談到了采用7nm+14nm工藝對比單純7nm工藝設計有效降低了成本:如果將64核產品作為基準比較,在48核、32核、24核、16核產品上有著最高約兩倍的節省,其中核心數量越大,所節約的成本越多。
而采用臺積電7nm工藝封裝的核心部分不僅大幅提升了能效比,相比第一代EPYC還有效降低了CCD的面積,這使得在第二代EPYC平臺中的CCD部分可以塞入更多的內核。同時,改進了的分支預測器,優化過的 L1 指令緩存,兩倍的浮點單元數據寬度,指令存儲隊列,兩倍的 L1 數據緩存讀寫帶寬。單個CCX兩倍的 L3 緩存等多種改動使得 Zen 2 相對于 Zen1 有超過 15% 的 IPC 提升。最終使得Zen 2相較Zen 1有了約兩倍的能效比提升。值得一提的是,由于采用這種非一體化的芯片設計有效地縮短了產品設計周期,AMD還將推出代號“米蘭”的第三代EPYC,采用臺積電7nm+工藝有望進一步提高能效比。
目前,AMD EPYC平臺已經得到了包括騰訊云、亞馬遜、微軟、甲骨文、谷歌等大型云服務提供商的青睞;此外,包括戴爾、HPE、H3C、聯想等頂級OEM合作伙伴也與AMD合作推出了豐富的基于第二代EPYC平臺的服務器產品。
從另一層面來看,在EPYC平臺從第一代到第二代的升級過程中,AMD并沒有更換處理器插座。這意味著,用戶可以通過升級固件并安裝新CPU的形式在不更換服務器整機的前提下就獲得更多核心及更多性能。顯然,這對于一些用戶來說是十分具有吸引力的。
回看文章最初的問題,構建數據中心通常需要一個相對復雜的流程,實際情況根本沒有那么多推倒重來的可能。而在不改變原有風火水電等配套設施的前提下,如何在持續提高計算性能的同時保證出色的能效比則是企業數據中心長期的追求。而縱觀AMD EPYC平臺的設計思路,則可以很大程度上對客戶的原有投資進行保護,滿足大多數用戶分批次升級的產品生命周期規劃。
Chiplets助力摩爾定律 開創更多可能
面對越來越豐富的計算類型,服務器也出現了計算場景化的趨勢。通過安裝GPU、FPGA、AISC等不同類型的計算核心,服務器往往能夠獲得在特定應用場景中更好的計算效率。但與此同時,通過不斷增加計算卡的方式來實現算力多元化,也會對服務器的功耗、散熱、物理空間占用等方面提出更高要求。
面對這樣的矛盾, 由AMD在數據中心計算平臺中首先實踐的Chiplets則給出了令人期待的解決路徑。未來,通過將不同的晶片集成在同一基板之上,AMD及其合作伙伴則可以在Socket的方寸之間就解決算力多元化的大挑戰。而由于CPU在服務器內往往有著最好的供電和散熱資源,通過計算卡形式進行算力多元化所帶來的多種問題也將因此迎刃而解。
換句話說,在已有的基板之上,AMD可以較為方便的對晶片數量進行增減。這就讓AMD可以用更低的成本和售價來推出面向中端或入門純處理器產品。當然,在去掉一些CCD之后,空余的IO帶寬和總線還可以用來與同樣集成在基板上的其他類型晶片相接駁,從而打造面向特定應用的“異構”處理器。
順著這一思路想象,我們可以期待的未來將更加豐富多彩。例如,我們可以將CPU上的其中一個或多個CCD替換為GPU并增加相應的HBM,從而獲得更好的ML/DL及推理應用性能(而這種方式也很有可能是解決多GPU之間數據交換與同步的新方法);再比如,我們也可以將這些CCD替換為更有針對性的ASIC來增強CPU在其他特定算法中的性能表現,進而打造出更具場景化的計算平臺方案。
相對于以往的芯片整體設計思路,這種利用Chiplets技術打造異構芯片的方法不僅能夠讓現有IP繼續發揮價值,更可以大幅降低新處理器或計算平臺的研發周期和成本,讓更多計算場景能夠以更低成本獲得大幅度的性能優化和基礎設施架構簡化。
而從更宏觀的層面來看,Chiplets技術也很可能是延續摩爾定律的有效催化劑。
決戰方寸之間
作為服務器乃至整個數字基礎架構的核心,處理器是一門相當復雜的藝術。說它是藝術不僅因為它需要在設計、制程與工程之間不斷探索新的平衡,更因為一款處理器要應對來自當下和未來的雙重挑戰。
而一款優秀的處理器所代表的計算平臺則要做到在為用戶提供可見的性能提升的同時,為用戶乃至行業的未來提供新的發展方向、新的發展思路。
從這兩方面來看,第二代EPYC處理器都具備獨特的意義。64核與7nm的組合為用戶帶來了肉眼可見的計算性能和密度提升,能夠幫助數據中心站上成本與性能的新高度。而Chiplets技術的應用則為制程進步趨緩背景下摩爾定律的繼續生效提供了全新路徑。
能夠在幾百平方毫米的方寸之間將對技術和未來洞察演繹至此,幾年以來,這樣的產品的確罕見。
在這里我并不想著墨過多溢美之詞;并不是因為這款產品不值得,而是因為很快我們還會有全新的Milan可以期待。屆時在做品讀亦為時不晚。
-
Socket
+關注
關注
0文章
212瀏覽量
34771
發布評論請先 登錄
相關推薦
評論