在處理器市場上,AMD Ryzen對Intel造成的實際壓力越來越大。據外媒報道,Mercury Research發布的2018年第三季度處理器市場份額報告顯示,AMD在桌面x86處理器的市場占有率提升到了13%,環比增加0.8個百分點,同比增加2.1個百分點。在筆記本處理器市場,AMD的份額在第三季度提升了1.5個百分點,摸到10.9%,服務器市場的增幅更是高達10.6%。
AMD Zen架構取得了空前成功,今年還優化為Zen+增強版,并有同樣優化的12nm工藝輔助,而現在我們終于迎來了全新的第二代Zen 2架構,以及全新的7nm工藝加持。
AMD原計劃采用GlobalFoundries 7nm為自家新CPU、GPU代工,但后者已經放棄7nm及后續工藝,好在還有天字一號代工廠臺積電,AMD 7nm CPU、GPU全都轉移了過去,而且目前看起來很順利,無論產品設計還是路線圖都在按計劃進行。
根據臺積電提供的數據,7nm相比于目前的14/12nm可以將晶體管密度提高一倍,同等頻率下功耗可以降低一半,而同等功耗下性能提升可以超過25%。
如果說12nm更多地是在“數字”上領先Intel 14nm,這一次7nm則是在技術上完全實現超越,也能稍微領先Intel仍在難產的10nm。
Zen 2,這是世界上第一個7nm工藝的高性能x86 CPU,除了新工藝主要變化包括:CPU核心執行增強、更深入的安全增強、模塊化設計靈活配置并降低制造難度。
Zen 2實現了兩倍于第一代的吞吐能力,這主要得益于執行流水下的改進、浮點單元和載入存儲單元的翻番、核心密度的翻番、每操作功耗的減半。
在前端設計上,Zen 2重點改進和優化了分支預測、指令預取、指令緩存、操作緩存。
而在浮點方面,Zen 2將浮點寬度翻了一番達到256-bit,載入存儲帶寬同樣翻了一番,并提升了分發/回退帶寬,所有模塊都保持著很高的吞吐。
安全性方面,AMD重點強調了新架構可以在硬件層面免疫Spectre幽靈安全漏洞。
Zen 2架構支持更多核心,但并不是單純地增加核心數量,而是采用了特殊的組合結構:EPYC霄龍最多單路64核心128線程,分為八個Die,每個Die內八個物理核心,同時外部還有一個單獨的I/O Die,集成內存控制器、Infinity Fabric高速總線、I/O輸入輸出,專門負責聯絡各個Die與物理核心。
這種新的模塊化設計更加靈活,可以單獨針對每個模塊進行優化、調配,同時借助I/O Die大大優化了整體延遲與功耗。
不過注意,CPU Die部分用的是7nm工藝, I/O Die部分則還是14nm,因為后者大部分都是模擬電路,對新工藝并不敏感,即便上了7nm也不會帶來集成度、性能、功耗的明顯改善,成本卻會明顯增加,所以采用了這種混合工藝模塊組合。
事實上,Intel也正在同一顆芯片內嘗試不同工藝的組合,都是出于同樣的目的。
以上說的都是Zen 2架構的理論部分,最終落實到EPYC霄龍、Ryzen銳龍產品上,還會有不同的表現,但可以預料,新架構新工藝,必然會帶來明顯更高的頻率、更低的功耗,而且無論桌面還是服務器,AMD這幾年都會保持前后代兼容。
AMD還首次確認,Zen 4架構已經在設計中,將在7nm+ Zen 3之后面世,時間上估計至少會在2021年。
7nm Radeon Instinct系列首發兩款產品,型號分別是MI60、MI50,主打機器學習訓練、高性能領域,也可用于虛擬化、機器學習推理,將在今年底出貨,相關系統和應用明年問世,2020年還有下一代產品。
Radeon Instinct MI60、MI50仍舊基于Vega GPU核心架構,但是一方面升級新工藝,另一方面也針對數據中心應用做了調整優化,包括計算單元、顯存、PCI-E 4.0等等。
14nm Vega 10核心擁有125億個晶體管,核心面積484平方毫米,7nm Vega則增至132億個晶體管(增幅6.4%),面積卻縮小到331平方毫米(幅度31.6%),同時只相當于對手(815平方米的12nm GV100)的大約40%。
新核心對基礎的計算單元進行了針對性的調整增強,比如矢量ALU單元支持16/32/64位操作,同時所有模塊都支持ECC。
它還是世界上第一個顯存帶寬達到1TB/s的GPU,最多32GB HBM2。
架構優化加上頻率提升(具體未公開),MI60相比于MI25在流處理器相同的情況下,性能提升幅度十分驚人,比如FP16浮點性能快了20%,INT8、INT4整數性能分別快了140%、380%,還有新的指令集,更適合執行機器學習應用。
如果只是進行矩陣乘法運算,MI60只會提升25%以上,但對于Resnet-50這樣的特定應用,提升幅度最高可達2.8倍,非常驚人。
TensorFlow FP32提升幅度在25-50%之間,而且憑借Infinity Fabric,MI60還支持近乎線性提升的多路擴展,比如四路性能就幾乎是單路的整整4倍。
Vega、EPYC現在都支持PCI-E 4.0,但是平臺尚未構建完成,所以八路并行在PCI-E 3.0下性能提升會受到一定的限制,未來都換到PCI-E 4.0還有望更猛。
PCI-E 4.0,7nm Vega是第一個支持的GPU,Rome EPYC則是第一個支持的CPU,二者互相配合,雙向帶寬可達64GB/s,最多可以四塊并行。
Infinity Fabric總線則可以在不同顯卡之間提供200GB/s的帶寬,是PCI-E 3.0的足足6倍,不過注意這里用了硬件橋接方式互連,目的是更方便地處理超大傳輸數據量。
而得益于對硬件虛擬化的支持(唯一哦),MI60/56還可以最多八塊卡并行,但實現方式略有不同,每四塊通過Infinity Fabric高速互聯,然后兩組四塊卡再通過PCI-E總線互連。
如果不需要這么多卡,也可以一塊、兩塊、四塊各自組成虛擬機再并聯于同一個系統內,但注意必須是完全同一型號的卡,不能混用。
MI60是個完全體,集成64個計算單元、4096個流處理器,峰值整數性能INT4 118Tops、INT8 59Tops,峰值浮點性能FP16 29.5TFlops、FP32 14.7TFlops、FP64 7.4TFlops,技術特性支持全芯片ECC錯誤校驗、RAS、PCI-E 4.0、雙鏈路Infinity Fabric,顯存搭配4096-bit 32GB HBM2,帶寬1TB/s,熱設計功耗300W。
MI50精簡到60個計算單元、3840個流處理器,性能降低約9.5%,顯存容量減半至16GB,其他完全同上。
對手如此來勢洶洶,Intel這邊也坐不住了。據Anandtech,Intel宣布將于12月11日 舉辦“Forward-Looking(展望未來)”架構溝通會。
本次活動密級很高,議程和內容尚不得而知,且只有少數媒體、分析師可以參與。不知何故,Intel如今對架構技術細節越發“三緘其口”,甚至取消了Intel開發者大會。
對于Intel來說,可談的話題相當多,比如CPU、GPU、AI、FPGA、PCIe 4.0/DDR5、安全漏洞、10nm家族、摩爾定律等,甚至還包括Jim Keller/Raja Koduri等行業大牛加入后對Intel產品路線的調整。
另外,一直有傳言酷睿架構將走到盡頭,難道這次Intel要放大招了?
-
處理器
+關注
關注
68文章
19286瀏覽量
229854 -
amd
+關注
關注
25文章
5468瀏覽量
134169 -
cpu
+關注
關注
68文章
10863瀏覽量
211786
原文標題:AMD技術溝通會結束,都說了啥?
文章出處:【微信號:kejimx,微信公眾號:科技美學】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論