管理书籍排行榜,神墓辰东小说,完美世界辰东小说下载

在任何芯片設計中，天使和魔鬼都在細節之中。AMD過去對皓龍處理器（Opteron）做出的一些架構選擇讓它備受煎熬，關于代碼如何利用硬件的假設并沒有按計劃實現。老款皓龍處理器（Opteron）處理器最初的設計非常出色，但公司似乎有意避免在后續產品上犯同樣的錯誤，比如第二代霄龍（Epyc）服務器芯片。

時間和客戶將會告訴我們答案，但這一衍生產品的優勢在于，它采用了經過大幅改進的多芯片設計，核心采用了更先進的蝕刻工藝，似乎正以它在最需要的時候想要的東西，準確地打入服務器市場。這對霄龍（Epyc）芯片的發展來說是個好的開始，它將取代英特爾目前和未來的至強（Xeon）芯片。我們一直渴望了解新的“羅馬”霄龍（Epyc）服務器芯片的架構細節，我們在上周的發布會上介紹了基本的概況、速度、插槽、功率和定價。現在，讓我們和Mike Clark一起深入了解羅馬處理器的架構細節，Mike Clark是Zen核架構的研發主力，同時也是AMD的企業院士（Corporate Fellow）。從很多方面來說，擁有Zen 2核和混合處理多芯片模塊設計的羅馬處理器（Rome），是AMD兩年前就希望能夠布局的領域。相比之下，羅馬處理器（Rome）現在越來越好，這一切都始于晶圓代工合作伙伴臺積電在處理器核及其相關L1和L2緩存區域采用了7nm先進的的蝕刻工藝。 Clark苦笑著說:"能在工藝技術領域處于領先地位是件好事。"他補充稱，英特爾和AMD將在未來幾年實現跨越式發展，因此這一勝利不會是永久性的，即便這是不可否認的，也是戰略性的勝利。“這個7nm工藝帶來了顯著的改進。有趣的是，它使我們的晶體管密度提高了2倍，但是關于主頻，實際上與臺積電TSMC和及工具人員做了大量工作。通常，當你使用一項新技術時，主頻會下降，你會失去Vmax，需要一些時間才能使主頻恢復到原來的水平。但是我們能夠和他們一起創造一個非常好的7nm的主頻并且保持同樣的功率。當然，如果你從另一個角度來看晶體管，你可以在同樣的性能水平上獲得一半的功率。” 每個時鐘或IPC指令也是羅馬處理器（Rome）架構的重要組成部分。從幾年前最后一次Opterons芯片使用的“Excavator”核心到“Naples”霄龍（Epyc）芯片使用的Zen 1核，AMD能夠在固定時鐘的基礎上將IPC增加50%，這是一個巨大的飛躍。類似于ARM的“Ares” Neoverse設計。ARM實際上預計IPC將增加60%，但公平地說，Excavator Opterons和Cortex-A72芯片一開始在IPC方面都不是很強大——至少與英特爾的Xeon核無法相提并論?，F在，AMD和ARM正在迎頭趕上，隨著Zen 2內核在羅馬處理器（Rome）上的使用，AMD又增加了15%的IPC。英特爾新一代IPC的改進幅度在5%到10%之間，大約是平均水平的一半。

Clark說，當IPC上升時，芯片架構師通常要付出更高的功耗的代價，但是Zen 2核設計的目標是使其與Naples的Zen 1相比保持功率持平。事實證明，羅馬處理器的工程師為此施加了壓力，并且能夠將核的功耗降低10%，超過了通過微縮工藝從Naples的14納米到用于Zen 2的7納米的功耗。實現這一目標的主要方法之一是將核心中的操作緩存加倍，這有助于降低功耗并提高性能。事實上，AMD實際上把每個Zen 2核上的L1指令緩存從64 KB縮小到了32 KB，并把晶體管的區域還給了op和分支預測單元，還用其中的一些增加了第三個地址生成單元。將L1數據與指令緩存(均為32kb)的關聯度提高一倍，達到8路，AMD將浮點數據路徑寬度加倍，然后將L1緩存帶寬加倍，以跟上它的速度。(Clark說，一個64 KB的8路關聯L1緩存將占用太多的功率，而對于64核，這將是一個大問題。)L3的緩存在每個小芯片（Chiplets）上加倍，達到16MB/ pop，并且在封裝上有兩倍多的chiplets，是L3緩存容量(256MB)的四倍，相當于Naples 處理器的容量。它并不是把所有的東西都翻倍，但隨著核數和chiplet翻倍，試圖達到更好的平衡。這包括分支預測、指令獲取和指令解碼單元，如下圖所示:

“我們喜歡能同時提高功率和性能，”Clark解釋道。“經常地走在正確的道路上是很重要的，因為最糟糕的功耗使用就是執行那些你正要扔掉的指令?！痹谖覀儎討B地發現我們做錯了之后，我們并沒有扔掉進程。這肯定會在前端消耗更多的功耗，但在后端會帶來好處?！? 這就引出了Zen 2核心中的整數和浮點指令單元。

在整數方面，算術邏輯單元(ALU)計數在4處保持相同，但是Zen 2內核中的地址生成單元(AGU)計數增加了1，總數為3。ALUs和AGUs的調度程序都得到了改進，寄存器文件和重新排序緩沖區的大小也得到了提高。并且針對ALUs和AGUs，控制同時多線程(SMT)的算法的公平性也進行了調整，以處理Zen 1的設計中不平衡。

當然，英特爾四年前在“Knights Landing”Xeon Phi處理器中實現了一個非常優雅的512位寬AVX-512矢量單元，并帶來了它的一個變量 - 有人會說一個不太優雅的變量，因為它更難以由于它的實施方式而保持供給 - 對于“Skylake”Xeon SP處理器而言，使用當前的“Cascade Lake”Xeon SP芯片基本保持不變，除了能夠在機器學習推理工作負載中消耗一半精度的指令之外。 Clark表示AMD正在考慮在未來的霄龍（Epyc）芯片中使用512位向量，但此時并不相信只添加更寬的向量是消耗晶體管預算的最佳方法。首先，Clark補充說仍有很多浮點例程不能與512位并行 - 有時甚至不能達到256位或128位-因此，在Epyc行中，在向量引擎上移動到512位是有意義的。我們認為，AMD可能會成為一個快速的追隨者，做類似于DLBoost機器學習推理指令的事情。也許該功能已經在框架中，等待在將來某個軟件堆棧準備就緒時激活。在Zen 1內核中，它有一對128位向量，執行AVX-256指令需要兩個操作，但是Zen 2可以在一個時鐘中運行AVX-256指令;這顯然需要更少的能量。雙精度乘法在Zen 1上花費了四個周期，而在Zen 2上只花費了三個周期，這提高了浮點單元的吞吐量和功率效率。(上面引用的IPC圖用于整數指令，而不是浮點指令。) 至于為Zen 2內核供電的高速緩存，支持高速緩存的所有結構都更大，并提供更高的吞吐量，從而推動IPC：

下面是Zen 2的CPU復雜度和緩存層次結構:

增加每個核心中的L2緩存和核心上的L3緩存是實現Zen 2核心中潛在IPC的關鍵，因為正如Clark正確地說的那樣：“減少內存延遲的最佳方法是一開始就不去那里?！? 加上這一切，你將8個CPU復合體以及I / O和內存集線器 - 總共9個芯片 - 放到封裝上，制成一個頂級的羅馬Epyc。較低的倉庫SKU在封裝上具有較少的核心小芯片，有時在每個裸片上激活的核心較少，這就產生了羅馬Epyc 7002系列芯片的廣度，正如我們上周詳述的那樣。這是拆除Naples和羅馬的MCMs，顯然它們的結構非常不同:

使用PCI-Express的第二代Infinity Fabric變體進行了一些重要更改，這些變體分別用于將Naples和羅馬插座中的小芯片相互鏈接。Naples小芯片可以在一個時鐘內對Infinity Fabric進行16字節讀取和16字節寫入 - 精細打印中的FCLK是結構時鐘的縮寫 - 而羅馬芯片中的Infinity Fabric可以讀取32字節和16每個結構時鐘的字節寫入。雖然羅馬芯片插入與Naples芯片相同的插槽，但元件在插座內部捆綁在一起的方式卻截然不同。內存控制器從CPU復雜小芯片上移到中央集線器上，在14納米工藝中蝕刻，其運行速度比在7納米時更好，因為I / O和內存必須將信號從封裝中推出并進入主板DRAM和PCI-Express外圍設備插入的地方。這個集線器芯片共有8個DDR4內存控制器，總數與Naples綜合體相同;每個通道都支持一個DIMM，每個控制器有兩個通道，但羅馬內存運行速度稍快--3.2 GHz對2.67 GHz - 因此填充所有內存插槽時，每個插槽最大可產生410 GB /秒的峰值內存帶寬。這比Cascade Lake Xeon SP處理器高45％，該處理器有6個內存控制器，總運行頻率為282 GB /秒，運行頻率為2.93 GHz，比Naples運行2.67 GHz的340 GB /秒高出21％ DRAM。（這些是雙插槽服務器的評級。）羅馬Epycs的真正重大變化，以及將對許多不同工作負載的性能產生有益影響的變化，就是NUMA域在芯片中的創建方式以及NUMA跳數的減少 - 下圖中的距離 - 這是從處理器復合體的一部分移動到另一部分所需的。看一看：

這基本上是一個NUMA服務器，該中心集線器是一個芯片組，使用非統一的內存訪問技術將chiplets(在這個類比中是插槽)連接到一個嬰兒共享內存系統中，從而將緩存和主內存捆綁在一起。使用Naples芯片，從任何一個裸片到另一個裸片有三種不同的距離，這就是內存掛起。有一個跳到兩個相鄰的芯片，有時兩個跳到對角線對面，三個到第二個插座中的芯片在雙插槽設置中?，F在，有兩個NUMA域，只有兩個不同的距離。它是從一個小芯片通過中央集線器到連接到任何處理器的內存的一跳，然后另一個跳過Infinity Fabric到第二個中央集線器以及掛起它的內存。為了進一步簡化問題，只有兩個NUMA域 - 每個羅馬復合體一個。這應該使Windows Server和Linux在單插槽和雙插槽系統上運行得更好，Clark 說，對于 Naples 而言，Windows Server在實施NUMA方面比Linux更麻煩。對羅馬NUMA架構的這些變化的結果是，性能應該更好，更均勻，并且需要更廣泛的工作負載才能啟動。I / O和內存控制器集線器芯片還實現了用于將外圍設備連接到系統的PCI-Express 4.0通道，在雙插槽服務器的情況下，將一對羅馬計算復合體相互捆綁在一起。與Naples芯片一樣，每個羅馬芯片都有128個PCI-Express通道，可以通過多種不同方式進行配置，如下圖所示：

與Naples一樣，PCI總線的一半用于實現兩個插座之間的NUMA鏈路，因此單插槽和雙插槽羅馬只有128個PCI-Express通道用于外圍設備。羅馬的網卡有兩倍的帶寬，實際上可以驅動100 Gb /秒和200 Gb /秒的適配器，而PCI-Express 3.0在使用前者方面遇到了麻煩，而在普通的x8插槽中則不能用后者。這些通道可以單獨使用，通常組合成一對（x2）用于存儲設備，可能為羅馬系統中的56個NVM-Express驅動器和高速網絡接口卡留出空間。從技術上講，Naples芯片有一個單獨的x1通道，與Infinity Fabric控件分開。由于存在中央集線器，因此x1通道也可用于其他流量。這意味著單插槽羅馬服務器技術上有129個PCI-Express 4.0通道，而雙插槽羅馬服務器有130個通道。英特爾至強可以縮小到x4通道; 據Clark說，他們不能做x2或x1車道。我們以前沒有聽過這個。最后，Zen 2核心有一些架構擴展，這里概述了這些擴展，并沒有被反饋到Naples芯片的Zen 1核心：

接下來，我們將看看AMD如何將Rome Epycs與Xeon競爭對手相抗衡，以及英特爾對Rome芯片最初和長期的反應。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

amd

amd

+關注

關注
25

文章
5485

瀏覽量
134418
晶圓代工

晶圓代工

+關注

關注
6

文章
859

瀏覽量
48623
服務器芯片

服務器芯片

+關注

關注
2

文章
123

瀏覽量
19271

原文標題：挑戰Intel，AMD擁有足夠的底氣嗎？

文章出處：【微信號：icbank，微信公眾號：icbank】歡迎添加關注！文章轉載請注明出處。

中科新松協作焊接機器人加速船舶智能化

“這兩年是船舶行業發展的窗口期，且下一個窗口期的出現時間難以預測。若未抓住當前機遇進行自動化改造，一旦窗口期關閉，造船廠將失去與國外競爭對手相抗衡的成本優勢，面臨被淘汰出局的風險。”

發表于 12-31 14:56 ?272次閱讀

AMD加入玻璃基板戰局

流氓或競爭對手起訴它。包括英特爾和三星在內的大多數芯片制造商都在探索未來處理器的玻璃基板。盡管AMD不再生產自己的芯片，而是將其外包給臺積電，但它仍然擁有硅片和芯片

發表于 11-28 01:03 ?272次閱讀

微軟將OpenAI列為競爭對手名單

微軟在其最新提交給美國證券交易委員會（SEC）的10-K文件中，正式將OpenAI列入其競爭對手名單，這一名單中還包括了亞馬遜、谷歌和Meta等科技巨頭。此舉標志著微軟對OpenAI在人工智能領域，特別是其ChatGPT聊天機器人及新推出的SearchGPT搜索引擎原型的

發表于 08-05 11:38 ?640次閱讀

AMD雄心勃勃：計劃構建百萬級GPU超級計算機集群

在全球科技競賽的舞臺上，AMD近日宣布了一項令人矚目的計劃——打造一個包含多達120萬顆GPU的超級計算機集群。這一宏大的舉措立即引發了業界的廣泛關注，許多人認為，這是AMD為了與英偉達等競爭對手一較高下而邁出的重要一步。

發表于 06-27 14:37 ?691次閱讀

OpenAI競爭對手Anthropic發布最強大模型Claude 3.5 Sonnet

3.5家族的第一款模型“Claude 3.5 Sonnet”。 OpenAI競爭對手Anthropic發布的最新大模型Claude 3.5 Sonnet號稱在深度理解、推理、代碼等多項基準測試中

發表于 06-21 14:52 ?959次閱讀

樹莓派5最大的競爭對手OrangePi 5 Pro?，新增4GB/8GB版本

OrangePi5Pro被稱為樹莓派5最大的競爭對手。繼OrangePi5Pro（16GB）版本發布一個月之后，香橙派近日再推出OrangePi5Pro4GB/8GB版本。除了在運行內存方面有所差異

發表于 05-07 10:00 ?810次閱讀

樹莓派5最大的<b class='flag-5'>競爭對手</b>OrangePi 5 Pro?，新增4GB/8GB版本

Genius Tracker? 安裝速度遠超競爭對手的單軸跟蹤器

來自第三方的時間研究表明?GameChange Solar 的?Genius Tracker? 安裝速度遠超競爭對手的單軸跟蹤器現場研究表明，照比市場中其他三款有競爭力的?1P 跟蹤器

發表于 04-07 16:49 ?502次閱讀

外交部回應英偉達將華為認定為“最大競爭對手”！

2月24日報道據德國之聲電臺網站2月23日報道，美國芯片巨頭英偉達在本周提交給美國證券交易委員會的文件中，在包含AI芯片等多個類別中，首度將華為認定為“最大競爭對手”。英偉達提及的其他

發表于 02-29 14:40 ?705次閱讀

英偉達將華為認定為最大競爭對手

近日，美國芯片巨頭英偉達在提交給美國證券交易委員會的文件中，首次將中國科技巨頭華為認定為在多個類別，包括AI芯片領域內的“最大競爭對手”。這一舉動被分析家視為全球先進制程芯片格局正在發生變化的明顯跡象。

發表于 02-25 16:47 ?1009次閱讀

英偉達CEO表示華為好公司　英偉達將華為認定為最大競爭對手

英偉達CEO表示華為好公司英偉達將華為認定為最大競爭對手 就在英偉達發布了超級亮眼的財報數據而暴漲拯救美國股市后，不可避免的會有人拿英偉達與華為去做對比。英偉達將華為認定為最大競爭對手

發表于 02-25 15:18 ?831次閱讀

英偉達在文件中首次明確指出最大的競爭對手

英偉達公司在最新提交給美國證券交易委員會的文件中，首次明確將華為定位為其在人工智能芯片領域的最大競爭對手。這一聲明引起了業界的廣泛關注，也表明了人工智能芯片市場的激烈競爭和華為在這一領域取得的重要

發表于 02-23 15:34 ?641次閱讀

英偉達首次將華為列為多個領域的最大競爭對手！

2月23日消息，據外媒報道，英偉達在周三提交給美國證交會的文件中,首次將華為列為包括人工智能(AI)芯片在內的多個領域的最大競爭對手！

發表于 02-23 13:37 ?1105次閱讀

英特爾向競爭對手AMD等開放芯片制造

基辛格針對相關問題作出解答，說明英特爾的代工廠將應用其尖端技術為主導客戶打造各類芯片，同時全面提供自身全套的IP支持，包括杰出的封裝技能。他特別表示，期待AMD等各行業巨頭能成為英特爾的客戶伙伴。

發表于 02-22 15:25 ?605次閱讀

英特爾愿意為競爭對手AMD等公司代工芯片

盡管基辛格未給出詳盡解答，但他透露了一些引人深思的見解。他指出，英特爾將會將其制程技術授權給一些競爭對手，同時也承認產品團隊可能需要與其基于英特爾核心技術的競爭者展開直接競爭。

發表于 02-22 09:43 ?655次閱讀

AMD AI芯片今年營收高于預期，明年第一季度營收預測

這一境況再度引起人們對AMD核心市場（以PC、服務器、游戲機及可編程處理器為主）客戶推遲購買的憂慮。雖然AMD在擴展AI加速器領域看似繁榮，但目前仍處于初級發展階段，并在這一利好市場上受到了競爭對手NVIDIA的壓制。

發表于 02-01 09:52 ?3290次閱讀

在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

搜索歷史

AMD如何將Rome Epycs與Xeon競爭對手相抗衡

評論

中科新松協作焊接機器人加速船舶智能化

AMD加入玻璃基板戰局

微軟將OpenAI列為競爭對手名單

AMD雄心勃勃：計劃構建百萬級GPU超級計算機集群

OpenAI競爭對手Anthropic發布最強大模型Claude 3.5 Sonnet

樹莓派5最大的競爭對手OrangePi 5 Pro?，新增4GB/8GB版本

Genius Tracker? 安裝速度遠超競爭對手的單軸跟蹤器

外交部回應英偉達將華為認定為“最大競爭對手”！

英偉達將華為認定為最大競爭對手

英偉達CEO表示華為好公司　英偉達將華為認定為最大競爭對手

英偉達在文件中首次明確指出最大的競爭對手

英偉達首次將華為列為多個領域的最大競爭對手！

英特爾向競爭對手AMD等開放芯片制造

英特爾愿意為競爭對手AMD等公司代工芯片

AMD AI芯片今年營收高于預期，明年第一季度營收預測