大家都知道CPU緩存很重要,但對于緩存的具體細分卻知之甚少,本文只要是關于CPU緩存的介紹,并著重描述了一級緩存、二級緩存、三級緩存區(qū)別方法。
CPU緩存
CPU緩存(Cache Memory)是位于CPU與內(nèi)存之間的臨時存儲器,它的容量比內(nèi)存小的多但是交換速度卻比內(nèi)存要快得多。高速緩存的出現(xiàn)主要是為了解決CPU運算速度與內(nèi)存讀寫速度不匹配的矛盾,因為CPU運算速度要比內(nèi)存讀寫速度快很多,這樣會使CPU花費很長時間等待數(shù)據(jù)到來或把數(shù)據(jù)寫入內(nèi)存。在緩存中的數(shù)據(jù)是內(nèi)存中的一小部分,但這一小部分是短時間內(nèi)CPU即將訪問的,當CPU調(diào)用大量數(shù)據(jù)時,就可先緩存中調(diào)用,從而加快讀取速度。
CPU緩存的容量比內(nèi)存小的多但是交換速度卻比內(nèi)存要快得多。緩存的出現(xiàn)主要是為了解決CPU運算速度與內(nèi)存讀寫速度不匹配的矛盾,因為CPU運算速度要比內(nèi)存讀寫速度快很多,這樣會使CPU花費很長時間等待數(shù)據(jù)到來或把數(shù)據(jù)寫入內(nèi)存。 ?
緩存大小是CPU的重要指標之一,而且緩存的結構和大小對CPU速度的影響非常大,CPU內(nèi)緩存的運行頻率極高,一般是和處理器同頻運作,工作效率遠遠大于系統(tǒng)內(nèi)存和硬盤。實際工作時,CPU往往需要重復讀取同樣的數(shù)據(jù)塊,而緩存容量的增大,可以大幅度提升CPU內(nèi)部讀取數(shù)據(jù)的命中率,而不用再到內(nèi)存或者硬盤上尋找,以此提高系統(tǒng)性能。但是從CPU芯片面積和成本的因素來考慮,緩存都很小。
按照數(shù)據(jù)讀取順序和與CPU結合的緊密程度,CPU緩存可以分為一級緩存,二級緩存,部分高端CPU還具有三級緩存,每一級緩存中所儲存的全部數(shù)據(jù)都是下一級緩存的一部分,這三種緩存的技術難度和制造成本是相對遞減的,所以其容量也是相對遞增的。當CPU要讀取一個數(shù)據(jù)時,首先從一級緩存中查找,如果沒有找到再從二級緩存中查找,如果還是沒有就從三級緩存或內(nèi)存中查找。一般來說,每級緩存的命中率大概都在80%左右,也就是說全部數(shù)據(jù)量的80%都可以在一級緩存中找到,只剩下20%的總數(shù)據(jù)量才需要從二級緩存、三級緩存或內(nèi)存中讀取,由此可見一級緩存是整個CPU緩存架構中最為重要的部分。
一級緩存、二級緩存、三級緩存區(qū)別是什么
一級緩存、二級緩存、三級緩存是什么?作用?區(qū)別??首先簡單了解一下一級緩存。目前所有主流處理器大都具有一級緩存和二級緩存,少數(shù)高端處理器還集成了三級緩存。其中,一級緩存可分為一級指令緩存和一級數(shù)據(jù)緩存。一級指令緩存用于暫時存儲并向CPU遞送各類運算指令;一級數(shù)據(jù)緩存用于暫時存儲并向CPU遞送運算所需數(shù)據(jù),這就是一級緩存的作用。?那么,二級緩存的作用又是什么呢?簡單地說,二級緩存就是一級緩存的緩沖器:一級緩存制造成本很高因此它的容量有限,二級緩存的作用就是存儲那些CPU處理時需要用到、一級緩存又無法存儲的數(shù)據(jù)。同樣道理,三級緩存和內(nèi)存可以看作是二級緩存的緩沖器,它們的容量遞增,但單位制造成本卻遞減。
需要注意的是,無論是二級緩存、三級緩存還是內(nèi)存都不能存儲處理器操作的原始指令,這些指令只能存儲在CPU的一級指令緩存中,而余下的二級緩存、三級緩存和內(nèi)存僅用于存儲CPU所需數(shù)據(jù)。?根據(jù)工作原理的不同,目前主流處理器所采用的一級數(shù)據(jù)緩存又可以分為實數(shù)據(jù)讀寫緩存和數(shù)據(jù)代碼指令追蹤緩存2種,它們分別被AMD和Intel所采用。不同的一級數(shù)據(jù)緩存設計對于二級緩存容量的需求也各不相同,下面讓我們簡單了解一下這兩種一級數(shù)據(jù)緩存設計的不同之處。
一、AMD一級數(shù)據(jù)緩存設計?AMD采用的一級緩存設計屬于傳統(tǒng)的“實數(shù)據(jù)讀寫緩存”設計。基于該架構的一級數(shù)據(jù)緩存主要用于存儲CPU最先讀取的數(shù)據(jù);而更多的讀取數(shù)據(jù)則分別存儲在二級緩存和系統(tǒng)內(nèi)存當中。做個簡單的假設,假如處理器需要讀取“AMD?ATHLON?64?3000+?IS?GOOD”這一串數(shù)據(jù)(不記空格),那么首先要被讀取的“AMDATHL”將被存儲在一級數(shù)據(jù)緩存中,而余下的“ON643000+ISGOOD”則被分別存儲在二級緩存和系統(tǒng)內(nèi)存當中(如下圖所示)。?需要注意的是,以上假設只是對AMD處理器一級數(shù)據(jù)緩存的一個抽象描述,一級數(shù)據(jù)緩存和二級緩存所能存儲的數(shù)據(jù)長度完全由緩存容量的大小決定,而絕非以上假設中的幾個字節(jié)。“實數(shù)據(jù)讀寫緩存”的優(yōu)點是數(shù)據(jù)讀取直接快速,但這也需要一級數(shù)據(jù)緩存具有一定的容量,增加了處理器的制造難度(一級數(shù)據(jù)緩存的單位制造成本較二級緩存高)。
二、Intel一級數(shù)據(jù)緩存設計?自P4時代開始,Intel開始采用全新的“數(shù)據(jù)代碼指令追蹤緩存”設計。基于這種架構的一級數(shù)據(jù)緩存不再存儲實際的數(shù)據(jù),而是存儲這些數(shù)據(jù)在二級緩存中的指令代碼(即數(shù)據(jù)在二級緩存中存儲的起始地址)。假設處理器需要讀取“INTEL?P4?IS?GOOD”這一串數(shù)據(jù)(不記空格),那么所有數(shù)據(jù)將被存儲在二級緩存中,而一級數(shù)據(jù)代碼指令追蹤緩存需要存儲的僅僅是上述數(shù)據(jù)的起始地址。
由于一級數(shù)據(jù)緩存不再存儲實際數(shù)據(jù),因此“數(shù)據(jù)代碼指令追蹤緩存”設計能夠極大地降CPU對一級數(shù)據(jù)緩存容量的要求,降低處理器的生產(chǎn)難度。但這種設計的弊端在于數(shù)據(jù)讀取效率較“實數(shù)據(jù)讀寫緩存設計”低,而且對二級緩存容量的依賴性非常大。?在了解了一級緩存、二級緩存的大致作用及其分類以后,下面我們來回答以下硬件一菜鳥網(wǎng)友提出的問題。
從理論上講,二級緩存越大處理器的性能越好,但這并不是說二級緩存容量加倍就能夠處理器帶來成倍的性能增長。目前CPU處理的絕大部分數(shù)據(jù)的大小都在0-256KB之間,小部分數(shù)據(jù)的大小在256KB-512KB之間,只有極少數(shù)數(shù)據(jù)的大小超過512KB。所以只要處理器可用的一級、二級緩存容量達到256KB以上,那就能夠應付正常的應用;512KB容量的二級緩存已經(jīng)足夠滿足絕大多數(shù)應用的需求。?這其中,對于采用“實數(shù)據(jù)讀寫緩存”設計的AMD?Athlon?64、Sempron處理器而言,由于它們已經(jīng)具備了64KB一級指令緩存和64KB一級數(shù)據(jù)緩存,只要處理器的二級緩存容量大于等于128KB就能夠存儲足夠的數(shù)據(jù)和指令,因此它們對二級緩存的依賴性并不大。這就是為什么主頻同為1.8GHz的Socket?754?Sempron?3000+(128KB二級緩存)、Sempron?3100+(256KB二級緩存)以及Athlon?64?2800+(512KB二級緩存)在大多數(shù)評測中性能非常接近的主要原因。所以對于普通用戶而言754?Sempron?2600+是值得考慮的。?反觀Intel目前主推的P4、賽揚系列處理器,它們都采用了“數(shù)據(jù)代碼指令追蹤緩存”架構,其中Prescott內(nèi)核的一級緩存中只包含了12KB一級指令緩存和16KB一級數(shù)據(jù)緩存,而Northwood內(nèi)核更是只有12KB一級指令緩存和8KB一級數(shù)據(jù)緩存。
因此,P4、賽隆系列處理器非常依賴于二級緩存,賽揚D 320(256KB二級緩存)和賽揚2.4GHz(128kb二級緩存)的性能差距是很好的證明;Cayon D和P4E處理器之間的性能差距也非常明顯。最后,如果你是一個狂熱的游戲愛好者或者一個專業(yè)的多媒體用戶,一個帶有1MB二級緩存的P4處理器和一個512Kb/1MB二級緩存的Athon 64處理器是你的理想選擇。由于CPU的主存和二級緩存在重計算負載下幾乎是“滿”的,大的二級緩存可以為處理器提供大約5%到10%的性能改進,這對于要求苛刻的用戶是絕對必要的。一級緩存是在CPU內(nèi)的,用來存放內(nèi)部指令,2級緩存和CPU封裝在一起,也是用來存放指令數(shù)據(jù)的,三級和四級緩存只在高端的服務器CPU里有,作用差不多,速度更快,更穩(wěn)定,更有效?并不是緩存越大越好,譬如AMD和INTER就有不同的理論,AMD認為一級緩存越大越好,所以一級比較大,而INTER認為過大會有更長的指令執(zhí)行時間,所以一級很小,二級緩存那兩個公司的理論又反過來了,AMD的小,INTER的大,一般主流的INTERCPU的2級緩存都在2M左右?我們通常用(L1,L2)來稱呼緩存又叫高速緩沖存儲器其作用在于緩解主存速度慢、跟不上CPU讀寫速度要求的矛盾。它的實現(xiàn)原理,是把CPU最近最可能用到的少量信息(數(shù)據(jù)或指令)從主存復制到CACHE中,當CPU下次再用這些信息時,它就不必訪問慢速的主存,而直接從快速的CACHE中得到,從而提高了得到這些信息的速度,使CPU有更高的運行效率。
緩存的大小
一般說來,更大一點的cache容量,對提高命中率是有好處的,如圖4.20所示,由于cache?是用價格很高的靜態(tài)存儲器SRAM器件實現(xiàn)的,而cache容量達到一定大小這后,再增加其容量,對命中率的提高并不明顯,從合理的性能/價格比考慮,cache的容量設置應在一個合理的容量范圍之內(nèi)。緩存要分一級二級?三級,是為了建立一個層次存儲結構,以達到最高性價比。而且多級組織還可以提高cache的命中率,提高執(zhí)行效能。
CPU緩存(Cache?Memory)是位于CPU與內(nèi)存之間的臨時存儲器,它的容量比內(nèi)存小的多但是交換速度卻比內(nèi)存要快得多。緩存的出現(xiàn)主要是為了解決CPU運算速度與內(nèi)存讀寫速度不匹配的矛盾,因為CPU運算速度要比內(nèi)存讀寫速度快很多,這樣會使CPU花費很長時間等待數(shù)據(jù)到來或把數(shù)據(jù)寫入內(nèi)存。在緩存中的數(shù)據(jù)是內(nèi)存中的一小部分,但這一小部分是短時間內(nèi)CPU即將訪問的,當CPU調(diào)用大量數(shù)據(jù)時,就可避開內(nèi)存直接從緩存中調(diào)用,從而加快讀取速度。由此可見,在CPU中加入緩存是一種高效的解決方案,這樣整個內(nèi)存儲器(緩存+內(nèi)存)就變成了既有緩存的高速度,又有內(nèi)存的大容量的存儲系統(tǒng)了。緩存對CPU的性能影響很大,主要是因為CPU的數(shù)據(jù)交換順序和CPU與緩存間的帶寬引起的。?緩存的工作原理是當CPU要讀取一個數(shù)據(jù)時,首先從緩存中查找,如果找到就立即讀取并送給CPU處理;如果沒有找到,就用相對慢的速度從內(nèi)存中讀取并送給CPU處理,同時把這個數(shù)據(jù)所在的數(shù)據(jù)塊調(diào)入緩存中,可以使得以后對整塊數(shù)據(jù)的讀取都從緩存中進行,不必再調(diào)用內(nèi)存。?正是這樣的讀取機制使CPU讀取緩存的命中率非常高(大多數(shù)CPU可達90%左右),也就是說CPU下一次要讀取的數(shù)據(jù)90%都在緩存中,只有大約10%需要從內(nèi)存讀取。
這大大節(jié)省了CPU直接讀取內(nèi)存的時間,也使CPU讀取數(shù)據(jù)時基本無需等待。總的來說,CPU讀取數(shù)據(jù)的順序是先緩存后內(nèi)存。?目前緩存基本上都是采用SRAM存儲器,SRAM是英文Static?RAM的縮寫,它是一種具有靜志存取功能的存儲器,不需要刷新電路即能保存它內(nèi)部存儲的數(shù)據(jù)。不像DRAM內(nèi)存那樣需要刷新電路,每隔一段時間,固定要對DRAM刷新充電一次,否則內(nèi)部的數(shù)據(jù)即會消失,因此SRAM具有較高的性能,但是SRAM也有它的缺點,即它的集成度較低,相同容量的DRAM內(nèi)存可以設計為較小的體積,但是SRAM卻需要很大的體積,這也是目前不能將緩存容量做得太大的重要原因。
它的特點歸納如下:優(yōu)點是節(jié)能、速度快、不必配合內(nèi)存刷新電路、可提高整體的工作效率,缺點是集成度低、相同的容量體積較大、而且價格較高,只能少量用于關鍵性系統(tǒng)以提高效率。?按照數(shù)據(jù)讀取順序和與CPU結合的緊密程度,CPU緩存可以分為一級緩存,二級緩存,部分高端CPU還具有三級緩存,每一級緩存中所儲存的全部數(shù)據(jù)都是下一級緩存的一部分,這三種緩存的技術難度和制造成本是相對遞減的,所以其容量也是相對遞增的。當CPU要讀取一個數(shù)據(jù)時,首先從一級緩存中查找,如果沒有找到再從二級緩存中查找,如果還是沒有就從三級緩存或內(nèi)存中查找。一般來說,每級緩存的命中率大概都在80%左右,也就是說全部數(shù)據(jù)量的80%都可以在一級緩存中找到,只剩下20%的總數(shù)據(jù)量才需要從二級緩存、三級緩存或內(nèi)存中讀取,由此可見一級緩存是整個CPU緩存架構中最為重要的部分。?
一級緩存(Level?1?Cache)簡稱L1?Cache,位于CPU內(nèi)核的旁邊,是與CPU結合最為緊密的CPU緩存,也是歷史上最早出現(xiàn)的CPU緩存。由于一級緩存的技術難度和制造成本最高,提高容量所帶來的技術難度增加和成本增加非常大,所帶來的性能提升卻不明顯,性價比很低,而且現(xiàn)有的一級緩存的命中率已經(jīng)很高,所以一級緩存是所有緩存中容量最小的,比二級緩存要小得多。一般來說,一級緩存可以分為一級數(shù)據(jù)緩存(Data?Cache,D-Cache)和一級指令緩存(Instruction?Cache,I-Cache)。二者分別用來存放數(shù)據(jù)以及對執(zhí)行這些數(shù)據(jù)的指令進行即時解碼,而且兩者可以同時被CPU訪問,減少了爭用Cache所造成的沖突,提高了處理器效能。目前大多數(shù)CPU的一級數(shù)據(jù)緩存和一級指令緩存具有相同的容量,例如AMD的Athlon?XP就具有64KB的一級數(shù)據(jù)緩存和64KB的一級指令緩存,其一級緩存就以64KB+64KB來表示,其余的CPU的一級緩存表示方法以此類推。
?Intel的采用NetBurst架構的CPU(最典型的就是Pentium?4)的一級緩存有點特殊,使用了新增加的一種一級追蹤緩存(Execution?Trace?Cache,T-Cache或ETC)來替代一級指令緩存,容量為12KμOps,表示能存儲12K條即12000條解碼后的微指令。一級追蹤緩存與一級指令緩存的運行機制是不相同的,一級指令緩存只是對指令作即時的解碼而并不會儲存這些指令,而一級追蹤緩存同樣會將一些指令作解碼,這些指令稱為微指令(micro-ops),而這些微指令能儲存在一級追蹤緩存之內(nèi),無需每一次都作出解碼的程序,因此一級追蹤緩存能有效地增加在高工作頻率下對指令的解碼能力,而μOps就是micro-ops,也就是微型操作的意思。它以很高的速度將μops提供給處理器核心。Intel?NetBurst微型架構使用執(zhí)行跟蹤緩存,將解碼器從執(zhí)行循環(huán)中分離出來。
這個跟蹤緩存以很高的帶寬將uops提供給核心,從本質(zhì)上適于充分利用軟件中的指令級并行機制。Intel并沒有公布一級追蹤緩存的實際容量,只知道一級追蹤緩存能儲存12000條微指令(micro-ops)。所以,我們不能簡單地用微指令的數(shù)目來比較指令緩存的大小。實際上,單核心的NetBurst架構CPU使用8Kμops的緩存已經(jīng)基本上夠用了,多出的4kμops可以大大提高緩存命中率。而如果要使用超線程技術的話,12KμOps就會有些不夠用,這就是為什么有時候Intel處理器在使用超線程技術時會導致性能下降的重要原因。
?例如Northwood核心的一級緩存為8KB+12KμOps,就表示其一級數(shù)據(jù)緩存為8KB,一級追蹤緩存為12KμOps;而Prescott核心的一級緩存為16KB+12KμOps,就表示其一級數(shù)據(jù)緩存為16KB,一級追蹤緩存為12KμOps。在這里12KμOps絕對不等于12KB,單位都不同,一個是μOps,一個是Byte(字節(jié)),而且二者的運行機制完全不同。所以那些把Intel的CPU一級緩存簡單相加,例如把Northwood核心說成是20KB一級緩存,把Prescott核心說成是28KB一級緩存,并且據(jù)此認為Intel處理器的一級緩存容量遠遠低于AMD處理器128KB的一級緩存容量的看法是完全錯誤的,二者不具有可比性。在架構有一定區(qū)別的CPU對比中,很多緩存已經(jīng)難以找到對應的東西,即使類似名稱的緩存在設計思路和功能定義上也有區(qū)別了,此時不能用簡單的算術加法來進行對比;而在架構極為近似的CPU對比中,分別對比各種功能緩存大小才有一定的意義。
結語?
關于緩存的細分就介紹到這了,希望本文能對你有所幫助。
評論
查看更多