在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

CPU是怎么實現加速的?

sanyue7758 ? 來源:處芯積律 ? 2023-04-06 10:58 ? 次閱讀

軟件在CPU上執行,采用一定的流水線執行指令,通常有取指(Instruction Fetch)、譯碼(Instruction Decode)、執行(Execute)、訪存(Memory)、寫回(Write Back)這幾步操作。如下圖所示,為5個階段的順序執行的處理器指令流,即CPU執行指令按照流水線,有一定的先后順序,單線程同一時刻只能計算出一個結果。

081fac22-d306-11ed-bfe3-dac502259ad0.png

那么,我們再深入探討一下CPU的體系結構,不外乎下圖的幾種:馮.諾依曼體系結構、哈佛體系結構、改進的哈佛體系結構,這幾種結構有其各自的優勢,應用于不同的產品中,也有各自的優缺點,其中X86最典型的馮.諾依曼結構,廣泛應用于個人電腦、工作站、服務器等;而ARM是最典型的哈佛結構,廣泛應用于單片機、ARM芯片等終端芯片,如手機、平板等,終端設備等。關于具體的細分,詳見下方思維導圖。

082ec630-d306-11ed-bfe3-dac502259ad0.png

馮.諾依曼結構(von Eeumann Architecture),也稱普林斯頓結構,如下圖所示,是一種將程序指令和數據合并在一起的存儲器結構。該結構中指令和數據共用一條總線,通過分時復用的方式進行讀寫操作,結構相對簡單,總線面積較小,但缺點是效率低,無法同時取指令和數據,成為了執行的瓶頸。

08420f24-d306-11ed-bfe3-dac502259ad0.png

08507fd2-d306-11ed-bfe3-dac502259ad0.png

為了解決馮.諾依曼結構無法并行取指令和數據,提高計算的效率,在此基礎上提出了哈佛結構(Harvard Architecture),這是一種將程序指令和數據分開的存儲器結構,如今下圖所示。該結構由于程序的指令和數據存儲在兩個獨立的存儲器,各自有獨立的訪問總線,因此提供了更大的存儲器帶寬,減輕了程序運行時訪問內存的瓶頸。但相應的也需要獨立的存儲器,以及更大的總線面積,其中ARM就是典型的哈佛結構。

086aef98-d306-11ed-bfe3-dac502259ad0.png

087a1b12-d306-11ed-bfe3-dac502259ad0.png

同樣采用流水線,相對于馮.諾依曼結構,哈佛結構的指令效率更高。哈佛結構在當前指令譯碼的時候,可以進行下一條指令的取指,然后在執行下一條指令的同時,又開始了第三條指令的取指。這一過程,通過指令預取,加快了原先5個步驟的流水線結構,提高了流水線的并行度。

實際上計算機體系結構發展到現在,馮.諾伊曼結構,和哈佛結構的界限已經沒有那么清晰。比如改進型的哈佛結構,指令和數據還是一起存儲在主存中,但CPU有額外的指令Cache和數據Cache(如下圖所示),在主存帶寬足夠允許的前提下,使得CPU可以同時去取指令和數據Cache,所以可以認為結構上對外是馮.諾伊曼結構,對內是哈佛結構,這就是改進型的哈佛結構。

由于本章僅在高層次上,對CPU架構設計帶來的加速進行基礎的描述,這塊就不再深入。那么,我們繼續探討,如何可以讓CPU流水線計算地更快。

1)采用更先進的工藝

從28nm到5nm/3nm,更先進的工藝使得允許我們可以在更高的頻率下進行工作,當然也意味著更高的流片成本。典型的以28nm為例,A53可以跑到1.5GHz,而在16nm工藝下,A53可以跑到2.3GHz的主頻(以上數據僅供參考,跟具體優化有關)。

088efbfe-d306-11ed-bfe3-dac502259ad0.png

但摩爾定律的終結,意味著一味地通過工藝的升級來提高主頻,變得越來越困難,除了單純的提升工藝,增加核數量,我們還得從微架構上探索,如何跑的更快。

2)超級流水線處理器

由于時鐘頻率受流水線中計算耗時最大的的,即我們的主頻需要滿足各階段的setup/hold time,如果將每一步計算拆分為更細的顆粒度,那么我們更容易滿足setup/hold time,因而可以跑在更高的主頻下——這就是超級流水線處理器/深流水線。

如下圖所謂,為細分后的超級流水線示意圖。

08a67e5a-d306-11ed-bfe3-dac502259ad0.png

3)標量流水線處理器

用更細的計算顆粒,我們可以運行在更高的主頻,這是提高了流水的速率。

換個思路,大力出奇跡:如果我們擁有多條河流,那我們可以成倍的提高流水的效率,這就是標量流水線處理器,如下圖所示:

08b4494a-d306-11ed-bfe3-dac502259ad0.png

在上圖中,每條流水線執行仍然需要5個周期,但上下兩個流水線可以重疊執行。圖中用9個周期,完成了5條指令,但即當流水線滿載時,每個周期都可以完成一條指令,相比于單流水線,提高了5倍的效率。當然我們擁有了5條河流來提高速率,也是付出了面積的代價,即FPGA中常用的面積換速度的思維。

4)超標量流水線處理器

結合超級流水線,以及標量流水線的特性,也自然有了超級標量流水線結構的處理器,其流水結構如下圖所示:

08c26b10-d306-11ed-bfe3-dac502259ad0.png

超標量流水線處理器指令流

即采用了多條流水線的結構,增加了并行計算性能;同時通過流水線每一階段的顆粒度,提高了運行的主頻。當然,相對于兩個種優化的結構,超標量流水線結構也是以更大的面積為代價。目前市場上幾乎所有處理器,都是超標量流水處理器結構。

5)采用多核CPU結構

當在確定的工藝,以及一定的超標量流水線結構的處理器下,單核CPU的性能很難再實現質的飛躍,那么多核處理器的結構,再次通過面積換速度,成倍的提升了CPU的硬件性能。典型的以下圖為例,為***處理器中,4核A72 + 4核A53的大小核結構。多核處理器,在進行SOC設計時,給架構師提出了更高的挑戰;同時在軟件應用時,也對多核并行處理提出了更高的要求,如下圖所示,為AR72/A53的多核結構。

08cfb72a-d306-11ed-bfe3-dac502259ad0.png

審核編輯:湯梓紅
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • ARM
    ARM
    +關注

    關注

    134

    文章

    9121

    瀏覽量

    368244
  • 存儲器
    +關注

    關注

    38

    文章

    7518

    瀏覽量

    164083
  • cpu
    cpu
    +關注

    關注

    68

    文章

    10889

    瀏覽量

    212390
  • 流水線
    +關注

    關注

    0

    文章

    120

    瀏覽量

    25905
  • 指令
    +關注

    關注

    1

    文章

    608

    瀏覽量

    35777

原文標題:CPU是怎么實現加速的?

文章出處:【微信號:處芯積律,微信公眾號:處芯積律】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    【FPGA干貨分享六】基于FPGA協處理器的算法加速實現

    處理器功能在硬件中實現以替代幾種軟件指令。通過減少多種代碼指令為單一指令,以及在硬件中直接實現指令的方式,從而實現代碼加速。最常用的協處理器是浮點單元(FPU),這是與
    發表于 02-02 14:18

    為什么FPGA協處理器可以實現算法加速

    代碼加速和代碼轉換到硬件協處理器的方法如何采用FPGA協處理器實現算法加速
    發表于 04-13 06:39

    對步進電機的控制,加速和減速是如何實現的?

    控制步進電機加速和減速是如何實現
    發表于 10-15 07:00

    CPU流水線的定義

    cpu流水線技術是一種將指令分解為多步,并讓不同指令的各步操作重疊,從而實現幾條指令并行處理,以加速程序運行過程的技術。
    發表于 12-14 15:29 ?4713次閱讀

    渦輪加速升壓(Turbo-boost)充電器可為CPU渦輪加速模式提供支持

    本文介紹的渦輪加速升壓 (turbo boost) 充電器,允許適配器和電池同時為系統供電,以滿足筆記本電腦在 CPU 內核加速模式下工作時出現的猝發、超高功率需求。
    發表于 07-20 14:43 ?5479次閱讀
    渦輪<b class='flag-5'>加速</b>升壓(Turbo-boost)充電器可為<b class='flag-5'>CPU</b>渦輪<b class='flag-5'>加速</b>模式提供支持

    渦輪加速升壓 (Turbo-boost) 充電器可為 CPU 渦輪加速模式提供支持

    渦輪加速升壓 (Turbo-boost) 充電器可為 CPU 渦輪加速模式提供支持
    發表于 09-15 14:21 ?4次下載
    渦輪<b class='flag-5'>加速</b>升壓 (Turbo-boost) 充電器可為 <b class='flag-5'>CPU</b> 渦輪<b class='flag-5'>加速</b>模式提供支持

    Java底層實現CPU還有10個術語!

    Java底層實現——CPU的10個術語
    的頭像 發表于 03-28 14:14 ?6270次閱讀

    Javascript如何實現GPU加速

    由 Demi 于 星期四, 2018-09-06 16:10 發表 一、什么是Javascript實現GPU加速CPU與GPU設計目標不同,導致它們之間內部結構差異很大。 CPU
    發表于 09-06 20:21 ?692次閱讀

    使用FPGA實現CPU設計的畢業論文總結

    CPU的總體結構到局部功能的實現采用了自頂向下的設計方法和模塊化的設計思想,利用Xilinx 公司的Spartan II 系列FPGA,設計實現了八位CPU軟核。在FPGA內部不僅
    發表于 08-03 17:58 ?13次下載
    使用FPGA<b class='flag-5'>實現</b><b class='flag-5'>CPU</b>設計的畢業論文總結

    如何使用FPGA實現八位RISC CPU的設計

    CPU的總體結構到局部功能的實現采用了自頂向下的設計方法和模塊化的設計思想, 利用Xilinx 公司的Spartan II 系列FPGA, 設計實現了八位CPU軟核。在FPGA 內部
    發表于 08-19 17:43 ?7次下載
    如何使用FPGA<b class='flag-5'>實現</b>八位RISC <b class='flag-5'>CPU</b>的設計

    為什么FPGA主頻比CPU慢,但卻可以用來幫CPU加速

    我們知道,FPGA的頻率一般只有幾百MHz,而CPU的頻率卻高達數GHz。那么,有不少網友心中就有一個疑問:為什么FPGA主頻比CPU慢,但卻可以用來幫CPU加速?。 今天,EDN就
    的頭像 發表于 11-20 09:56 ?3985次閱讀

    Intel Sapphire Rapids CPU,吹響反攻DPU的號角

    CPU已經到了性能瓶頸,這是大家的共識;當CPU遇到性能瓶頸的時候,通過加速的方式進一步提升性能,也是大家的共識。但是,加速實現形態,是分
    的頭像 發表于 12-19 15:01 ?1052次閱讀

    基于CPCI總線CPU主控模塊的設計與實現

    電子發燒友網站提供《基于CPCI總線CPU主控模塊的設計與實現.pdf》資料免費下載
    發表于 10-18 11:09 ?0次下載
    基于CPCI總線<b class='flag-5'>CPU</b>主控模塊的設計與<b class='flag-5'>實現</b>

    基于雙CPU的電能質量監測系統設計與實現

    電子發燒友網站提供《基于雙CPU的電能質量監測系統設計與實現.pdf》資料免費下載
    發表于 10-20 09:47 ?0次下載
    基于雙<b class='flag-5'>CPU</b>的電能質量監測系統設計與<b class='flag-5'>實現</b>

    音視頻解碼器硬件加速實現更流暢的播放效果

    思想是利用專門的硬件資源,如GPU或專用的解碼芯片,來分擔原本由CPU承擔的解碼任務。這種方式不僅可以大幅提高解碼速度,還能降低CPU的負載,從而實現更流暢的播放效果。 硬件加速的優勢
    的頭像 發表于 02-21 14:40 ?1019次閱讀
    音視頻解碼器硬件<b class='flag-5'>加速</b>:<b class='flag-5'>實現</b>更流暢的播放效果
    主站蜘蛛池模板: 国产成人毛片毛片久久网| 国产精品美女在线| 五月婷婷七月丁香| 亚洲人成网站在线在线| 香蕉视频在线观看黄| 四虎精品久久久久影院| 日韩毛片视频| 理论片人人51| 成人在线亚洲| 天天爽夜夜爽人人爽曰喷水| 欧美在线视频7777kkkk| 成人夜色香网站在线观看| 国产黄色网| 黄.www| 五月天精品| 欧美成人aaa大片| 国产一级特黄特色aa毛片| 99国产国人青青视频在线观看| 天天操夜夜摸| 视频在线观看免费网站| 免费在线不卡视频| 天天性视频| 久草免费在线播放| 亚洲vv| www.天堂.com| 二区中文字幕| 四虎国产精品永久在线播放| 久久久噜噜噜久久久午夜| 在线天天干| www.免费| 一色屋精品免费视频 视频| 人人看人人添人人爽| 国产亚洲午夜精品a一区二区| 亚洲免费一级视频| 51国产| 一级毛片一片毛| 欧美色p| 午夜在线视频观看| 亚洲精品日韩专区silk| 国产成人精品三级在线| 全黄性色大片|