在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

CPU 的浮點運算能力比 GPU 差,為什么不提高 CPU 的浮點運算能力呢

Dbwd_Imgtec ? 來源:未知 ? 作者:李建兵 ? 2018-03-16 15:12 ? 次閱讀

問:為什么 CPU 的浮點運算能力比 GPU 差,為什么不提高 CPU 的浮點運算能力?


「速度區別主要是來自于架構上的區別」是一個表面化的解釋。對,架構是不同。但是這種不同是目前各個廠家選擇的現狀,還是由于本質的原因決定的?CPU 能不能增加核?GPU 那張圖為什么不需要 cache?

首先,CPU 能不能像 GPU 那樣去掉 cache?不行。GPU 能去掉 cache 關鍵在于兩個因素:數據的特殊性(高度對齊,pipeline 處理,不符合局部化假設,很少回寫數據)、高速度的總線。對于后一個問題,CPU 受制于落后的數據總線標準,理論上這是可以改觀的。對于前一個問題,從理論上就很難解決。因為 CPU 要提供通用性,就不能限制處理數據的種類。這也是 GPGPU 永遠無法取代 CPU 的原因。

其次,CPU 能不能增加很多核?不行。首先 cache 占掉了面積。其次,CPU 為了維護 cache 的一致性,要增加每個核的復雜度。還有,為了更好的利用 cache 和處理非對齊以及需要大量回寫的數據,CPU 需要復雜的優化(分支預測、out-of-order 執行、以及部分模擬 GPU 的 vectorization 指令和長流水線)。所以一個 CPU 核的復雜度要比 GPU 高的多,進而成本就更高(并不是說蝕刻的成本高,而是復雜度降低了成片率,所以最終成本會高)。所以 CPU 不能像 GPU 那樣增加核。

至于控制能力,GPU 的現狀是差于 CPU,但是并不是本質問題。而像遞歸這樣的控制,并不適合高度對齊和 pipeline 處理的數據,本質上還是數據問題。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • cpu
    cpu
    +關注

    關注

    68

    文章

    10863

    瀏覽量

    211786
  • gpu
    gpu
    +關注

    關注

    28

    文章

    4740

    瀏覽量

    128951

原文標題:為什么 CPU 的浮點運算能力比 GPU 差,為什么不提高 CPU 的浮點運算能力?

文章出處:【微信號:Imgtec,微信公眾號:Imagination Tech】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    FPGA中的浮點四則運算是什么

    由于定點的四則運算比較簡單,如加減法只要注意符號擴展,小數點對齊等問題即可。在本文中,運用在前一節中描述的自定義浮點格式FPGA中數的表示方法(下),完成浮點四則運算的實現過程 1.自
    的頭像 發表于 11-16 12:51 ?268次閱讀
    FPGA中的<b class='flag-5'>浮點</b>四則<b class='flag-5'>運算</b>是什么

    FPGA中浮點四則運算的實現過程

    由于定點的四則運算比較簡單,如加減法只要注意符號擴展,小數點對齊等問題即可。在本文中,運用在前一節中描述的自定義浮點格式FPGA中數的表示方法(下),完成浮點四則運算的實現過程 1.自
    的頭像 發表于 11-16 11:19 ?439次閱讀
    FPGA中<b class='flag-5'>浮點</b>四則<b class='flag-5'>運算</b>的實現過程

    【RA-Eco-RA2E1-48PIN-V1.0開發板試用】在M23內核上使用qfplib浮點運算庫進行浮點運算

    運算。難道由于硬件不支持FPU, 常用的M0/M0+/M23/M3內核就無緣浮點運算?答案是顯然不是的。 我們可以移植使用開源的qfplib庫來實現
    發表于 11-05 22:07

    請問AURIX TC3xx tricore架構下浮點運算和將浮點數小數點去掉變成整數來計算哪種方式更加節省算力?

    ? tricore架構下CPU有專門的FPU來處理浮點運算,是否意味著用12.89參與運算,在調用FPU來計算的情況下,計算時間不會比12890參與計算的時間長,甚至可能
    發表于 08-26 06:54

    cpu運算器和控制器的作用是什么

    CPU運算器和控制器是計算機的核心組成部分,它們共同完成計算機的各種運算和控制任務。下面我們將詳細介紹運算器和控制器的作用。 運算器的作用
    的頭像 發表于 06-30 11:15 ?2190次閱讀

    cpu控制器和運算器組成的部件有哪些

    CPU(中央處理器)是計算機的核心部件,負責執行程序指令和處理數據。CPU主要由控制器和運算器組成,這兩個部件共同完成計算機的運算任務。下面詳細介紹
    的頭像 發表于 06-30 11:01 ?1892次閱讀

    請問esp32 wroom 32u默認開啟硬件浮點運算單元了嗎?

    請問esp32 wroom 32u 默認開啟硬件浮點運算單元了嗎?感謝
    發表于 06-21 11:08

    在定時器內使用浮點運算的PID控制算法,程序就會重啟,為什么?

    在定時器內使用浮點運算的PID控制算法,程序就會重啟,把浮點數換為整形數據就不會。
    發表于 06-05 07:24

    優秀的Verilog/FPGA開源項目-浮點運算器(FPU)介紹

    浮點運算器(英文:floating point unit,簡稱FPU)是計算機系統的一部分,它是專門用來進行浮點運算的(CPU中也叫ALU
    的頭像 發表于 04-26 11:27 ?3449次閱讀
    優秀的Verilog/FPGA開源項目-<b class='flag-5'>浮點</b><b class='flag-5'>運算</b>器(FPU)介紹

    verilog語音實現浮點運算

    Verilog可以通過使用IEEE標準的浮點數表示來實現浮點運算。下面是一個基本的Verilog模塊示例,展示了如何進行加法、乘法和除法等常見的浮點
    發表于 03-25 21:49

    STSPIN32F0支持硬件浮點運算嗎?

    STSPIN32F0 支不支持硬件浮點運算
    發表于 03-13 06:32

    XMC7100D進行2維浮點fft運算,如何優化?

    使用XMC72_EVK 降頻到250MHz,運行一個2維浮點fft運算,這個二維數組大小是64x128。循環運行1000次的時間是22秒 而使用XMC72_EVK 工作在350MHz,循環運行
    發表于 02-02 07:53

    為什么GPUCPU更快?

    GPUCPU更快的原因并行處理能力GPU可以同時處理多個任務和數據,而CPU通常只能一次處理
    的頭像 發表于 01-26 08:30 ?2414次閱讀
    為什么<b class='flag-5'>GPU</b><b class='flag-5'>比</b><b class='flag-5'>CPU</b>更快?

    ADSP-CM419的浮點運算速度大概是多快?

    求問有人知道ADSP-CM419的浮點運算速度大概是多快嗎?就是說完成一次加、減、乘、除大概需要多長時間?
    發表于 01-12 07:05

    stm32f407浮點運算速度

    支持硬件浮點運算單元(FPU),可以提供快速和高效的浮點運算性能。本文將詳細介紹 STM32F407 的浮點
    的頭像 發表于 01-04 10:58 ?3389次閱讀
    主站蜘蛛池模板: 非常黄的网站| 伊人网大香| 五月婷婷开心综合| 激情啪啪网站| 欧美成人免费大片888| 男男gay污小黄文| 欧美成人久久| 全免费午夜一级毛片真人| 国产一级做a爰大片免费久久| 韩国一级网站| 欧美在线bdsm调教一区| 精品国产成人三级在线观看| 欧美日一级| 美女黄色一级片| 在线色网站| 国产乱辈通伦影片在线播放亚洲 | 俺来也久久| 日韩操穴| 三级理论手机在线观看视频| 午夜小视频在线播放| 亚洲高清一区二区三区四区| 欧美色欧美亚洲高清在线视频| 天堂网在线最新版www| 国产亚洲欧美日韩俺去了| 狠狠狠色丁香婷婷综合久久88 | 四虎影院在线看| 一级特黄aaa大片| 午夜欧美性欧美| 极品美女啪啪| 性性欧美| 亚洲色图狠狠干| 99一级毛片| 双性人皇上被c到哭| 久久全国免费久久青青小草| 国产大毛片| 日本四虎影院| 久操久操| 三级色图| 狠狠的操| 三级毛片在线| 久久久久免费|