在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

CPU和GPU大不相同,究竟原因在哪?

5RJg_mcuworld ? 來源:互聯網 ? 作者:佚名 ? 2017-10-26 06:42 ? 次閱讀

在北京舉辦的NVIDIA GTC China會議中,無論是AI智能運算,還是服務器數據中心、智能城市,甚至還有去年很火熱但是已經很多人已經支撐不下去的虛擬現實,看起來在很多內心中依然是屬于圖形行業代表的NVIDIA已經變得越來越豐滿,不過在這些新聞的背后,似乎還有更大膽的預言:摩爾定律已死,GPU最終會取代CPU

摩爾定律是由英特爾Intel)創始人之一戈登·摩爾(Gordon Moore)提出來的。其內容為:當價格不變時,集成電路上可容納的元器件的數目,約每隔18-24個月便會增加一倍,性能也將提升一倍。換言之,每一美元所能買到的電腦性能,將每隔18-24個月翻一倍以上。這一定律揭示了信息技術進步的速度。

概要:CPU和GPU之所以大不相同,是由于其設計目標的不同,它們分別針對了兩種不同的應用場景。

盡管這種趨勢已經持續了超過半個世紀,摩爾定律仍應該被認為是觀測或推測,而不是一個物理或自然法。然而,2010年國際半導體技術發展路線圖的更新增長已經放緩在2013年年底,之后的時間里晶體管數量密度預計只會每三年翻一番。

CPU和GPU之所以大不相同,是由于其設計目標的不同,它們分別針對了兩種不同的應用場景。CPU需要很強的通用性來處理各種不同的數據類型,同時又要邏輯判斷又會引入大量的分支跳轉和中斷的處理。這些都使得CPU的內部結構異常復雜。而GPU面對的則是類型高度統一的、相互無依賴的大規模數據和不需要被打斷的純凈的計算環境。于是CPU和GPU就呈現出非常不同的架構。

GPU采用了數量眾多的計算單元和超長的流水線,但只有非常簡單的控制邏輯并省去了Cache。而CPU不僅被Cache占據了大量空間,而且還有有復雜的控制邏輯和諸多優化電路,相比之下計算能力只是CPU很小的一部分

從上圖可以看出:Cache, local memory: CPU > GPU Threads(線程數): GPU > CPURegisters: GPU > CPU 多寄存器可以支持非常多的Thread,Thread需要用到register,Thread數目大,register也必須得跟著很大才行。SIMD Unit(單指令多數據流,以同步方式,在同一時間內執行同一條指令): GPU > CPU。 CPU 基于低延時的設計:

CPU有強大的ALU(算術運算單元),它可以在很少的時鐘周期內完成算術計算。當今的CPU可以達到64bit 雙精度。執行雙精度浮點源算的加法和乘法只需要1~3個時鐘周期。CPU的時鐘周期的頻率是非常高的,達到1.532~3gigahertz(千兆HZ, 10的9次方),大的緩存也可以降低延時。保存很多的數據放在緩存里面,當需要訪問的這些數據,只要在之前訪問過的,如今直接在緩存里面取即可。復雜的邏輯控制單元。當程序含有多個分支的時候,它通過提供分支預測的能力來降低延時。數據轉發。 當一些指令依賴前面的指令結果時,數據轉發的邏輯控制單元決定這些指令在pipeline中的位置并且盡可能快的轉發一個指令的結果給后續的指令。這些動作需要很多的對比電路單元和轉發電路單元。

GPU是基于大的吞吐量設計。GPU的特點是有很多的ALU和很少的Cache,緩存的目的是保存后面需要訪問的數據的,這點和CPU不同,而是為Thread提高服務的。如果有很多線程需要訪問同一個相同的數據,緩存會合并這些訪問,然后再去訪問dram(因為需要訪問的數據保存在dram中而不是Cache里面),獲取數據后Cache會轉發這個數據給對應的線程,這個時候是數據轉發的角色。但是由于需要訪問dram,自然會帶來延時的問題。GPU的控制單元(左邊黃色區域塊)可以把多個的訪問合并成少的訪問。

GPU雖然有dram延時,卻有非常多的ALU和非常多的Thread,為了平衡內存延時的問題,我們可以中充分利用多的ALU的特性達到一個非常大的吞吐量的效果。盡可能多的分配Threads。通常來看GPU ALU會有非常重的pipeline就是因為這樣。所以CPU擅長邏輯控制,串行的運算。和通用類型數據運算不同,GPU擅長的是大規模并發計算,這也正是密碼破解等所需要的。所以GPU除了圖像處理,也越來越多的參與到計算當中來。

什么類型的程序適合在GPU上運行?

(1)計算密集型的程序。所謂計算密集型(Compute-intensive)的程序,就是其大部分運行時間花在了寄存器運算上,寄存器的速度和處理器的速度相當,從寄存器讀寫數據幾乎沒有延時。可以做一下對比,讀內存的延遲大概是幾百個時鐘周期;讀硬盤的速度就不說了,即便是SSD, 也實在是太慢了。

(2)易于并行的程序。GPU其實是一種SIMD(Single Instruction Multiple Data)架構, 他有成百上千個核,每一個核在同一時間最好能做同樣的事情。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • cpu
    cpu
    +關注

    關注

    68

    文章

    10882

    瀏覽量

    212299
  • 摩爾定律
    +關注

    關注

    4

    文章

    636

    瀏覽量

    79118
  • gpu
    gpu
    +關注

    關注

    28

    文章

    4754

    瀏覽量

    129096

原文標題:GPU會取代CPU的位置嗎?

文章出處:【微信號:mcuworld,微信公眾號:嵌入式資訊精選】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    ADS1251從TEST+輸入相同固定的電壓,為何每次讀取到的數據都不相同?

    從TEST+輸入相同固定的電壓,,為何每次讀取到的數據都不相同?? 簡易電路圖: 以每一秒中段讀取一次~~不知為什數據會亂跳~~
    發表于 01-03 07:53

    ADS1256設置不同的數據輸出速率的時候,得到的24bit的輸出數據不相同,為什么?

    在使用ADS1256采集數據時出現問題描述如下:當設置不同的數據輸出速率的時候,得到的24bit的輸出數據不相同。 采集系統硬件描述如下,下位機MCU采用的主頻為456MHZ,通過GPIO口跟
    發表于 12-13 06:34

    如何選擇適合的GPU

    在現代計算領域,GPU(圖形處理單元)的作用已經遠遠超出了傳統的圖形渲染。從深度學習到科學計算,再到視頻編輯,GPU都在發揮著越來越重要的作用。然而,市場上的GPU型號繁多,性能和價格也各不相
    的頭像 發表于 10-27 11:07 ?360次閱讀

    TLC4502實際設計、使用中應該特別注意些什么?

    TLC4502初看就是個性能優越的運放,實際上的內部結構與普通的運放大不相同,實際設計、使用中應該特別注意些什么?
    發表于 09-26 07:43

    請問正向輸入VF3與反向輸入VF2的波形為什么不相同呢?虛短怎么就不成立了呢?

    請問正向輸入VF3與反向輸入VF2的波形為什么不相同呢?虛短怎么就不成立了呢?
    發表于 08-16 12:07

    算力服務器為什么選擇GPU

    服務器會選擇GPU而不是傳統的CPU呢?GPUCPU的區別GPUCPU二者都由寄存器、控制器
    的頭像 發表于 07-25 08:28 ?695次閱讀
    算力服務器為什么選擇<b class='flag-5'>GPU</b>

    5G賦能智慧海洋,網絡怎么建?舟山移動探索出新路子

    紛紛揚帆出海,開啟了海域5G網絡建設和業務發展新征程。海域無線環境、業務分布與陸地大不相同,運營商多年積累并已輕車熟路的整套網絡規劃、建設、優化和維護模式均面臨全新
    的頭像 發表于 06-06 08:05 ?348次閱讀
    5G賦能智慧海洋,網絡怎么建?舟山移動探索出新路子

    CPU渲染和GPU渲染優劣分析

    使用計算機進行渲染時,有兩種流行的系統:基于中央處理單元(CPU)或基于圖形處理單元(GPU)。CPU渲染利用計算機的CPU來執行場景并將其渲染到接近完美。這也是執行渲染的更傳統方式。
    的頭像 發表于 05-23 08:27 ?635次閱讀
    <b class='flag-5'>CPU</b>渲染和<b class='flag-5'>GPU</b>渲染優劣分析

    深度剖析AI網絡中GPU與光模塊配比及需求

    市場上存在多種計算光模塊與GPU比例的方法,導致結果不相同。造成這些差異的主要原因是不同網絡結構中光模塊數量的波動。所需的光模塊的準確數量主要取決于幾個關鍵因素。
    發表于 04-23 17:36 ?2138次閱讀
    深度剖析AI網絡中<b class='flag-5'>GPU</b>與光模塊配比及需求

    X-Silicon發布RISC-V新架構 實現CPU/GPU一體化

    X-Silicon 的芯片與其他架構不同,其設計將 CPUGPU 的功能整合到單核架構中。這與英特爾和 AMD 的典型設計不同,前者有獨立的 CPU 內核和 GPU 內核。
    發表于 04-08 11:34 ?615次閱讀
    X-Silicon發布RISC-V新架構 實現<b class='flag-5'>CPU</b>/<b class='flag-5'>GPU</b>一體化

    STM32WB55RGV6使用QSPI官方例程讀寫外部FLASH,讀出的數據跟寫入的數據不相同是為什么?

    STM32WB55RGV6 使用 QSPI 官方例程擦除、讀、寫 FLASH,每一步都返回OK,但是讀出的數據跟寫入的數據不相同,讀出的數據是 0X99 0X99 0X99 0XFF 0XFF 后面
    發表于 03-27 08:29

    PCF8563(RTC)讀取時間有誤是什么原因導致的?

    使用I2C硬件驅動模塊對EEPROM芯片進行讀寫,是正常的。但對于PCF8563芯片通信時,讀取到的時間是有誤的,小時和分的數值也在經常變化,【PCF8563與EEPROM的讀時序是相同的,且二者的從機地址也不相同】,請問這種情況是什么
    發表于 03-14 08:33

    gpu是什么和cpu的區別

    GPUCPU是兩種常見的計算機處理器,它們在結構和功能上有很大的區別。在這篇文章中,我們將探討GPUCPU的區別,并詳細介紹它們的原理、應用領域和性能特點。 一、概述 1.1
    的頭像 發表于 02-20 11:24 ?1.9w次閱讀

    gpu服務器是干什么的 gpu服務器與cpu服務器的區別有哪些

    gpu服務器是干什么的 gpu服務器與cpu服務器的區別 GPU服務器是一種專門用于處理圖形運算的服務器,而CPU服務器則是一種處理通用計算
    的頭像 發表于 01-30 15:31 ?902次閱讀

    為什么GPUCPU更快?

    GPUCPU更快的原因并行處理能力:GPU可以同時處理多個任務和數據,而CPU通常只能一次處理一項任務。這是因為
    的頭像 發表于 01-26 08:30 ?2479次閱讀
    為什么<b class='flag-5'>GPU</b>比<b class='flag-5'>CPU</b>更快?
    主站蜘蛛池模板: 人人揉揉香蕉大青草| 全部免费a级毛片| 日日日天天射天天干视频| 狠狠色丁香婷婷综合视频| 婷婷色九月| 久久精品国产精品亚洲红杏| 成人欧美一区二区三区的电影| 欧美日韩国产一区| 色综合综合网| 伊人狠狠丁香婷婷综合色| 亚欧乱色束缚一区二区三区| avtom影院永久地址人人影院| 欧美午夜一区| 天天狠天天干| 偷自在线| 在线黄色.com| 波多野结衣在线观看一区二区| 精品伊人久久香线蕉| 青草悠悠视频在线观看| 毛片啪啪| 久操伊人网| 播播开心激情网| 天天干天天舔天天射| 国产精品久久久久久久免费 | 中国一级黄色毛片| 男人午夜视频| 中文在线 | 中文| 91av视频免费在线观看| 很黄很黄的网站免费的| 久久影院午夜伦手机不四虎卡| 四虎免费看黄| 欧美视频一区二区三区在线观看| 久久久久国产一级毛片高清片| 男啪女r18肉车文| 午夜免费的国产片在线观看| 特黄特色三级在线播放| 色综合中文网| 好色999| 天天色天天色天天色| 欧美最猛性xxxx高清| 亚洲四虎|