芯片的速度主要取決于三個方面:微架構、主頻、IPC(每個時鐘周期執行的指令數)。
1.微架構
從微架構上看,CPU和GPU看起來完全不是按照相同的設計思路設計的,當代CPU的微架構是按照兼顧“指令并行執行”和“數據并行運算”的思路而設計,就是要兼顧程序執行和數據運算的并行性、通用性以及它們的平衡性。CPU的微架構偏重于程序執行的效率,不會一味追求某種運算極致速度而犧牲程序執行的效率。
CPU微架構的設計是面向指令執行高效率而設計的,因而CPU是計算機中設計最復雜的芯片。和GPU相比,CPU核心的重復設計部分不多,這種復雜性不能僅以晶體管的多寡來衡量,這種復雜性來自于實現:如程序分支預測,推測執行,多重嵌套分支執行,并行執行時候的指令相關性和數據相關性,多核協同處理時候的數據一致性等等復雜邏輯。
GPU其實是由硬件實現的一組圖形函數的集合,這些函數主要用于繪制各種圖形所需要的運算。這些和像素,光影處理,3D 坐標變換等相關的運算由GPU硬件加速來實現。圖形運算的特點是大量同類型數據的密集運算——如圖形數據的矩陣運算,GPU的微架構就是面向適合于矩陣類型的數值計算而設計的,大量重復設計的計算單元,這類計算可以分成眾多獨立的數值計算——大量數值運算的線程,而且數據之間沒有像程序執行的那種邏輯關聯性。
GPU微架構復雜度不高,盡管晶體管的數量不少。從應用的角度看,如何運用好GPU的并行計算能力主要的工作是開發好它的驅動程序。GPU驅動程序的優劣很大程度左右了GPU實際性能的發揮。
因此從微架構上看,CPU擅長的是像操作系統、系統軟件和通用應用程序這類擁有復雜指令調度、循環、分支、邏輯判斷以及執行等的程序任務。它的并行優勢是程序執行層面的,程序邏輯的復雜度也限定了程序執行的指令并行性,上百個并行程序執行的線程基本看不到。GPU擅長的是圖形類的或者是非圖形類的高度并行數值計算,GPU可以容納上千個沒有邏輯關系的數值計算線程,它的優勢是無邏輯關系數據的并行計算。
2.主頻
另外,GPU執行每個數值計算的速度并沒有比CPU快,從目前主流CPU和GPU的主頻就可以看出了,CPU的主頻都超過了1GHz,2GHz,甚至3GHz,而GPU的主頻最高還不到1GHz,主流的也就500~600MHz。要知道1GHz = 1000MHz。所以GPU在執行少量線程的數值計算時并不能超過CPU。
目前GPU數值計算的優勢主要是浮點運算,它執行浮點運算快是靠大量并行,但是這種數值運算的并行性在面對程序的邏輯執行時毫無用處。
3.IPC
(每個時鐘周期執行的指令數)
這個方面,CPU和GPU無法比較,因為GPU大多數指令都是面向數值計算的,少量的控制指令也無法被操作系統和軟件直接使用。如果比較數據指令的IPC,GPU顯然要高過CPU,因為并行的原因。但是,如果比較控制指令的IPC,自然是CPU的要高的多。原因很簡單,CPU著重的是指令執行的并行性。
另外,目前有些GPU也能夠支持比較復雜的控制指令,比如條件轉移、分支、循環和子程序調用等,但是GPU程序控制這方面的增加,和支持操作系統所需要的能力CPU相比還是天壤之別,而且指令執行的效率也無法和CPU相提并論。
最后總結一下:
CPU擅長的:操作系統,系統軟件,應用程序,通用計算,系統控制等等;游戲中人工智能,物理模擬等等;3D建模-光線追蹤渲染;虛擬化技術——抽象硬件,同時運行多個操作系統或者一個操作系統的多個副本等等。
GPU擅長的:圖形類矩陣運算,非圖形類并行數值計算,高端3D游戲。
綜上所述,在一臺均衡計算的計算機系統中,CPU和GPU還是各司其職,除了圖形運算,GPU將來可能主要集中在高效率低成本的高性能并行數值計算,幫助CPU分擔這種類型的計算,提高系統這方面的性能。而當前的典型應用還是高端3D游戲,一個高效的GPU配合一個高效的CPU,3D游戲的整體效率才能得到保證。“高端3D游戲只需要高端顯卡”或者“高端3D游戲只需要CPU”都是無稽之談。
-
cpu
+關注
關注
68文章
10889瀏覽量
212373 -
gpu
+關注
關注
28文章
4760瀏覽量
129129 -
IPC
+關注
關注
3文章
352瀏覽量
51977
原文標題:CPU和GPU擅長和不擅長的地方
文章出處:【微信號:mcu168,微信公眾號:硬件攻城獅】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論