與中央處理單元 (CPU) 相比,圖形處理單元 (GPU) 更適合以更高分辨率和更快的幀速率形成圖像,因為 GPU 具有數百個可以并行處理數千個數據集的計算單元。并行數據結構和高線程數使 GPU 本質上更適合需要大量計算功能的應用,例如醫學成像和視頻游戲,例如并發可視化和交互式分割。
容納 CPU 和 GPU 的多核處理器設計已經存在多年。事實上,幾乎每臺筆記本電腦、智能手機和平板電腦現在都擁有多核處理器、集成 GPU 和許多其他加速器,用于音頻、網絡和其他功能。然而,在這些多核處理器設計中,GPU 通常不直接訪問應用程序內存,因此充當 CPU 的從屬設備。
幾年前,AMD 引入了加速處理器單元 (APU) 的概念,該單元為處理器內部的 CPU 和 GPU 結合了高速緩存一致性內存。將兩個處理單元組合在同一條總線上以提高處理器吞吐量的想法最終導致了2012 年異構系統架構 (HSA) 基金會的創建。
HSA 中的一組標準和規范促進了 CPU、GPU 和其他加速器的公共總線和共享內存,以使這些截然不同的架構協同工作。AMD、ARM、聯發科和德州儀器等行業領導者參與了這項工作,這標志著現有多核處理器設計方法的重大突破。
1. HSA 將現有的異構計算提升到一個新的水平。
首先,HSA 1.0 旨在通過自動將計算從 CPU 卸載到 GPU 來釋放 GPU 在嵌入式計算中的潛力,反之亦然。通過使軟件能夠以更低的延遲和顯著降低的開銷有效地將任務分配給 GPU,HSA 允許 GPU 任務通過共享虛擬內存功能 (SVM) 直接安全地訪問系統內存中的數據,并在應用程序進程中遍歷數據結構內存(ptr-is-ptr)。現在,這一切都可以完成,而無需像以前在傳統 GPU 計算 API 中所要求的那樣提供數據緩沖區的主機 CPU 配置。
即將發布的 HSA 標準將數字信號處理器 (DSP) 集成到架構中,并提高了與系統中非 HSA 啟用的可編程和固定功能加速器的高效互操作性。
接下來,雖然 HSA 是OpenCL等通用 GPU (GPGPU) API 的重要基礎,但憑借其細粒度和粗粒度共享虛擬內存功能,許多高級語言已被移植和優化為原生目標 HSA 平臺,包括 C++ 17、GCC、LLVM/CLANG 和 Python。優化 CAFFE、BLAS、CHARM++、FFT、Sparse、FLAME 和 Docker 等軟件框架的工作也在進行中,以使開發人員更容易直接高效地編程和使用異構并行設備。
這些異構計算環境創造的這種新的處理器效率水平正在重振醫療和打印成像等行業。直到最近,需要圖像配準、圖像分割和圖像去噪等計算密集型工作的醫學成像產品在很大程度上以犧牲圖像質量為代價來犧牲幀速率。
HSA 以其創新的機制為不同的處理核心分配不同的負載,從而實現具有強大可視化和圖像保真度的高效計算。現在有大量資源可用于幫助開發人員調整或創建新應用程序以利用異構架構。其中包括 HSA Foundation GitHub 存儲庫和Radeon 開放計算解決方案 GitHub。后者將 HSA 編程模型擴展到高性能離散 GPU,并包括CodeXL 2.0 中提供的強大的開源調試和分析工具。
計算密集型醫療領域可以受益于 GPU 加速,以增強特定于 MRI、PET、超聲和顯微鏡等應用的算法的執行。
2. GPU 加速提供卓越的速度,可有效滿足醫學成像獨特的數據吞吐量和后處理需求。
具體來說,教程是異構系統架構——下一代異構計算的基礎,以及醫療和打印成像中的 GPU 計算,而小組的主題是異構系統架構:未來的功率、性能和編程。
-
處理器
+關注
關注
68文章
19314瀏覽量
230074 -
gpu
+關注
關注
28文章
4743瀏覽量
129003 -
API
+關注
關注
2文章
1502瀏覽量
62117
發布評論請先 登錄
相關推薦
評論