在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

GPU競爭壁壘:微架構和平臺生態

架構師技術聯盟 ? 來源:架構師技術聯盟 ? 2023-05-15 11:00 ? 次閱讀

據Global Market Insights 數據,全球 GPU 市場預計將以 CAGR 25.9%持續增長,至 2030 年達到 4000 億美元規模。其中 AI 領域大語言模型的持續推出以及參數量的不斷增長有望驅動模型訓練端、推理端 GPU 需求快速增長。

近年來,國產 GPU 廠商在圖形渲染 GPU 和高性能計算 GPGPU 領域上均推出了較為成熟的產品,在性能上不斷追趕行業主流產品,在特定領域達到業界一流水平。生態方面國產廠商大多兼容英偉達 CUDA,融入大生態進而實現客戶端不斷導入。在高端GPU 芯片進口受限的背景下,國產 GPU 廠商預計將乘政策東風,抓住國產替代契機快速成長。

a0f44268-f251-11ed-90ce-dac502259ad0.png

GPU(圖形處理器)最初是為了解決 CPU 在圖形處理領域性能不足的問題而誕生。CPU 作為核心控制計算單元,高速緩沖存儲器(Cache)、控制單元(Control)在 CPU 硬件架構設計中所占比例較大,主要為實現低延遲和處理單位內核性能要求較高的工作而存在,而計算單元(ALU)所占比例較小,這使得 CPU 的大規模并行計算表現不佳。GPU 架構內主要為計算單元,采用極簡的流水線進行設計,適合處理高度線程化、相對簡單的并行計算,在圖像渲染等涉及大量重復運算的領域擁有更強運算能力。 GPGPU脫胎于GPU,通用性提升

a0ff6404-f251-11ed-90ce-dac502259ad0.png

CPU+GPU 異構計算解決多元化計算需求

a10960ee-f251-11ed-90ce-dac502259ad0.png

大語言模型開啟 AI 元年

a110f944-f251-11ed-90ce-dac502259ad0.png

常見的AI 加速芯片主要為GPU、FPGAASIC

a11ae1ac-f251-11ed-90ce-dac502259ad0.png

大語言模型有望拉動 GPU 需求增量

a12385d2-f251-11ed-90ce-dac502259ad0.png

a12faf6a-f251-11ed-90ce-dac502259ad0.png

GPU 的微架構是用以實現指令執行的硬件電路結構設計 以 Nvidia 第一個實現統一著色器模型的 Tesla 微架構為例,從頂層 Host Interface 接受來自 CPU 的數據,藉由 Vertex(頂點)、Pixel(片元)、Compute(計算著色器)分發給各 TPC(Texture Processing Clusters 紋理處理集群)進行處理。

a13a875a-f251-11ed-90ce-dac502259ad0.png

流處理器、特殊函數計算單元構成計算核心 在單個 TPC 中主要的運算結構為SM(Streaming Multiprocessor 流式多處理器),其內在蘊含 I Cache(指令緩存)、C Cache(常量緩存)以及核心的計算單元 SP(Streaming Processor 流處理器)和 SFU(Special Function Unit 特殊函數計算單元),外加 Texture Unit(紋理單元)。

a1467a60-f251-11ed-90ce-dac502259ad0.png

解耦計算單元,擁抱通用計算 由于圖形渲染流管線相對固定,Nvidia 在 Tesla構中將部分重要環節剝離并實現可編程,解耦出 SM 計算單元用于通用計算,即可實現根據具體任務需要分配相應線程實現通用計算處理。

a14f464a-f251-11ed-90ce-dac502259ad0.png

計算核心、紋理單元增加, GPC 功能更加完整,Nvidia Fermi 架構奠定完整GPU 計算架構基礎。

a1596788-f251-11ed-90ce-dac502259ad0.png

在Tesla 之后,Nvidia 第一個完整的 GPU 計算架構 Fermi通過制程微縮增加更多計算核心、紋理單元,并且通過增加 PolyMorph Engine(多形體引擎)和 Raster Engine(光柵引擎)使得原來 TPC 升級成為擁有更加完整功能的 GPC(Graphics Processing Clusters 圖形處理器集群)。Fermi 架構共包含 4 個 GPC,16 個 SM,512 個CUDA Core。

英偉達GPU從最初 Fermi 架構到最新的 Ampere 架構和 Hopper 架構

a166f9f2-f251-11ed-90ce-dac502259ad0.png

每一階段都在性能和能效比方面得到提升,引入了新技術,如 CUDA、GPUBoost、RT 核心和 Tensor 核心等,在圖形渲染、科學計算和深度學習等領域發揮重要作用。最新一代 Hopper 架構在 2022 年 3 月推出,旨在加速 AI 模型訓練,使用 Hopper Tensor Core 進行 FP8 和 FP16 的混合精度計算,以大幅加速Transformer 模型的 AI 計算。與上一代相比,Hopper 還將 TF32、FP64、FP16 和INT8 精度的每秒浮點運算(FLOPS)提高了 3 倍。

AMD 作為全球第二大GPU廠商,亦通過持續的架構演進保持其市場領先地位

a16fa23c-f251-11ed-90ce-dac502259ad0.png

從2010年以來,AMD 相繼推出:GCN 架構、RDNA 架構、RDNA 2 架構、RDNA 3 架構、CDNA 架構和 CDNA 2 架構。最新一代面向高性能計算和人工智能 CDNA 2 架構于架構采用增強型 Matrix Core 技術,支持更廣泛的數據型和應用,針對高性能計算工作負載帶來全速率雙精度和全新 FP64 矩陣運算。基于 CDNA2 架構的 AMD Instinct MI250X GPU FP64 雙精度運算算力最高可達 95.7 TFLOPs。

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • gpu
    gpu
    +關注

    關注

    28

    文章

    4741

    瀏覽量

    128963
  • 微架構
    +關注

    關注

    0

    文章

    22

    瀏覽量

    7045

原文標題:GPU競爭壁壘:微架構和平臺生態

文章出處:【微信號:架構師技術聯盟,微信公眾號:架構師技術聯盟】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    《算力芯片 高性能 CPUGPUNPU 架構分析》第3篇閱讀心得:GPU革命:從圖形引擎到AI加速器的蛻變

    在數據挖掘工作中,我經常需要處理海量數據的深度學習任務,這讓我對GPU架構和張量運算充滿好奇。閱讀《算力芯片》第7-9章,讓我對這些關鍵技術有了全新認識。 GPU架構從早期的固定功能流
    發表于 11-24 17:12

    GPU服務器AI網絡架構設計

    眾所周知,在大型模型訓練中,通常采用每臺服務器配備多個GPU的集群架構。在上一篇文章《高性能GPU服務器AI網絡架構(上篇)》中,我們對GPU
    的頭像 發表于 11-05 16:20 ?363次閱讀
    <b class='flag-5'>GPU</b>服務器AI網絡<b class='flag-5'>架構</b>設計

    【「算力芯片 | 高性能 CPU/GPU/NPU 架構分析」閱讀體驗】--了解算力芯片GPU

    本篇閱讀學習第七、八章,了解GPU架構演進及CPGPU存儲體系與線程管理 █從圖形到計算的GPU架構演進 GPU圖像計算發展 ●從三角形開始
    發表于 11-03 12:55

    GPU加速計算平臺是什么

    GPU加速計算平臺,簡而言之,是利用圖形處理器(GPU)的強大并行計算能力來加速科學計算、數據分析、機器學習等復雜計算任務的軟硬件結合系統。
    的頭像 發表于 10-25 09:23 ?251次閱讀

    GPU算力租用平臺是什么

    GPU算力租用平臺是一種基于云計算的服務模式,它允許用戶通過互聯網按需租用高性能GPU資源,而無需自行購買、部署和維護這些硬件。
    的頭像 發表于 10-16 10:15 ?234次閱讀

    【「算力芯片 | 高性能 CPU/GPU/NPU 架構分析」閱讀體驗】--全書概覽

    GPU、NPU,給我們剖析了算力芯片的架構。書中有對芯片方案商處理器的講解,理論聯系實際,使讀者能更好理解算力芯片。 全書共11章,由淺入深,較系統全面進行講解。下面目錄對全書內容有一個整體了解
    發表于 10-15 22:08

    【「大模型時代的基礎架構」閱讀體驗】+ 未知領域的感受

    算法的引擎GPUGPU硬件架構剖析、GPU服務器的設計與實現、GPU集群的網絡設計與實現、GPU
    發表于 10-08 10:40

    名單公布!【書籍評測活動NO.43】 算力芯片 | 高性能 CPU/GPU/NPU 架構分析

    ,即大模型專用AI超級計算機的中樞核心。 作者介紹: 濮元愷,曾就職于中關村在線核心硬件事業部,負責CPU和GPU類產品評測,長期關注GPGPU并行計算相關芯片架構。目前在量化金融領域,主要負表
    發表于 09-02 10:09

    ALINX FPGA+GPU架構視頻圖像處理開發平臺介紹

    Alinx 最新發布的新品 Z19-M 是一款創新的 FPGA+GPU 異構架構視頻圖像處理開發平臺,它結合了 AMD Zynq UltraScale+ MPSoC(FPGA)與 NVIDIA Jetson Orin NX(
    的頭像 發表于 08-29 14:43 ?1201次閱讀

    名單公布!【書籍評測活動NO.41】大模型時代的基礎架構:大模型算力中心建設指南

    基于TOGAF方法論,剖析業界知名案例的設計方案。 全書總計13章。第1章講解AI與大模型時代對基礎架構的需求;第2章講解軟件程序與專用硬件的結合,涉及GPU并行運算庫、機器學習程序的開發框架和分布式AI訓練
    發表于 08-16 18:33

    中科馭數HADOS 3.0:以四大架構革新,全面擁抱敏捷開發理念,引領DPU應用生態

    一家成功的大算力芯片公司,其核心壁壘必須是軟硬兼備的,既要有芯片架構的強大技術壁壘,更要有持久投入的、生態兼容完備的軟件護城河。HADOS,就是中科馭數的軟件護城河。
    的頭像 發表于 07-09 14:26 ?374次閱讀
    中科馭數HADOS 3.0:以四大<b class='flag-5'>架構</b>革新,全面擁抱敏捷開發理念,引領DPU應用<b class='flag-5'>生態</b>

    信Linux原生版在龍架構平臺終端成功啟動運行

    近日,在騰訊信團隊、龍芯中科與國產操作系統廠商的共同努力下,信Linux原生版在龍架構平臺終端成功啟動運行,并在操作系統廠商應用商店上架分發,為用戶帶來全新的龍
    的頭像 發表于 03-19 16:32 ?883次閱讀
    <b class='flag-5'>微</b>信Linux原生版在龍<b class='flag-5'>架構</b><b class='flag-5'>平臺</b>終端成功啟動運行

    GPU技術、生態及算力分析

    對比AMD從2013年開始建設GPU生態,近10年時間后用于通用計算的ROCm開放式軟件平臺才逐步有影響力,且還是在兼容CUDA的基礎上。因此我們認為國內廠商在軟件和生態層面與英偉達C
    的頭像 發表于 01-14 10:06 ?1265次閱讀
    <b class='flag-5'>GPU</b>技術、<b class='flag-5'>生態</b>及算力分析

    gpu服務器評測

    GPU服務器進行評測。 一、超GPU服務器概述 超GPU服務器是一種基于超微服務器
    的頭像 發表于 01-10 10:37 ?1395次閱讀

    深入解讀AMD最新GPU架構

    GCN 取代了 Terascale,并強調 GPGPU 和圖形應用程序的一致性能。然后,AMD 將其 GPU 架構開發分為單獨的 CDNA 和 RDNA 線路,分別專門用于計算和圖形。
    發表于 01-08 10:12 ?1227次閱讀
    深入解讀AMD最新<b class='flag-5'>GPU</b><b class='flag-5'>架構</b>
    主站蜘蛛池模板: 理论毛片| 久久中文字幕一区二区| 美女被免费视频的网站| 全免费一级午夜毛片| 国内精品99| 美女扒开尿口给男人看大全| 久久久久国产成人精品亚洲午夜 | 精品三级视频| 国模久久| 人与牲动交xx| 免费一级欧美在线观看视频片| 四虎最新影院| 免费一区在线观看| 真实国产伦子系| 天堂福利视频| 免费国产一区二区三区| 国模私拍一区二区三区| 夜夜澡人人爽人人喊_欧美| 日色视频| 射吧亚洲| 国产成人精品曰本亚洲78| 四虎网址| 天天综合天天做天天综合| 日本黄色免费片| 国产毛片农村妇女系列| 国产精品最新资源网| 永久福利盒子日韩日韩免费看| brazzersvideosexhd欧美高清| 天天夜天天干| 在线免费看影视网站| 5151hh四虎国产精品| 亚洲国产一区二区在线| 永久免费看www色视频| 一区二区三区高清在线观看| 三级视频网站| 国产福利乳摇在线播放| 天天操狠狠干| 69女poren18中国| 婷婷色婷婷| 日韩一区二区三区免费| 色天使视频|