在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

神經處理器GPNPU支持ML的SoC架構

sakobpqhz ? 來源:算力基建 ? 作者:算力基建 ? 2022-12-20 11:13 ? 次閱讀

Performance, Power, Area(PPA)是半導體行業中常用的衡量標準。這三個指標對開發的所有電子產品都產生了巨大的影響。影響的程度當然取決于具體的電子產品以及目標終端市場和應用。因此,PPA權衡決策由產品公司在為各自的終端產品選擇各種芯片(以及ASIC的IP)時做出。

另一個重要的考慮因素是在不需要重新設計的情況下確保產品的壽命。換句話說,就是讓自己的產品適應不斷變化的市場和產品需求。雖然產品公司在重新設計之前會采用輔助方法來延長產品的使用壽命,但直接提供future proofing的解決方案是首選的方法。例如,在需求快速變化的市場積極增長時期,FPGA在面向未來的通信基礎設施產品中發揮了關鍵作用。當然,替代路徑可能比FPGA路徑提供更好的PPA收益。但是FPGA路徑通過避免重新設計幫助產品公司節省了大量的時間和金錢,并確保他們能夠保持或增長他們的市場份額。

還有一個考慮因素是,開發產品的路徑可以提供方便和速度。這直接轉化為上市時間,進而轉化為市場份額和盈利能力。最后,客戶可以輕松地在產品上開發應用軟件。

01市場情況

人工智能AI)驅動的、支持機器學習(ML)的產品和應用正在快速增長,并帶來巨大的市場增長機會。新的ML模型正在快速引入,現有的模型也在增強。市場機會范圍從數據中心到邊緣人工智能產品和應用。許多針對這些市場的產品無法在PPA和產品/應用程序開發的易用性之間進行權衡。

如果有一種方法可以提供PPA優化、future proofing、便于產品和應用程序開發,所有這些都集中到一個產品中會怎么樣呢?它是一個統一的體系結構,簡化SoC硬件設計和編程的混合處理器IP。可以解決ML推理、預處理和后處理的一體化問題。

02新型混合SoC處理器

最近,Quadric宣布了第一個通用神經處理器(GPNPU)系列,這是一種半導體知識產權(IP)產品,融合了神經處理加速器和數字信號處理器(DSP)。IP使用一個統一的體系結構,解決ML性能特征和DSP功能,具有完全的C++可編程性。本文將從一個典型的支持ML的SoC架構的組件、其局限性、Quadric產品、優點和可用性等方面展開介紹。

03典型的支持ML的SoC架構的組件

支持ML架構的關鍵組件包括神經處理單元(NPU)、數字信號處理(DSP)單元和實時中央處理單元(CPU)。NPU用于運行當今最流行的ML網絡的圖形層,并且在已知的推理工作負載上表現非常好。DSP用于有效地執行語音和圖像處理,并涉及復雜的數學運算。實時CPU用于協調NPU、DSP和存儲ML模型權重的內存之間的ML工作負載。通常,只有CPU可直接供軟件開發人員用于代碼開發。NPU和DSP只能通過預定義的應用程序編程接口(API)訪問。

04典型架構的局限性

如上所述,典型的加速器NPU不是完全可編程的處理器。雖然它們非常高效地運行已知的圖形層,但它們不能隨著ML模型的發展而運行新的層。如果需要通過API不可用的ML操作符,則需要將其添加到CPU上,因為知道它的性能會很差。該架構不適合新ML模型和ML操作符的future proofing。充其量,可以通過在實時CPU上實現新的ML操作符來呈現性能較低的解決方案。

另一個限制是,程序員必須在NPU、DSP和實時CPU上劃分代碼,然后調整交互以滿足期望的性能目標。典型的架構還可能導致在NPU核和CPU核之間拆分矩陣操作。由于需要在內核之間交換大數據塊,因此此操作會導致推斷延遲和功耗問題。

來自不同IP供應商的多個IP核迫使開發者依賴于多個設計和生產力工具鏈。必須使用多個工具鏈通常會延長開發時間,并使調試具有挑戰性。

05Quadric方法的好處

Quadric的Chimera GPNPU家族為ML推理和相關的傳統C++圖像、視頻、雷達和其他信號處理創建了統一的單核體系結構。這允許將神經網絡和C++代碼合并到單個軟件代碼流中。內存帶寬通過單一的統一編譯堆棧進行優化,并使功耗顯著減小。編程單核系統也比處理異構多核系統容易得多。標量、向量和矩陣計算只需要一個工具鏈。

統一的Chimera GPNPU架構的其他好處包括,由于不必在NPU、DSP和CPU之間移動激活數據,從而節省了面積和功耗。統一的核心架構大大簡化了硬件集成,使性能優化任務更加容易。

分析內存使用情況以確定最佳片外帶寬的系統設計任務也得到了簡化。這也直接導致了功率最小化。

d067e60e-8013-11ed-8abf-dac502259ad0.png

06應用程序開發

Chimera軟件開發工具包(SDK)允許通過兩步編譯過程將來自通用ML訓練工具集的圖代碼與客戶的C++代碼合并。這導致可以在統一的Chimera單處理器核心上運行的單一代碼流。目前廣泛使用的ML訓練工具集有TensorFlow、PyTorch、ONNX和Caffe。實現的SoC的用戶將擁有對Chimera所有核心資源的完全訪問權,以實現應用程序編程的最大靈活性。整個系統也可以從單個調試控制臺進行調試。

d083b488-8013-11ed-8abf-dac502259ad0.png

07在不損失性能的情況下

實現future proofing

Chimera GPNPU架構擅長處理卷積層,這是卷積神經網絡(CNNs)的核心。Chimera GPNPU可以運行任何ML操作符。通過使用Chimera計算庫(CCL) API編寫C++內核并使用Chimera SDK編譯該內核,可以添加自定義ML操作符。自定義運算符的性能與本地運算符相同,因為它們利用了Chimera GPNPU的相關核心資源。

SoC開發人員可以在SoC被剝離后很長時間內實現新的神經網絡運算符和庫。這本身就大大增加了芯片的使用壽命。

軟件開發人員可以在產品的整個生命周期中繼續優化他們的模型和算法的性能。他們可以添加新的特性和功能,為他們的產品在市場上獲得競爭優勢。

08Quadric的當前產品

Chimera架構已經在芯片領域得到了快速驗證。QB系列GPNPU的整個家族可以在主流的16nm和7nm工藝中使用傳統的標準電池流和常用的單端口SRAM實現1GHz的工作。Chimera核心可以針對任何芯片鑄造廠和任何工藝技術。

Chimera GPNPU系列的QB系列包括三個核心:

Chimera QB1 -每秒1萬億次機器學習運算(TOPS),每秒64千兆次DSP運算(GOPs); Chimera QB4 - 4 TOPS機器學習,256 GOP DSP;

Chimera QB16–16 TOPS機器學習,1 TOPS DSP;

如果需要,可以將兩個或多個Chimera核心配對在一起,以滿足更高級別的性能要求。

審核編輯:郭婷

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 處理器
    +關注

    關注

    68

    文章

    19391

    瀏覽量

    230636
  • 半導體
    +關注

    關注

    334

    文章

    27616

    瀏覽量

    221013
  • soc
    soc
    +關注

    關注

    38

    文章

    4193

    瀏覽量

    218696

原文標題:一種新的混合SoC處理器—GPNPU

文章出處:【微信號:算力基建,微信公眾號:算力基建】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    走進北大 | 算能RISC-V通用處理器設計成功開課

    近日,北京大學集成電路學院賈天宇老師開設的《現代SoC處理器架構設計》如期進行,算能首席科學家楊柳西博士、處理器架構師張明俊受邀,為北大博士
    的頭像 發表于 12-06 01:06 ?387次閱讀
    走進北大 | 算能RISC-V通用<b class='flag-5'>處理器</b>設計成功開課

    一文看懂SoC架構

    一、SoC 架構圖:核心功能和設計目標 SoC 是基于通用處理器這樣的思路進行設計的,與 PC 設計思路一樣。即通用處理器是由 CORE +
    的頭像 發表于 11-29 09:57 ?826次閱讀
    一文看懂<b class='flag-5'>SoC</b>的<b class='flag-5'>架構</b>

    迅為3A6000_7A2000核心主板龍芯全國產處理器LoongArch架構

    ,也證明了國內有能力在自研 CPU 架構上做出一流的產品。 龍芯 3A6000 處理器采用龍芯自主指令系統龍架構(LoongArch),是龍芯第四代微架構的首款產品,主頻達到 2.5G
    發表于 10-12 11:25

    簡述微處理器的指令集架構

    處理器的指令集架構(Instruction Set Architecture,ISA)是計算機體系結構中的核心組成部分,它定義了計算機能夠執行的指令集合、數據類型、寄存、內存訪問方式等,是連接
    的頭像 發表于 10-05 14:59 ?532次閱讀

    新的 MathWorks 硬件支持支持從 MATLAB 和 Simulink 模型到高通 Hexagon 神經處理單元架構的自動化代碼生成

    新的硬件支持包不僅無需耗時的手寫代碼優化和驗證,還支持處理器在環測試 MathWorks 今天宣布,推出針對 Qualcomm? Hexagon? 神經
    的頭像 發表于 09-23 11:59 ?305次閱讀

    ARM處理器和CISC處理器的區別

    ARM處理器和CISC(復雜指令集計算機)處理器在多個方面存在顯著的區別。這些區別主要體現在架構原理、性能與功耗、設計目標、應用領域以及市場生態等方面。
    的頭像 發表于 09-10 11:10 ?530次閱讀

    處理器的指令集架構介紹

    處理器的指令集架構(Instruction Set Architecture,ISA)是計算機體系結構中至關重要的部分,它定義了微處理器能夠執行的操作和指令的集合,以及這些指令如何被組織、存儲
    的頭像 發表于 08-22 10:53 ?1466次閱讀

    神經網絡架構有哪些

    神經網絡架構是機器學習領域中的核心組成部分,它們模仿了生物神經網絡的運作方式,通過復雜的網絡結構實現信息的處理、存儲和傳遞。隨著深度學習技術的不斷發展,各種
    的頭像 發表于 07-01 14:16 ?820次閱讀

    嵌入式微處理器的分類 嵌入式微處理器的種類和型號

    的分類可以從多個角度進行劃分,比如架構、指令集、用途等。下面將從這些角度詳細介紹嵌入式微處理器的種類和型號。 一、架構分類 嵌入式微處理器架構
    的頭像 發表于 05-04 16:31 ?2346次閱讀

    嵌入式微處理器架構可分為

    嵌入式微處理器架構是指用于嵌入式系統的微處理器的設計和組織方式。嵌入式系統是指內嵌在其他電子設備中的計算機系統,它們通常用于實時控制、通信、處理數據等任務。嵌入式微
    的頭像 發表于 04-21 14:39 ?1208次閱讀

    Alif Semiconductor宣布推出先進的BLE和Matter無線微控制,搭載適用于AI/ML工作負載的神經網絡協同處理器

    4 月 18 日 -先進的安全、互聯、節能的人工智能和機器學習(AI/ML)微控制(MCU)和融合處理器供應商Alif Semiconductor?今天宣布推出Balletto?系列。該系列是先進
    發表于 04-18 17:51 ?693次閱讀
    Alif Semiconductor宣布推出先進的BLE和Matter無線微控制<b class='flag-5'>器</b>,搭載適用于AI/<b class='flag-5'>ML</b>工作負載的<b class='flag-5'>神經</b>網絡協同<b class='flag-5'>處理器</b>

    芯原股份DC8200顯示處理器IP助力賽昉科技RISC-V架構SoC

    芯原股份宣布,賽昉科技成功將芯原的先進顯示處理器IP DC8200應用于其基于RISC-V架構的量產SoC昉·驚鴻-7110中。JH-7110 SoC以其卓越的性能、低功耗和安全性,為
    的頭像 發表于 03-27 10:02 ?693次閱讀

    華為pockets是什么處理器

    華為Pockets的處理器型號是高通驍龍778G 4G SoC。這款處理器可以提供出色的性能,滿足用戶的各種需求,同時支持快速的應用程序響應和流暢的操作體驗。
    的頭像 發表于 03-05 17:16 ?1520次閱讀

    華為pockets處理器型號

    華為Pockets的處理器型號是高通驍龍778G 4G SoC。這款處理器可以提供出色的性能,滿足用戶的各種需求,同時支持快速的應用程序響應和流暢的操作體驗。
    的頭像 發表于 03-05 16:53 ?1262次閱讀

    淺談SoC中常用的處理器

    復雜系統執行多種多樣的復雜任務。任務常因為市場需求而改變。處理器的軟件可編程性使得它可以實現更加快速的功能開發和提供更加敏捷的可適性,已成為SoC最為重要的組件,其性能直接決定了系統性能的優劣。
    的頭像 發表于 02-23 09:19 ?1354次閱讀
    淺談<b class='flag-5'>SoC</b>中常用的<b class='flag-5'>處理器</b>
    主站蜘蛛池模板: 六月婷婷七月丁香| 高清不卡一区| 国产伦精品一区二区三区免| 日日骑夜夜操| 天天爽夜夜爽人人爽免费| 亚洲成网站www久久九| 午夜亚洲精品| 手机看片自拍自拍自拍 | 影院成人区精品一区二区婷婷丽春院影视 | 国产三级视频| 国产三级在线观看免费| xxxxbbbb欧美| 午夜在线播放视频| 久久天天躁狠狠躁夜夜爽蜜月| 97精品伊人久久久大香线焦| 国产农村乱色xxxx| 美女扒开尿口给男人看的让| 尤物视频黄| 日韩一级免费毛片| 免费激情网址| 国产精品不卡片视频免费观看| 亚洲激情视频网站| 加勒比在线一区| 亚洲色图片区| 香港三级理论在线影院| 色播五月综合| 精品一区二区视频| 夜夜操天天射| 福利在线播放| 日本aaaaa高清免费看| 一级a爰片久久毛片| 婷婷综合七月激情啪啪| 女色专区| 午夜网站在线| 啪啪网站免费观看| 一区二区三区电影| 欧美成人久久| 亚洲人成网站999久久久综合| www五月| 一级@片| 久久人人精品|