遮天辰东小说笔趣阁,大主宰之灵路天蚕土豆,欢乐颂第二季

現如今，深度神經網絡正在以越來越大的規模部署，橫跨了從云端，自動駕駛到IoT等平臺。比如用于圖像識別，語音識別及翻譯，癌癥檢測以及自動駕駛中對感知層海量數據的處理等。在很多領域，深度神經網絡的精度已經超越人類，它的優越性來源于它對原始數據的特征提取，并通過對大量數據的學習來獲取輸入空間的有效表征，但是它的高精度是以超高計算復雜度為代價。因此很多廠商都在追逐NPU的算力來解決這些復雜問題，但是隨著算力的提高，NPU設計也越來越復雜，將伴隨著面積和功耗的增加，這對于那些面積和功耗有很大限制的設備帶來了挑戰，因此如何提升NPU的能效比就成了亟待解決的問題。

NPU通過數據分區和有效調度，利用數據的重用以及執行分段來提高能效比和硬件利用率，而實現高利用率，數據重用將直接依賴于如何調度深度神經網絡的計算和如何將這些計算有效的映射到NPU的硬件單元上。以CNN為例，數據流無非包含三個方面filter(Weight)，ifmap和ofmap，如下圖。

因此在設計NPU時需要考慮如利用內存的層次結構，決定哪些數據要讀到那一層的內存中以及什么時候被處理，如何可以重用filter,ifmap和ofmap，將他們存放在本地內存中，從而大大減少DRAM的訪問次數，這將在很大程度上提高NPU的硬件利用率及性能，并減少由于DRAM訪問帶了的額外功耗。根據數據處理特征可以將數據流分為以下幾類：

1)、靜態weight

weight靜態數據流的設計是通過在PE的RF(Register File)中存取weight，來減少讀取weight產生的功耗。weight從DRAM讀取到RF并保持靜態以供進一步訪問，NPU在計算時盡可能多的利用RF中的weight以達到最大程度的重用。通常的實現是將ifmap廣播給所有的PE，部分和(Psum)將穿過所有的PE來完成空間上的累加。

2)、靜態輸出

輸出靜態數據流的設計是通過將accumulator產生的Psum存放到本地的RF中，以避免將Psum剛寫入DRAM再讀回，從而減少因Psum讀寫產生的功耗。通常的實現是流式輸入Activation，并將weight廣播給所有的PE。

3)、無本地重用

如果考慮到RF會增大面積，可以將所有的數據都存放到Global Buffer中，這樣沒有任何數據會留在PE的RF，也不會增設RF單元來減小面積，但是增加了PE和Global Buffer的數據交互。具體來說是通過多廣播Activation，單廣播Weight以及Psum穿過所有的PE進行累加來實現的。

4)、靜態行

靜態行數據流的目標是將所有的數據類型(Activation,weight, psum)的重用和計算都在RF中完成，來提升總體的能效。它區別于上面的靜態weight和靜態輸出，只是分別對weight和psum進行優化。

具體選用哪種數據流方式要結合NPU微架構的設計。下面總結了來自于幾個廠家的NPU，它們分別利用了不同數據流類型來提高能效比。

參考文獻：

【1】Vivienne S. Yu-Hsin C.and etc., “Ef?cient Processing of Deep Neural Networks: A Tutorial and Survey”

關于復睿微電子：

復睿微電子是世界500強企業復星集團出資設立的先進科技型企業。復睿微電子植根于創新驅動的文化，通過技術創新改變人們的生活、工作、學習和娛樂方式。公司成立于2022年1月，目標成為世界領先的智能出行時代的大算力方案提供商，致力于為汽車電子、人工智能、通用計算等領域提供以高性能芯片為基礎的解決方案。

目前主要從事汽車智能座艙、ADS/ADAS芯片研發，以領先的芯片設計能力和人工智能算法，通過底層技術賦能，推動汽車產業的創新發展，提升人們的出行體驗。在智能出行的時代，芯片是汽車的大腦。復星智能出行集團已經構建了完善的智能出行生態，復睿微是整個生態的通用大算力和人工智能大算力的基礎平臺。復睿微以提升客戶體驗為使命，在后摩爾定律時代持續通過先進封裝、先進制程和解決方案提升算力，與合作伙伴共同面對汽車智能化的新時代。

審核編輯：李倩

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

芯片

芯片

+關注

關注
456

文章
50892

瀏覽量
424305
神經網絡

神經網絡

+關注

關注
42

文章
4772

瀏覽量
100851
NPU

NPU

+關注

關注
2

文章
286

瀏覽量
18647

原文標題：ADS算力芯片NPU數據流的重用性

文章出處：【微信號：zuosiqiche，微信公眾號：佐思汽車研究】歡迎添加關注！文章轉載請注明出處。

IO模塊助力PLC，全面提升中水處理設備能效

隨著我國環保事業的不斷發展，中水處理技術在工業、生活等領域發揮著越來越重要的作用。如何提高中水處理設備的能效，成為行業關注的焦點。本文將為您介紹明達技術高效解決方案——利用自主研發的分布式IO模塊配合PLC，實現中水處理設備能

發表于 12-16 14:57 ?109次閱讀

IO模塊助力PLC，全面<b class='flag-5'>提升</b>中水處理設備<b class='flag-5'>能</b><b class='flag-5'>效</b>

Erp指令能效

ErP指令EC244/2009、EC245/2009、EU1194/2012和能效標簽指令EU874/2012已經實行多年，歐盟委員會在近3年通過參照不斷改進的照明產品技術、環境和經濟因素以及實際

發表于 11-20 23:57 ?192次閱讀

Erp指令<b class='flag-5'>能</b><b class='flag-5'>效</b>

NPU與機器學習算法的關系

在人工智能領域，機器學習算法是實現智能系統的核心。隨著數據量的激增和算法復雜度的提升，對計算資源的需求也在不斷增長。NPU作為一種專門為深度學習等機器學習任務設計的處理器，其與機器學習算法的關系日益

發表于 11-15 09:19 ?496次閱讀

NPU的工作原理解析

神經網絡的計算流程，顯著提高了處理速度和能效。NPU通常集成在SoC（System on Chip）中，與CPU和GPU協同工作，共同完成復雜的計算任務。 NPU的架構

發表于 11-15 09:17 ?735次閱讀

NPU在邊緣計算中的優勢

和GPU相比，NPU在處理神經網絡相關的計算任務時，能夠提供更高的能效比和更快的處理速度。NPU通過優化數據流和計算結構，使得神經網絡的前向

發表于 11-15 09:13 ?417次閱讀

NPU技術如何提升AI性能

隨著人工智能技術的飛速發展，深度學習作為AI領域的核心驅動力，對計算能力的需求日益增長。NPU技術應運而生，為AI性能的提升提供了強大的硬件支持。 NPU技術概述 NPU是一種專門為深

發表于 11-15 09:11 ?502次閱讀

什么是NPU芯片及其功能

的設計靈感來源于人腦的神經網絡結構。人腦通過神經元和突觸的復雜網絡處理信息，而NPU芯片則通過模擬這種結構來提高數據處理的效率。與傳統的CPU和GPU相比，NPU芯片在處理深度學習任務時具有更高的能

發表于 11-14 15:48 ?1507次閱讀

AcrelEMS企業微電網能效管理平臺如何輔助企業進行能源平衡優化？

安科瑞徐赟杰 18706165067 摘要 2022年6月29日工信部、發改委、財政部、生態環境部、國資委、市場監管總局六部門聯合下發《關于印發工業能效提升行動計劃的通知》（工信部聯節〔2022

發表于 11-13 11:13 ?157次閱讀

AcrelEMS企業微電網<b class='flag-5'>能</b><b class='flag-5'>效</b>管理平臺如何輔助企業進行能源平衡優化？

智慧水務綜合能效管理系統-提高污水廠能效

簡婷安科瑞電氣股份有限公司上海嘉定 201801 AcrelEMS-SW智慧水務能效管理平臺 1平臺概述安科瑞電氣具備從終端感知、邊緣計算到能效管理平臺的產品*態體系，Acrel

發表于 10-21 14:14 ?197次閱讀

智慧水務綜合<b class='flag-5'>能</b><b class='flag-5'>效</b>管理系統-提高污水廠<b class='flag-5'>能</b><b class='flag-5'>效</b>

利用AI和加速計算提升天氣預報效率和能效

在 NVIDIA GPU 驅動的擴散模型助力下，生成式 AI 在各個領域實現新的應用，大大提升了效率。　　當臺灣氣象員得以在一臺機器上模擬臺風的細節，他們深感其對預報任務能效的巨大提升

發表于 06-07 15:06 ?559次閱讀

重磅！英特爾發布intel3制程至強6能效核處理器，賦能數據中心能效升級

、橫向擴展工作負載帶來性能與能效的雙重提升，同時攜手金山云、浪潮信息、南大通用，以及記憶科技等多家生態合作伙伴，分享基于該處理器的端到端創新解決方案，及其在諸多領域的實踐成果與應用價值。

發表于 06-07 10:38 ?5190次閱讀

AMD披露高效數據中心策略，預計至2027年能效提升超百倍

會議期間，蘇姿豐談論了AMD如何通過實施30x25戰略推動2025年計算節點能效提升30倍的目標。她進一步透露，AMD已找到2026年至2027年間將能效

發表于 05-24 17:37 ?1030次閱讀

天璣9300旗艦芯：全大核CPU架構，性能與能效的提升

“全大核”CPU 架構設計打破常規，摒棄小核，采用超大核（Arm Cortex-X）與大核（Arm Cortex-A）的組合，以更高時鐘頻率提升性能和能效，同時降低功耗，延長電池壽命。

發表于 05-06 10:22 ?637次閱讀

智慧水務能效管理平臺-為污水處理的能效管理提供科學、精細的解決方案

程瑜安科瑞電氣股份有限公司上海嘉定 201801 AcrelEMS-SW智慧水務能效管理平臺 1平臺概述安科瑞電氣具備從終端感知、邊緣計算到能效管理平臺的產品*態體系，Acrel

發表于 04-18 15:50 ?463次閱讀

AI PC 2024年出貨占比達18%，將實現重大轉變

AI PC的獨特之處在于配備了神經處理單元（NPU）等專業人工智能處理器，可提升生產效率、滿足個性化需求及提升能效，從而改變個人電腦市場格局

發表于 03-19 10:41 ?447次閱讀

在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

搜索歷史

如何提升NPU的能效比？

評論

IO模塊助力PLC，全面提升中水處理設備能效

Erp指令能效

NPU與機器學習算法的關系

NPU的工作原理解析

NPU在邊緣計算中的優勢

NPU技術如何提升AI性能

什么是NPU芯片及其功能

AcrelEMS企業微電網能效管理平臺如何輔助企業進行能源平衡優化？

智慧水務綜合能效管理系統-提高污水廠能效

利用AI和加速計算提升天氣預報效率和能效

重磅！英特爾發布intel3制程至強6能效核處理器，賦能數據中心能效升級

AMD披露高效數據中心策略，預計至2027年能效提升超百倍

天璣9300旗艦芯：全大核CPU架構，性能與能效的提升

智慧水務能效管理平臺-為污水處理的能效管理提供科學、精細的解決方案

AI PC 2024年出貨占比達18%，將實現重大轉變