深度解析華為NPU/GPU技術(shù)演進(jìn)與進(jìn)階

01 術(shù)? 語

CPU/GPU/NPU 等等都是硬件芯片，簡單來說，晶體管既可以用來實(shí)現(xiàn)邏輯控制單元，也可以用來實(shí)現(xiàn)運(yùn)算單元（算力）。在芯片總面積一定的情況下，就看控制和算力怎么分。 ?

CPU：通用目的處理器，重邏輯控制；

GPU：通用目的并行處理器（GPGPU），圖形處理器；

NPU：專用處理器，相比 CPU/GPU，擅長執(zhí)行更具體的計算任務(wù)。

CPU

大部分芯片面積都用在了邏輯單元，因此邏輯控制能力強(qiáng)，算力弱（相對）。 ?

GPU

大部分芯片面積用在了計算單元，因此并行計算能力強(qiáng)，但邏輯控制弱。適合圖像渲染、矩陣計算之類的并行計算場景。作為協(xié)處理器，需要在 CPU 的指揮下工作。

Image Source [8] ?

NPU / TPU

也是協(xié)處理器。在 wikipedia 中沒有專門的 NPU (Neural Processing Unit) 頁面，而是歸到 AI Processors 大類里面，指的是一類特殊目的硬件加速器，更接近 ASIC，硬件實(shí)現(xiàn)神經(jīng)網(wǎng)絡(luò)運(yùn)算，比如張量運(yùn)算、卷積、點(diǎn)積、激活函數(shù)、多維矩陣運(yùn)算等等[7]。 ? 如果還不清楚什么是神經(jīng)網(wǎng)絡(luò)，可以看看?以圖像識別為例，關(guān)于卷積神經(jīng)網(wǎng)絡(luò)（CNN）的直觀解釋（2016）。 ? 在這些特殊任務(wù)上，比 CPU/GPU 這種通用處理器效率更高，功耗更小，響應(yīng)更快?（比如一個時鐘周期內(nèi)可以完成幾十萬個乘法運(yùn)算），因此適合用在手機(jī)、邊緣計算、物聯(lián)網(wǎng)等等場景。 ? TPU：這里特制 Google 的 Tensor Processing Unit，目的跟 NPU 差不多。[11] 對 TPU 和 GPU 的使用場景區(qū)別有一個非常形象的比喻： ? 如果外面下雨了，你其實(shí)并不需要知道每秒到底有多少滴雨，而只要知道雨是大還是小。與此類似，神經(jīng)網(wǎng)絡(luò)通常不需要 16/32bit 浮點(diǎn)數(shù)做精確計算，可能 8bit 整型預(yù)測的精度就足以滿足需求了。

Floor Plan of Google TPU die(yellow = compute, blue = data, green = I/O, red = control) [11] ?

小? 結(jié)

GPU 已經(jīng)從最初的圖像渲染和通用并行計算，逐步引入越來越多的神經(jīng)網(wǎng)絡(luò)功能（比如 Tensor Cores、Transformer）；另一方面，NPU 也在神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上，開始引入越來越強(qiáng)大的通用計算功能，所以這倆有雙向奔赴的趨勢。 ? ? 02 華為 DaVinci 架構(gòu)：一種方案覆蓋所有算力場景

場景、算力需求和解決方案

不同算力場景下，算力需求（TFLOPS）和內(nèi)存大小（GB）的對應(yīng)關(guān)系 [1]

華為的解決方案：一種架構(gòu)（DaVinci），覆蓋所有場景?[1] ? 用在幾個不同產(chǎn)品方向上，手機(jī)處理器，自動駕駛芯片等等，專門的 AI 處理器，使用場景類似于 GPU。 ?

Ascend NPU 設(shè)計

2017 年發(fā)布了自己的 NPU 架構(gòu)，[2] 詳細(xì)介紹了 DaVinci 架構(gòu)的設(shè)計。除了支持傳統(tǒng)標(biāo)量運(yùn)算、矢量運(yùn)行，還引入了 3D Cube 來加速矩陣運(yùn)算。 ?

Image Source [2] ? 單位芯片面積或者單位功耗下，性能比 CPU/GPU 大幅提升：

Image Source [2] ? 下面看看實(shí)際使用場景和產(chǎn)品系列。 ? ? 03 路線一：NPU 用在手機(jī)芯片（Mobile AP SoC） ? 現(xiàn)代手機(jī)芯片不再是單功能處理器，而是集成了多種芯片的一個片上系統(tǒng)（SoC），華為 NPU 芯片就集成到麒麟手機(jī)芯片內(nèi)部，隨著華為 Mate 系列高端手機(jī)迭代。

Image Source [7] ? 比如，一些典型的功能劃分 [7]： ?

CPU 主處理器，運(yùn)行 app；

GPU 渲染、游戲等；

NPU 圖像識別、AI 應(yīng)用加速。

Mate 系列手機(jī)基本上是跟 Kirin 系列芯片一起成長的，早期的手機(jī)不是叫 “Mate XX”，而是 “Ascend Mate XX”，從中也可以看出跟昇騰（Ascend）的淵源。 ?

Kirin 970，2017, Mate 10 系列手機(jī)

據(jù)稱是第一個手機(jī)內(nèi)置的 AI 處理器（NPU）[3]。在 AI 任務(wù)上（比如手機(jī)上輸入文字搜圖片，涉及大批量圖片識別）比 CPU 快 25~50 倍。 ?

10nm，臺積電代工

CPU 8-core with a clockspeed of uP to 2.4GHz i.e. 4 x Cortex A73 at 2.4GHz + 4 x Cortex 53 at 1.8GHz

GPU?12-core Mali G72MP12 ARM GPU

NPU?1.92 TFLOPs FP16

Kirin 990 5G，2019, Mate 30 系列手機(jī)

Kirin 990 包含了 D-lite 版本的 NPU [1]：

World’s st 5G SoC Poweed by 7nm+ EUV

World’s 1st 5G NSA & SA Flagship SoC

Wolrd’s 1st 16-Core Mali-G76?GPU

World’s 1st Big-Tiny Core Architechture?NPU

麒麟 990 5G 芯片邏輯拓?fù)?[1] ? 一些硬件參數(shù) [1,4]：

臺積電?7nm+?工藝

CPU 8-Core

NPU?2+1 Core

GPU?16-core Mali-G76（ARM GPU）

GPU?16-core Mali-G76 (ARM GPU)

NPU

——HUAWEI Da Vinci Architecture, ——2x Ascend Lite + 1x Ascend Tiny

2G/3G/4G/5G Modem

LPDDR 4X

4K HDR Video

Kirin 9000 5G，2020，Mate 40 系列手機(jī)

Image Source ?

臺積電?5nm?工藝

GPU 24-core Mali-G78, Kirin Gaming+ 3.0

NPU

——HUAWEI?Da Vinci Architecture 2.0?第二代架構(gòu) ——2x Ascend Lite + 1x Ascend Tiny ? 這個是臺積電 5nm 工藝 [5]，然后就被***了。所以 Mate 50 系列用的高通處理器，Mate 60 系列重新回歸麒麟處理器。 ?

Kirin 9000s，2023，Mate 60 系列手機(jī)

王者低調(diào)回歸，官網(wǎng)沒有資料。 ? 據(jù)各路媒體分析，是中芯國際 7+nm 工藝，比上一代 9000 落后一些，畢竟制程有差距，看看國外媒體的副標(biāo)題 [6]： ? It's tough to beat a 5nm processor with a 7nm chip. ? Wikipedia 提供的參數(shù) [10]：

SMIC 7nm FinFET

CPU HiSilicon Taishan microarchitecture Cortex-A510

GPU Maleoon 910 MP4

NPU 有，但是沒提

小? 結(jié)

手機(jī)芯片系列先到這里，接下來看看作為獨(dú)立卡使用的 NPU 系列。 ? ? 04 路線二：NPU 用作推理/訓(xùn)練芯片（Ascend AI Processor）

兩個產(chǎn)品：301 低功耗；910 高算力。 ? 設(shè)計見 paper [2]。 ?

產(chǎn)品：加速卡 Atlas 系列

型號 Atlas 200/300/500/…，包括了 NPU 在內(nèi)的 SoC，用于 AI 推理和訓(xùn)練。 ?

Ascend 310，2019，推理

＞Spec 用的是 D-mini version：

紙面算力基本對標(biāo) NVIDIA T4 [9]。 ?

Ascend 910,?2019，訓(xùn)練

＞Spec & Performance, vs. Google TPU

Image Source [1]

Image Source [1] ? ＞計算集群

Image Source [1]

審核編輯：黃飛

閱讀全文

處理器(222513) 處理器(222513)
華為(247256) 華為(247256)
gpu(126788) gpu(126788)
NPU(18105) NPU(18105)
邏輯單元(5092) 邏輯單元(5092)

麒麟970引入NPU大放異彩，高通引入NPU證明了華為的前瞻性

華為在去年推出的高端芯片麒麟970是業(yè)界首次在手機(jī)芯片中集成專門為AI計算打造的NPU，而華為更為此開發(fā)了HiAI移動計算架構(gòu)。據(jù)測試，麒麟970在執(zhí)行AI計算任務(wù)時，其可以更高效的完成此類任務(wù)，較CPU、GPU等芯片的效率更高，具有25倍的性能優(yōu)勢，在圖像識別方面可以達(dá)到2000張/分鐘。

2018-10-09 08:48:57

8686

4G的技術(shù)演進(jìn)道路及趨勢報告

4G的技術(shù)演進(jìn)道路及趨勢報告從現(xiàn)有技術(shù)考慮，4G有三條可能的技術(shù)演進(jìn)軌跡，但最終的趨勢將是不同的無線通信技術(shù)在NGN架構(gòu)下融合、共存，形成多層次的無線網(wǎng)絡(luò)環(huán)境。2006年，在業(yè)界還在為3G牌照的歸屬猜測議論之時，4G已經(jīng)“潤物細(xì)無聲”的走入人們的視野。[hide][/hide]

2009-12-18 16:40:24

npu，vop2

大家好，我在npu使用上遇到了一些問題，請教一下大家，問題如下：我把內(nèi)核配置里的vop2驅(qū)動裁剪了以后，深度學(xué)習(xí)模型就不能在npu上運(yùn)行了。可是我如果不裁剪掉vop2，我的核心板就卡死在

2023-11-09 13:51:13

華為NB-IOT解決方案解析

2017-09-30 09:09:38

華為如何進(jìn)行全面轉(zhuǎn)型？

華為接下來的動作可能是這家公司在AI領(lǐng)域最大的投入：發(fā)布華為云數(shù)據(jù)中心AI芯片，并跟國際巨頭達(dá)成合作；推出類似TensorFlow、Caffe、PaddlePaddle的深度學(xué)習(xí)開源框架，同時推出跨

2019-09-11 11:51:49

華為手機(jī)技術(shù)大爆發(fā)！友商：集體啞火？擠牙膏？

，也引發(fā)了廣泛的關(guān)注和熱議。除去爭議最大的性價比問題，華為這四款新機(jī)的綜合表現(xiàn)十分強(qiáng)勁，甚至有網(wǎng)友高呼，看得比早前的蘋果發(fā)布會還要興奮不已。所謂“厚積薄發(fā)”，隨著一部部眼前一亮的新機(jī)與可圈可點(diǎn)的技術(shù)

2018-10-19 16:45:11

華為海思麒麟9000s是處于什么水平的處理器？

　　華為海思麒麟9000s是一款旗艦級處理器，采用了5nm工藝制程，是目前華為公司最強(qiáng)大的芯片之一。該芯片主要應(yīng)用于華為Mate40系列手機(jī)中，其性能指標(biāo)非常出色，從CPU、GPU、AI計算能力等

2023-08-31 09:34:09

華為的GPU Turbo技術(shù)你知道是什么嗎？

華為GPU Turbo揭秘，嚇人的技術(shù)，原來只是神經(jīng)網(wǎng)絡(luò)

2019-11-11 06:24:43

華為鴻蒙深度研究報告-興業(yè)證券

華為鴻蒙深度研究報告

2021-08-06 14:46:46

華為技術(shù)有限公司c語言編程規(guī)范分享！

好資源，大家一起分享啊！華為技術(shù)有限公司c語言編程規(guī)范.pdf (915.01 KB )

2019-09-30 03:16:50

深度學(xué)習(xí)框架TensorFlow&TensorFlow-GPU詳解

TensorFlow&TensorFlow-GPU：深度學(xué)習(xí)框架TensorFlow&TensorFlow-GPU的簡介、安裝、使用方法詳細(xì)攻略

2018-12-25 17:21:10

深度學(xué)習(xí)框架只為GPU?

CPU優(yōu)化深度學(xué)習(xí)框架和函數(shù)庫機(jī)器學(xué)***器

2021-02-22 06:01:02

解析深度學(xué)習(xí)：卷積神經(jīng)網(wǎng)絡(luò)原理與視覺實(shí)踐

2020-06-14 22:21:12

AIO-3399ProC NPU開發(fā)相關(guān)資料推薦

1、AIO-3399ProCNPU開發(fā)簡介AIO-3399ProC 開發(fā)者需要注意：NPU推理階段會與CPU進(jìn)行數(shù)據(jù)通信，單次傳輸數(shù)據(jù)量少但頻率高，但是與USB3.0相比PCIE不適合小文件

2022-07-01 17:38:45

AMD迎頭猛追Intel 全球首發(fā)7nm GPU很威風(fēng)！

MI60與MI50加速器，為全球首款7奈米資料中心GPU，旨在滿足新一代深度學(xué)習(xí)、高效能運(yùn)算、云端運(yùn)算以及渲染等應(yīng)用所需的運(yùn)算效能需求。研究人員、科學(xué)家以及開發(fā)者等將能夠運(yùn)用AMD Radeon

2018-11-20 11:35:12

ARM究竟有沒有美國的技術(shù)？

算不算美國的技術(shù)，還真不好說。　　而華為的麒麟芯片，使用的CPU、GPU全是ARM的公版內(nèi)核，還沒有去自研，所以現(xiàn)在這個問題就不好說了，一旦真不給用，可以使用ARM的架構(gòu)，也就是指令集，但在內(nèi)核方面，要么就只有一直使用A76或以下的內(nèi)核，要么就要自研了。`

2020-06-23 10:48:46

AUTOSAR架構(gòu)深度解析精選資料分享

AUTOSAR架構(gòu)深度解析本文轉(zhuǎn)載于：AUTOSAR架構(gòu)深度解析AUTOSAR的分層式設(shè)計，用于支持完整的軟件和硬件模塊的獨(dú)立性(Independence)，中間RTE(Runtime Environment)作為虛擬功能...

2021-07-28 07:02:13

AUTOSAR架構(gòu)深度解析精選資料推薦

AUTOSAR架構(gòu)深度解析本文轉(zhuǎn)載于：AUTOSAR架構(gòu)深度解析目錄AUTOSAR架構(gòu)深度解析AUTOSAR分層結(jié)構(gòu)及應(yīng)用軟件層功能應(yīng)用軟件層虛擬功能總線VFB及運(yùn)行環(huán)境RTE基礎(chǔ)軟件層(BSW)層

2021-07-28 07:40:15

Arm?Ethos?-U65 NPU技術(shù)參考手冊

神經(jīng)處理單元(Neural Processing Unit, NPU)提高了神經(jīng)網(wǎng)絡(luò)的推理性能。轉(zhuǎn)專業(yè)的目標(biāo)量化卷積神經(jīng)網(wǎng)絡(luò)(CNN)和8位和16位整數(shù)遞歸神經(jīng)網(wǎng)絡(luò)網(wǎng)絡(luò)(RNN)。NPU支持8位

2023-08-02 10:09:29

CDMA演進(jìn)技術(shù)綜合介紹

CDMA演進(jìn)技術(shù)綜合介紹 縱觀全球市場，CDMA20001XEV-DO自2002年實(shí)現(xiàn)商用以來也始終保持穩(wěn)定的增長勢頭。并且，基于EV-DO網(wǎng)絡(luò)精彩數(shù)據(jù)服務(wù)的不斷涌現(xiàn)，全球

2010-03-16 09:13:42

CPU,GPU,TPU,NPU都是什么

嵌入式算法移植優(yōu)化學(xué)習(xí)筆記5——CPU,GPU,TPU,NPU都是什么一、什么是CPU?二、什么是GPU?三、什么是TPU?四、什么是NPU?附：一、什么是CPU?中央處理器（CPU），是電子計算機(jī)

2021-12-15 06:07:07

C語言深度解析

C語言深度解析，本資料來源于網(wǎng)絡(luò)，對C語言的學(xué)習(xí)有很大的幫助，有著較為深刻的解析，可能會對讀者有一定的幫助。

2023-09-28 07:00:01

FPGA在深度學(xué)習(xí)應(yīng)用中或?qū)⑷〈?b class="flag-6" style="color: red">GPU

現(xiàn)場可編程門陣列 (FPGA) 解決了 GPU 在運(yùn)行深度學(xué)習(xí)模型時面臨的許多問題在過去的十年里，人工智能的再一次興起使顯卡行業(yè)受益匪淺。英偉達(dá) (Nvidia) 和 AMD 等公司的股價也大幅

2024-03-21 15:19:45

HSA----CPU+GPU異構(gòu)系統(tǒng)架構(gòu)詳解

解析HSA----CPU+GPU異構(gòu)系統(tǒng)架構(gòu)

2021-02-03 07:07:34

I2C通信設(shè)計深度解析

2012-08-12 21:31:58

Imagination Rogue GPU技術(shù)有哪些優(yōu)勢？

PowerVR 6系列GPU與競爭對手Mali-T600系列GPU的規(guī)格對比PowerVR的看家本領(lǐng)——TBDR渲染技術(shù)

2021-02-26 07:39:38

MCU、DSP、GPU、MPU、CPU、DPU、FPGA、ASIC、SOC、ECU、NPU、TPU、VPU、APU、BPU、ECU、FPU、EPU、這些主控異同點(diǎn)有哪些？

MCU、DSP、GPU、MPU、CPU、DPU、FPGA、ASIC、SOC、ECU、NPU、TPU、VPU、APU、BPU、ECU、FPU、EPU、這些主控異同點(diǎn)有哪些？

2021-12-17 17:07:47

Mali GPU支持tensorflow或者caffe等深度學(xué)習(xí)模型嗎

Mali GPU 支持tensorflow或者caffe等深度學(xué)習(xí)模型嗎？好像caffe2go和tensorflow lit可以部署到ARM，但不知道是否支持在GPU運(yùn)行？我希望把訓(xùn)練

2022-09-16 14:13:01

STM32MP1 DK2是否包含NPU (galcore.ko)？

最近買了STM32MP1 DK2的板子。DK2板是否包含NPU（神經(jīng)處理單元）？我們可以通過 galcore.ko（Linux 內(nèi)核模塊）使用 NPU 設(shè)備在 DK2 板上運(yùn)行深度學(xué)習(xí)網(wǎng)絡(luò)模型嗎？

2023-02-06 07:28:15

Zstack中串口操作的深度解析(一)

本帖最后由 eehome 于 2013-1-5 10:06 編輯 Zstack中串口操作的深度解析(一)歡迎研究ZigBee的朋友和我交流。。。

2012-08-12 21:11:29

java經(jīng)典面試題深度解析

免費(fèi)視頻教程：java經(jīng)典面試題深度解析對于很多初學(xué)者來說，學(xué)好java在后期面試的階段都沒什么經(jīng)驗(yàn)，為了讓大家更好的了解面試相關(guān)知識，今天在這里給大家分享了一個java經(jīng)典面試題深度解析的免費(fèi)視頻

2017-06-20 15:16:08

　　華為云深度學(xué)習(xí)服務(wù)，讓企業(yè)智能從此不求人

深度學(xué)習(xí)訓(xùn)練的第一個困難是技術(shù)難度高。企業(yè)要進(jìn)行深度學(xué)習(xí)的模型訓(xùn)練，有很高的技術(shù)門檻。比如要自己搭建深度學(xué)習(xí)平臺，要有懂得編程的技術(shù)人員，還要有海量的訓(xùn)練數(shù)據(jù)等等。而華為云深度學(xué)習(xí)服務(wù)，可以提供深度

2018-08-02 20:44:09

【技術(shù)系列】淺談GPU虛擬化技術(shù)（第一章）

摘要： GPU深度好文系列，阿里云技術(shù)專家分享第一章GPU虛擬化發(fā)展史GPU的虛擬化發(fā)展歷程事實(shí)上與公有云市場和云計算應(yīng)用場景的普及息息相關(guān)。如果在10年前談起云計算，大部分人的反應(yīng)是“不知所云

2018-04-16 10:51:32

【資料上新】迅為基于3568開發(fā)板的NPU開發(fā)資料全面升級

隨著人工智能，大數(shù)據(jù)的時代來臨，以前嵌入式處理器中的CPU和GPU漸漸的難以滿足與日俱增的需求，尤其是深度學(xué)習(xí)方面。為了應(yīng)對日漸增長的需求，NPU就誕生的了。NPU英語全稱為Neural

2022-06-23 15:05:22

一圖了解頻率控制技術(shù)的演進(jìn)

一起來漲姿勢，如題，分享一張頻率控制技術(shù)演進(jìn)的圖（圖片來源：世強(qiáng)先進(jìn)），了解下電子產(chǎn)品心臟的技術(shù)發(fā)展過程。貌似CMEMS可編程振蕩器有替代石英振蕩器的趨勢，作為一個新出現(xiàn)的技術(shù)，想問問壇友們，對CMEMS技術(shù)如何看？

2014-03-28 18:57:00

什么是深度學(xué)習(xí)？使用FPGA進(jìn)行深度學(xué)習(xí)的好處？

上述分類之外，還被用于多項任務(wù)（下面顯示了四個示例）。在 FPGA 上進(jìn)行深度學(xué)習(xí)的好處我們已經(jīng)提到，許多服務(wù)和技術(shù)都使用深度學(xué)習(xí)，而 GPU 大量用于這些計算。這是因?yàn)榫仃嚦朔ㄗ鳛?b class="flag-6" style="color: red">深度學(xué)習(xí)中的主要

2023-02-17 16:56:59

全業(yè)務(wù)時代的光傳送網(wǎng)技術(shù)是如何演進(jìn)的？

全業(yè)務(wù)時代的光傳送網(wǎng)技術(shù)是如何演進(jìn)的？

2021-05-28 06:55:31

內(nèi)置NPU的Orange Pi 4B,你怎么看

任務(wù)。GPU采用Mali-T860 MP4，支持LPDDR4內(nèi)存與USB Type-C，支持eDP、HDMI、MIPI顯示接口，無論是CPU、GPU還是外設(shè)接口都達(dá)到行業(yè)的領(lǐng)先水平。迅龍軟件有限公司推出

2019-12-23 21:07:01

功能安全---AUTOSAR架構(gòu)深度解析精選資料分享

AUTOSAR架構(gòu)深度解析本文轉(zhuǎn)載于：AUTOSAR架構(gòu)深度解析AUTOSAR的分層式設(shè)計，用于支持完整的軟件和硬件模塊的獨(dú)立性(Independence)，中間RTE(Runtime

2021-07-23 08:34:18

基于RKNN程序開發(fā)和模型轉(zhuǎn)換的NPU簡要說明

1. NPU開發(fā)簡介1.1. 前言AIO-3399ProC 開發(fā)者需要注意：NPU推理階段會與CPU進(jìn)行數(shù)據(jù)通信，單次傳輸數(shù)據(jù)量少但頻率高，但是與USB3.0相比PCIE不適合小文件傳輸。所以導(dǎo)致

2022-05-31 11:10:20

如何判斷推理何時由GPU或NPU在iMX8MPlus上運(yùn)行？

當(dāng)我為 TFLite 模型運(yùn)行基準(zhǔn)測試時，有一個選項 --nnapi=true我如何知道 GPU 和 NPU 何時進(jìn)行推理？謝謝

2023-03-20 06:10:30

如何調(diào)用RK3588的NPU資源？

如何調(diào)用RK3588的NPU資源，還有NPU資源使用上的注意點(diǎn)，有NPU調(diào)用資源的教程嗎？

2022-05-16 09:41:42

射頻系統(tǒng)的深度學(xué)習(xí)【回映分享】

本文由回映電子整理分享，歡迎工程老獅們參與學(xué)習(xí)與評論內(nèi)容? 射頻系統(tǒng)中的深度學(xué)習(xí)? Deepwave Digital技術(shù)? 信號檢測和分類示例? GPU的實(shí)時DSP基準(zhǔn)測試? 總結(jié)回映電子是一家

2022-01-05 10:00:58

峰會回顧第7期 | 視窗繪制技術(shù)演進(jìn)和新趨勢

技術(shù)演進(jìn)，并通過各種Kit提供外掛式3D能力；（3）圍繞自研GPU及新一代Metal API進(jìn)行垂直整合（軟硬協(xié)同）；（4）各類SDK及開發(fā)工具深度整合，各個Kit間互操作性好，從底層能力到系統(tǒng)框架

2023-08-22 16:33:14

探討互聯(lián)網(wǎng)IPv6技術(shù)的發(fā)展與演進(jìn)

探討互聯(lián)網(wǎng)IPv6技術(shù)的發(fā)展與演進(jìn)

2021-05-25 06:56:02

氮化鎵功率半導(dǎo)體技術(shù)解析

氮化鎵功率半導(dǎo)體技術(shù)解析基于GaN的高級模塊

2021-03-09 06:33:26

請問在RK3399pro中間計算時能否調(diào)用GPU的一些現(xiàn)成數(shù)據(jù)庫或函數(shù)來計算

我在用RK3399pro的NPU做深度學(xué)習(xí)計算，使用了兩個rknn模型進(jìn)行推理，但是在這兩個rknn模型之間需要進(jìn)行一些中間計算（從第一個模型輸出到第二個模型輸入之間的計算），計算主要是對圖像進(jìn)行

2022-05-09 15:26:51

陳海波：OpenHarmony技術(shù)領(lǐng)先，產(chǎn)學(xué)研深度協(xié)同，生態(tài)蓬勃發(fā)展

、全棧協(xié)同深度優(yōu)化、跨平臺框架等關(guān)鍵技術(shù)。由技術(shù)指導(dǎo)委員會孵化，并由華為、阿里、美的、深開鴻等單位共建的跨平臺應(yīng)用開發(fā)框架開源項目ArkUI-X已于近期開源。眾行致遠(yuǎn)，OpenHarmony產(chǎn)學(xué)研

2023-11-06 14:35:46

高手進(jìn)階_終極內(nèi)存技術(shù)指南

[url=]高手進(jìn)階_終極內(nèi)存技術(shù)指南[/url]

2014-05-29 16:40:10

高手進(jìn)階終極內(nèi)存技術(shù)指南

高手進(jìn)階終極內(nèi)存技術(shù)指南

2012-08-15 17:53:09

華為認(rèn)證-HCNAv2.0進(jìn)階.part1

華為認(rèn)證-HCNAv2.0進(jìn)階的第1部分。

2016-05-11 10:45:50

華為認(rèn)證-HCNAv2.0進(jìn)階.part2

華為認(rèn)證-HCNAv2.0進(jìn)階的第二部分。

2016-05-11 10:45:50

基于Spark和BigDL的深度學(xué)習(xí)技術(shù)的案例解析

本文主要分享英特爾和京東在基于Spark和BigDL的深度學(xué)習(xí)技術(shù)在搭建大規(guī)模圖片特征提取框架上的實(shí)戰(zhàn)經(jīng)驗(yàn)。圖像特征提取被廣泛地應(yīng)用于相似圖片檢索，去重等。在使用BigDL框架（下文即將提到）之前

2017-12-05 16:14:10

2662

GPU及由其驅(qū)動的深度學(xué)習(xí)技術(shù)推動智能醫(yī)療的無限接近

幾個世紀(jì)以來，醫(yī)生都試圖借助更好的醫(yī)療工具來深入檢查病人的身體狀況，讓他們遠(yuǎn)離病痛的折磨。如今，GPU及其推動的深度學(xué)習(xí)技術(shù)正在為智能醫(yī)學(xué)儀器打開一扇全新的大門。

2017-12-09 11:51:22

6901

一圖深度解析IoT領(lǐng)域4大“戰(zhàn)役”

深度解析IoT領(lǐng)域4大“戰(zhàn)役”

2018-01-22 10:25:31

4612

NPU的簡介以及Kirin 970的NPU的性能測試解析

去年，華為推出了業(yè)界首款集成NPU的移動芯片Kirin 970。作為新一代的旗艦，這個SoC上面的CPU集成了8個核心，其中 4 個為高性能的 ARM 公版 A73 架構(gòu)，最高主頻 2.4GHz

2018-01-24 14:32:41

31252

深度學(xué)習(xí)方案ASIC、FPGA、GPU比較哪種更有潛力

幾乎所有深度學(xué)習(xí)的研究者都在使用GPU，但是對比深度學(xué)習(xí)硬鑒方案，ASIC、FPGA、GPU三種究竟哪款更被看好？主要是認(rèn)清對深度學(xué)習(xí)硬件平臺的要求。

2018-02-02 15:21:40

10268

基于虛擬化的多GPU深度神經(jīng)網(wǎng)絡(luò)訓(xùn)練框架

針對深度神經(jīng)網(wǎng)絡(luò)在分布式多機(jī)多GPU上的加速訓(xùn)練問題，提出一種基于虛擬化的遠(yuǎn)程多GPU調(diào)用的實(shí)現(xiàn)方法。利用遠(yuǎn)程GPU調(diào)用部署的分布式GPU集群改進(jìn)傳統(tǒng)一對一的虛擬化技術(shù)，同時改變深度神經(jīng)網(wǎng)絡(luò)在分布式

2018-03-29 16:45:25

深度解析華為“很嚇人的技術(shù)”：GPU Turbo

華為GPU Turbo這一項技術(shù)首先是在6月6日的榮耀Play上搭載，在發(fā)布前也余承東對自家GPU Turbo技術(shù)的宣傳語就是”一項很嚇人的技術(shù)”。

2018-09-10 16:42:28

14969

華為麒麟980雙核NPU謎底揭開：還是來自寒武紀(jì)科技

關(guān)鍵詞：寒武紀(jì) , 人工智能 , 麒麟980 , NPU 來源：快科技華為麒麟970通過集成NPU神經(jīng)網(wǎng)絡(luò)單元，開啟了手機(jī)AI時代，不過這個NPU并非華為自研，而是來自AI獨(dú)角獸寒武紀(jì)科技的A1

2018-11-14 12:47:01

273

華為麒麟980的雙核NPU是自研的嗎

華為麒麟970通過集成NPU神經(jīng)網(wǎng)絡(luò)單元，開啟了手機(jī)AI時代，不過這個NPU并非華為自研，而是來自AI獨(dú)角獸寒武紀(jì)科技的A1處理器IP。

2018-11-14 16:50:19

4512

一文解析三星NPU的核心技術(shù)

7倍，并可以增強(qiáng)從照片到AR的性能。今年的CVPR，三星題為《通過優(yōu)化量化間隔，借助任務(wù)損失學(xué)習(xí)量化深度神經(jīng)網(wǎng)絡(luò)》的論文透露了三星NPU的核心技術(shù)。

2019-07-13 07:18:00

5311

GPU和GPP相比誰才是深度學(xué)習(xí)的未來

相比GPU和GPP，F(xiàn)PGA在滿足深度學(xué)習(xí)的硬件需求上提供了具有吸引力的替代方案。憑借流水線并行計算的能力和高效的能耗，F(xiàn)PGA將在一般的深度學(xué)習(xí)應(yīng)用中展現(xiàn)GPU和GPP所沒有的獨(dú)特優(yōu)勢。

2019-10-18 15:48:14

1339

阿里MNN支持華為NPU，優(yōu)化MNN的性能和精度問題

今天上午據(jù)軟件綠色聯(lián)盟消息，阿里MNN已經(jīng)接入華為 HiAI生態(tài)，正式支持華為NPU。

2019-12-23 14:04:42

3422

區(qū)塊鏈的核心技術(shù)挖礦演進(jìn)詳細(xì)資料說明

是由最開始的CPU挖礦，過度到GPU挖礦，最終演化到當(dāng)前的ASIC（專業(yè)礦機(jī)）挖礦時代，本篇解析其中的邏輯設(shè)計和技術(shù)實(shí)現(xiàn)。挖礦的演進(jìn)是硬件的演進(jìn)過程，同時也是軟件的演進(jìn)過程，尤其是軟硬件對接協(xié)議的改進(jìn)過程，因此本?直接將與挖礦有關(guān)的?

2019-12-25 08:00:00

芯片里的CPU、GPU、NPU是什么，它們是如何工作的

眾所周知，隨著智能手機(jī)的流行，越來越多的人都知道了手機(jī)芯片的相關(guān)知識，更是知道了CPU、GPU、NPU等等“深奧”的知識點(diǎn)。

2020-03-25 14:21:04

15958

Arm即將推出新一代的旗艦CPU、GPU和NPU

Arm宣布推出用于旗艦型手機(jī)的新款處理器IP系列：Cortex-X1 CPU，Cortex-A78 CPU，Mali-G78 GPU和Ethos-N78神經(jīng)網(wǎng)絡(luò)處理器（NPU）。

2020-05-28 11:21:39

3930

麒麟820將會是華為首款G77 GPU的芯片？

麒麟820 5G處理器的CPU將采用A76，GPU為G77，仍將使用7nm制程工藝（此前傳聞6nm），同時ISP和NPU將迎來全面的升級，這將是華為首款搭載G77 GPU的處理器，甚至麒麟990使用的都是G76。

2020-08-06 16:29:06

1348

ARM被收購后還將繼續(xù)開發(fā)Mali GPU及NPU芯片?

在日前的ARM DevSummit開發(fā)者峰會上，NVIDIA創(chuàng)始人、CEO黃仁勛也回應(yīng)了這個說法，他表示ARM被收購之后還會繼續(xù)開發(fā)Mali GPU及NPU芯片，NVIDIA不會阻止，兩邊都有各自的客戶。

2020-10-11 11:57:35

2231

CPU、GPU、TPU、NPU等的講解

CPU、GPU、TPU、NPU等的講解

2021-01-05 14:54:17

9852

全面概述ARM Mali GPU架構(gòu)演進(jìn)！

年初有機(jī)會調(diào)研了一下歷代ARM Mali GPU架構(gòu)，目前一共四代【1】，分別是Utgard，Midgard，Bifrost和Valhall。有感于他的演進(jìn)是大GPU架構(gòu)發(fā)展的縮影，所以作文一篇記錄

2021-03-31 13:51:32

6375

深度解析Asp.Net2.0中的Callback機(jī)制

深度解析Asp.Net2.0中的Callback機(jī)制(ups電源技術(shù)維修)-該文檔為深度解析Asp.Net2.0中的Callback機(jī)制講解文檔，是一份還算不錯的參考文檔，感興趣的可以下載看看，，，，，，，，，，，，，，，，，

2021-09-27 16:28:20

熱虹吸散熱技術(shù)解決GPU服務(wù)器散熱問題

隨著深度學(xué)習(xí)、仿真、BIM設(shè)計、AEC行業(yè)在各行各業(yè)應(yīng)用的發(fā)展，在AI技術(shù)虛擬GPU技術(shù)的加持之下，需要強(qiáng)大的GPU算力解析。無論是GPU服務(wù)器，還是GPU工作站都趨向于小型化、模塊化、高集成度

2021-10-09 14:11:38

1621

HarmonyOS測試技術(shù)與實(shí)戰(zhàn)-HarmonyOS圖形棧測試技術(shù)深度解析

HDC 2021華為開發(fā)者大會HarmonyOS測試技術(shù)與實(shí)戰(zhàn)-HarmonyOS圖形棧測試技術(shù)深度解析

2021-10-23 15:09:00

1300

NVIDIA GPU加快深度神經(jīng)網(wǎng)絡(luò)訓(xùn)練和推斷

深度學(xué)習(xí)是推動當(dāng)前人工智能大趨勢的關(guān)鍵技術(shù)。在 MATLAB 中可以實(shí)現(xiàn)深度學(xué)習(xí)的數(shù)據(jù)準(zhǔn)備、網(wǎng)絡(luò)設(shè)計、訓(xùn)練和部署全流程開發(fā)和應(yīng)用。聯(lián)合高性能 NVIDIA GPU 加快深度神經(jīng)網(wǎng)絡(luò)訓(xùn)練和推斷。

2022-02-18 13:31:44

1780

如何提升NPU的能效比？

NPU通過數(shù)據(jù)分區(qū)和有效調(diào)度，利用數(shù)據(jù)的重用以及執(zhí)行分段來提高能效比和硬件利用率，而實(shí)現(xiàn)高利用率，數(shù)據(jù)重用將直接依賴于如何調(diào)度深度神經(jīng)網(wǎng)絡(luò)的計算和如何將這些計算有效的映射到NPU的硬件單元上。以CNN為例，數(shù)據(jù)流無非包含三個方面filter(Weight)，ifmap和ofmap，如下圖。

2022-08-01 11:19:54

1844

深度學(xué)習(xí)算法進(jìn)行優(yōu)化的處理器——NPU

NPU（Neural-network Processing Unit，嵌入式神經(jīng)網(wǎng)絡(luò)處理器）是針對深度學(xué)習(xí)*算法進(jìn)行優(yōu)化的處理器。它能像人類神經(jīng)網(wǎng)絡(luò)一樣快速、高效地處理大量數(shù)據(jù)，因此它主要用于AI算法。

2022-10-17 10:53:24

1930

深度解析PiN二極管基本原理及設(shè)計應(yīng)用

2022-12-21 10:12:24

1270

GPU 引領(lǐng)的深度學(xué)習(xí)

GPU 引領(lǐng)的深度學(xué)習(xí)

2023-01-04 11:17:16

517

深度解析如何管控SMT回流焊爐溫曲線

2023-06-21 09:48:53

871

華為孟晚舟：5.5G是5G網(wǎng)絡(luò)的必然之路

華為提出了5.5G的概念，該概念不僅包括無線網(wǎng)絡(luò)5G和固定網(wǎng)絡(luò)F5G的演進(jìn)升級，在聯(lián)接層面是個產(chǎn)業(yè)倡議，還代表了涵蓋多個領(lǐng)域的技術(shù)和產(chǎn)業(yè)演進(jìn)階段。

2023-06-28 17:47:34

1486

什么是CPU、GPU、TPU、DPU、NPU、BPU？有什么區(qū)別？

技術(shù)日新月異，物聯(lián)網(wǎng)、人工智能、深度學(xué)習(xí)等遍地開花，各類芯片名詞GPU, TPU, NPU，DPU層出不窮…它們都是什么鬼？又有什么不一樣？ 01 CPU CPU，作為機(jī)器的“大腦”，它是布局謀略

2023-06-30 08:48:26

12587

最強(qiáng)科普！深度解析華為云盤古大模型

搭檔完成復(fù)雜任務(wù) 預(yù)測臺風(fēng)路徑降低災(zāi)害損失幫助縮短藥物研發(fā)周期 …… 此次發(fā)布有諸多新升級更為客戶提供了“開箱即用”的模型服務(wù) 簡直就是一個AI大禮包！一支視頻為你深度解析盤古大模型硬實(shí)力！你想了解的都在這兒原文標(biāo)題：最強(qiáng)科普！深度解析華為云盤古

2023-07-14 15:20:03

1406

進(jìn)階課程-地址解析協(xié)議(ARP)

電子發(fā)燒友網(wǎng)站提供《進(jìn)階課程-地址解析協(xié)議(ARP).pdf》資料免費(fèi)下載

2023-07-31 11:41:58

npu是什么意思?npu芯片是什么意思？npu到底有什么用？

。正如CPU和GPU一樣，NPU也是一種專門的處理器芯片，但不同于前二者，NPU被用于深度學(xué)習(xí)領(lǐng)域。NPU在深度學(xué)習(xí)領(lǐng)域的應(yīng)用可以提高運(yùn)算速度，降低功耗，加速推理流程等。 NPU技術(shù)介紹 NPU技術(shù)屬于人工智能（AI）的一部分。NPU是一種高度專業(yè)化的芯片，主要用于處理神經(jīng)網(wǎng)絡(luò)的推理工作。推理是

2023-08-27 17:03:05

27382

cpu gpu npu的區(qū)別 NPU與GPU哪個好？gpu是什么意思？

cpu gpu npu的區(qū)別 NPU與GPU哪個好？gpu是什么意思？在當(dāng)今數(shù)字化和人工智能的時代，高效的計算能力是現(xiàn)代技術(shù)發(fā)展的重要基礎(chǔ)。因此，Central Processing Unit

2023-08-27 17:03:08

8357

npu是華為獨(dú)有的嗎？手機(jī)有npu和沒有npu的區(qū)別？

npu是華為獨(dú)有的嗎？手機(jī)有npu和沒有npu的區(qū)別？ NPU是華為公司研發(fā)的一種專用運(yùn)算單元，它的英文全稱是"Neural Processing Unit"，中文翻譯為神經(jīng)網(wǎng)絡(luò)處理器，也就是能夠

2023-08-27 17:03:16

2490

TPU和NPU的區(qū)別

和NPU之間的區(qū)別。什么是TPU？ TPU，即Tensor Processing Unit，是由Google公司開發(fā)的專用於深度學(xué)習(xí)的加速器。它被設(shè)計成一個ASIC（應(yīng)用特定集成電路），可延長深度學(xué)習(xí)模型的訓(xùn)練和推理速度。TPU可以處理大量的矩陣數(shù)學(xué)運(yùn)算，這是深度學(xué)習(xí)任務(wù)中最常見的操作。目

2023-08-27 17:08:29

3804

npu芯片有什么用

等領(lǐng)域，對于提高設(shè)備的智能化程度和性能有著非常重要的作用。一、 NPU芯片概述 NPU芯片是一款專為人工智能應(yīng)用而設(shè)計的芯片，它主要處理神經(jīng)網(wǎng)絡(luò)算法，可以大幅度提高人工智能的計算效率和速度。NPU芯片通常是在CPU和GPU之外的一種獨(dú)立處理器，

2023-08-27 17:08:32

4443

手機(jī)里的npu是什么意思？手機(jī)npu是干什么的？

。什么是NPU？ NPU，全稱神經(jīng)處理單元（Neural Processing Unit），是一種專門用來處理人工智能計算的芯片，它是一種對計算機(jī)網(wǎng)絡(luò)算法架構(gòu)進(jìn)行優(yōu)化的結(jié)構(gòu)，是將深度神經(jīng)網(wǎng)絡(luò)計算從中央處理器（CPU）、圖像處理器（GPU）等芯片中分離出來，由專門的神經(jīng)網(wǎng)絡(luò)

2023-08-27 17:08:39

3462

GPU的張量核心：深度學(xué)習(xí)的秘密武器

GPU最初是為圖形渲染而設(shè)計的，但是由于其卓越的并行計算能力，它們很快被引入深度學(xué)習(xí)中。深度學(xué)習(xí)的迅速發(fā)展離不開計算機(jī)圖形處理單元（GPU）的支持，而GPU中的張量核心則被譽(yù)為深度學(xué)習(xí)的秘密武器

2023-09-26 08:29:54

538

移動回傳技術(shù)的三大演進(jìn)方向向POTN技術(shù)演進(jìn)

電子發(fā)燒友網(wǎng)站提供《移動回傳技術(shù)的三大演進(jìn)方向向POTN技術(shù)演進(jìn).pdf》資料免費(fèi)下載

2023-11-10 15:28:38

GPU在深度學(xué)習(xí)中的應(yīng)用與優(yōu)勢

人工智能的飛速發(fā)展，深度學(xué)習(xí)作為其重要分支，正在推動著諸多領(lǐng)域的創(chuàng)新。在這個過程中，GPU扮演著不可或缺的角色。就像超級英雄電影中的主角一樣，GPU在深度學(xué)習(xí)中擁有舉足輕重的地位。那么，GPU在深度

2023-12-06 08:27:37

743

CPU、GPU、TPU、NPU分別是什么？哪個最強(qiáng)？

技術(shù)日新月異，物聯(lián)網(wǎng)、人工智能、深度學(xué)習(xí)等遍地開花，各類芯片名詞CPU，GPU,TPU,NPU層出不窮…它們都是什么？又有著什么千絲萬縷的關(guān)系和區(qū)別？接下來，統(tǒng)一介紹一下：01CPUCPU最早用于

2023-12-22 08:26:25

945

已全部加載完成

搜索歷史

深度解析華為NPU/GPU技術(shù)演進(jìn)與進(jìn)階

評論