在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

TPU內存(一)

jf_pJlTbmA9 ? 來源:jf_pJlTbmA9 ? 作者:jf_pJlTbmA9 ? 2023-08-18 11:29 ? 次閱讀

首先我們來看一下TPU的簡要架構。

wKgZomTeyeaAZIfgAAHD0ac5UQY873.jpg

我們可以從ppt中了解到一個TPU中包含多個NPU(Neuron Processing Unit),主要由一個local memory和多個執行單元組成。前者用于存儲要運算的數據,后者是TPU上最小的計算單元。每個NPU一次可以驅動它的所有EU做一個MAC操作。

就整體 TPU 內存而言,它由system memory和local memory組成。 system memory的主要部分是global memory,其實就是一塊DDR。 有時根據 TPU 的特殊設計還會有其他組件,但我們不會在視頻中提及這些部分,所以現在了解global memory就足夠了。 而對于local memory,我們暫時只需要知道是一組Static RAM就可以了。 稍后我會進一步解釋。

通常global memory很大,用于存儲來自host端的整個數據塊。

而local memory雖然有限但在計算速度上更有優勢。

所以有時候對于一個很大的張量,我們需要把它切分成幾個部分,送到local memory中進行計算,然后把結果存回global memory。

為了在 TPU 上執行這些操作,我們就需要用到指令。

wKgaomTeyeiALJ1CAAIDykCTHHk383.jpg

指令主要有兩種:

  1. GDMA用于system memory和local memory間或system memory內的數據傳輸;
  2. BDC用于驅動執行單元在NPU上做計算工作;
    另外,對于那些不適合并行加速的計算,比如NMS,SORT,我們還需要HAU指令,但是這意味著我們需要額外的處理器

對于local memory的構成,它是由多個Static RAM組成的。每個 SRAM 稱為一個bank。此外,我們將這些 SRAM 分成多個部分給同樣數量的NPU,每個部分稱為一個lane。

wKgZomTeyeqAXvi9AAFu4L8pxm8967.jpg

而對于每個NPU,它只能訪問屬于它的那部分local memory,這使得單個NPU的執行單元只能處理自己local memory上的那部分張量。

wKgaomTeyeuAfgPDAAF-yNBzCFA101.jpg

一旦我們調用單個 BDC 指令,所有 NPU 的執行單元將在每個 NPU 的相同位置執行相同的操作。 這就是 TPU 加速運算的方式。

此外,TPU 可以同時處理的數據數量取決于每個 NPU 上的執行單元數量。

對于一個特定的TPU,EU Bytes是固定的,所以對于不同類型的數據,EU的個數會有所不同。

例如當EU Bytes為64時,則表示一個NPU可以同時處理64個int8數據。

wKgaomTeye2Ad3tgAAHvEqSiXMk797.jpg

同理,我們可以根據數據的字節計算出對應的EU_NUM。

對于地址分配,假設我們的local memory由16個SRAM組成,總內存為16MB,有64個NPU,那么每個NPU的內存為256KB。

wKgZomTeyfCAAJ_6AAHhbitBbHs249.jpg

單個通道中每個bank的內存大小則為16KB,相當于16x1024 字節。

所以這個塊的地址范圍是從0到16x1024 – 1。

同理,NPU0中下個bank的地址從16x1024開始到32x1024-1

按照這個規則,我們就可以得到local memory上的所有地址。

審核編輯:湯梓紅
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • DDR
    DDR
    +關注

    關注

    11

    文章

    712

    瀏覽量

    65342
  • 內存
    +關注

    關注

    8

    文章

    3025

    瀏覽量

    74047
  • TPU
    TPU
    +關注

    關注

    0

    文章

    141

    瀏覽量

    20728
收藏 人收藏

    評論

    相關推薦

    TPU-MLIR開發環境配置時出現的各種問題求解

    按照 TPU-MLIR 開發指南進行環境配置: 2.1. 代碼下載? 代碼路徑: https://github.com/sophgo/tpu-mlir 克隆該代碼后, 需要在Docker中編譯
    發表于 01-10 08:02

    CORAL-EDGE-TPU:珊瑚開發板TPU

    包括個上系統模塊(SOM)和護壁板。SOM基于iMX 8M應用處理器,還包含LPDDR4內存,eMMC存儲,雙頻Wi-Fi和Edge TPU。Edge TPU是由Google設計的小
    發表于 05-29 10:43

    TPU透明副牌.TPU副牌料.TPU抽粒廠.TPU塑膠副牌.TPU再生料.TPU低溫料

    清源塑膠經營. 供應TPU塑膠原料.副牌.再生顆粒料.TPU塑膠.TPU透明副牌. 再生粒子.白色.黑色.透明. 注塑料.擠出料. 壓延等等..聚醚. 脂肪料. 聚酯料.硬度70A--98A.
    發表于 11-21 17:21

    TPU副牌低溫料.TPU熱熔料.TPU中溫料.TPU低溫塑膠.TPU低溫抽粒.TPU中溫塑料

    清源塑膠公司.供應TPU塑膠原料.副牌.再生顆粒料.TPU塑膠.TPU透明副牌. 再生粒子.白色.黑色.透明. 注塑料.擠出料. 壓延等等..聚醚. 脂肪料. 聚酯料.硬度70A--98A. 高硬度
    發表于 11-21 17:33

    供應TPU抽粒工廠.TPU再生工廠.TPU聚醚料.TPU聚酯料.TPU副牌透明.TPU副牌.TPU中低溫料

    清源塑膠經營.進口.國內.供應TPU原料.副牌TPU塑膠.TPU透明副牌. 再生粒子.白色.黑色.透明. 注塑料.擠出料. 壓延等等..聚醚. 脂肪料. 聚酯料.硬度70A--98A. 高硬度
    發表于 11-21 17:47

    采購TPU復牌料.復牌TPU原料.TPU復牌透明塑料.TPU廢邊料.TPU廢膜料.TPU低溫料

    全球大量采購① tpu,透明,白色,副牌,再生粒,注塑,擠出料,TPU邊角膜料. TPU廢卷膜. 進口.國內料. 200噸,② TPU低溫,中溫.副牌料,膠塊料. 200噸, ③ PB
    發表于 11-22 02:38

    如何驗證MC68332 TPU配置是否正確?

    a) 以下 TPU 模塊配置在項目中完成 *M332_TPU_TMCR = 0x1e4c;/* 選擇 TCR1 時基 = 250nsec, TCR2 = 4usec,仿真模式
    發表于 05-09 08:17

    BM1684中各種內存的概念

    A53專用 + 4GB TPU專用 + 4GB VPP/VPU專用。 設備內存(Device Memory)和系統內存(Host Memory): 根據BM168x產品類型或工作模式的不同,設備
    發表于 09-19 07:47

    tpu是什么材料_tpu硬度范圍_tpu的應用

    TPU(Thermoplastic polyurethanes)名稱為熱塑性聚氨酯彈性體橡膠。主要分為有聚酯型和聚醚型之分,它硬度范圍寬(60HA-85HD)、耐磨、耐油,透明,彈性好,在日用品
    發表于 12-01 15:55 ?2w次閱讀

    文了解CPU、GPU和TPU的區別

    很多讀者可能分不清楚 CPU、GPU 和 TPU 之間的區別,因此 Google Cloud 將在這篇博客中簡要介紹它們之間的區別,并討論為什么 TPU 能加速深度學習。
    的頭像 發表于 09-06 16:53 ?2.8w次閱讀

    文搞懂 CPU、GPU 和 TPU

    張量處理單元(TPU)是種定制化的 ASIC 芯片,它由谷歌從頭設計,并專門用于機器學習工作負載。TPU 為谷歌的主要產品提供了計算支持,包括翻譯、照片、搜索助理和 Gmail 等。 在本文中,我們將關注
    的頭像 發表于 09-15 10:46 ?4.4w次閱讀

    TPU內存(二)

    TPU內存(二)
    的頭像 發表于 08-18 11:29 ?445次閱讀
    <b class='flag-5'>TPU</b><b class='flag-5'>內存</b>(二)

    TPU和NPU的區別

    和NPU之間的區別。 什么是TPUTPU,即Tensor Processing Unit,是由Google公司開發的專用於深度學習的加速器。它被設計成個ASIC(應用特定集成電路),可延長深度學習模型的訓練和推理速度。
    的頭像 發表于 08-27 17:08 ?8218次閱讀

    谷歌發布多模態Gemini大模型及新TPU系統Cloud TPU v5p

    谷歌亦發布新TPU 系統——Cloud TPU v5p,以幫助訓練尖端的 AI 模型。目
    的頭像 發表于 12-12 10:50 ?1378次閱讀
    谷歌發布多模態Gemini大模型及新<b class='flag-5'>一</b>代<b class='flag-5'>TPU</b>系統Cloud <b class='flag-5'>TPU</b> v5p

    tpu材料的用途和特點

    TPU材料,即熱塑性聚氨酯(Thermoplastic Polyurethane),是種聚合物材料,具有廣泛的應用領域和獨特的特點。 TPU材料的主要用途如下: 鞋類行業:TPU材料
    的頭像 發表于 01-16 10:17 ?3272次閱讀
    主站蜘蛛池模板: 国产黄大片在线观看| 亚洲一区二区三区中文字幕| 欧美一区高清| 色天使在线观看| 成人网在线观看| 操操操操操| 五月婷婷中文字幕| 成人在线a| 欧美性猛交xxxx乱大交| 特黄a大片免费视频| 丝袜美女被c| 色天使亚洲| 夜夜cao| 免费观看视频网站| 四虎国产精品免费观看| 日本三级黄视频| 欧美视频区| 台湾久久| 欧美性区| 凸输偷窥xxxx自由视频| www.狠狠操.com| 男人搡女人视频免费看| 日韩免费三级电影| 色图插插插| 中文字幕卡二和卡三的视频| 久久成人国产精品青青| 国产精品好好热在线观看| 日产精品卡二卡三卡四卡无卡乱码| 亚洲狠狠色丁香婷婷综合| 成人国产日本亚洲精品| 日韩激情淫片免费看| 色秀视频免费网站在线观看| 新版天堂资源中文8在线| 2020天天干| 日日夜夜噜| 欧美成人免费观看bbb| 亚洲精品美女| 18女毛片| 国产精品一级香蕉一区| 国产成人精品曰本亚洲| 一区二区在线观看高清|