盗墓笔记小说全集,完结小说排行榜,小说阅读网免费小说

谷歌本月推出千元級搭載Edge TPU芯片的開發板，性能令人期待。本文以可視化圖形的方式，對比TPU、GPU和CPU，解釋了TPU在執行神經網絡計算方面的優勢。

谷歌最便宜 TPU 值不值得買？

谷歌 Edge TPU 在本月初終于公布價格 —— 不足 1000 元人民幣，遠低于 TPU。

實際上，Edge TPU 基本上就是機器學習的樹莓派，它是一個用 TPU 在邊緣進行推理的設備。

Edge TPU(安裝在 Coral 開發板上）

云 vs 邊緣

Edge TPU顯然是在邊緣(edge)運行的，但邊緣是什么呢？為什么我們不選擇在云上運行所有東西呢？

在云中運行代碼意味著你使用的CPU、GPU和TPU都是通過瀏覽器提供的。在云中運行代碼的主要優點是，你可以為特定的代碼分配必要的計算能力（訓練大型模型可能需要大量的計算）。

邊緣與云相反，意味著你是在本地運行代碼(也就是說你能夠實際接觸到運行代碼的設備)。在邊緣運行代碼的主要優點是沒有網絡延遲。由于物聯網設備通常要頻繁地生成數據，因此運行在邊緣上的代碼非常適合基于物聯網的解決方案。

對比 CPU、GPU，深度剖析 TPU

TPU(Tensor Processing Unit, 張量處理器)是類似于CPU或GPU的一種處理器。不過，它們之間存在很大的差異。最大的區別是TPU是ASIC，即專用集成電路。ASIC經過優化，可以執行特定類型的應用程序。對于TPU來說，它的特定任務就是執行神經網絡中常用的乘積累加運算。CPU和GPU并未針對特定類型的應用程序進行優化，因此它們不是ASIC。

下面我們分別看看 CPU、GPU 和 TPU 如何使用各自的架構執行累積乘加運算：

在 CPU 上進行累積乘加運算

CPU 通過從內存中讀取每個輸入和權重，將它們與其 ALU (上圖中的計算器) 相乘，然后將它們寫回內存中，最后將所有相乘的值相加，從而執行乘積累加運算。

現代 CPU 通過其每個內核上的大量緩存、分支預測和高時鐘頻率得到增強。這些都有助于降低 CPU 的延遲。

GPU 上的乘積累加運算

GPU 的原理類似，但它有成千上萬的 ALU 來執行計算。計算可以在所有 ALU 上并行進行。這被稱為 SIMD (單指令流多數據流)，一個很好的例子就是神經網絡中的多重加法運算。

然而，GPU 并不使用上述那些能夠降低延遲的功能。它還需要協調它的數千個 ALU，這進一步減少了延遲。

簡而言之，GPU 通過并行計算來大幅提高吞吐量，代價是延遲增加。或者換句話說:

CPU 是一個強大而訓練有素的斯巴達戰士，而 GPU 就像一支龐大的農民大軍，但農民大軍可以打敗斯巴達戰士，因為他們人多。

讀取 TPU 上的乘加操作的權重

TPU 的運作方式非常不同。它的 ALU 是直接相互連接的，不需要使用內存。它們可以直接提供傳遞信息，從而大大減少延遲。

從上圖中可以看出，神經網絡的所有權重都被加載到 ALU 中。完成此操作后，神經網絡的輸入將加載到這些 ALU 中以執行乘積累加操作。這個過程如下圖所示：

TPU 上的乘加操作

如上圖所示，神經網絡的所有輸入并不是同時插入 ALU 的，而是從左到右逐步地插入。這樣做是為了防止內存訪問，因為 ALU 的輸出將傳播到下一個 ALU。這都是通過脈動陣列 (systolic array) 的方式完成的，如下圖所示。

使用脈動陣列執行乘加操作

上圖中的每個灰色單元表示 TPU 中的一個 ALU (其中包含一個權重)。在 ALU 中，乘加操作是通過將 ALU 從頂部得到的輸入乘以它的權重，然后將它與從左編得到的值相加。此操作的結果將傳播到右側，繼續完成乘加操作。ALU 從頂部得到的輸入被傳播到底部，用于為神經網絡層中的下一個神經元執行乘加操作。

在每一行的末尾，可以找到層中每個神經元的乘加運算的結果，而不需要在運算之間使用內存。

使用這種脈動陣列顯著提高了 Edge TPU 的性能。

Edge TPU 推理速度超過其他處理器架構

TPU 還有一個重要步驟是量化 (quantization)。由于谷歌的 Edge TPU 使用 8 位權重進行計算，而通常使用 32 位權重，所以我們應該將權重從 32 位轉換為 8 位。這個過程叫做量化。

量化基本上是將更精確的 32 位數字近似到 8 位數字。這個過程如下圖所示：

量化

四舍五入會降低精度。然而，神經網絡具有很好的泛化能力 (例如 dropout)，因此在使用量化時不會受到很大的影響，如下圖所示。

非量化模型與量化模型的精度

量化的優勢更為顯著。它減少了計算量和內存需求，從而提高了計算的能源效率。

Edge TPU 執行推理的速度比任何其他處理器架構都要快。它不僅速度更快，而且通過使用量化和更少的內存操作，從而更加環保。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

谷歌

谷歌

+關注

關注
27

文章
6168

瀏覽量
105381
機器學習

機器學習

+關注

關注
66

文章
8418

瀏覽量
132635
TPU

TPU

+關注

關注
0

文章
141

瀏覽量
20728

原文標題：一文讀懂：谷歌千元級Edge TPU為何如此之快？

文章出處：【微信號：AI_era，微信公眾號：新智元】歡迎添加關注！文章轉載請注明出處。

從TPU v1到Trillium TPU，蘋果等科技公司使用谷歌TPU進行AI計算

，在訓練尖端人工智能方面，大型科技公司正在尋找英偉達以外的替代品。 ? 不斷迭代的谷歌TPU 芯片 ? 隨著機器學習算法，特別是深度學習算法在

發表于 07-31 01:08 ?3375次閱讀

BP神經網絡和卷積神經網絡的關系

廣泛應用的神經網絡模型。它們各自具有獨特的特點和優勢，并在不同的應用場景中發揮著重要作用。以下是對BP神經網絡和卷積神經網絡關系的詳細探討，內容將涵蓋兩者的定義、原理、區別、聯系以及應

發表于 07-10 15:24 ?1512次閱讀

BP神經網絡和人工神經網絡的區別

BP神經網絡和人工神經網絡（Artificial Neural Networks，簡稱ANNs）之間的關系與區別，是神經網絡領域中一個基礎且重要的話題。本文將從定義、結構、算法、應用及未來發展等多個

發表于 07-10 15:20 ?1071次閱讀

rnn是遞歸神經網絡還是循環神經網絡

：循環神經網絡的基本概念循環神經網絡是一種具有時間序列特性的神經網絡，它能夠處理序列數據，具有記憶功能。與傳統的前饋神經網絡不同，循環神經網絡

發表于 07-05 09:52 ?577次閱讀

循環神經網絡和卷積神經網絡的區別

結構。它們在處理不同類型的數據和解決不同問題時具有各自的優勢和特點。本文將從多個方面比較循環神經網絡和卷積神經網絡的區別。基本概念循環

發表于 07-04 14:24 ?1299次閱讀

循環神經網絡和遞歸神經網絡的區別

處理序列數據方面具有顯著的優勢，但它們在結構和工作原理上存在一些關鍵的區別。循環神經網絡（RNN） 1.1 RNN的結構循環神經網絡是一

發表于 07-04 14:19 ?918次閱讀

深度神經網絡與基本神經網絡的區別

在探討深度神經網絡（Deep Neural Networks, DNNs）與基本神經網絡（通常指傳統神經網絡或前向神經網絡）的區別時，我們需

發表于 07-04 13:20 ?874次閱讀

bp神經網絡是深度神經網絡嗎

BP神經網絡（Backpropagation Neural Network）是一種常見的前饋神經網絡，它使用反向傳播算法來訓練網絡。雖然BP神經網絡

發表于 07-03 10:14 ?848次閱讀

bp神經網絡和卷積神經網絡區別是什么

BP神經網絡（Backpropagation Neural Network）和卷積神經網絡（Convolutional Neural Network，簡稱CNN）是兩種不同類型的人工神經網絡，它們

發表于 07-03 10:12 ?1185次閱讀

卷積神經網絡和bp神經網絡的區別

不同的神經網絡模型，它們在結構、原理、應用等方面都存在一定的差異。本文將從多個方面對這兩種神經網絡進行詳細的比較和分析。引言

發表于 07-02 14:24 ?3968次閱讀

計算

道哥的書籍值不值得買呢，這本書還沒有看過，不知道寫的怎么樣

發表于 05-16 11:55

谷歌將推出第六代數據中心AI芯片Trillium TPU

在今日舉行的I/O 2024開發者大會上，谷歌公司震撼發布了其第六代數據中心AI芯片——Trillium Tensor處理器單元（TPU）。據谷歌首席

發表于 05-15 11:18 ?635次閱讀

Groq推出大模型推理芯片超越了傳統GPU和谷歌TPU

Groq推出了大模型推理芯片，以每秒500tokens的速度引起轟動，超越了傳統GPU和谷歌TPU。

發表于 02-26 10:24 ?1041次閱讀

tpu材料的用途和特點

的制作，例如鞋底、鞋面、鞋墊等。TPU具有耐磨、抗刮擦、柔軟舒適等特點，可以為鞋提供良好的保護和舒適性。服裝行業：TPU材料在服裝行業中應用廣泛，常用于雨衣、防水服、防寒服等。其具有良好的防水性能、抗紫外線能力和耐磨性，能夠有

發表于 01-16 10:17 ?3271次閱讀

TPU-MLIR開發環境配置時出現的各種問題求解

。參考下文配置Docker。 2.2. Docker配置? TPU-MLIR在Docker環境開發, 配置好Docker就可以編譯和運行了。從 DockerHub https

發表于 01-10 08:02

在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

搜索歷史

谷歌最便宜TPU值不值得買？TPU在執行神經網絡計算方面的優勢

評論

從TPU v1到Trillium TPU，蘋果等科技公司使用谷歌TPU進行AI計算

BP神經網絡和卷積神經網絡的關系

BP神經網絡和人工神經網絡的區別

rnn是遞歸神經網絡還是循環神經網絡

循環神經網絡和卷積神經網絡的區別

循環神經網絡和遞歸神經網絡的區別

深度神經網絡與基本神經網絡的區別

bp神經網絡是深度神經網絡嗎

bp神經網絡和卷積神經網絡區別是什么

卷積神經網絡和bp神經網絡的區別

計算

谷歌將推出第六代數據中心AI芯片Trillium TPU

Groq推出大模型推理芯片超越了傳統GPU和谷歌TPU

tpu材料的用途和特點

TPU-MLIR開發環境配置時出現的各種問題求解