在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

TVM中將計算算符分成四種

電子設計 ? 來源:電子設計 ? 作者:電子設計 ? 2022-02-08 14:44 ? 次閱讀

作者:安平博,Xilinx高級工程師;來源:AI加速微信公眾號

算符融合將多個計算單元揉進一個計算核中進行,減少了中間數據的搬移,節省了計算時間。TVM中將計算算符分成四種:

1 injective。一一映射函數,比如加法,點乘等。

2 reduction。輸入到輸出具有降維性質的,比如sum。

3 complex-out。這是計算比較復雜的,比如卷積運算等。

4 opaque。無法被融合的算符,比如sort。

根據以上對算符的不同類型,TVM提供了三種融合規則:

pIYBAGAJ2T6AJeJJAADW3l6UdT0832.png

從一定角度看,這種融合實際上是數據計算pipeline化,即兩次計算中間數據不再經歷store-load的過程,而是直接給到下一個計算單元完成計算。

在走入fuse ops代碼之前,還需要了解一些算法基礎知識。算符融合中應用了支配樹算法。在一個有向無環圖中,對于一個節點n來說,從初始節點s出發到達n的所有路徑都經歷一個節點m,那么m就是n的支配點。而距離n最近的支配點被稱作立即支配點。以r為樹根,將所有立即支配點按照支配關系連接起來就形成了支配樹。立即后支配點是從一個點n出發所有到終止節點的路徑中通過的最近節點,形成的支配樹是后支配樹。

在DAG中,對于一個點,所有能到達它的點在支配樹中的LCA,就是它支配樹中的父親。為什么算符融合要建立在后支配樹的基礎上呢?我猜測可能是因為對于兩個可融合算符在DAG中位置分為兩種,一種是父子關系,那么可以直接執行算符融合算法;另外一種是它們之間是后支配關系。對于具有后支配關系的兩個節點(n->m),就要判斷未來路徑上的節點是否都能夠和點m發生融合,如果可以,那么n也可以和m發生融合。比如下圖:

o4YBAGAJ2XyAGjlUAAAaksTA-qU713.png

Conv2d要和elemwise add融合,必須判斷它的三個op是否能和elemwise add融合。

TVM中融合流程分為三步:

1 遍歷relay樹,建立DAG用于后支配樹分析;

2 建立后支配樹;

3 應用算符融合算法。

一 建立DAG圖

算符融合代碼在src/relay/transforms/fuse_ops.cc中。其中算符融合也應用在常量折疊中。

首先TVM中通過如下代碼來遍歷relay樹結構并建立DAG圖。

pIYBAGAJ2buADAxoAACiH4i61bc319.png

o4YBAGAJ2hCAXqd5AAKMwZogBVY140.png

VisitExpr可以遞歸的調用在類IndexedforwardGraph中定義的VisitExpr_函數,通過深度優先搜索遍歷relay樹,并且建立DAG圖。深度優先搜索是從exit節點作為根節點反向搜鎖的,因此搜索樹是一個后序搜索樹。Outputs中保存了一個節點的輸入的邊,在構建后序支配樹會通過這些輸入邊求取LCA。那么在這個搜索樹基礎上應用支配樹算法,就能夠得到一個后序支配樹了。在這個類中針對不同節點類型重寫visitExpr_函數,節點類型有FunctionNode,ConstantNode, CallNode, TuppleNode等。我們來看CallNode的訪問函數定義:

pIYBAGAJ2lmARVsVAAbKmwPUr8I233.png

在最后還會遞歸調用ExprVisitor::VisitExpr_函數,最終將深度優先搜索到的節點按照葉節點起始順序一次加入DAG圖中。只有ConstantNode的訪問函數中不再調用VisitExpr_,因為常量節點應該不存在葉節點了。在callNode中會將其輸入加入到DAG中,同時遍歷和輸入以及其op連接的節點,ExprVisitor中對CallNode訪問函數定義為:

o4YBAGAJ2peAYpq5AACTWGic2PA585.png

因為ExprVisitor是被IndexForwardGraph繼承的,而VisitExpr_是虛擬函數,this就會指向IndexForwardGraph實例,最終就會調用這個類中定義的VisitExpr_函數,實現遞歸的遍歷relay樹。

這里要關注一下OpPatternKind,它定義了算子類型,是不同融合算法使用的依據。其定義在include/tvm/relay/op_attr_types.h文件中。

pIYBAGAJ2tuAdZhAAAHp6B7gjc0360.png

二 建立后序支配樹

接下來看后序支配樹的構建。構建函數是PostDom。因為根節點(DAG圖的出口)在post_dfs_order中最后,所以從根節點開始尋找每個節點出點的LCA,這個LCA就是后序支配點。

o4YBAGAJ2xqAM6QfAADdIrgDoKQ847.png

GetNode函數是獲得支配點,構建支配樹。在GetNode中,首先初始化根節點,然后求每個節點的輸入節點的LCA,即是這個節點的支配點。

pIYBAGAJ21mAScbsAAEpUSdPj2c136.png

LeastComonAncestor函數中主要代碼是:

pIYBAGAJ25mABK65AAF2UY5KmQs700.png

通過兩兩求節點的LCA,來求取所有節點的LCA。程序會將計算圖中的末節點深度設置為1。然后向上逐層增加,那么LCA的共同祖先是相同的,深度也一定是一致。遍歷所有的節點,就得到一個后向支配樹。節點的pattern指向他的LCA。在計算支配點的pattern的時候,會依據pattern的定義,選擇pattern值最大的作為LCA的pattern。這塊不是太深入理解??赡苁瞧涠x的從最小值到最大值pattern可以向下進行融合,比如kElemWise=0, kInjective=2, 那么前者就能融合到KInjective中。

三 融合

完成了DAG和postDominator tree構建后,就開始融合操作。TVM中定義了group結構體,用于表示融合后的圖結構。Group結構體如下:

pIYBAGAJ29eAK44AAAEOJLVDA3c904.png

如果某些算符可以融合,那么就通過這個結構體中的parent,master_ref將這些節點建立連接關系。Group首先進行初始化和DAG相同的圖。然后分別遍歷dag,postDominator tree,以及group圖中節點,來判斷算符是否能被融合。Dag中和postDom中對應相同index的節點分別是被支配點和支配點。主要融合函數是以下兩個函數:

pIYBAGAJ3BaAGxgUAAD5TKkTU2I760.png

pIYBAGAJ3F2ATjJUAAPdJjrvDa0392.png

在runFuse中,有幾種情況是不進行算符融合的:

1 算符類型是Kopaque的。

2 該節點不存在支配點。

3 能夠融合的節點超過了一定數量。

融合操作算法基本上是考察當前節點到其支配點所有路徑上的節點是否都符合融合規則,如果符合就進行融合,不符合就不融合。函數CheckPath就是用于考察src到sink路徑是否能夠融合的。

融合分成了三個phase,每個phase處理不同可融合類型。這里我沒有深入研究。當判斷支配樹的前后節點可以融合后,就通過函數commitFuse執行融合操作。

完成融合之后,會遍歷節點創建新的graph。

審核編輯:何安

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • TVM
    TVM
    +關注

    關注

    0

    文章

    19

    瀏覽量

    3663
收藏 人收藏

    評論

    相關推薦

    DAC61404 SPI應該是四種模式中的哪種?

    DAC61404 SPI應該是四種模式中的哪種?
    發表于 11-27 06:18

    雙軸測徑儀的四種樣式!

    儀設計了四種外觀樣式。 45°角布置的開口測徑儀 這個樣式的雙軸測徑儀是目前大部分產線所使用的,樣式簡單大氣。用于外徑及橢圓度尺寸的檢測。 45°角布置的閉口測徑儀 該樣式的雙軸測徑儀將上面的開口閉合
    發表于 08-27 17:42

    濾波電路的四種類型是什么

    濾波電路是電子電路中非常重要的一部分,它主要用于對信號進行頻率選擇,即允許特定頻率范圍內的信號通過,而阻止其他頻率的信號。濾波電路根據其特性可以分為四種基本類型:低通濾波器(Low-Pass
    的頭像 發表于 08-08 16:25 ?2702次閱讀

    負反饋的四種類型是什么

    負反饋是電子系統中常用的一技術,它通過將系統輸出的一部分信號以某種方式反饋到輸入端,以減小輸出信號與期望信號之間的差異,從而提高系統的穩定性和性能。負反饋主要分為四種類型:電壓串聯負反饋、電壓并聯負反饋、電流串聯負反饋和電流并聯負反饋。
    的頭像 發表于 08-08 16:15 ?3914次閱讀

    負反饋的四種類型及判斷方法

    負反饋,又稱為負反饋調節,是指在一個系統中,當系統輸出的某些變化對輸入產生抑制作用時,系統會自動調節以維持穩定狀態的現象。負反饋在生物、工程、經濟等多個領域都有廣泛的應用。本文將介紹負反饋的四種
    的頭像 發表于 08-02 11:01 ?2384次閱讀

    簡述四種基本觸發器及其功能

    在數字電路設計中,觸發器是一基本且重要的存儲元件,用于存儲二進制信息(即0和1)。根據功能和應用場景的不同,觸發器可以分為多種類型,其中四種基本觸發器包括RS觸發器、JK觸發器、D觸發器和T觸發器。以下是對這四種基本觸發器及其
    的頭像 發表于 07-27 14:59 ?9857次閱讀

    元器件的包裝方式及常見的四種方式

    四種元件包裝方式在實際生產和使用中廣泛應用,不同的包裝方式適用于不同類型和規格的元件,并且可以根據具體要求進行定制化的包裝設計。不同的包裝方式也可以影響元件的存儲、運輸和使用,選擇適合的包裝方式對于保護元件質量和提高生產效率具有重要意義。
    的頭像 發表于 06-27 12:58 ?1590次閱讀

    介紹MCUboot支持的四種升級模式(2)

    介紹MCUboot支持的四種升級模式,分別是Overwrite、Swap、Direct XIP和加載到RAM中執行。由于FSP不支持第四種——加載到RAM中執行,因為我們重點介紹前三。
    的頭像 發表于 06-13 10:56 ?936次閱讀
    介紹MCUboot支持的<b class='flag-5'>四種</b>升級模式(2)

    電氣設備的狀態有哪四種

    電氣設備的狀態可以分為四種:正常狀態、異常狀態、故障狀態和緊急狀態。這四種狀態涵蓋了電氣設備在運行過程中可能遇到的各種情況。本文將詳細分析這四種狀態的特點、原因、影響以及相應的處理措施。 一、正常
    的頭像 發表于 06-05 16:47 ?4469次閱讀

    四種電源防接反電路

    防反接電路用于防止電子元器件因正負極接反而燒毀。常見的防反接電路有四種:二極管串聯、整流橋、NMOS和PMOS。二極管串聯利用二極管的單向導電性,整流橋則能正反接都導通但會消耗電能。NMOS和PMOS的防反接電路設計則通過控制電流路徑來實現正負極的保護。
    發表于 05-22 16:19

    如何理解IGBT的四種SOA?

    如何理解IGBT的四種SOA? IGBT的四種SOA表示了IGBT器件在不同工作狀態下的安全操作區域。這四種SOA是:Continuous SOA、Limited SOA、Pulse SOA
    的頭像 發表于 02-18 11:04 ?1090次閱讀

    四種編程語言之間的區別和聯系

    編程語言是一人與計算機之間進行交流的方式,不同的編程語言有著不同的特點和用途。本文將對四種常見的編程語言——Python、Java、C++和JavaScript進行比較,分析它們的區別和聯系。 一
    的頭像 發表于 02-05 14:16 ?1576次閱讀

    A/D轉換的四種誤差

    針對A/D轉換中可能出現的誤差,主要分為以下四種情況,漂移誤差、線型比例誤差、非線性誤差、非單調性誤差。還有那些能夠引起AD轉換出現比較大的誤差類別? 先說AD轉換是怎么取值的,假設輸入信號0-3V
    發表于 01-30 14:19

    淺析電子負載常見的的四種工作模式

    淺析電子負載常見的的四種工作模式 電子負載是電子設備的一,用于模擬負載并測試電源的性能。它在電子行業和電力領域有廣泛的應用。電子負載常見的四種工作模式是恒阻模式、恒流模式、恒壓模式和恒功率模式
    的頭像 發表于 01-22 13:43 ?2759次閱讀

    電子負載的四種功能實現原理

    電子負載的四種功能實現原理? 電子負載是一用于模擬負載、測試和評估電源、電池和其他電子設備的工具。它可以模擬電子負載的特性,并能夠提供不同的負載條件。電子負載主要通過四種功能來實現:恒流負載、恒阻
    的頭像 發表于 01-18 14:13 ?2702次閱讀
    主站蜘蛛池模板: 亚洲高清毛片| 三级黄色在线观看| 全黄h全肉边做边吃奶在线观看| 激情婷婷网| 美女福利在线观看| 丁香六月婷婷七月激情| 久久天天躁狠狠躁夜夜不卡| 免费伦费一区二区三区四区| 在线观看色视频| 久久久免费精品视频| 天天在线天天综合网色| 亚洲一区二区三区免费视频| 日韩美女奶水喂男人在线观看| 51成人网| 888米奇在线视频四色| 三级不卡| 天天摸天天操天天射| 免费在线一区二区三区| 日本三级三级三级免费看| 51成人网| 性8sex亚洲区入口| 亚洲最大成人网色| 久久成人综合| 天天综合在线视频| 视频一区二区在线播放| 咪咪爱毛片| 好吊色视频988gao在线观看| 一个人看aaaa免费中文| 国产黄页| 亚洲 午夜在线一区| 美女三级在线| jizjizjizjiz日本护士出水| 上海一级毛片| 日韩 ed2k| 亚洲特级aaaaaa毛片| 真实一级一级一片免费视频| 日本口工福利漫画无遮挡| 九色综合伊人久久富二代| 521色香蕉网在线观看免费| 日本人的色道免费网站| 黄黄网|