在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

編譯器優化那些事兒之區域分析

冬至子 ? 來源:畢昇編譯 ? 作者:辛迎林 ? 2023-06-07 11:36 ? 次閱讀

1、概念介紹

為了有效地優化代碼,編譯器需要在程序的各個節點建立并求解與信息有關的方程來收集數據流信息,并將這些信息分發給流程圖的每個塊,這個過程被稱為數據流分析。

通過檢查程序的一部分(基本程序塊),編譯器可以執行一些優化。如下圖所示:

image.png

  • 在此程序中, d1是無用的,d1中x的值永遠不會在程序中被使用;
  • 在編譯時,d2中的表達式(1 + 2)將被計算;

所以該基本程序塊可以被優化為:x = 3。

但是有一些優化必須通過檢查整個程序來實現。如下圖所示:

image.png

從圖中可以看出:d3對c的初始化賦值是無用的,x的值恒定為6,d6可以簡化為:c = 7。

從上面這個例子可以看出,僅通過一兩個連續語句,編譯器無法發現這些優化信息。必須通過更加全面的數據流分析,以便編譯器在程序的每個節點都了解以下內容:

  • 保證哪些變量具有恒定值
  • 重新定義之前將使用哪些變量

這篇文章將會介紹一種數據流分析方法——區域分析,在正式開始之前,我們先來了解幾個概念:

  • 嚴格支配:如果不首先通過x就不可能到達w,則稱x嚴格支配w。
  • 支配:如果x嚴格支配w或x=w,則稱x支配w。

以下圖為例,如果想要到達2、3或4,必須要先通過1,所以在{1,2,3,4}集合中1占支配地位,1嚴格支配集合{2,3,4}。

image.png

流圖的區域是節點N和控制流邊E的集合,必須滿足以下條件:

  • N中存在一個節點頭h,它支配了N中的所有節點。
  • 如果存在節點m可以在不經過節點頭h的情況下到達N中的節點n,則m也必然在N中。
  • E是N中節點之間所有控制流邊的集合,進入h的循環邊可以不包含在內。

以下圖為例,節點B1、B2、B3和B4都可以單獨看做一個區域(圖(a));節點B1和B2以及邊B1->B2和循環邊B2->B1組成的循環也是一個區域(圖(b));根據區域的第三個條件,循環邊可以不包含在區域內,所以節點B1和B2以及邊B1->B2也可以形成一個區域(圖(c))。

image.png

然而,圖(d)中節點B3、B4以及邊B3->B4組成的子圖(虛線部分)不形成區域,因為控制流既可以通過節點B3處進入子圖,也可以通過節點B4進入子圖。B3和B4都無法做到完全支配另一個,不符合區域的第一個條件。即使我們選擇B3作為頭h,也不符合區域的第二個條件。因為B1可以不經過B3,沿著邊B1->B4到達B4,根據區域的第二個條件,B1應該在該“區域”中,但這顯然不正確。

2、區域分析的基本思想

  • 對于每個區域R,以及R中的每個子區域R',我們計算一個傳遞函數,該函數總結了從區域R開始到基本塊B結束執行所有可能路徑的效果。
  • 如果基本塊B是區域R的出口塊(即區域R內的基本塊B有到R外的某個塊的傳出邊),計算區域R的每個出口塊B的傳遞函數就是計算從區域R的入口通向B過程中,執行所有可能路徑的效果,即整個區域R的傳遞函數。
  • 從單個基本塊組成的區域開始,逐步構造更大的區域,計算更大區域的傳遞函數。
  • 在構造更大的上層區域時,如果區域R的邊在R的上層區域上形成一個非循環流圖。我們可以繼續按上層區域的拓撲順序計算傳遞函數。
  • 如果R是一個循環區域,那么我們只需要考慮循環邊對R入口節點的影響。
  • 直到整個程序組成一個區域,并計算整個程序組成的區域P的傳遞函數,若入口節點處的初始值為V,則:

image.png

3、傳遞函數

在一個語句之前和之后的數據流值受該語句的語義約束,即語句前后的程序點的數據流值受該語句語義的約束,這種約束關系稱為傳遞函數。基本塊的傳遞函數表示為(以下都以Reaching Definitions 為例):F(x) = Gen U (x - Kill)

image.png

其中,x表示基本塊B的輸入;F(x)表示基本塊B的輸出;kill表示被基本塊B中各語句殺死的變量的集合;Gen表示基本塊中沒有被各語句殺死的定值的集合。

image.png

上圖顯示了流圖中各基本塊的Gen和Kill集合。以基本塊B1為例,該基本塊有三條語句:

  • d1: i = f-1,“生成”了一個對變量i的賦值d1,并“殺死”了程序中其它對i的賦值,即d4和d7;
  • d2: j = n,“生成”了一個對變量j的賦值d2,并“殺死”了程序中其它對j的賦值,即d5;
  • d3: a = u1,“生成”了一個對變量a的賦值d3,并“殺死”了程序中其它對a的賦值,即d6。

所以基本塊B1的Gen為{d1,d2,d3},kill為{d4,d5,d6,d7}。

對于區域分析,構造更大的區域實際上就是更新了Gen和Kill集合的值。

4、關于傳遞函數的必要假設

為了使區域分析發揮作用,我們需要對區域中傳遞函數集的屬性做出某些假設。具體來說,我們需要對傳遞函數進行三個基本操作: 組合匯聚閉包

4.1 組合(composition)

節點序列的傳遞函數可以通過各個節點的傳遞函數的組合來導出。設F1和F2是兩個節點的傳遞函數,執行F1后執行F2的效果用F2(F1(x))表示:

image.png

4.2 匯聚(meet)

匯聚用于導出執行路徑不同,但輸入端點與輸出端點相同的節點。一般用F1(x)∧F2(x)表示:

image.png

4.3 閉包(closure)

如果F表示循環的傳遞函數,那么Fn表示循環n次的效果。在迭代次數未知的情況下,我們必須假設循環可以執行0次或多次。我們用F*(x)表示這樣一個循環的傳遞函數,則F的閉包如下圖所示:

image.png

5、處理可簡化流圖

可簡化流圖是指那些可以通過以下兩個規則轉換簡化為單個節點的流圖:

  • T1:刪除循環。如果n是具有循環的節點,即邊n->n,刪除該邊(n的所有此類邊)。

image.png

如上圖所示:R是執行T1規則后形成的新區域,原區域n的頭結點H也是新區域R的頭結點,n中H到每一個基本塊B的傳遞函數為Fn,B,則在新區域R中的傳遞函數為:

image.png

  • T2:刪除頂點

    如果有一個節點n具有唯一的前置節點m,則將m和n合并[2]。

image.png

如上圖所示:R是執行T2規則后形成的新區域,對于n中的基本塊B,傳遞函數未改變(FR,B = Fn,B);對于m中的基本塊:

image.png

為了構建區域的層次結構,我們需要識別循環。在可簡化流圖中(這里,我們假設流程圖都是可簡化的),任何兩個循環要么是不相交的,要么一個嵌套在另一個循環中。可簡化流圖解析到循環層次結構時,先將每個基本塊本身作為一個區域。我們將這些區域稱為葉區域。然后,從里到外排序循環,即從最里面的循環開始。處理循環時,我們通過兩個步驟將整個循環替換為一個節點:

  1. 將循環L的主體(除報頭的循環邊外的所有節點和邊)替換為代表區域R的節點。L報頭的邊現在并入R的節點。循環L的任何出口的邊被R到同一目的節點的邊替換。但是,如果控制流邊是循環邊,那么它就會成為R上的循環邊。我們稱R為主體區域。
  2. 構造一個代表整個循環L的區域R'。我們可以把R'稱作循環區域。R和R'之間唯一的區別是,后者包括循環L的循環邊。換句話說,當R'替換流圖中的R時,我們所要做的就是將R的循環邊刪除[3]。

通過重復上述操作,我們可以逐漸將大的循環減少到單個節點。由于可簡化流圖的循環是嵌套的或不相交的,因此循環區域的節點可以表示在此簡化過程中構建的一系列流圖中循環的所有節點。

最終,所有循環都被簡化為單個節點。此時,流程圖有兩種情況:一是簡化為單個節點;二是有幾個節點剩余,具有HO循環(即,簡化的流圖是多個節點的非循環圖)。在前一種情況下,我們完成了區域層次結構的構建,而在后一種情況下,我們為整個流圖再次構建出一個主體區域。

以下圖為例,圖(a)為控制流圖。此流程圖中有一個循環邊(B4->B2)。區域的層次結構如圖(b)所示,共有8個區域:

image.png

  • 區域R1-R5分別代表塊B1-B5的葉區域。每個塊也是其區域中的出口塊。
  • 區域R6表示流圖中唯一循環的主體;它包含區域R2、R3和R4以及三個區域間控制流邊R2->R3、R2->R4和R3->R4。它有R3和R4兩個出口塊,因為它們都有不包含在區域中的輸出邊。圖(c)顯示了R6簡化為單個節點的流程圖。請注意,邊R3->R5和R4->R5都被邊R6->R5取代。因為從R3和R4兩個區域的輸出都將到達到達R5的輸入,因此簡化后用一條邊代表之前兩條邊。
  • 循環區域R7代表整個循環。它包括一個子區域R6和一個循環邊R4->R2。它還有兩個出口節點,也就是R3和R4。圖(d)顯示了整個循環簡化到R7后的流程圖。
  • 最后,主體區域R8是頂部區域。它包括三個區域,R1、R7、R5和三個區域間控制流邊R1->R2、R3->R5和R4->R5。當我們將流程圖縮小到R8時,它將成為一個單一節點。由于其頭B1沒有循環邊,因此不需要將此主體區域減少為循環區域。

6、處理不可簡化流圖

對于不可簡化流圖,我們建議使用迭代數據流分析算法來進行數據流分析。但是如果只是偶爾處理不可簡化流圖的話,可以使用節點分裂方法進行分析。

下面圖(a)就是一個典型的不可簡化流圖。R2和R3之間存在循環,但R2和R3又都不占支配地位,導致我們無法進一步解析該圖。我們選擇一些區域R(如R2),該區域R具有多個前置節點(R2的前置節點為R1和R3),并且不是整個流圖的頭。如果有k個前置節點,則制作流圖R的k個副本,并將每個前置節點連接到R的不同副本。這里需要注意,只有區域的頭才可能有該區域之外的前置節點。在識別新的循環邊并構建其區域后,這種節點分裂使得區域數量減少。由此產生的流圖可能仍然不可簡化,但通過分裂階與新的循環被識別并折疊到區域的階段交替使用,我們最終只剩下一個區域,即流圖已經被約化。

圖(b)中所示的分裂將邊R2b->R3變成了循環邊,此時R3支配R2b,這兩個區域可以合并為一個新區域。由此產生的三個區域(R1、R2a和新區域)形成一個非循環圖。此時,我們可以將整個流程圖簡化為單個區域。一般來說,可能需要額外的拆分,在最壞的情況下,基本塊的總數可能會成為原始流圖中塊數的指數。

image.png

總結

本文簡單介紹了一種解決數據流問題的方法——區域分析。在區域分析過程中,我們首先為基本塊創建傳遞函數,然后通過組合、匯聚和閉包等操作總結加大區域的傳遞函數,最終構造出整個數據流圖的傳遞函數。通過區域分析等數據分析的方法,可以發現更多的優化機會,如將代碼從循環內部移動到循環外部、冗余的代碼刪除等。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 編譯器
    +關注

    關注

    1

    文章

    1642

    瀏覽量

    49231
  • 數據流
    +關注

    關注

    0

    文章

    121

    瀏覽量

    14395
收藏 人收藏

    評論

    相關推薦

    編譯器優化那些事兒(6):別名分析概述

    指向哪些對象或者指向哪些地址,而別名分析解決的是兩個指針指向的是否是同一個對象。指針分析和別名分析通常通過靜態代碼分析來實現。別名分析
    發表于 09-15 14:09

    編譯器_keil的優化選項問題

    keil編譯器優化選項針對ARM,對STM32編譯的一些優化的問題
    發表于 02-25 14:18 ?3次下載

    Linux的那些事兒我是Sysfs

    Linux的那些事兒我是Sysfs
    發表于 10-29 09:28 ?5次下載
    Linux的<b class='flag-5'>那些</b><b class='flag-5'>事兒</b><b class='flag-5'>之</b>我是Sysfs

    Linux的那些事兒我是SCSI硬盤

    Linux的那些事兒我是SCSI硬盤
    發表于 10-29 09:32 ?19次下載
    Linux的<b class='flag-5'>那些</b><b class='flag-5'>事兒</b><b class='flag-5'>之</b>我是SCSI硬盤

    Linux的那些事兒我是PCI

    Linux的那些事兒我是PCI
    發表于 10-29 09:35 ?10次下載
    Linux的<b class='flag-5'>那些</b><b class='flag-5'>事兒</b><b class='flag-5'>之</b>我是PCI

    Linux的那些事兒我是Hub

    Linux的那些事兒我是Hub
    發表于 10-29 09:37 ?7次下載
    Linux的<b class='flag-5'>那些</b><b class='flag-5'>事兒</b><b class='flag-5'>之</b>我是Hub

    Linux的那些事兒我是EHCI主機控制

    Linux的那些事兒我是EHCI主機控制
    發表于 10-29 09:40 ?3次下載
    Linux的<b class='flag-5'>那些</b><b class='flag-5'>事兒</b><b class='flag-5'>之</b>我是EHCI主機控制<b class='flag-5'>器</b>

    Linux的那些事兒我是Block層

    Linux的那些事兒我是Block層
    發表于 10-29 09:43 ?9次下載
    Linux的<b class='flag-5'>那些</b><b class='flag-5'>事兒</b><b class='flag-5'>之</b>我是Block層

    編譯器優化對函數的影響

    編譯器如gcc,可以指定不同的優化參數,在某些條件下,有些函數可能會被優化掉。
    的頭像 發表于 06-22 14:58 ?2863次閱讀
    <b class='flag-5'>編譯器</b><b class='flag-5'>優化</b>對函數的影響

    深度學習編譯器Layerout Transform優化

    繼續深度學習編譯器優化工作解讀,本篇文章要介紹的是OneFlow系統中如何基于MLIR實現Layerout Transform。
    的頭像 發表于 05-18 17:32 ?797次閱讀

    編譯器優化那些事兒:別名分析概述

    別名分析編譯器理論中的一種技術,用于確定存儲位置是否可以以多種方式訪問。如果兩個指針指向相同的位置,則稱這兩個指針為別名。
    的頭像 發表于 05-24 16:16 ?593次閱讀
    <b class='flag-5'>編譯器</b><b class='flag-5'>優化</b><b class='flag-5'>那些</b><b class='flag-5'>事兒</b>:別名<b class='flag-5'>分析</b>概述

    編譯器優化選項

    一個程序首先要保證正確性,在保證正確性的基礎上,性能也是一個重要的考量。要編寫高性能的程序,第一,必須選擇合適的算法和數據結構;第二,應該編寫編譯器能夠有效優化以轉換成高效可執行代碼的源代碼,要做到
    的頭像 發表于 11-24 15:37 ?944次閱讀
    <b class='flag-5'>編譯器</b>的<b class='flag-5'>優化</b>選項

    Triton編譯器與其他編譯器的比較

    Triton編譯器與其他編譯器的比較主要體現在以下幾個方面: 一、定位與目標 Triton編譯器 : 定位:專注于深度學習中最核心、最耗時的張量運算的優化。 目標:提供一個高度抽象、靈
    的頭像 發表于 12-24 17:25 ?446次閱讀

    Triton編譯器的優勢與劣勢分析

    Triton編譯器作為一種新興的深度學習編譯器,具有一系列顯著的優勢,同時也存在一些潛在的劣勢。以下是對Triton編譯器優勢與劣勢的分析: 優勢 高效性能
    的頭像 發表于 12-25 09:07 ?330次閱讀

    Triton編譯器優化技巧

    在現代計算環境中,編譯器的性能對于軟件的運行效率至關重要。Triton 編譯器作為一個先進的編譯器框架,提供了一系列的優化技術,以確保生成的代碼既高效又適應不同的硬件架構。 1. 指令
    的頭像 發表于 12-25 09:09 ?314次閱讀
    主站蜘蛛池模板: 欧美线人一区二区三区| 日本二区免费一片黄2019| 中文字幕视频二区| 亚洲一区二区视频在线观看| 分分精品| 国产1区二区| 国产一区二区三区四卡| 国产主播在线看| 97色在线| 手机在线你懂得| 国产女同视频| 韩国xxxxxxxx69| aaaaa国产毛片| 五月婷婷六月合| 欧美色网络| 国产精品一一在线观看| 午夜亚洲精品| 国产人人爱| 日本不卡在线观看| 午夜三级毛片| 男人的天堂在线精品视频| 国产精品三级在线播放| 天天射天天爱天天干| 成年人午夜影院| 日本一区不卡在线观看| 五月婷婷综合激情| 免费看三级黄色片| 白丝丝袜高跟国产在线视频| 日在线视频| 在线免费亚洲| 亚洲精品福利网站| 猛操网| 国产精品不卡片视频免费观看| 123综合网在线| 国产在视频线精品视频2021| 亚洲欧美在线一区| 亚洲成a人片777777久久| 毛片毛片免费看| 天天操夜夜操视频| 亚洲色图综合图片| 日韩成人免费一级毛片|