在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

加法網絡再突破—NeurIPS 2020 Spotlight

電子設計 ? 來源:電子設計 ? 作者:電子設計 ? 2020-12-08 22:11 ? 次閱讀
華為諾亞方舟實驗室聯合悉尼大學發布論文《Kernel Based Progressive Distillation for Adder Neural Networks》,提出了針對加法神經網絡的蒸餾技術,ResNet-34和ResNet-50網絡在ImageNet上分別達到了68.8%和76.8%的準確率,效果與相同結構的CNN相比持平或超越,該論文已被NeurIPS2020接收。

開源鏈接:
huawei-noah/AdderNet?github.com
論文鏈接:
https://arxiv.org/pdf/2009.13044.pdf?arxiv.org

研究背景

深度卷積神經網絡(CNN)被廣泛應用于諸多計算機視覺領域的實際任務中(例如,圖片分類、物體檢測、語義分割等)。然而,為了保證性能,神經網絡通常是過參數化的,因此會存在大量的冗余參數。近期提出的加法神經網絡(ANN),通過將卷積操作中的距離度量函數替換為L1距離,極大減少了神經網絡中的乘法操作,從而減少了網絡運行所需的功耗和芯片面積。
然而,ANN在準確率方面和同結構的CNN相比仍然有一定差距,在某種程度上限制了ANN在實際應用中對CNN的替換。為了提高ANN的性能,我們提出了一種基于核的漸進蒸餾方法。具體的,我們發現一個訓練好的ANN網絡其參數通常服從拉普拉斯分布,而一個訓練好的CNN網絡其參數通常服從高斯分布。因此,我們對網絡中間層的特征圖輸出進行核變換后,使用距離度量函數估計教師網絡(CNN)和學生網絡(ANN)之間的損失。對于最后一層,我們使用傳統的KL散度估計兩個網絡之間的損失。同時,在訓練中我們使用隨機初始化的教師網絡,與學生網絡同時訓練,以減少兩個網絡之間參數分布的差異性。
實驗表明,我們的算法得到的ANN能夠在CIFAR-10,CIFAR-100,ImageNet等標準圖片分類數據集上達到或超越同結構CNN的準確率。
對網絡中間層特征圖輸出進行核變換
ANN本身精度不好的原因是原始ANN在反向傳播時,使用的是近似的梯度,導致目標函數無法向著最小的方向移動。傳統KD方法應用到ANN上效果不佳的原因,在于ANN的權重分布是拉普拉斯分布,而CNN的權重分布為高斯分布,因此分布不同導致無法直接對中間層的feature map使用KD方法。本方法首先將核變換作用于教師網絡和學生網絡的中間層輸出,并使用1x1卷積對新的輸出進行配準。之后,結合最后一層的蒸餾損失與分類損失,得到整體的損失函數。

漸進式蒸餾算法
傳統的蒸餾方法使用固定的,訓練好的教師網絡來教學生網絡。這樣做會帶來問題。由于教師網絡和學生網絡處于不同的訓練階段,因此他們的分布會因為訓練階段的不同而不同,所以會導致KD方法效果不好。因此我們采用漸進式蒸餾方法,讓教師網絡和學生網絡共同學習,有助于KD方法得到好的結果。即目標函數變為:

其中b為當前的step。
實驗結果
我們在CIFAR-10、CIFAR-100、ImageNet三個數據集上分別進行了實驗。
下表是在CIFAR-10和CIFAR-100數據集上的結果,我們使用了VGG-small、ResNet-20與ResNet-32作為教師網絡,同結構的ANN作為學生網絡。可以看到,使用了本方法得到的ANN在分類準確率上相比原始的ANN有大幅度的提升,并且能夠超過同結構的CNN模型。表格中#Mul表示網絡中乘法操作的次數。#Add表示加法操作次數,#XNOR表示同或操作的次數。

下表展示了在ImageNet數據集上的結果,我們使用ResNet-18與ResNet-50網絡作為教師網絡,同結構的ANN作為學生網絡。結果顯示我們的方法得到的ANN在分類準確率上相比同結構CNN基本相同或能夠超越。

最后,我們展示了ResNet-20,ANN-20與通過本方法得到的PKKD ANN-20模型在CIFAR-10與CIFAR-100數據集上的訓練精度曲線與測試精度曲線。

圖中的實線表示訓練精度,虛線表示測試精度。在兩個數據集中,CNN的訓練和測試準確率都超過了原始的ANN模型。這是因為在訓練原始ANN時,反向傳播的梯度使用的是L2 norm來近似,因此梯度方向是不準確的。當使用本方法后,CNN的訓練過程可以指導ANN的訓練,因此可以得到更好的結果。同時,知識蒸餾方法能夠幫助學生網絡防止過擬合,這也是我們的方法有最低的訓練精度和最高的測試精度的原因。



推薦閱讀



文章首發知乎,更多深度模型壓縮相關的文章請關注深度學習壓縮模型論文專欄

審核編輯:符乾江

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 計算機視覺
    +關注

    關注

    8

    文章

    1698

    瀏覽量

    46032
  • 深度學習
    +關注

    關注

    73

    文章

    5507

    瀏覽量

    121294
收藏 人收藏

    評論

    相關推薦

    螞蟻數科與浙大團隊榮獲NeurIPS競賽冠軍

    近日,在機器學習領域的頂級國際會議NeurIPS的特設競賽中,螞蟻數科旗下的摩斯聯合浙江大學計算機體系結構實驗室陳文智、魏成坤團隊組成的“Morse ARCLab”參賽隊伍憑借出色的表現,成功在激烈的競爭中脫穎而出,為中國AI技術的發展貢獻了重要力量。
    的頭像 發表于 11-26 10:27 ?257次閱讀

    加法運放電路實驗報告數據分析

    加法運放電路實驗報告的數據分析主要包括對實驗結果的觀察、與理論值的對比以及誤差原因的分析。以下是一個基于常見加法運放電路實驗的數據分析示例: 一、實驗目的與原理 實驗目的 :了解加法器的模擬實現方法
    的頭像 發表于 09-03 10:03 ?943次閱讀

    加法運放電路輸出電壓是多少

    負反饋配置下能夠非常精確地控制其輸出電壓。 加法運放電路的基本形式是將多個輸入信號通過電阻網絡連接到運算放大器的反相輸入端(通常也會有一個反饋電阻從輸出連接到反相輸入端以形成負反饋),而運算放大器的非反相輸入端則接地
    的頭像 發表于 09-03 09:50 ?567次閱讀
    <b class='flag-5'>加法</b>運放電路輸出電壓是多少

    加法器是時序邏輯電路嗎

    加法器不是時序邏輯電路 ,而是組合邏輯電路的一種。時序邏輯電路和組合邏輯電路的主要區別在于它們如何處理輸出信號。 組合邏輯電路的輸出僅依賴于當前的輸入信號,而不依賴于電路之前的狀態或輸入歷史。這
    的頭像 發表于 08-28 11:05 ?646次閱讀

    請問增益為1的加法器有哪些?

    增益為1的加法器指的是輸出信號的幅度與輸入信號幅度相等的加法器。這類加法器在模擬電路設計中非常重要,因為它們在執行加法運算的同時,不會改變信號的幅度。
    的頭像 發表于 05-23 15:10 ?1147次閱讀

    串行加法器和并行加法器的區別?

    串行加法器和并行加法器是兩種基本的數字電路設計,用于執行二進制數的加法運算。它們在設計哲學、性能特點以及應用場景上有著明顯的區別。
    的頭像 發表于 05-23 15:06 ?2754次閱讀

    加法器的原理是什么 加法器有什么作用

    加法器是數字電路中的基本組件之一,用于執行數值的加法運算。加法器的基本原理和作用可以從以下幾個方面進行詳細闡述。
    的頭像 發表于 05-23 15:01 ?3301次閱讀
    <b class='flag-5'>加法</b>器的原理是什么 <b class='flag-5'>加法</b>器有什么作用

    同相加法器和反相加法器的區別是什么

    同相加法器和反相加法器是運算放大器在模擬電路設計中常用的兩種基本電路結構,它們在信號處理方面有著不同的特性和應用場景。
    的頭像 發表于 05-23 14:35 ?2723次閱讀

    加法放大器的原理和應用

    加法放大器,作為一種重要的電子電路設備,其在信號處理、音頻混合、以及多種電子系統中發揮著關鍵作用。它基于放大器的線性特性,通過特定的電路設計,將多個輸入信號進行相加,并輸出放大后的信號。本文將對加法放大器的原理、特點、設計方法以及其在不同領域的應用進行詳細的闡述。
    的頭像 發表于 05-22 18:09 ?1791次閱讀

    加法器ICL7660M/TR芯片發熱問題?

    想做個加法器,經打板焊接,芯片焊接完還用萬用表檢測了,無短接,虛焊情況。輸入5V后,ICL7660電源極性反轉變換器芯片發熱。但是芯片輸入電壓極限值是10V,輸入5V芯片就發熱冒煙了。經檢查,芯片
    發表于 05-06 16:32

    FPGA加法截位處理方法介紹

    本模塊實現輸入與輸出位寬相同數據加法,并對結果進行四舍五入截位,對標matlab round函數。
    的頭像 發表于 04-18 16:53 ?814次閱讀

    加法運算電路和減法運算電路的區別

    加法運算的電路如下圖所示,輸出電壓為若干個輸入電壓的比例和
    的頭像 發表于 02-19 09:52 ?7677次閱讀
    <b class='flag-5'>加法</b>運算電路和減法運算電路的區別

    什么是反相加法運算電路?反相加法運算電路與減法運算電路

    在電子技術的海洋中,有一種電路如同數學中的加法器一樣,能夠將不同的信號進行相加處理。這就是被廣泛應用于信號處理領域的反相加法運算電路。
    的頭像 發表于 02-17 15:34 ?4831次閱讀
    什么是反相<b class='flag-5'>加法</b>運算電路?反相<b class='flag-5'>加法</b>運算電路與減法運算電路

    電路+公式,秒懂反相加法運算電路

    加法放大器的一般設計如以下電路所示。普通反相放大器電路在其反相輸入端只有一個電壓/輸入。如果更多輸入電壓如圖所示連接到反相輸入端子,則結果輸出將是所有施加的輸入電壓的總和,但是是反相的。
    發表于 02-15 11:16 ?1.4w次閱讀
    電路+公式,秒懂反相<b class='flag-5'>加法</b>運算電路

    反相加法運算電路原理介紹

    反相加法運算電路利用運算放大器(通常簡稱為Op-Amp)的特性來實現多個輸入信號的加法運算。每個輸入信號都通過一個電阻連接到運算放大器的反相輸入端,而運算放大器的同相輸入端則接地或虛擬接地。輸出電壓
    的頭像 發表于 01-31 15:53 ?4110次閱讀
    反相<b class='flag-5'>加法</b>運算電路原理介紹
    主站蜘蛛池模板: 最好看最新的中文字幕1| 99久久国产免费 - 99久久国产免费 | 国产亚洲情侣久久精品| 久操操| 91操碰| 一区二区影视| 免费观看做网站爱| 在线网址你懂的| 四虎影视亚洲精品| 在线capcom超级碰碰| 五月婷婷免费视频| 天堂国产| 免费国产在线视频| 国产色司机在线视频免费观看| freexxxx性欧美| 深夜久久| 在线网站黄色| 国产精品福利午夜在线观看| 456成人网| 亚洲黄网在线| 成年人啪啪网站| v视界影院最新网站| avbobo在线观看| 在线视频人人视频www| 色噜噜狠狠网站| 很黄很色的网站| 天天操欧美| 丁香激情小说| 亚洲 欧美 另类 吹潮| 亚洲成人观看| 欧美三级小视频| bt 电影天堂| 国内精品久久久久久久久野战| 中文字幕一区二区精品区| 亚洲色吧| 色婷婷综合久久久久中文一区二区| 男人的天堂网在线| 亚洲三级色| 视频在线视频免费观看| 张柏芝三级无删减在线观看| 青青导航|