欢乐颂第一季,豆豆小说阅读网,有声小说下载

圖 1 吳雙（左側(cè)）和李國(guó)齊（右側(cè)）- 被錄用文章的兩位作者

清華大學(xué)類腦計(jì)算研究中心博士生吳雙的論文被 ICLR2018 收錄并在會(huì)上做口頭報(bào)告。迄今為止，這是中國(guó)作為第一署名單位里唯一一篇被 ICLR 會(huì)議收錄的口頭報(bào)告文章。該報(bào)告主要探討如何實(shí)現(xiàn)對(duì)全離散化深度神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練和推理，便于部署到嵌入式設(shè)備中。

ICLR 是深度學(xué)習(xí)領(lǐng)域的頂會(huì)，更被譽(yù)為深度學(xué)習(xí)的“無冕之王”，得到了 google, Facebook, DeepMind, Amazon，IBM 等眾多高科技公司的高度關(guān)注和參與。ICLR2018 于當(dāng)?shù)貢r(shí)間 2018 年 4 月 30 日在加拿大溫哥華會(huì)展中心召開，為期 4 天。本次大會(huì)的主席是深度學(xué)習(xí)領(lǐng)域三巨頭中的 Yoshua Bengio（蒙特利爾大學(xué)）和 Yann LeCun （紐約大學(xué) & Facebook），本次大會(huì)收到一千多篇投稿文章，其中僅有 23 篇被收錄為本次會(huì)議的口頭報(bào)告文章。

吳雙同學(xué)的報(bào)告題目為 “Training and Inference with Integers in Deep Neural Networks”。

離散化架構(gòu) WAGE，訓(xùn)練推理合二為一

該報(bào)告主要探討如何實(shí)現(xiàn)對(duì)全離散化深度神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練和推理，便于部署到嵌入式設(shè)備中。

在深度學(xué)習(xí)領(lǐng)域，高精度意味著大面積、高功耗，從而導(dǎo)致高成本，這背離了嵌入式設(shè)備的需求，因此硬件加速器和神經(jīng)形態(tài)芯片往往采用低精度的硬件實(shí)現(xiàn)方式。在低精度的算法研究方面，之前的工作主要集中在對(duì)前向推理網(wǎng)絡(luò)的權(quán)重值和激活值的縮減，使之可以部署在硬件加速器和神經(jīng)形態(tài)芯片上；而網(wǎng)絡(luò)的訓(xùn)練還是借助于高精度浮點(diǎn)實(shí)現(xiàn)（GPU）。這種訓(xùn)練和推理的分離模式往往導(dǎo)致需要耗費(fèi)大量的額外精力，對(duì)訓(xùn)練好的浮點(diǎn)網(wǎng)絡(luò)進(jìn)行低精度轉(zhuǎn)換，這不僅嚴(yán)重影響了神經(jīng)網(wǎng)絡(luò)的應(yīng)用部署，更限制了在應(yīng)用端的在線改善。

為應(yīng)對(duì)這種情況，本文提出了一種聯(lián)合的離散化架構(gòu) WAGE，首次實(shí)現(xiàn)了將離散化神經(jīng)網(wǎng)絡(luò)的反向訓(xùn)練過程和前向推理合二為一。具體來說就是將網(wǎng)絡(luò)權(quán)重、激活值、反向誤差、權(quán)重梯度用全用低精度整形數(shù)表達(dá)，在網(wǎng)絡(luò)訓(xùn)練時(shí)去掉難以量化的操作及操作數(shù)（比如批歸一化等），從而實(shí)現(xiàn)整個(gè)訓(xùn)練流程全部用整數(shù)完成。

在數(shù)據(jù)集實(shí)測(cè)中，WAGE 的離散化方法能夠有效的提高測(cè)試精度。由于該方法能夠同時(shí)滿足深度學(xué)習(xí)加速器和神經(jīng)形態(tài)芯片的低功耗和反向訓(xùn)練需求，更使之具備高效地在線學(xué)習(xí)的能力，對(duì)未來多場(chǎng)景、多目標(biāo)的可遷移、可持續(xù)學(xué)習(xí)的人工智能應(yīng)用將大有裨益。

WAGE框架將訓(xùn)練和推理中的所有層中的權(quán)重（ weights ，W），激活值（ ac tivations ，A），梯度（ gradients ，G）和誤差（ errors ，E）限制為低位整數(shù)。首先，對(duì)于操作數(shù)，應(yīng)用線性映射和方向保持移位來實(shí)現(xiàn)三元權(quán)重，用于激活和梯度累加的8位整數(shù)。其次，對(duì)于操作，批歸一化由一個(gè)常數(shù)因子取代。用于微調(diào)的其他技術(shù)（如具有動(dòng)量和L2正則化的SGD優(yōu)化器）可以簡(jiǎn)化或放棄，性能的下降很小。考慮到整體雙向傳播，我們完全簡(jiǎn)化了累積比較周期的推理，并分別訓(xùn)練到具有對(duì)齊操作的低位乘法累加（MAC）周期。

所提出的框架在MNIST，CIFAR10，SVHN，ImageNet數(shù)據(jù)集上進(jìn)行評(píng)估。相對(duì)于只在推理時(shí)離散權(quán)重和激活的框架，WAGE具有可比的準(zhǔn)確性，并且可以進(jìn)一步減輕過擬合。WAGE為DNN生成純粹的雙向低精度整數(shù)數(shù)據(jù)流，可以將其用于專門硬件的訓(xùn)練和推理。我們?cè)贕itHub上發(fā)布了代碼。

圖1

圖2：WAGE的量化方法

實(shí)現(xiàn)細(xì)節(jié)

MNIST：采用LeNet-5的一個(gè)變體。WAGE中的學(xué)習(xí)率η在整個(gè)100個(gè)epochs中保持為1。我們報(bào)告了測(cè)試集上10次運(yùn)行的平均準(zhǔn)確度。

SVHN＆CIFAR10：錯(cuò)誤率的評(píng)估方式與MNIST相同。

ImageNet：使用AlexNe模型在ILSVRC12數(shù)據(jù)集上評(píng)估WAGE框架。

表1：WAGE及其他方法在多個(gè)數(shù)據(jù)集上的測(cè)試或驗(yàn)證錯(cuò)誤率（％）

圖3：訓(xùn)練曲線

結(jié)論和未來工作

這項(xiàng)工作的目標(biāo)是展示在DNN中應(yīng)用低位整數(shù)訓(xùn)練和推理的潛力。與FP16相比，8-bit整數(shù)運(yùn)算不僅會(huì)降低IC設(shè)計(jì)的能耗和面積成本（約5倍，見Table 5），還會(huì)減少訓(xùn)練期間內(nèi)存訪問成本和內(nèi)存大小要求，這將大大有利于具有現(xiàn)場(chǎng)學(xué)習(xí)能力的的移動(dòng)設(shè)備。這個(gè)工作中有一些沒有涉及到的點(diǎn)，未來的算法開發(fā)和硬件部署還有待改進(jìn)或解決。

表5

WAGE使DNN的純低位整數(shù)數(shù)據(jù)流進(jìn)行訓(xùn)練和推理得以實(shí)現(xiàn)。我們引入一種新的初始化方法和分層常數(shù)比例因子來取代批歸一化，這是網(wǎng)絡(luò)量化的一個(gè)難點(diǎn)。此外，還探討了誤差計(jì)算和梯度累積的位寬要求。實(shí)驗(yàn)表明，我們可以量化梯度的相對(duì)值，并且在反向傳播中丟棄大多數(shù)小值及其數(shù)量級(jí)。雖然為了穩(wěn)定收斂和最終的精度，權(quán)重更新的積累是必不可少的，但仍然可以在訓(xùn)練中進(jìn)一步減少壓縮和內(nèi)存消耗。WAGE在多個(gè)數(shù)據(jù)集實(shí)現(xiàn)了最高精度。通過微調(diào)、更有效的映射、批歸一化等量化方法，對(duì)增量工作有一定的應(yīng)用前景。總而言之，我們提出了一個(gè)沒有浮點(diǎn)表示的框架，并展示了在基于整數(shù)的輕量級(jí)ASIC或具有現(xiàn)場(chǎng)學(xué)習(xí)能力的FPGA上實(shí)現(xiàn)離散訓(xùn)練和推理的潛力。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

神經(jīng)網(wǎng)絡(luò)

神經(jīng)網(wǎng)絡(luò)

+關(guān)注

關(guān)注
42

文章
4776

瀏覽量
100939
gpu

gpu

+關(guān)注

關(guān)注
28

文章
4760

瀏覽量
129129

原文標(biāo)題：ICLR oral：清華提出離散化架構(gòu)WAGE，神經(jīng)網(wǎng)絡(luò)訓(xùn)練推理合二為一

文章出處：【微信號(hào)：AI_era，微信公眾號(hào)：新智元】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

評(píng)論

相關(guān)推薦

機(jī)器學(xué)習(xí)的第二階段：推理

我們之前討論過，訓(xùn)練過程是機(jī)器學(xué)習(xí)的第一階段，而推理則緊隨其后，為機(jī)器學(xué)習(xí)的第二階段。在訓(xùn)練階段

發(fā)表于 06-28 16:03 ?6036次閱讀

進(jìn)一步解讀英偉達(dá) Blackwell 架構(gòu)、NVlink及GB200 超級(jí)芯片

性能，加速模型的訓(xùn)練和推理過程。 2. 生成式 AI 解決方案與英偉達(dá) Grace CPU、新一代網(wǎng)絡(luò)芯片等產(chǎn)品一起，面向生成式 AI 共同組成完整解決方案，

發(fā)表于 05-13 17:16

如何把兩個(gè)電路合二為一？

大家好求助本人做了兩個(gè)arduino回路。 word 里面，左邊的是控制電機(jī)左右轉(zhuǎn)動(dòng)的。右邊是通過滑動(dòng)變阻器控制電機(jī)轉(zhuǎn)速的。想把兩個(gè)電路合二為一。程序上的編寫請(qǐng)給位給予建議

發(fā)表于 08-23 05:55

模擬技術(shù)與數(shù)字技術(shù)怎樣才能合二為一電子資料

模擬技術(shù)與數(shù)字技術(shù)怎樣才能合二為一,還是數(shù)字技術(shù)替代模擬技術(shù)?作為一般應(yīng)用的話，的確可以區(qū)分開模擬和數(shù)字系統(tǒng)。但是在尖端領(lǐng)域，你很難區(qū)分他們的。比如，高速數(shù)字電路板要考慮的敷銅阻抗和信號(hào)反射問題。

發(fā)表于 04-21 06:14

圖像預(yù)處理和改進(jìn)神經(jīng)網(wǎng)絡(luò)推理的簡(jiǎn)要介紹

為提升識(shí)別準(zhǔn)確率，采用改進(jìn)神經(jīng)網(wǎng)絡(luò)，通過Mnist數(shù)據(jù)集進(jìn)行訓(xùn)練。整體處理過程分為兩步：圖像預(yù)處理和改進(jìn)神經(jīng)網(wǎng)絡(luò)推理。圖像預(yù)處理主要根據(jù)圖像的特征，將數(shù)據(jù)處理成規(guī)范的格式，而改進(jìn)神經(jīng)網(wǎng)絡(luò)推理

發(fā)表于 12-23 08:07

如何用PyArmNN加速樹莓派上的ML推理

NN推理引擎構(gòu)建一個(gè)示例應(yīng)用程序，將圖像分類為火或非火。本指南使用Raspberry Pi 3或4設(shè)備。樹莓派設(shè)備是由Arm CPU驅(qū)動(dòng)的霓虹燈的架構(gòu)。Neon是針對(duì)Arm處理器

發(fā)表于 08-02 15:40

Android和iPhone完美融合，魯大師發(fā)布魯?shù)皵?shù)據(jù)線將接口合二為一

日前，魯大師智能硬件推出了一款魯?shù)皵?shù)據(jù)線，號(hào)稱真正做到了蘋果lightning和安卓Micro接口合二為一。

發(fā)表于 12-06 10:52 ?1385次閱讀

天貓精靈Queen發(fā)布一款美妝鏡和AI智能音箱合二為一的新產(chǎn)品

3月4日下午，天貓精靈官方微博宣布，正式推出新品天貓精靈Queen。從這樣的命名不難看出，天貓精靈Queen是一款面對(duì)女性消費(fèi)者推出的產(chǎn)品，其將女孩子日常接觸的美妝鏡和AI智能音箱合二為一，在產(chǎn)品的創(chuàng)意上確實(shí)是別出心裁。

發(fā)表于 03-05 16:42 ?1567次閱讀

高通發(fā)布Wi-Fi或?qū)?G和Wi-Fi合二為一？

高通發(fā)布多款Wi-Fi 6芯片，5G和Wi-Fi將合二為一

發(fā)表于 08-28 08:59 ?3679次閱讀

基于離散化正交匹配追蹤的中繼混合預(yù)編碼算法

為提高大規(guī)模多輸入多輸出（MMo）中繼系統(tǒng)的波東成形增益，降低混合預(yù)編碼架構(gòu)中移相器與射頻鏈路的硬件成本，提出一種基于離散化正交匹配追蹤的中

發(fā)表于 03-31 14:45 ?29次下載

汽車的電動(dòng)化與智能化正在合二為一 電動(dòng)車的下一波“進(jìn)化”會(huì)在哪？

汽車的電動(dòng)化與智能化正在合二為一，電動(dòng)化的普及需要靠智能化來拉動(dòng)，而智能化的最佳載體正是電動(dòng)

發(fā)表于 06-13 14:59 ?1066次閱讀

離散與分布式：改變軍事訓(xùn)練和模擬系統(tǒng)

　　增強(qiáng)現(xiàn)實(shí)和虛擬現(xiàn)實(shí)（AR/VR）等進(jìn)步正在重新定義在日益多樣化的軍事訓(xùn)練場(chǎng)景中對(duì)質(zhì)量和性能的期望。這些改進(jìn)還表明，隨著系統(tǒng)工程師為下一代“培訓(xùn)即服務(wù)”做準(zhǔn)備，系統(tǒng)設(shè)計(jì)策略需要改變哲

發(fā)表于 11-11 15:07 ?708次閱讀

華為新品發(fā)布會(huì)：HUAWEI WATCH Buds耳機(jī)手表二合一

　　HUAWEI WATCH Buds通過極致的架構(gòu)設(shè)計(jì)，高集成度設(shè)計(jì)精益求精：21層立體堆疊I超微型精密轉(zhuǎn)軸設(shè)計(jì)和小巧便捷的耳機(jī)合二為一。

發(fā)表于 12-09 14:25 ?1067次閱讀

深度學(xué)習(xí)框架區(qū)分訓(xùn)練還是推理嗎

深度學(xué)習(xí)框架區(qū)分訓(xùn)練還是推理嗎深度學(xué)習(xí)框架是一個(gè)非常重要的技術(shù)，它們能夠加速深度學(xué)習(xí)的開發(fā)與部署過程。在深度學(xué)習(xí)中，我們通常需要進(jìn)行兩個(gè)關(guān)鍵的任務(wù)，即訓(xùn)練和

發(fā)表于 08-17 16:03 ?1411次閱讀

為提升銷量,理想汽車或?qū)⒘闶酆徒桓恫?b class='flag-5'>合二為一

據(jù)了解，自4月份以來，理想汽車已經(jīng)啟動(dòng)了2.0版本的矩陣式組織結(jié)構(gòu)升級(jí)，對(duì)部分部門進(jìn)行了結(jié)構(gòu)性調(diào)整。其中一項(xiàng)重要改變就是將零售與交付部門合二為一，進(jìn)一步細(xì)化分工，其目的無疑是增加銷量。