在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

基于權重系聯的線性自動編碼器

zhKF_jqr_AI ? 來源:未知 ? 作者:李倩 ? 2018-07-02 14:26 ? 次閱讀

現代的深度神經網絡通常具有海量參數,甚至高于訓練數據的大小。這就意味著,這些深度網絡有著強烈的過擬合傾向。緩解這一傾向的技術有很多,包括L1、L2正則、及早停止、組歸一化,以及dropout。在訓練階段,dropout隨機丟棄隱藏神經元及其連接,以打破神經元間的共同適應。盡管dropout在深度神經網絡的訓練中取得了巨大的成功,關于dropout如何在深度學習中提供正則化機制,目前這方面的理論解釋仍然很有限。

最近,約翰·霍普金斯大學的Poorya Mianjy、Raman Arora、Rene Vidal在ICML 2018提交的論文On the Implicit Bias of Dropout,重點研究了dropout引入的隱式偏置。

基于權重系聯的線性自動編碼器

為了便于理解dropout的作用機制,研究人員打算在簡單模型中分析dropout的表現。具體而言,研究人員使用的簡單模型是只包含一個隱藏層的線性網絡。該網絡的目標是找到最小化期望損失(平方損失)的權重矩陣U、V:

上式中,x為輸入,y為標注輸出,D為輸入x的分布,h表示隱藏層。

學習算法為帶dropout的隨機梯度下降,其目標為:

其中,dropout率為1-θ,具體的算法為:

這一算法的目標等價于(推導過程見論文附錄A.1):

其中,λ = (1-θ)/θ

研究人員又令U = V,進一步簡化模型為權重系聯的單隱藏層線性自動編碼器。相應地,該網絡的目標為:

研究人員證明了,如果矩陣U是以上目標的全局最優解,那么U的所有列范數相等。這意味著,dropout傾向于給所有隱藏節點分配相等的權重,也就是說,dropout給整個網絡加上了隱式的偏置,傾向于讓隱藏節點都具有類似的影響,而不是讓一小部分隱藏節點具有重要影響。

上圖可視化了參數λ的不同取值的效果。該網絡為單隱藏層線性自動編碼器,搭配一維輸入、一維輸出,隱藏層寬度為2。當λ = 0時,該問題轉換為平方損失最小化問題。當λ > 0時,全局最優值向原點收縮,所有局部極小值均為全局最小值(證明過程見論文第4節)。當λ增大時,全局最優值進一步向原點收縮。

單隱藏層線性網絡

接著,研究人員將上述結果推廣到了單隱藏層線性網絡。回憶一下,這一網絡的目標為:

和權重系聯的情形類似,研究人員證明了,如果矩陣對(U, V)是以上目標的全局最優解,那么,‖ui‖‖vi‖ = ‖u1‖‖v1‖,其中,i對應隱藏層的寬度。

研究人員進一步證明,前面提到的單隱藏層線性神經網絡的目標等價于正則化的矩陣分解(regularized matrix factorization):

利用矩陣分解這一數學工具,研究人員證明了全局最佳值可以在多項式時間內找到:

試驗

研究人員試驗了一些模型,以印證前面提到的理論結果。

上圖可視化了dropout的收斂過程。和之前的可視化例子類似,模型為單隱藏層線性自動編碼器,一維輸入、一維輸出,隱藏層寬度為2。輸入取樣自標準正態分布。綠點為初始迭代點,紅點為全局最優點。從圖中我們可以看到,在不同的λ取值下,dropout都能迅速收斂至全局最優點。

研究人員還在一個淺層線性網絡上進行了試驗。該網絡的輸入x ∈ ?80,取樣自標準正態分布。網絡輸出y ∈ ?120,由y = Mx生成,其中M ∈ ?120x80均勻取樣自右、左奇異子空間(指數譜衰減)。下圖展示了不同參數值(λ ∈ {0.1, 0.5, 1})與不同隱藏層寬度(r ∈ {20, 80})的組合。藍色曲線為dropout不同迭代次數下對應的目標值,紅線為目標的最優值。總共運行了50次,取平均數。

上:r = 20;下:r = 80

上圖最后一列為“重要性評分”的方差。重要性評分的計算方法為:‖uti‖‖vti‖,其中t表示時刻(迭代),i表示隱藏層節點。從上圖我們看到,隨著dropout的收斂,“重要性評分”的方差單調下降,最終降至0. 且λ較大時,下降較快。

結語

這項理論研究確認了dropout是一個均質地分配權重的過程,以阻止共同適應。同時也從理論上解釋了dropout可以高效地收斂至全局最優解的原因。

研究人員使用的是單隱藏層的線性神經網絡,因此,很自然地,下一步的探索方向為:

更深的線性神經網絡

使用非線性激活的淺層神經網絡,例如ReLU(ReLU可以加速訓練)

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 編碼器
    +關注

    關注

    45

    文章

    3650

    瀏覽量

    134756
  • 神經網絡
    +關注

    關注

    42

    文章

    4774

    瀏覽量

    100894
  • Dropout
    +關注

    關注

    0

    文章

    13

    瀏覽量

    10054

原文標題:dropout的隱式偏置

文章出處:【微信號:jqr_AI,微信公眾號:論智】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    新手 Protel 99SE 自動編碼和電氣規則問題

    跟著視頻畫的,到自動編碼時出現這個問題,哪位大神幫忙
    發表于 03-12 22:36

    什么是線性編碼器

    `線性編碼器是什么呢,首先我們要先了解一下編碼器什么,編碼器就是把數據利用一定的原理,把數據編輯整理,進而轉換成能利用通訊采集的信號的一種設備。這里我們一般認為
    發表于 12-17 11:22

    稀疏邊緣降噪自動編碼器的方法

    為了提高自動編碼器算法的學習精度,更進一步降低分類任務的分類錯誤率,提出一種組合稀疏自動編碼器(SAE)和邊緣降噪自動編碼器(mDAE)從而形成稀疏邊緣降噪自動編碼器(SmDAE)的方
    發表于 12-21 14:41 ?3次下載
    稀疏邊緣降噪<b class='flag-5'>自動編碼器</b>的方法

    基于動態dropout的改進堆疊自動編碼機方法

    針對堆疊自動編碼機( SA)容易產生過擬合而降低垃圾郵件分類精度的問題,提出了一種基于動態dropout的改進堆疊自動編碼機方法。首先分析了垃圾郵件分類問題的特殊性,將dropout算法引入到堆疊
    發表于 12-26 14:37 ?0次下載
    基于動態dropout的改進堆疊<b class='flag-5'>自動編碼</b>機方法

    自動編碼器的社區發現算法

    準確.提出一種基于深度稀疏自動編碼器的社區發現算法CoDDA(a community detection algorithm based on deep sparse autoencoder),嘗試提高使用這些經典方法處理高維鄰接矩陣進行社區發現的準確性.首先,提出基于跳數的處理方法,對稀疏的鄰接矩
    發表于 01-02 18:32 ?0次下載
    <b class='flag-5'>自動編碼器</b>的社區發現算法

    編碼器正交編碼工作原理

    正交編碼器(又名雙通道增量式編碼器),用于將線性移位轉換為脈沖信號。
    發表于 08-02 08:50 ?3.3w次閱讀

    自動編碼器與PCA的比較

    編碼器雖然不像 PCA 那般在教科書上隨處可見,但是在早期被拿來做深度網絡的逐層預訓練,其地位可見一斑。盡管在 ReLU、Dropout 等神器出現之后,人們不再使用 AutoEncoders 來
    發表于 06-11 15:37 ?5930次閱讀

    如何使用深度神經網絡技術實現機器學習的全噪聲自動編碼器

    ,基于自動編碼器的深度神經網絡可以有效的用于數據特征提取。自動編碼是一種無監督學習算法,稀疏自動編碼器、降噪自動編碼器、收縮自動編碼器是在原
    發表于 12-11 15:44 ?7次下載
    如何使用深度神經網絡技術實現機器學習的全噪聲<b class='flag-5'>自動編碼器</b>

    一種改進的基于半自動編碼器的協同過濾推薦算法

    為高效利用推薦系統中用戶和物品的交互歷史和輔助信息,提出一種改進的協同過濾推薦算法。利用半自動編碼器對用戶和物品的輔助信息進行特征提取,將提取岀的特征映射到矩陣分解模型中,通過反向傳播算法實現半自動編碼器
    發表于 03-23 16:35 ?4次下載
    一種改進的基于半<b class='flag-5'>自動編碼器</b>的協同過濾推薦算法

    一種混合自動編碼器高斯混合模型MAGMM

    高維數據的無監督異常檢測是機器學習的重要挑戰之一。雖然先前基于單一深度自動編碼器和密度估計的方法已經取得了顯著的進展,但是其僅通過一個深度自編碼器來生成低維表示,這表明沒有足夠的信息來執行后續
    發表于 04-13 15:33 ?7次下載
    一種混合<b class='flag-5'>自動編碼器</b>高斯混合模型MAGMM

    如何使用TensorFlow構建和訓練變分自動編碼器

    在本文中,我們將研究一個非常流行的 AI 用例,用于壓縮數據并使用自動編碼器重建壓縮數據。
    的頭像 發表于 05-05 16:57 ?2147次閱讀
    如何使用TensorFlow構建和訓練變分<b class='flag-5'>自動編碼器</b>

    堆疊降噪自動編碼器(SDAE)

    自動編碼器(Auto-Encoder,AE) 自編碼器(autoencoder)是神經網絡的一種,經過訓練后能嘗試將輸入復制到輸出。自編碼器內部有一個隱藏層 h,可以產生編碼(code
    的頭像 發表于 01-11 17:04 ?6594次閱讀
    堆疊降噪<b class='flag-5'>自動編碼器</b>(SDAE)

    編碼器種類及型號

    編碼器種類及型號:最常見的編碼器類型是旋轉編碼器線性編碼器。旋轉編碼器通常用于測量機器人的關節
    的頭像 發表于 05-18 11:15 ?5781次閱讀
    <b class='flag-5'>編碼器</b>種類及型號

    編碼器與PLC的接線方法

    編碼器分為旋轉編碼器線性編碼器兩種。旋轉編碼器用于檢測旋轉位置和速度,而線性
    發表于 12-22 09:20 ?1591次閱讀
    <b class='flag-5'>編碼器</b>與PLC的接線方法

    編碼器好壞怎么判斷,編碼器原理

    編碼器(Encoder)是將輸入數據轉化為特定編碼表示的一種技術。對于不同類型的編碼器,評判其好壞可以從多個方面進行考量,包括編碼質量、速度、模型結構等。
    的頭像 發表于 01-23 10:58 ?1933次閱讀
    主站蜘蛛池模板: h网站在线看| 激情五月婷婷丁香| 久操综合| wwwa级片| 免费毛片网站| 天堂社区在线观看| 永久免费在线播放| 黄色网址在线免费观看| 狠狠色丁香婷婷综合| 日本黄段视频| 特级毛片aaaa免费观看| 长腿丝袜美女被啪啪| 一道精品一区二区三区| 99久久香蕉国产综合影院| 色444| 99色婷婷| 国产二区三区毛片| 精品国产乱码久久久久久浪潮| 久久精品99| 久久综合免费| 伦理片第一页| 欧美成人一区二区三区在线视频| 四虎影院永久网站| 全部免费a级毛片| 日韩一级精品视频在线观看| 亚洲高清免费视频| 最近高清在线国语| 日本一区二区三区不卡在线视频| 男人视频网| 欧美另类69| 欧美极品第1页专区| 欧美精品人爱a欧美精品| 男女互插小说| 年下攻高h好涨| 婷婷六月天在线| 四虎国产精品高清在线观看| 天堂在线中文字幕| 免费jyzzjyzz在线播放大全| 爱爱免费网站| 天天玩天天操| 天天好比|