在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

一種新的表示學習方法——對比預測編碼

DPVg_AI_era ? 來源:未知 ? 作者:李倩 ? 2018-07-14 09:18 ? 次閱讀

DeepMind的最新研究提出一種新的表示學習方法——對比預測編碼。研究人員在多個領域進行實驗:音頻、圖像、自然語言和強化學習,證明了相同的機制能夠在所有這些領域中學習到有意義的高級信息,并且優于其他方法。

2013年,Bengio等人發表了關于表示學習( representation learning)的綜述,將表示學習定義為“學習數據的表征,以便在構建分類器或其他預測器時更容易提取有用的信息”,并將無監督特征學習和深度學習的諸多進展納入表示學習的范疇。

今天,DeepMind在最新論文Representation Learning with Contrastive Predictive Coding中,提出一種新的表示學習方法——對比預測編碼(Contrastive Predictive Coding, CPC),將其應用于各種不同的數據模態、圖像、語音、自然語言和強化學習,證明了相同的機制能夠在所有這些領域中學習到有意義的高級信息,并且優于其他方法。

預測編碼思想

使用分層的可微模型以端到端的方式從標記數據中學習高級表示,這是人工智能迄今為止最大的成功之一。這些技術使得人工指定的特性在很大程度上變得多余,并且在一些真實世界的應用中極大地改進了當前最優的技術。但是,這些技術仍存在許多挑戰,例如數據效率、穩健性或泛化能力。

改進表示學習需要一些不是專門解決單一監督任務的特征。例如,當預訓練一個模型以進行圖像分類時,特征可以相當好地轉移到其他圖像分類域,但也缺少某些信息,例如顏色或計數的能力,因為這些信息與分類無關,但可能與其他任務相關,例如圖像描述生成(image captioning)。類似地,用于轉錄人類語音的特征可能不太適合于說話者識別或音樂類型預測。因此,無監督學習是實現強健的、通用的表示學習的重要基石。

盡管無監督學習很重要,但無監督學習尚未得到類似監督學習的突破:從原始觀察中建模高級表示仍然難以實現。此外,并不總是很清楚理想的表示是什么,以及是否可以在沒有對特定的數據模態進行額外的監督學習或專門化的情況下學習這樣的表示。

無監督學習最常見的策略之一是預測未來、缺失信息或上下文信息。這種預測編碼(predictive coding)的思想是數據壓縮信號處理中最古老的技術之一。在神經科學中,預測編碼理論表明,大腦可以預測不同抽象層次的觀察。

最近在無監督學習方面的一些工作已經成功地利用這些概念,通過預測鄰近的單詞來學習單詞表示。對于圖像來說,從灰度或image patches的相對位置來預測顏色,也被證明是有用的。我們假設這些方法卓有成效,部分原因是我們預測相關值的上下文通常是有條件地依賴于相同的共享高級潛在信息之上。通過將其作為一個預測問題,我們可以自動推斷出這些特征與表示學習相關。

本文有以下貢獻:

首先,我們將高維數據壓縮成一個更緊湊的潛在嵌入空間,在這個空間中,條件預測更容易建模。

其次,我們在這個潛在空間中使用強大的自回歸模型來預測未來。

最后,我們依賴噪聲對比估計(Noise-Contrastive Estimation)損失函數,與在自然語言模型中學習詞嵌入的方法類似,允許對整個模型進行端到端的訓練。

對比預測編碼

圖1:對比預測編碼的概覽,即我們提出的表示學習方法。雖然圖中將音頻作為輸入,但是我們對圖像、文本和強化學習使用的是相同的設置。

圖1顯示了對比預測編碼模型的架構。首先,非線性編碼器將輸入的觀察序列映射到潛在表示序列,可能具有較低的時間分辨率。接下來,自回歸模型概括潛在空間中所有,并生成一個上下文潛在表示

我們不是直接用生成模型來預測未來的觀察。 相反,我們對密度比建模,保留了之間的交互信息,公式如下:

其中代表“成正比”。

在我們的實驗中,我們使用線性變換對每個步驟k進行不同的預測,也可以使用非線性網絡或遞歸神經網絡。

4個不同領域的實驗:語音、圖像、NLP和強化學習

我們提出四個不同應用領域的benchmark:語音、圖像、自然語言和強化學習。對于每個領域,我們訓練CPC模型,并通過線性分類任務或定性評估來探討“表示”(representations)所包含的內容;在強化學習中,我們測量了輔助的CPC loss如何加速agent的學習。

語音(Audio)

對于語音,我們使用了公開的LibriSpeech數據集中100小時的子數據集。雖然數據集不提供原始文本以外的標簽,但我們使用Kaldi工具包獲得了強制對齊的通話序列,并在Librispeech上預訓練模型。該數據集包含來自251個不同說話者的語音。

圖2:10個說話者子集的音頻表示的t-SNE可視化。每種顏色代表不同的說話者。

圖3:在語音波形中預測未來1到20個潛在步驟的對比損失,正樣本預測的平均精度。該模型最多預測未來200 ms,因為每一步包含10ms的音頻。

圖像(Vision)

在視覺表示實驗中,我們使用ImageNet數據集。我們使用ResNet v2 101架構作為圖像編碼器來提取CPC表示(該編碼器沒有經過預訓練)。在無監督訓練后,訓練一個線性層以測量ImageNet標簽的分類精度。

圖4:圖像實驗中對比預測編碼的可視化

圖5:每一行都顯示了激活CPC架構的某個神經元的image patches

表3:ImageNet top-1無監督分類結果。

表4:ImageNet top-5無監督分類結果。

表3和表4顯示了與state-of-the-art相比,CPC模型在ImageNet top-1和top-5的分類精度。盡管相對領域不可知,但CPC模型在top-1相比當前最優模型的精度提高了9%,在top-5的精度提高了4%。

自然語言

在自然語言實驗中,我們首先在BookCorpus 數據集上學習我們的無監督模型,并通過對一組分類任務使用CPC表示來評估模型作為通用特征提取器的能力。

對于分類任務,我們使用了以下數據集:我們使用以下數據集:電影評論情緒(MR),客戶產品評論(CR),主觀性/客觀性,意見極性(MPQA)和問題類型分類 (TREC)。

表5:五種常見NLP基準的分類精度。

評估任務的結果如表5所示。

強化學習

最后,我們評估了DeepMind Lab 在3D環境下的五種強化學習的無監督學習方法:rooms_watermaze,explore_goal_locations_small,seekavoid_arena_01,lasertag_three_opponents_small和rooms_keys_doors_puzzle。

在這里,我們采用標準的batched A2C agent作為基本模型,并添加CPC作為輔助損失。 學習的表示對其未來觀察的分布進行編碼。

圖6:五個DeepMind Lab任務的強化學習結果。黑色:batched A2C基線,紅色:添加輔助對比損失

如圖6所示,在10億幀的訓練后,對于5個游戲中的4個,agent的表現有明顯提高。

結論

在本文中,我們提出了對比預測編碼(CPC),這是一種用于提取緊湊潛在表示以對未來觀測進行編碼的框架。CPC將自回歸建模和噪聲對比估計與預測編碼的直覺相結合,以一種無監督的方式學習抽象表示。

我們在多個領域測試了這些表現形式:音頻、圖像、自然語言和強化學習,并在用作獨立特征時實現了強大的或最優的性能。訓練模型的簡單性和低計算要求,以及在強化學習領域與主要損失一起使用時令人鼓舞的結果,都展現了無監督學習令人興奮的發展,并且這種學習普遍適用于更多數據模態。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 編碼器
    +關注

    關注

    45

    文章

    3659

    瀏覽量

    134980
  • 數據集
    +關注

    關注

    4

    文章

    1209

    瀏覽量

    24767
  • 深度學習
    +關注

    關注

    73

    文章

    5511

    瀏覽量

    121374

原文標題:DeepMind無監督表示學習重大突破:語音、圖像、文本、強化學習全能冠軍!

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    一種實用的混沌保密編碼方法

    一種實用的混沌保密編碼方法 基于實用符號動力學的基礎理論,提出了一種實用的混沌保密編碼方法,該方法借助于單峰的logistic映射處于混沌
    發表于 11-18 10:55 ?10次下載

    一種隨機的人工神經網絡學習方法

    針對復雜網絡環境下網絡流監測(分類)問題,為實現多個類別直接分類以及提高學習方法的訓練速度,提出了一種隨機的人工神經網絡學習方法。該方法借鑒平面高斯(PG)神經網絡模型,引入隨機投影思
    發表于 12-05 15:26 ?0次下載

    一種融合節點先驗信息的圖表示學習方法

    基于深度學習提出了融合節點先驗信息的圖表示學習方法,該方法將節點特征作為先驗知識。要求學習到的表示
    發表于 12-18 16:53 ?0次下載
    <b class='flag-5'>一種</b>融合節點先驗信息的圖<b class='flag-5'>表示</b><b class='flag-5'>學習方法</b>

    基于概率校準的集成學習方法

    針對原有集成學習多樣性不足而導致的集成效果不夠顯著的問題,提出一種基于概率校準的集成學習方法以及兩降低多重共線性影響的方法。首先,通過使用
    發表于 12-22 11:02 ?0次下載
    基于概率校準的集成<b class='flag-5'>學習方法</b>

    機器學習和線性隨機效應混合模型在縱向數據預測上的對比

    本文針對牛奶中所含蛋白質的縱向數據,利用R軟件,運用機器學習方法中的決策樹、boost、bagging、隨機森林、神經網絡、支持向量機和傳統處理縱向數據的線性隨機效應混合模型做預測對比。變化訓練集
    發表于 01-02 18:51 ?0次下載

    一種模糊森林學習方法

    針對隨機森林學習方法訓練數據時存在的過擬合問題,通過改進各決策節點的決策函數設計一種模糊森林學習方法。利用高斯隸屬度函數構建決策樹上各節點的決策函數,將確定決策路徑轉換為模糊決策路徑。根據樣本從根
    發表于 02-23 11:09 ?1次下載

    一種結合屬性信息的二分網絡表示學習方法

    現有的網絡表示學習算法主要是針對同質網絡或異質網絡設計的,而忽略了在推薦系統、搜索引擎和答系統等領域出現的二分網絡的特殊特征以及這類網絡所攜帶著的非常豐富的屬性信息。為了解決上述題,提出了一種結合
    發表于 03-26 14:44 ?13次下載
    <b class='flag-5'>一種</b>結合屬性信息的二分網絡<b class='flag-5'>表示</b><b class='flag-5'>學習方法</b>

    基于異質網絡層次的基因節點表示學習方法

    基因組測序技術的快速發展使得生物數據庫中的基因和基因組序列數據數量迅速增加,但其中仍有大量基因功能是未知的。為此,提出基于異質網絡層次注意力機制的基因節點表示學習方法HAGE,用以預測基因功能。結合
    發表于 03-26 16:15 ?5次下載
    基于異質網絡層次的基因節點<b class='flag-5'>表示</b><b class='flag-5'>學習方法</b>

    一種多通道自編碼器深度學習的入侵檢測方法

      針對現有的入侵檢測方法在檢測準確率和誤報率方面存在的不足,提岀了一種多通道自編碼器深度學習的入侵檢測方法。該
    發表于 04-07 15:23 ?7次下載
    <b class='flag-5'>一種</b>多通道自<b class='flag-5'>編碼</b>器深度<b class='flag-5'>學習</b>的入侵檢測<b class='flag-5'>方法</b>

    一種針對有向網絡表示學習的優化方法

    的影響,増強模型對全局結構信息的感知,文中提出了一種針對有向網絡表示學習的優化方法。該方法借助 Trueskill
    發表于 04-13 15:20 ?10次下載
    <b class='flag-5'>一種</b>針對有向網絡<b class='flag-5'>表示</b><b class='flag-5'>學習</b>的優化<b class='flag-5'>方法</b>

    一種基于塊對角化表示的多視角字典對學習方法

    考慮一種合成型宇典或解析型字典的學習算法不能同時滿足處理速度、可解釋性以及應用范圍的要求。針對上述問題,提岀了一種基于塊對角化表示的多視角字典對學習
    發表于 04-20 14:04 ?1次下載

    基于變分自編碼器的網絡表示學習方法

    ,將這些信息融入到網絡表示學習過程中,有助于提升下游任務的性能。但是針對不同的應用場景,結構和屬性信息并不總是線性相關,而且它們都是高度非線性的數據。提岀一種基于變分自編碼器的網絡
    發表于 05-12 14:50 ?27次下載

    面向異質信息的網絡表示學習方法綜述

    面向異質信息的網絡表示學習方法綜述
    發表于 06-09 14:12 ?13次下載

    基于圖嵌入的兵棋聯合作戰態勢實體知識表示學習方法

    合作戰態勢實體知識的特點,提出一種基于圖嵌入的兵棋聯合作戰態勢實體知識表示學習方法。該方法采用基于元路徑的多層異構圖嵌入模型,對想定場景中的兵棋聯合作戰態勢實體及其關系知識進行
    發表于 01-11 08:34 ?931次閱讀

    一種創新的動態軌跡預測方法

    本文提出了一種動態軌跡預測方法,通過結合歷史幀和歷史預測結果來提高預測的穩定性和準確性。它引入了歷史預測
    的頭像 發表于 10-28 14:34 ?480次閱讀
    <b class='flag-5'>一種</b>創新的動態軌跡<b class='flag-5'>預測</b><b class='flag-5'>方法</b>
    主站蜘蛛池模板: 国产网站在线免费观看| 精品卡1卡2卡三卡免费网站视频| 99久久99久久精品国产| 激情婷婷综合久久久久| 激情婷婷色| 亚洲综合天堂网| 性欧美网站| 日本三级s级在线播放| 免费一级特黄a| 国产免费一级高清淫日本片 | 亚洲精品久久婷婷爱久久婷婷| 亚洲综合国产一区二区三区| 免费看黄的视频网站| 亚洲淫视频| 日本黄色片在线播放| 久久国产乱子伦精品免费强| www.激情五月.com| 免费一级毛片清高播放| 亚洲娇小性色xxxx| 色吧综合网| 性色网站| 久久一卡二卡| 亚洲操| 黄色成人一级片| 中文字幕一区二区三区四区| 福利三区| 日本免费黄网站| 国产久爱青草视频在线观看| 天天做天天摸天天爽天天爱| 国产精品视频久久久久久| 亚洲免费一区二区| 亚洲αv久久久噜噜噜噜噜| 人人人人凹人人爽人人澡| 国产欧美色图| 日日爽视频| ggg成人| 五月综合激情网| 精品国产香港三级| 日日日干干干| 亚洲成网站| 日本黄色电影在线|