在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

一篇解決表示學習坍塌問題的工作報告

深度學習自然語言處理 ? 來源:圓圓的算法筆記 ? 作者:Fareise ? 2022-08-31 11:12 ? 次閱讀

1 表示學習中的坍塌問題

在表示學習中,一種很常見的做法是利用孿生網絡的結構,讓同一個樣本的不同數據增強后的表示相似。比如對于一張圖像,使用翻轉、裁剪等方法生成另一個增強圖像,兩個圖像分別經過兩個共享參數編碼器,得到表示,模型的優化目標是讓這兩個表示的距離近。

這種方法一個比較大的挑戰在于,模型在訓練過程中容易出現坍塌問題。模型可以把所有樣本的表示都學成完全相同的常數向量(比如每個樣本模型的輸出都是全0向量),這樣就能滿足上述兩個表示距離近的要求了。

2 解決坍塌問題的方法

業內有很多解決坍塌問題的方法,主要可以分為4種類型:

對比學習方法:在訓練一對正樣本對時,同時采樣大量的負樣本,讓正樣本之間離得近,負樣本之間離得遠,避免模型偷懶把所有樣本的表示都學成一樣的。

聚類方法:在訓練過程中增加一個聚類過程,將樣本分配給不同的類簇,然后在類簇級別進行對比學習。

基于蒸餾的方法:通過模型結構的角度避免坍塌問題,學習一個student network來預測teacher network的表示,teacher network是student network參數的滑動平均,teacher network不通過反向傳播更新參數。

信息最大化方法:讓生成的embedding中每一維的向量相互正交,使其信息量最大化,這樣可以避免各個維度的值信息過于冗余,防止坍塌問題。

目前常用的負樣本采樣方法,一個比較大的問題是計算開銷大,取得好的效果往往需要大量負樣本,因此有了MoCo等對比學習框架。本文提出的方法基于信息最大化的思路,能夠只使用正樣本對實現表示學習的同時,防止坍現象的發生。關于對比學習的常用經典方法,可以參考這篇文章:對比學習中的4種經典訓練模式。

3 信息最大化方法歷史工作

基于信息最大化的方法典型的工作有兩篇ICLM 2021的文章,分別是Whitening for Self-Supervised Representation Learning(ICML 2021,W-MSE)Barlow twins: Self-supervised learning via redundancy reduction(ICML 2021)。下面介紹一下這兩篇文章的整體思路,Facebook的這篇論文也是基于這個思路設計的。

d3146b2a-284d-11ed-ba43-dac502259ad0.png

W-MSE的整體網絡結構如上圖,模型中輸入一對互為正樣本的樣本對(例如一個圖像的不同增強形式),使用共享參數Encoder分別編碼后,增加一個whitening模塊,對每個batch內的所有embedding進行白化,讓embedding的各個維度變量線性無關,后面再接norm處理。下圖形式化表明了W-MSE的用途,通過白化+norm讓樣本形成一個球形分布,正樣本之間距離近,每個樣本需要調整自己在圓周上的位置拉進正樣本之間的距離,形成最終的簇。

d33098f4-284d-11ed-ba43-dac502259ad0.png


Barlow twins方法也是同樣的思路,只是做法不同。在得到一對正樣本的兩個embedding后,計算兩個向量各個變量之間的相關性矩陣,優化這個矩陣接近對角矩陣,以此實現embedding中各個變量之間線性無關。

d3550ca2-284d-11ed-ba43-dac502259ad0.png

4 VICREG

Facebook團隊提出的VICREG是上述基于信息最大化表示學習方法的一個擴展,損失函數主要包括variance、invariance、covariance三個部分。模型的主體結構如下,仍然是一個孿生網絡結構,輸入一個樣本的不同view互為正樣本。

d370b272-284d-11ed-ba43-dac502259ad0.png

variance部分主要是讓batch內每個樣本embedding向量的每一維變量之間的方差不小于一個值,這樣可以有效防止每個樣本的向量都對應同一個點的情況,防止坍塌的發生。

invariance部分即讓正樣本對的表示embedding距離盡可能小,是正常的表示學習loss。

covariance借鑒了Barlow twins中的思路,讓batch內的embedding非對角線元素盡可能為0,即讓表示向量各個維度變量線性無關。

最終的表示學習loss是由上述3個loss的加和:

d3817d8c-284d-11ed-ba43-dac502259ad0.png

5 實驗結果

作者進行了一些實驗驗證VICREG表示學習方法的效果。在ImageNet數據集上,使用不同方法預訓練的表示接一個線性層進行分類,或者基于預訓練的表示使用部分數據進行finetune,對比圖像分類效果,實驗結果如下:

d38f8f9e-284d-11ed-ba43-dac502259ad0.png

作者也對比了在不同方法上是否采用variance或covariance等loss的效果變化:

d3a9c04e-284d-11ed-ba43-dac502259ad0.png

6 總結

本文介紹了Facebook AI團隊在2022年ICLR的一篇解決表示學習坍塌問題的工作,順帶介紹了基于信息最大化的防坍塌工作,有助于幫助我們更深層次理解表示學習的原理,以及如何解決實際應用表示學習、對比學習時遇到的坍塌問題。



審核編輯:劉清

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 矩陣
    +關注

    關注

    0

    文章

    423

    瀏覽量

    34581
  • Network
    +關注

    關注

    0

    文章

    64

    瀏覽量

    29644

原文標題:ICLR2022 | Facebook AI提出解決表示學習坍塌問題新方法

文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    廣電計量新年首深度研究報告出爐

    新年伊始,廣電計量首深度研究報告出爐,公司憑借全面發展的企業實力和資本市場的優異表現在新的年獲得資本市場的認可。
    的頭像 發表于 01-03 11:31 ?270次閱讀

    中國發展報告:我國是無人機第大技術來源國

    電子發燒友網報道(文/吳子鵬)近日,國務院發展研究中心撰寫并在京發布的《中國發展報告2024》顯示,與發展新質生產力相適應的新型生產關系正加快完善。比如低空經濟,從20多個省份將其寫入政府工作報告
    的頭像 發表于 01-03 00:17 ?2131次閱讀

    廣電計量助力第二屆低空科技發展大會區順利舉辦

    低空經濟是新質生產力的典型代表,也將是中國經濟新的增長點,其戰略意義重大,發展前景廣闊。今年年初低空經濟在全國兩會上作為“新增長引擎”寫入政府工作報告。2024年伊始,低空經濟被寫入陜西省政府工作報告,陜西低空經濟發展迎來全新機遇。
    的頭像 發表于 12-24 11:23 ?246次閱讀

    維智科技入選中國數據要素X行業應用圖譜

    自2014年“大數據”首次寫入政府工作報告以來,戰略重心逐步由“互聯網+”、“大數據戰略”、“數字化升級”向“培育數據要素市場”傾斜。
    的頭像 發表于 12-05 10:16 ?179次閱讀

    杰和科技攜新品受邀參加深圳計算機行業協會會員大會

    2024年8月23日杰和科技攜新品受邀參加深圳計算機行業協會會員大會2024年8月23日,深圳計算機行業協會舉行了第十一屆第次會員大會,杰和科技受邀參加此次活動,審議第十屆理事會工作報告、監事會
    的頭像 發表于 09-12 08:12 ?279次閱讀
    杰和科技攜新品受邀參加深圳計算機行業協會會員大會

    羅德與施瓦茨發布城市空中交通eVTOL測試解決方案

    2024年政府工作報告提出,“積極打造生物制造、商業航天、低空經濟等新增長引擎”。這是低空經濟首次被寫入政府工作報告。低空經濟依托于1000米以內的低空空域,以各種有人駕駛和無人駕駛航空器的各類低空飛行活動為牽引,輻射帶動相關領域融合發展。
    的頭像 發表于 08-16 16:30 ?498次閱讀

    AI入門之深度學習:基本概念

    1、什么是深度學習 1.1、機器學習 ?? ? 圖1:計算機有效工作的常用方法:程序員編寫規則(程序),計算機遵循這些規則將輸入數據轉換為適當的答案。這方法被稱為符號主義人工智能,適
    的頭像 發表于 08-08 11:24 ?1974次閱讀
    AI入門之深度<b class='flag-5'>學習</b>:基本概念<b class='flag-5'>篇</b>

    深視智能參編《2024智能檢測裝備產業發展研究報告:機器視覺

    為全面了解機器視覺檢測裝備產業發展情況,中國電子技術標準化研究院聯合業內龍頭企業、科研院所和產業聯盟等(參編單位名單見附件),共同編制了《智能檢測裝備產業發展研究報告:機器視覺》?!吨悄軝z測裝備
    的頭像 發表于 08-05 08:38 ?317次閱讀
    深視智能參編《2024智能檢測裝備產業發展研究<b class='flag-5'>報告</b>:機器視覺<b class='flag-5'>篇</b>》

    【《大語言模型應用指南》閱讀體驗】+ 基礎

    今天開始學習《大語言模型應用指南》第一篇——基礎,對于人工智能相關專業技術人員應該可以輕松加愉快的完成此閱讀,但對于我還是有許多的知識點、專業術語比較陌生,需要網上搜索
    發表于 07-25 14:33

    基于Python和深度學習的CNN原理詳解

    卷積神經網絡 (CNN) 由各種類型的層組成,這些層協同工作以從輸入數據中學習分層表示。每個層在整體架構中都發揮著獨特的作用。
    的頭像 發表于 04-06 05:51 ?2187次閱讀
    基于Python和深度<b class='flag-5'>學習</b>的CNN原理詳解

    兩會過后,來CMIMS 2024看新能源汽車產業穩中提質

    政府工作報告時,被多次提及的關鍵詞匯。 政府工作報告中匯報了上年我國在新能源汽車中取得的顯著成績,首先是我國新能源汽車產銷量占全球比重超過60%,另外,我國電動汽車、鋰電池、光伏產品“新三樣”在去年出口增長了近30%。
    的頭像 發表于 03-20 11:52 ?396次閱讀
    兩會過后,來CMIMS 2024看新能源汽車產業穩中提質

    中科曙光推出種半實物實時仿真系統計算平臺及國產化方案

    隨著各地新春第會陸續召開,已有31省、自治區、直轄市發布政府工作報告,對新年數字經濟發展做出詳實規劃,尤其對裝備制造、工業仿真軟件等做出具體部署。
    的頭像 發表于 03-19 09:42 ?696次閱讀

    颯特紅外2023年售后服務工作報告

    這是颯特紅外投身紅外熱像儀研制生產的第33個年頭,這是颯特紅外售后服務工作與合作伙伴共慶的第33個315。
    的頭像 發表于 03-15 09:20 ?387次閱讀
    颯特紅外2023年售后服務<b class='flag-5'>工作報告</b>

    從政府工作報告看磁元件2024年機遇

    字越少,事越大!政府工作報告提到的2024年重點工作,對行業來說有哪些機會? 2024年3月5日,十四屆全國人大二次會議在人民大會堂開幕,國務院總理李強作政府工作報告。 政府工作報告
    的頭像 發表于 03-11 15:13 ?329次閱讀

    快看!各地政府工作報告,重點提及這些MEMS傳感器及芯片項目!

    近日,多個省市發布2024年工作報告,回顧年取得的成績并展望2024年工作安排。 近年來,半導體產業(集成電路芯片、智能傳感器)等受到國家和各省市的高度重視,包括廣東重慶浙江等省市2024年
    的頭像 發表于 02-20 08:41 ?438次閱讀
    快看!各地政府<b class='flag-5'>工作報告</b>,重點提及這些MEMS傳感器及芯片項目!
    主站蜘蛛池模板: 欧美tube44videos| 黄色三级网站| 91夫妻视频| 日韩亚洲欧美日本精品va| 午夜影院免费版| www.夜色| 狠狠躁夜夜躁人人爽天天天天| 六月婷婷综合网| 欧美色图在线视频| 奇米色影院| 靓装爱神12丝袜在线播放| 国产精品天天爽夜夜欢张柏芝| aaa大片| 国产高清视频在线播放www色| 丁香婷婷久久| 手机看片1024福利| 国产精品久久久久久久久免费 | 性欧美xxxx视频| 色多多视频在线观看免费大全| 欧美精品videosex极品| 国产免费人成在线视频视频| 在线免费看一级片| 俺也去第四色| 日本黄页在线观看| 五月激情视频| 五月婷婷六月丁香在线| 午夜性视频播放免费视频| 亚洲一区免费视频| 在线免费观看一区二区三区| 欧美成人性高清观看| 亚洲卡5卡6卡7国色天香| 一二三区在线视频| 97人人揉人人捏人人添| 日韩一级片在线观看| 国模绪| 免费一级毛片不卡在线播放| 精品欧美| 婷婷色综合网| 韩国三级hd中文字幕好大| 天天操天天操| 中文字幕一区二区三区永久|