在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

利用2.5GPU年的算力在7個數據集上訓練了12000多個模型

nlfO_thejiangme ? 來源:lq ? 2019-04-30 09:14 ? 次閱讀

基于無監督的方式理解高維數據并將信息濃縮為有用的表示一直是深度學習領域研究的關鍵問題。其中一種方法是利用非耦合表示(disentangled representations)模型來捕捉場景中獨立變化的特征。如果能夠實現對于各種獨立特征的描述,機器學習系統就可以用于真實環境中的導航,機器人或無人車利用這種方法可以將環境解構成一系列元素,并利用通用的知識去理解先前未見過的場景。



雖然非監督解耦方法已被廣泛應用于好奇驅動的探索、抽象推理、視覺概念學習和域適應的強化學習中,但最近進展卻無法讓我們清晰了解不同方法的性能和方法的局限。為了深入探索這一問題,谷歌的研究人員在ICML2019上發表了一篇大規模深入研究非監督非耦合表示的論文”Challenging Common Assumptions in the Unsupervised Learning of Disentangled Representations”,對近年來絕大多數的非監督解耦表示方法進行探索、利用2.5GPU年的算力在7個數據集上訓練了12000多個模型。基于大規模的實驗結果,研究人員對這一領域的一些假設產生了質疑,并為解耦學習的未來發展方向給出了建議。與此同時,研究人員還同時發布了研究中所使用的代碼和上萬個預訓練模型,并封裝了disentanglement_lib供研究者進行實驗復現和更深入的探索。

理解非耦合表示

為了更好地理解非耦合表示的本質,讓我一起來看看下面動圖中每個獨立變化的元素。下面的每一張圖代表了一個可以被編碼到矢量表示中的因子,它可以獨立控制圖像中每個語義元素的屬性。例如第一個可以控制地板的顏色,第二個則控制墻的顏色,最后一個則控制圖片的視角。

解耦表示的目標在于建立起一個能夠獨立捕捉這些特征的模型,并將這些特征編碼到一個表示矢量中。下面的10個小圖展示了基于FactorVAE方法學習十維表示矢量的模型,圖中展示 了每一維對于圖像對應信息的捕捉。從各個圖中可以看出模型成功地解耦了地板、墻面的顏色,但是左下角的兩個圖片可以看到物體的顏色和大小的表示卻依然相關沒有解耦。

大規模研究的發現

在直觀地理解了解耦表示之后,讓我們來看看科學家在研究中發現了什么。這一領域基于變分自編碼器提出了各種各樣的非監督方法來學習非耦合表示,同時給出了許多不同的性能度量方法,但卻缺乏一個大規模的性能測評和對比研究。為此研究人員構建了一個大規模、公平性、可復現的實驗基準,并系統的測試了六種不同的模型(BetaVAE, AnnealedVAE, FactorVAE, DIP-VAE I/II and Beta-TCVAE)和解耦性能度量方法(BetaVAE score, FactorVAE score, MIG, SAP, Modularity and DCI Disentanglement),在7個數據集上進行了12800個模型的訓練后,研究人員們有了顛覆過去的發現:首先,是非監督學習的方式。研究人員在大量的實驗后發現沒有可靠的證據表明模型可以通過無監督的方式學習到有效的解耦表示,隨機種子和超參數對于結構的影響甚至超過了模型的選擇。換句話說,即使你訓練的大量模型中有部分是解耦的,但這些解耦表示在不基于基準標簽的情況下是無從確認和識別的。此外好的超參數在不同的數據集上并不一致,這意味著沒有歸納偏置(inductive biases)是無法實現非監督解耦學習的(需要把對數據集的假設考慮進模型中)。對于實驗中評測的模型和數據集,研究人員表示無法驗證解耦對于downstream tasks任務有利的假設(這一假設認為基于解耦表示可以利用更少的標簽來進行學習)。下圖展示了研究中的一些發現,可以看到隨機種子在運行中的影響超過了模型的選擇(左)和正則化(右)的強度(更強的正則化并沒有帶來更多的解耦性能)。這意味著很差超參數作用下的好模型也許比很好超參數作用下的壞模型要好得多。

未來研究方向

基于這些全新的發現和研究結果,研究人員為解耦表示領域提出了四個可能的方向:1.在沒有歸納偏置的條件下給出非監督解耦表示學習的理論結果是不可能的,未來的研究應該更多地集中于歸納偏置的研究以及隱式和顯示監督在學習中所扮演的角色;2.為橫跨多數據集的非監督模型尋找一個有效的歸納偏置將會成為關鍵的開放問題;3.應該強調解耦學習在各個特定領域所帶來的實際應用價值,潛在的應用方向包括機器人、抽象推理和公平性等;4.在各種多樣性數據集上的實驗應該保證可重復性。

代碼和工具包

為了讓其他研究人員更好的復現結構,論文同時還發布了 disentanglement_lib工具包,其中包含了實驗所需的模型、度量、訓練、預測以及可視化代碼工具。可以在命令行中用不到四行代碼就能復現是論文中所提到的模型,也可以方便地改造來驗證新的假設。最后 disentanglement_lib庫易于拓展和集成,易于創建新的模型,并用公平的可復現的比較進行檢驗。由于復現所有的模型訓練需要2.5GPU年的算力,所以研究人員同時開放了論文中提到的一萬多個預訓練模型可以配合前述工具使用。如果想要使用這個工具可以在這里找到源碼:

https://github.com/google-research/disentanglement_lib

其中包含了以下內容:模型:BetaVAE, FactorVAE, BetaTCVAE, DIP-VAE度量:BetaVAE score, FactorVAE score, Mutual Information Gap, SAP score, DCI, MCE數據集:dSprites, Color/Noisy/Scream-dSprites, SmallNORB, Cars3D, and Shapes3D預訓練模型:10800 pretrained disentanglement models依賴包:TensorFlow, Scipy, Numpy, Scikit-Learn, TFHub and Gin

git clone https://github.com/google-research/disentanglement_lib.git #下載gitcd disentanglement_lib #轉到源碼目錄pip install .[tf_gpu] #安裝依賴文件dlib_tests #驗證安裝

隨后下載對應的數據文件:

dlib_download_data#在.bashrc寫入路徑export DISENTANGLEMENT_LIB_DATA=

隨后就可以愉快地復現實驗了,其中?是0-12599間的模型序號:dlib_reproduce --model_num=進行評測:dlib_aggregate_results

相信這篇文章的研究結果和代碼工具將為接下來的研究提供更為明確的方向和便捷的途徑,促進非耦合表示學習領域的發展。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 谷歌
    +關注

    關注

    27

    文章

    6176

    瀏覽量

    105677
  • gpu
    gpu
    +關注

    關注

    28

    文章

    4760

    瀏覽量

    129131
  • 數據集
    +關注

    關注

    4

    文章

    1208

    瀏覽量

    24748

原文標題:耗時2.5GPU年訓練12800個模型,谷歌研究人員揭示非耦合表示的奧秘

文章出處:【微信號:thejiangmen,微信公眾號:將門創投】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    AI訓練,為什么需要GPU

    隨著由ChatGPT引發的人工智能熱潮,GPU成為了AI大模型訓練平臺的基石,甚至是決定性的底座。為什么
    的頭像 發表于 04-24 08:05 ?1075次閱讀
    AI<b class='flag-5'>訓練</b>,為什么需要<b class='flag-5'>GPU</b>?

    名單公布!【書籍評測活動NO.43】 芯片 | 高性能 CPU/GPU/NPU 微架構分析

    全球范圍內,對于推動科技進步、經濟發展及社會整體的運作具有至關重要的作用。隨著信息技術的高速發展,高性能計算(HPC)和人工智能(AI)等技術多個領域的應用變得日益廣泛,芯片
    發表于 09-02 10:09

    【「芯片 | 高性能 CPU/GPU/NPU 微架構分析」閱讀體驗】--全書概覽

    GPU、NPU,給我們剖析了芯片的微架構。書中有對芯片方案商處理器的講解,理論聯系實際,使讀者能更好理解芯片。 全書共11章,
    發表于 10-15 22:08

    【「芯片 | 高性能 CPU/GPU/NPU 微架構分析」閱讀體驗】--了解芯片GPU

    從而充分利用 GPU的強大計算能力。CUDA編程模型中,GPU的計算資源被組織為線期線程塊和線程網格3級。線程是基本的執行單元,線程塊是包
    發表于 11-03 12:55

    數據、算法和其實現載體是什么

    背景介紹數據、算法和是人工智能技術的三大要素。其中,體現著人工智能(AI)技術具體實現的能力,實現載體主要有CPU、
    發表于 07-26 06:47

    Ubuntu使用Nvidia GPU訓練模型

    問題最近在Ubuntu使用Nvidia GPU訓練模型的時候,沒有問題,過一會再訓練出現非常卡頓,使用nvidia-smi查看發現,顯示
    發表于 01-03 08:24

    索尼發布新的方法,ImageNet數據224秒內成功訓練了ResNet-50

    近年來,許多研究人員提出了多種方案來解決這兩問題(見原文參考文獻)。這些工作利用ImageNet/ResNet-50訓練來衡量訓練效果。ImageNet/ResNet-50分別是最流
    的頭像 發表于 11-16 10:01 ?9842次閱讀

    GPU如何訓練大批量模型?方法在這里

    深度學習模型數據的規模增長速度已經讓 GPU 也開始捉襟見肘,如果你的
    發表于 12-03 17:24 ?876次閱讀

    ICML 2019最佳論文新鮮出爐!

    這是一篇大規模深入研究無監督解耦表示(Disentangled Representation)的論文,對近年來絕大多數的非監督解耦表示方法進行了探索、利用 2.5GPU
    的頭像 發表于 06-15 10:02 ?5276次閱讀

    利用ImageNet訓練了能降噪、超分和去雨的圖像預訓練模型

    。但是不同的是,因為IPT是同時訓練多個task,因此模型定義了多個head和tail分別對應不同的task。
    的頭像 發表于 03-03 16:05 ?4435次閱讀
    <b class='flag-5'>利用</b>ImageNet<b class='flag-5'>訓練了</b>一<b class='flag-5'>個</b>能降噪、超分和去雨的圖像預<b class='flag-5'>訓練</b><b class='flag-5'>模型</b>

    夯實基礎 賦能大模型創新發展

    《 國產 GPU的大模型實踐 》 的主題演講 , 全面介紹了天數智芯 通用 GPU產品特色 以及 模型
    的頭像 發表于 07-17 22:25 ?580次閱讀
    夯實<b class='flag-5'>算</b><b class='flag-5'>力</b>基礎  賦能大<b class='flag-5'>模型</b>創新發展

    模型“狂歡”之下,之困何解?

    打造一AI大模型究竟需要多少算?公開數據顯示,ChatGPT初始所需的就是1萬塊英偉達A
    的頭像 發表于 08-23 16:09 ?785次閱讀

    20個數據可以訓練神經網絡嗎

    當然可以,20個數據點對于訓練神經網絡來說可能非常有限,但這并不意味著它們不能用于訓練。實際,神經網絡可以
    的頭像 發表于 07-11 10:29 ?1011次閱讀

    【一文看懂】大白話解釋“GPUGPU

    隨著大模型的興起,“GPU”這個詞正頻繁出現在人工智能、游戲、圖形設計等工作場景中,什么是GPU,它與CPU的區別是什么?以及到底什么是
    的頭像 發表于 10-29 08:05 ?815次閱讀
    【一文看懂】大白話解釋“<b class='flag-5'>GPU</b>與<b class='flag-5'>GPU</b><b class='flag-5'>算</b><b class='flag-5'>力</b>”

    PyTorch GPU 加速訓練模型方法

    深度學習領域,GPU加速訓練模型已經成為提高訓練效率和縮短訓練時間的重要手段。PyTorch作
    的頭像 發表于 11-05 17:43 ?591次閱讀
    主站蜘蛛池模板: 男人j桶进女人免费视频| 中文字幕在线二区| 狠狠色噜噜狠狠狠狠2018| 黄在线观看网站| 丁香六月啪| 欧美爱爱帝国综合社区| 国产精品久久久久久久牛牛| 午夜免费毛片| 久操福利视频| 欧美一级特黄啪啪片免费看| 拍拍拍无挡视频免费全程1000| 免费看 s色| 欧美综合成人网| 欧美一级视频免费| 国产专区日韩精品欧美色| 成人a毛片手机免费播放| 久久夜色精品国产尤物| 全部免费a级毛片| 久久久久国产精品免费免费不卡| 国产性较精品视频免费| 亚洲夜夜骑| 久久精品国产精品亚洲红杏| 日日爱视频| 亚洲网站大全| aa黄色毛片| 丁香六月在线| 性久久久久久久久| 亚洲第一中文字幕| 最黄毛片| 奇米狠狠干| 国产精品一区二区三区四区| 日本三级黄色录像| 九色综合伊人久久富二代| bt天堂在线www种子搜索| 97成人在线视频| 毛片又大又粗又长又硬| 欧美30p| 国产在线观看黄色| 狠狠干狠狠艹| 啪啪激情综合| 午夜小影院|