生成對抗網絡(GAN)在機器學習領域展示了創造逼真的圖像和視頻的巨大能力和潛力。除了其生成能力外,對抗學習的概念是一個框架,如果進一步探索,它可能會導致機器學習的巨大突破。
使用易于理解的解釋和圖表,本文將本能地解釋GAN的工作原理,培訓過程中遇到的挑戰以及對抗性學習的力量。
GAN是由兩個模型組成的系統:生成器和鑒別器。
鑒別器只是一個分類器,它確定給定圖像是來自數據集的真實圖像還是來自生成器的人工生成圖像。該二進制分類器將采用卷積神經網絡的形式。
生成器的任務是獲取隨機輸入值(噪聲)并使用反卷積神經網絡從中創建圖像。將這個概念想像成為隨機數生成器設置種子-相同的輸入噪聲將產生相同的輸出。生成器使用隨機噪聲作為種子來生成圖像。
兩模型系統的目的是使生成器欺騙鑒別器,而且使鑒別器以其可能的最高準確度對生成器的圖像進行分類。兩個有價值的對手(生成對抗網絡)之間的這場持續戰役意味著,兩個模型通過擊敗對方而變得更好。生成器使用鑒別器獲取有關其圖像的說服力的反饋,并且鑒別器從生成器獲取更多數據以進行訓練。
反卷積神經網絡(DNN)是GAN的核心。它是負責生成圖像的算法。顧名思義,卷積神經網絡可以被認為是“向后運行CNN”,但其機制要復雜得多。DNN也稱為deconv或轉置卷積神經網絡,其使用的層類似于CNN中的層,但向后的層是向上采樣(而不是向下采樣),從而使圖像更大。
這比CNN困難。通過壓縮或概括其信息來縮小圖像比在不使圖像模糊且具有相同的細節量的情況下放大圖像要容易得多。通過轉置卷積(反卷積)可以解決此問題。
從這個意義上講,如果DNN是GAN的心臟,那么轉置的卷積就是動脈。首先,了解反卷積需要了解卷積。例如,考慮以下卷積:
以下卷積按如下步驟執行,假定步幅為1。卷積將圖像概括為較低維之一。
反卷積層的目標與卷積層的目標相反:采取縮小的圖像和可訓練的核,并預測“原始圖像”。在這種情況下,隨機噪聲將通過一系列反卷積進行轉換,以產生更清晰的圖像。
這些轉置的卷積是根據鑒別結果進行訓練的。如果鑒別器性能較差,則需要生成器的當前權重并適當地欺騙鑒別器。但是,如果鑒別器性能良好,則需要大幅改變發電機的當前權重,以降低鑒別器的性能。換句話說,鑒別器是發生器的損失函數。
盡管這種想法具有革命性,但眾所周知,GAN很難訓練。GAN中的一個常見故障是,鑒別器使生成器過載,以100%的確定性將生成的圖像識別為偽造的圖像。由于鑒別器充當了去卷積層權重調整的損失函數,因此絕對確定性不會使生成器下降。
訓練GAN的另一個常見失敗稱為模式崩潰,其中生成器發現并利用了鑒別器中的弱點。當GAN生成相似的圖像時,無論隨機輸入的變化如何,都可以在GAN中識別出模式崩潰。這意味著生成器僅生成它已獲悉的圖像,幾乎總是會欺騙鑒別器。這意味著生成器沒有改進,因為鑒別器給出的結果很差,這意味著生成器正在產生理想的結果。有時可以通過以某種方式“加強”鑒別器(例如,通過調整其訓練速率或重新配置其層)來糾正模式崩潰。
GAN是基于這樣的思想,即兩個平等匹配的個人之間的競爭既可以改善雙方的競爭,又需要對它們進行健康且嚴格的監管,來讓一個人不會剝削另一個人。生成對抗網絡和對抗學習作為一個領域仍然很年輕,并顯示出巨大的潛力。它們具有塑造數字世界的巨大潛力。
-
圖像采集
+關注
關注
2文章
301瀏覽量
41301 -
GaN
+關注
關注
19文章
1950瀏覽量
73785 -
機器學習
+關注
關注
66文章
8428瀏覽量
132835
發布評論請先 登錄
相關推薦
評論