在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

「自行科技」一文了解生成式對抗網(wǎng)絡(luò)GAN

自行科技 ? 來源:自行科技 ? 作者:自行科技 ? 2022-09-16 09:25 ? 次閱讀

一、什么是GAN網(wǎng)絡(luò)

生成式對抗網(wǎng)絡(luò)(Generative adversarial network, GAN)是一種深度學習模型,是近年來復(fù)雜分布上無監(jiān)督學習最具前景的方法之一。

主要包含兩個模塊:生成器(Generator)和判別器(Discriminator)。生成器要不斷優(yōu)化自己生成的數(shù)據(jù)讓判別器判斷不出來,判別器也要進行優(yōu)化讓自己判斷得更準確。二者關(guān)系形成對抗,因此叫生成式對抗網(wǎng)絡(luò)。

二、 GAN的意義及用途

意義:GAN網(wǎng)絡(luò)可以幫助我們建立模型,相比于在已有模型上進行參數(shù)更新的傳統(tǒng)網(wǎng)絡(luò),更具研究價值。同時,GAN網(wǎng)絡(luò)是一種無監(jiān)督的學習方式,它的泛化性非常好。用途:(1)數(shù)據(jù)生成,主要指圖像生成。圖像生成:基于訓練的模型,生成類似于訓練集的新的圖片。

文本描述生成圖像:給定一個文本描述句,生成符合描述句內(nèi)容的圖像。

(2)圖像數(shù)據(jù)增強:增強圖像中的有用信息,改善圖像的視覺效果。

(3)圖像外修復(fù):從受限輸入圖像生成具有語義意義結(jié)構(gòu)的新的視覺和諧內(nèi)容來擴展圖像邊界。

(4)圖像超分辨率:由一幅低分辨率圖像或圖像序列恢復(fù)出高分辨率圖像。

(5)圖像風格遷移:通過某種方法,把圖像從原風格轉(zhuǎn)換到另一個風格,同時保證圖像內(nèi)容沒有變化。

三、 GAN的發(fā)展

自2014年GAN的第一次提出,GAN在圖像領(lǐng)域、語音與自然語言處理(Natural language processing, NLP)領(lǐng)域以及其他領(lǐng)域開始快速發(fā)展,衍生出了一系列模型。其中,比較流行的有DCGAN(Deep convolutional generative adversarial networks),StyleGAN,BigGAN,StackGAN,Pix2pix,CycleGAN等。

DCGNN:這是第一次在GAN中使用卷積神經(jīng)網(wǎng)絡(luò)(Convolutional neural network, CNN)并取得了非常好的結(jié)果。它是GAN研究的一個里程碑,因為它提出了一個重要的架構(gòu)變化來解決訓練不穩(wěn)定,模式崩潰和內(nèi)部協(xié)變量轉(zhuǎn)換等問題。從那時起,基于DCGAN的架構(gòu)就被應(yīng)用到了許多GAN架構(gòu)。StyleGAN:GAN研究領(lǐng)域的重大突破,在面部生成任務(wù)中創(chuàng)造了新紀錄。算法的核心是風格轉(zhuǎn)移技術(shù)或風格混合。除了生成面部外,它還可以生成高質(zhì)量的汽車,臥室等圖像。BigGAN:用于圖像生成的最新進展,生成的圖像質(zhì)量足以以假亂真,這是GAN首次生成具有高保真度和低品種差距的圖像。StackGAN:2017年,由“StackGAN: Text to Photo-realistic Image Synthesis with Stacked Generative Adversarial Networks”論文中提出。作者使用StackGAN完成文本到圖像的生成過程,并得到了非常好的結(jié)果。Pix2pix:對于圖像到圖像的翻譯任務(wù),Pix2pix也顯示出了令人印象深刻的結(jié)果。無論是將夜間圖像轉(zhuǎn)換為白天的圖像還是給黑白圖像著色,或者將草圖轉(zhuǎn)換為逼真的照片等,Pix2pix都呈現(xiàn)出很好的效果。CycleGAN:將對偶學習與GAN進行結(jié)合,能將一類圖片自動轉(zhuǎn)化為另一類圖片。其中對偶學習是一種類似于雙語翻譯任務(wù)的雙重學習機制,利用原始任務(wù)和雙重任務(wù)之間的反饋信號對模型進行訓練。與輸入必須是成對數(shù)據(jù)的Pix2pix模型相比,CycleGAN對非成對數(shù)據(jù)也能進行訓練,更具普適性。

四、 GAN的網(wǎng)絡(luò)結(jié)構(gòu)

在介紹GAN網(wǎng)絡(luò)結(jié)構(gòu)之前,我們先了解兩個概念:生成器和判別器。

生成器:輸入為隨機數(shù)據(jù),輸出為生成數(shù)據(jù)(通常是圖像)。通常這個網(wǎng)絡(luò)選用最普通的多層隨機網(wǎng)絡(luò)即可,網(wǎng)絡(luò)太深容易引起梯度消失或者梯度爆炸。判別器:我們把生成器生成的數(shù)據(jù)稱為假數(shù)據(jù),對應(yīng)的,來自真實數(shù)據(jù)集的數(shù)據(jù)稱為真數(shù)據(jù)。判別器輸入為數(shù)據(jù)(這里指代真實圖像和生成圖像),輸出是一個判別概率。需注意的是,這里判別的是圖像的真假,而非圖像的類別。輸入一個圖片后,我們并不需要確認這張圖片是什么,而是判別圖像來源于真實數(shù)據(jù)集,還是由生成器輸出得到。網(wǎng)絡(luò)實現(xiàn)同樣可用最基本的多層神經(jīng)網(wǎng)絡(luò)。

bb7607ac7e3f45a7b627be478f55c561~noop.image?_iz=58558&from=article.pc_detail&x-expires=1663895976&x-signature=XSCePeGgL%2Fils61w%2FwM2YlXaCTU%3D

圖1 GAN網(wǎng)絡(luò)結(jié)構(gòu)

GAN 的主要思想就是在生成數(shù)據(jù)的過程中加入一個可以判斷真實數(shù)據(jù)和生成數(shù)據(jù)的判別器,使生成器和判別器相互對抗,判別器的作用是努力地分辨真實數(shù)據(jù)和生成數(shù)據(jù),生成器的作用是努力改進自己從而生成可以迷惑判別器的數(shù)據(jù)。GAN的網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示。GAN網(wǎng)絡(luò)結(jié)構(gòu)主要包含判別器D和生成器G,判別器D和生成器G通常由包含卷積或全連接層的多層網(wǎng)絡(luò)實現(xiàn)。判別器D:使用了混合整流器線性激活函數(shù)和sigmoid激活函數(shù),輸入為真實數(shù)據(jù)x和生成器G輸出的假數(shù)據(jù)G(z)。目標是實現(xiàn)對數(shù)據(jù)來源的二分類判別:真(來源于真實數(shù)據(jù)的分布)或者假(來源于生成器的假數(shù)據(jù)G(z))生成器G:使用了maxout激活函數(shù),輸入為隨機噪聲z。目標是使自己生成的假數(shù)據(jù)G(z)在D上的表現(xiàn)D(G(z)),和真實數(shù)據(jù)x在D上的表現(xiàn)D(x)一致。GAN的訓練包括兩個方面:最大化判別器分類準確率的判別器的參數(shù)和找到最大程度混淆判別器的生成器的參數(shù)。當更新一個模型生成器的參數(shù)時,另一個模型判別器的參數(shù)是固定的,反之亦然。通常是兩個網(wǎng)絡(luò)單獨且交替訓練,先訓練判別器,再訓練生成器,再訓練判別器,如此反復(fù),直到達到納什均衡。

6dc17019175b4ac8a23857844b7c398b~noop.image?_iz=58558&from=article.pc_detail&x-expires=1663895976&x-signature=fOusrrd58047vGm0V4AzJoBvohY%3D

圖2 生成器樣本示例

GAN網(wǎng)絡(luò)訓練用到的數(shù)據(jù)集:MNIST,the Toronto Face Database(TFD)和CIFAR-10數(shù)據(jù)集。圖2展示了經(jīng)過訓練后從生成器中抽取的樣本示例,其中,最右邊的列顯示了鄰近樣本的最近訓練示例,以證明模型沒有記憶訓練集。樣本是公平隨機抽取,而不是精心挑選。圖2中,a)表示GAN網(wǎng)絡(luò)在MNIST數(shù)據(jù)集上的生成效果,b)表示GAN網(wǎng)絡(luò)在TFD數(shù)據(jù)集上的生成效果。c)和d)均表示GAN網(wǎng)絡(luò)在CIFAR-10數(shù)據(jù)集上的生成效果,只是c)中GAN網(wǎng)絡(luò)采取全連接模型,而d)中是卷積判別器和反卷積生成器。在使用GAN進行圖像生成任務(wù)時,比較典型的網(wǎng)絡(luò)結(jié)構(gòu)有DCGAN網(wǎng)絡(luò)和基于先驗知識的StackGAN網(wǎng)絡(luò)。DCGAN將CNN與GAN進行了融合,利用CNN強大的特征提取能力來提高GAN的學習效果。DCGAN主要是在網(wǎng)絡(luò)結(jié)構(gòu)上對 GAN 進行了改進。生成器相當于反卷積網(wǎng)絡(luò),而判別器相當于卷積網(wǎng)絡(luò)。DCGAN的生成器網(wǎng)絡(luò)結(jié)構(gòu)如圖3所示。

1ed704fcb2cd4b13b22cf8d3dc2f2351~noop.image?_iz=58558&from=article.pc_detail&x-expires=1663895976&x-signature=JDbHAdZuTP%2ByMjRLlII9cUZ24%2Bk%3D

圖3 DCGAN生成器網(wǎng)絡(luò)結(jié)構(gòu)

DCGAN網(wǎng)絡(luò)最先采用CNN結(jié)構(gòu)實現(xiàn)GAN模型,介紹了如何使用卷積層,并給出一些額外的結(jié)構(gòu)上的指導建議來實現(xiàn)。另外,它還討論如何可視化GAN的特征、隱空間的插值、利用判別器特征訓練分類器以及評估結(jié)果。關(guān)于DCGAN的應(yīng)用主要集中在圖像處理方面,可以說這個模型是最典型、應(yīng)用最廣泛的GAN變種模型。StackGAN是一種新的堆疊生成對抗網(wǎng)絡(luò),用于從文本描述合成照片真實感圖像,其網(wǎng)絡(luò)結(jié)構(gòu)如圖4。StackGAN首次從文本描述生成256×256分辨率的圖像,且生成的圖像具有照片般逼真的細節(jié)。StackGAN網(wǎng)絡(luò)結(jié)構(gòu)分為兩個部分:Stage-ⅠGAN和Stage-ⅡGAN。 Stage-ⅠGAN:根據(jù)給定的文本描述,繪制對象的原始形狀和原始顏色,并根據(jù)隨機噪聲向量繪制背景布局,生成低分辨率圖像。生成器G0:首先是經(jīng)過一個CA(調(diào)節(jié)增強技術(shù))模塊,對文本嵌入進行降維。StackGAN沒有直接將降維后的文本嵌入作為condition,而是將它接了一個全連接層,并從得到的獨立的高斯分布中隨機采樣得到高斯條件變量。接著,將高斯條件變量與噪聲向量經(jīng)過級聯(lián)得到的一組向量輸入到生成器中,然后,經(jīng)過上采樣之后生成一張64*64的圖像。判別器D0:首先,文本嵌入經(jīng)過一個全連接層被壓縮到128維,然后經(jīng)過空間復(fù)制將其擴成一個4×4×128的張量。同時,圖像會經(jīng)過一系列的下采樣到4×4。然后,圖像過濾映射會連接圖像和文本張量的通道。隨后,張量會經(jīng)過一個1×1的卷積層去連接跨文本和圖像學到的特征。最后,會通過只有一個節(jié)點的全連接層去產(chǎn)生圖像真假的概率。

d86f744ed3b24a519e53b7a617100a96~noop.image?_iz=58558&from=article.pc_detail&x-expires=1663895976&x-signature=XPAN687P4hLS4TCRll5hm9c6988%3D

圖4 StackGAN網(wǎng)絡(luò)結(jié)構(gòu)

Stage-Ⅱ GAN:

修正第一階段低分辨率圖像的缺陷,通過再次文本描述來完成對象的細節(jié),生成了高分辨率的真實感圖像。與通常的GAN不同,本階段不使用隨機噪聲。

生成器G:將第二階段生成器設(shè)計為一個具有殘差塊的編解碼網(wǎng)絡(luò)。Stage-Ⅰ GAN生成的64×64的圖片,加上對文本嵌入進行CA操作得到的高斯條件變量,與前一階段相似,高斯條件變量被擴成一個16×16×128的張量(綠色部分)。同時,由前一個GAN生成的64×64的圖像,會經(jīng)過下采樣變成16×16(紫色部分)。連接圖像特征和文本特征后,經(jīng)過殘差塊,再上采樣,生成圖片。判別器D:對于判別器,其結(jié)構(gòu)類似于第一階段判別器,僅具有額外的下采樣塊。另外,為了明確地強制GAN更好地學習圖像和條件文本之間的對齊,我們在兩個階段都采用了匹配感知判別器。StackGAN訓練用到的數(shù)據(jù)集:CUB,Oxford-102和MS COCO數(shù)據(jù)集。圖5中a),b)和c)分別展示了基于這三個數(shù)據(jù)集的測試集,StackGAN網(wǎng)絡(luò)生成的圖像示例。總體來說,StackGAN生成的高分辨率的圖像,細節(jié)信息較豐富,且能較好地反映相應(yīng)的文本描述。

6a813559535946bf8203d46eead0e51f~noop.image?_iz=58558&from=article.pc_detail&x-expires=1663895976&x-signature=HoMCC7vCBtxtt10aBraagn%2BQLng%3D

圖5 StackGAN網(wǎng)絡(luò)生成的圖像示例

五、 GAN的實際應(yīng)用示例圖

(1)生成人臉:

fb74ae67eddd4a799f52035f9798ee7a~noop.image?_iz=58558&from=article.pc_detail&x-expires=1663895976&x-signature=L8rW2B3THzmcP0ghTZrjuzkcWEs%3D

圖6 基于GAN方法生成人臉

(2)語義圖像-圖片轉(zhuǎn)化:

4ae1be5926364717b1c28c9b3797b00d~noop.image?_iz=58558&from=article.pc_detail&x-expires=1663895976&x-signature=0D8Ush0PloJ1UnIKizN6N9uhayY%3D

圖7基于GAN方法將語義圖像轉(zhuǎn)化成圖片

(3)生成動漫人物形象:

72b4685c039c413e89e76dc3cc68c9ec~noop.image?_iz=58558&from=article.pc_detail&x-expires=1663895976&x-signature=p%2FSgwFxDUZQlWJjN7rMs%2BMibS1M%3D

圖8基于GAN方法生成動漫人物

(4)路況預(yù)測:圖9中,奇數(shù)列顯示解碼圖像,偶數(shù)列顯示目標圖像:

25dc239df8f342ac8c1108be14968389~noop.image?_iz=58558&from=article.pc_detail&x-expires=1663895976&x-signature=esrwokKvYpan9LdkokilKtJQRDg%3D

圖9基于GAN方法的路況預(yù)測結(jié)果

(5)人臉圖像修復(fù):圖10中,依次顯示真實圖像,缺失圖像,修復(fù)圖像:

2dc8ed2df326433c96658e390cbf5b75~noop.image?_iz=58558&from=article.pc_detail&x-expires=1663895976&x-signature=9f766TwEUQANvaZsxm0ZCfFfMPc%3D

圖10基于GAN方法修復(fù)人臉圖像



審核編輯 黃昊宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 深度學習
    +關(guān)注

    關(guān)注

    73

    文章

    5509

    瀏覽量

    121325
收藏 人收藏

    評論

    相關(guān)推薦

    #新年新氣象,大家新年快樂!#AIGC入門及鴻蒙入門

    Generated Content,即人工智能生成內(nèi)容。它利用人工智能技術(shù)自動生成或輔助生成文本、圖像、音頻、視頻等內(nèi)容。 AIGC的核心技術(shù)包括自然語言處理(NLP)、計算機視覺、生成對抗
    發(fā)表于 01-13 10:46

    AIGC入門及鴻蒙入門

    Generated Content,即人工智能生成內(nèi)容。它利用人工智能技術(shù)自動生成或輔助生成文本、圖像、音頻、視頻等內(nèi)容。 AIGC的核心技術(shù)包括自然語言處理(NLP)、計算機視覺、生成對抗
    發(fā)表于 01-13 10:32

    言登頂中國生成AI使用率榜首

    人工智能產(chǎn)品的用戶規(guī)模已達到2.3億人,占整體人口的16.4%。這數(shù)據(jù)表明,生成人工智能產(chǎn)品在網(wǎng)民中已經(jīng)形成了相當規(guī)模的用戶群體,并且未來仍有顯著的增長空間。 在激烈的市場競爭中,百度
    的頭像 發(fā)表于 12-04 14:03 ?374次閱讀

    不懂就問AI:AI大模型embeding是什么

    osc推看到部分內(nèi)容,關(guān)于AI的,雖然作者早期也做過AI的部分工作,就是簡單的訓練和預(yù)測,也是用的GAN等類似的生成對抗
    的頭像 發(fā)表于 11-09 10:31 ?732次閱讀
    不懂就問AI:AI大模型embeding是什么

    生成AI工具作用

    生成AI工具是指那些能夠自動生成文本、圖像、音頻、視頻等多種類型數(shù)據(jù)的人工智能技術(shù)。在此,petacloud.ai小編為您整理生成AI工
    的頭像 發(fā)表于 10-28 11:19 ?269次閱讀

    GaN有體二極管嗎?了解GaN的第三象限運行

    電子發(fā)燒友網(wǎng)站提供《GaN有體二極管嗎?了解GaN的第三象限運行.pdf》資料免費下載
    發(fā)表于 09-19 12:55 ?6次下載
    <b class='flag-5'>GaN</b>有體二極管嗎?<b class='flag-5'>了解</b><b class='flag-5'>GaN</b>的第三象限運行

    三行代碼完成生成AI部署

    LLM加載與推理部署能力,實現(xiàn)了OpenVINO對CNN網(wǎng)絡(luò)生成模型、LLM網(wǎng)絡(luò)主流模型的全面推理支持。
    的頭像 發(fā)表于 08-30 16:49 ?432次閱讀
    三行代碼完成<b class='flag-5'>生成</b><b class='flag-5'>式</b>AI部署

    生成對抗網(wǎng)絡(luò)(GANs)的原理與應(yīng)用案例

    生成對抗網(wǎng)絡(luò)(Generative Adversarial Networks,GANs)是種由蒙特利爾大學的Ian Goodfellow等人在2014年提出的深度學習算法。GANs通過構(gòu)建兩個
    的頭像 發(fā)表于 07-09 11:34 ?1151次閱讀

    生成AI的定義和特征

    生成人工智能(Generative Artificial Intelligence, GAI)是人工智能領(lǐng)域的個重要分支,它利用機器學習算法,特別是深度學習技術(shù),使計算機能夠模擬人類的創(chuàng)造性
    的頭像 發(fā)表于 07-05 17:33 ?1145次閱讀

    生成AI的基本原理和應(yīng)用領(lǐng)域

    生成人工智能(Generative Artificial Intelligence,簡稱Generative AI)是種利用機器學習算法和深度學習技術(shù),通過模擬人類的創(chuàng)造性思維過程,生成
    的頭像 發(fā)表于 07-04 11:50 ?1618次閱讀

    生成AI與神經(jīng)網(wǎng)絡(luò)模型的區(qū)別和聯(lián)系

    生成AI與神經(jīng)網(wǎng)絡(luò)模型是現(xiàn)代人工智能領(lǐng)域的兩個核心概念,它們在推動技術(shù)進步和應(yīng)用拓展方面發(fā)揮著至關(guān)重要的作用。本文將詳細探討生成AI與神
    的頭像 發(fā)表于 07-02 15:03 ?844次閱讀

    原來這才是【生成AI】!!

    隨著ChatGPT、言等AI產(chǎn)品的火爆,生成AI已經(jīng)成為了大家茶余飯后熱議的話題。可是,為什么要在AI前面加上“生成
    的頭像 發(fā)表于 06-05 08:04 ?290次閱讀
    原來這才是【<b class='flag-5'>生成</b><b class='flag-5'>式</b>AI】!!

    深度學習生成對抗網(wǎng)絡(luò)GAN)全解析

    GANs真正的能力來源于它們遵循的對抗訓練模式。生成器的權(quán)重是基于判別器的損失所學習到的。因此,生成器被它生成的圖像所推動著進行訓練,很難知道生成
    發(fā)表于 03-29 14:42 ?4659次閱讀
    深度學習<b class='flag-5'>生成對抗</b><b class='flag-5'>網(wǎng)絡(luò)</b>(<b class='flag-5'>GAN</b>)全解析

    pcb應(yīng)變測試有多重要?了解

    pcb應(yīng)變測試有多重要?了解
    的頭像 發(fā)表于 02-24 16:26 ?1144次閱讀

    生成人工智能和感知人工智能的區(qū)別

    生成新的內(nèi)容和信息的人工智能系統(tǒng)。這些系統(tǒng)能夠利用已有的數(shù)據(jù)和知識來生成全新的內(nèi)容,如圖片、音樂、文本等。生成人工智能通常基于深度學習技術(shù),如生成
    的頭像 發(fā)表于 02-19 16:43 ?1878次閱讀
    主站蜘蛛池模板: 男女做视频网站免费观看| 久久青青成人亚洲精品| 长腿丝袜美女被啪啪| 激情五月社区| 亚洲爽爽网站| 五月综合色| 日韩视频高清| 两性午夜欧美高清做性| 很狠操| qyule亚洲精品| 天天干网址| 亚洲图片综合区另类图片| 99久久精品免费看国产免费| 伊人男人天堂| 色综合久久综合| 嫩草黄色影院| 高h肉肉视频在线播放观看| 在线观看s色| 久久香蕉精品视频| 欲色啪| 俄罗斯美女在线观看一区| 性色aⅴ闺蜜一区二区三区| 色多多在线视频| 经典三级第一页| 欧美.亚洲.日本一区二区三区| 最新国产在线播放| 色老成人精品视频在线观看 | 成人午夜网站| 亚洲二区视频| 亚1州区2区3区4区产品乱码| 欧美在线一区二区三区| 高清色视频| 美女自熨出白浆视频在线播放| 人人揉揉香蕉大青草| 中文字幕色综合久久| 日韩精品午夜| 国产啊v在线观看| 久久久一本波多野结衣| 亚洲卡一卡2卡三卡4卡国色| 无遮挡很爽很污很黄很色的网站| 免费看成年视频网页|