在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

基于GAN-inversion的圖像重構過程

深度學習自然語言處理 ? 來源:深度學習自然語言處理 ? 作者:深度學習自然語言 ? 2022-07-13 14:19 ? 次閱讀

筆者最近在集中時間學習對抗生成網絡(GAN),特別是深度生成先驗進行多用途圖像修復與處理,需要對圖像修復與處理經典論文進行回顧和精讀。

將從圖像修復與處理的經典之作DGP《Exploiting Deep Generative Prior for Versatile Image Restoration and Manipulation》開始,重啟精讀之路。

DGP提出了一種挖掘GAN中圖像先驗的方式,在多個任務上揭示了GAN作為一種通用圖像先驗的潛力。

論文提出了同時插值隱變量和生成器的漸變式圖像反演方法,可以應用于復雜圖片的對抗防御,在實驗中DGP所展現出的強大的像素間空間關系模擬能力也十分有趣。

Deep generative prior的圖像復原效果

01深度生成先驗

深度圖像先驗DIP僅依靠輸入圖像的統計信息,無法應用于需要更一般的圖像統計信息的任務,如圖像上色和圖像編輯。

我們更感興趣的是研究一種更通用的圖像先驗,即在大規模自然圖像上訓練的GAN生成器用于圖像合成。具體來說,是一個基于GAN-inversion的圖像重構過程。

在實踐中,僅僅通過優化隱向量z難以準確重建ImageNet這樣的復雜真實圖像。訓練GAN的數據集(ImageNet)本身是自然圖片中很少的一部分,GAN受限于有限的模型性能和mode collapse,其模擬的圖片分布與訓練集圖片分布也存在鴻溝。

即使存在以上限制,GAN仍然學習了豐富的圖片信息,為了利用這些信息并且實現精確重建,我們讓生成器online地適應于每張目標圖片,即聯合優化隱向量z和生成器參數

e8a3abdc-026d-11ed-ba43-dac502259ad0.png

我們將此新的目標稱為深度生成先驗(DGP),DGP顯著提高了圖像重構的效果。設計合適的距離度量和優化策略非常關鍵,在重建過程中,生成器原始的生成先驗被修改了,輸出真實自然圖像的能力可能會下降。

02判別器指引的漸進式重建

從 latent space Z 中隨機抽取幾百個候選的初始 latent code,并選擇在度量L下重構效果最好的一個。

在GAN重建中,傳統的距離度量方法是 MSE 或 Perceptual loss。優化生成器參數時,將這些傳統距離度量用在圖像恢復如上色任務中,常常無法準確恢復顏色,并且重建過程中圖像會變得模糊,需要設計更好的優化方式來保留生成器的原有信息。

我們在該工作中選擇使用與生成器對應的判別器來作為距離度量。與Perceptual loss所采用的VGGNet不同,判別器并非在一個第三方的任務上訓練,而是在預訓練時就與生成器高度耦合,它天然地適用于調整生成器的輸出分布。

使用這種基于判別器的距離度量時,重建的過程更加自然和真實,最終顏色恢復的效果也更好。

e8da5646-026d-11ed-ba43-dac502259ad0.png

其中D(x, i)代表以x作為輸入時判別器第i個block輸出的特征

雖然改進的距離度量帶來了更好的效果,但是圖像復原的結果仍存在非自然痕跡,因為生成器在針對目標圖片優化時,淺層參數匹配好圖片整體布局之前,深層參數就開始匹配細節紋理了。

e8efceea-026d-11ed-ba43-dac502259ad0.png

上面的蘋果圖是幾種訓練策略的對比,從三行效果可以看出,有的蘋果在訓練初期沒被染上色后期還是沒被染上色,我們把這種現象稱作“信息滯留”。

對策就是:使用漸進式重建的策略,即在微調生成器時,先優化淺層,再逐漸過渡到深層,讓重建過程“先整體后局部”。

與非漸進策略相比,這種漸進策略更好地保留了缺失語義和現有語義之間的一致性。

e91b971e-026d-11ed-ba43-dac502259ad0.png

03重建結果

使用BigGAN模型,基于ImageNet進行訓練,使用ImageNet驗證集中的1000張圖像進行實驗,取每類的第一張,相比于其他方法,DGP取得了非常高的PSNR和SSIM,視覺上的重建誤差幾乎難以察覺。

04實驗

因為GAN刻畫了自然圖像的先驗,因此可以完成很多的任務:比如上色、補全、超分辨率等等,還能進行圖像處理。下面放一些效果圖。

圖像上色

使用ResNet50上的分類精度作為定量評估結果, 下列方法的精度分別為 51.5%, 56.2%, 56.0%, 62.8%。

e9a097ca-026d-11ed-ba43-dac502259ad0.png

圖像補全

e9c15870-026d-11ed-ba43-dac502259ad0.png

超分辨率

e9e2b7a4-026d-11ed-ba43-dac502259ad0.png

靈活性

e9f9a248-026d-11ed-ba43-dac502259ad0.png

隨機擾動

ea27bb4c-026d-11ed-ba43-dac502259ad0.png

總結

GAN作為圖像領域最強大的生成式模型之一,學習到了豐富的自然圖像流形,可以對自然圖像的恢復和編輯帶來巨大幫助。

利用好大規模預訓練模型的能力是深度學習目前各個領域的流行前沿,可以減少對訓練數據的需求,整合相近的研究領域。

未來更強大的生成式模型,將帶來更具實際應用價值的圖像恢復和編輯應用,有望在更廣泛的領域落地

ea5a7d48-026d-11ed-ba43-dac502259ad0.png

原文標題:深度學習論文精讀[GAN]:利用深度生成先驗進行多用途圖像修復與處理

文章出處:【微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。

審核編輯:彭靜
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • GaN
    GaN
    +關注

    關注

    19

    文章

    1950

    瀏覽量

    73783
  • 生成器
    +關注

    關注

    7

    文章

    317

    瀏覽量

    21061
  • 深度學習
    +關注

    關注

    73

    文章

    5510

    瀏覽量

    121337

原文標題:深度學習論文精讀[GAN]:利用深度生成先驗進行多用途圖像修復與處理

文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    基于相變材料的可重構超構表面用于圖像處理

    光學超構表面(metasurface)實現了在亞波長尺度內的模擬計算和圖像處理,并具備更低的功耗、更快的速度。雖然人們已經展示了各種圖像處理超構表面,但大多數考慮的器件都是靜態的,缺乏可重構性。然而
    的頭像 發表于 11-13 10:24 ?363次閱讀
    基于相變材料的可<b class='flag-5'>重構</b>超構表面用于<b class='flag-5'>圖像</b>處理

    GaN有體二極管嗎?了解GaN的第三象限運行

    電子發燒友網站提供《GaN有體二極管嗎?了解GaN的第三象限運行.pdf》資料免費下載
    發表于 09-19 12:55 ?6次下載
    <b class='flag-5'>GaN</b>有體二極管嗎?了解<b class='flag-5'>GaN</b>的第三象限運行

    GaN應用介紹

    電子發燒友網站提供《GaN應用介紹.pdf》資料免費下載
    發表于 09-12 09:55 ?0次下載
    <b class='flag-5'>GaN</b>應用介紹

    GaN晶體管的應用場景有哪些

    GaN(氮化鎵)晶體管,特別是GaN HEMT(高電子遷移率晶體管),近年來在多個領域展現出廣泛的應用場景。其出色的高頻性能、高功率密度、高溫穩定性以及低導通電阻等特性,使得GaN晶體管成為電力電子和高頻通信等領域的優選器件。以
    的頭像 發表于 08-15 11:27 ?1014次閱讀

    重構:改善既有代碼的設計」實戰篇

    背景 在軟件開發的世界里,代碼重構是提升項目質量、適應業務變化的關鍵步驟。最近,我重新翻閱了《重構:改善既有代碼的設計 第二版》,這本書不僅重新點燃了我對重構的熱情,還深化了我的理解:重構
    的頭像 發表于 08-14 10:42 ?290次閱讀
    「<b class='flag-5'>重構</b>:改善既有代碼的設計」實戰篇

    圖像檢測和圖像識別的原理、方法及應用場景

    的目標物體的過程。它的目標是確定圖像中是否存在特定的物體,并在圖像中找到這些物體的位置,通常以矩形框的形式表示。 1.2 圖像識別 圖像識別
    的頭像 發表于 07-16 11:19 ?4640次閱讀

    圖像識別技術的原理是什么

    值化、濾波、邊緣檢測等操作。這些操作可以提高圖像的質量,減少噪聲,突出圖像的特征,為后續的特征提取和分類器設計提供基礎。 1.1 去噪 去噪是去除圖像中的噪聲,提高圖像質量的
    的頭像 發表于 07-16 10:46 ?1214次閱讀

    GaN MOSFET 器件結構及原理

    GaN MOSFET(氮化鎵金屬氧化物半導體場效應晶體管)是一種新型的功率器件,具有高功率密度、高效率和快速開關速度等優點。與傳統的硅基MOSFET相比,GaN MOSFET具有更高的電子遷移率
    的頭像 發表于 07-14 11:39 ?1428次閱讀

    CGD為電機控制帶來GaN優勢

    評估套件具有 Qorvo 的高性能無刷直流 / 永磁同步電機控制器 / 驅動器和 CGD 易于使用的 ICeGaN GaN 功率 IC 的性能 ? 英國劍橋 - Cambridge GaN
    發表于 06-07 17:22 ?1762次閱讀
    CGD為電機控制帶來<b class='flag-5'>GaN</b>優勢

    STDRIVEG600驅動GAN逆變器,在某一拍出現控制信號丟失,導致電機電流跌落的原因?

    STDRIVEG600驅動GAN逆變器時候,在某一拍出現控制信號丟失,導致電機電流出現跌落情況 上圖紫色的是電機電流,青色的是上管的PWM給定信號,黃色的是經過了GAN開關管驅動
    發表于 03-13 06:14

    功率GaN的多種技術路線簡析

    電子發燒友網報道(文/梁浩斌)功率GaN的大規模應用,其實也只有六七年的歷史,從2018手機快速充電器上才正式吹響了普及的號角。目前,從晶體管來看,功率GaN主要的產品是HEMT(高電子遷移率晶體管
    的頭像 發表于 02-28 00:13 ?2925次閱讀

    圖像編碼常見的編碼方式和處理過程

    圖像編碼是將圖像數據轉換為數字形式的過程,通常通過壓縮圖像數據以便于存儲和傳輸。圖像編碼的主要目標是在盡可能減少數據量的同時,保持
    的頭像 發表于 02-26 14:32 ?1.2w次閱讀

    功率GaN,炙手可熱的并購賽道?

    ? 電子發燒友網報道(文/梁浩斌)繼去年英飛凌收購GaN Systems之后,2024年1月,另一家汽車芯片大廠瑞薩也收購了功率GaN公司Transphorm。 ? Transphorm在2022年
    的頭像 發表于 02-26 06:30 ?2491次閱讀
    功率<b class='flag-5'>GaN</b>,炙手可熱的并購賽道?

    關于數字圖像處理的常用技巧

    圖像生成采集處理過程中都會不同程度的引入各種噪聲,因此會導致圖像的質量變差。從而影響對圖像的識別。所以必須要對圖像進行濾波,所以必須對
    的頭像 發表于 02-19 09:27 ?971次閱讀
    關于數字<b class='flag-5'>圖像</b>處理的常用技巧

    相機圖像處理過程詳解

    指的是專門用來處理感光件信號并生成最終圖像的硬件,通常會作為一個模塊集成到片上系統。
    的頭像 發表于 01-22 11:21 ?2002次閱讀
    相機<b class='flag-5'>圖像</b>處理<b class='flag-5'>過程</b>詳解
    主站蜘蛛池模板: 国产呦精品系列在线| 国产午夜免费视频片夜色| 国产成人亚洲日本精品| 男人搡女人视频免费看| 在线www 天堂网在线| 成人a毛片视频免费看| 成年片免费网址网站| 亚洲视频天天射| 天天操夜夜欢| 黄网免费| 国产女人小便视频| 男女无遮挡在线完整视频| 不卡视频免费在线观看| 性无码专区无码| 国产三级在线| 亚洲网站www| 乱小说录目伦800| 一品毛片| 日本三级电影在线观看| 特级片毛片| 欧洲色| 国产精品欧美一区二区三区 | 在线观看免费观看| 亚洲网站在线看| 亚洲天堂婷婷| 欧美激欧美啪啪片免费看| 国产色丁香久久综合| 夜夜爽免费视频| 九草伊人| 立即播放免费毛片一级| 在线黄视频| 国产精品久久免费观看| 思思久久96热在精品不卡| 美女被拍拍拍拍拍拍拍拍| a级毛片免费观看网站| 欧美啊片| 国产午夜精品久久久久| 午夜性视频| 四虎影院黄色| 韩国三级理论在线观看视频| www色多多|