目前,人工智能(AI)領域正在快速發(fā)展,每隔一段時間就取得新的突破。最近突出的一個詞是Generative Adversarial Network(GAN) - 但這是什么意思?
名詞解釋:究竟什么是生成對抗網(wǎng)絡(GAN)?
GAN背后的理念最初是在2014年提出的,在最基本的層面上將,它描述了一個系統(tǒng),這個系統(tǒng)中將兩個AI系統(tǒng)(神經(jīng)網(wǎng)絡)相互對立,以提高模型輸出結(jié)果的質(zhì)量。
為了理解GAN是如何工作的,可以想象一個盲人偽造者試圖仿造一幅大師的畫作。首先,他并不知道這幅畫應該是什么樣子的,但他碰巧有一位朋友對所有大師的杰作都有照片般的記憶。
這位朋友相當于一名偵探,必須確定他的朋友所展示的畫作是與真正偉大大師創(chuàng)作的畫作一致,還是明顯的贗品。
這是GAN運行的基本機制——只不過這位偽造者他的朋友都是AI,行事速度超快,每秒可以制造和檢測數(shù)千件贗品。然后兩人都從結(jié)果中進行“學習”,以改善在未來的表現(xiàn)。偵探在檢測贗品方面的能力越來越強,要求偽造者必須要把贗品做的更逼真才行。
近年來,由于GAN能夠基于現(xiàn)有的真實信息建立的規(guī)則制造出“新”信息,因此在人工智能開發(fā)領域引起了廣泛關注。編寫說明書可能是一個典型的例子。開發(fā)人員在成千上萬的指導手冊的內(nèi)容作為訓練數(shù)據(jù)對GAN進行訓練,有朝一日可以創(chuàng)建一個可以查看任何工具,設備或軟件的系統(tǒng),再為這個系統(tǒng)生成一份使用說明書。
如何設計了解你感覺的AI
接下來,讓我們更深入地研究一下GAN的工作機制。負責創(chuàng)建虛假數(shù)據(jù)的“偽造”網(wǎng)絡被稱為生成網(wǎng)絡,它的工作是閱讀并理解訓練數(shù)據(jù)的特征屬性。然后嘗試通過生成遵循相同規(guī)則的“候選”數(shù)據(jù)集來復制這些訓練數(shù)據(jù)。
“偵探”網(wǎng)絡的作用是識別生成網(wǎng)絡的輸出數(shù)據(jù)是(人工生成的)假數(shù)據(jù),還是真實的(訓練)數(shù)據(jù),這個“偵探”稱為判別網(wǎng)絡。因為判別網(wǎng)絡與生成網(wǎng)絡進行對抗性競爭,所以整個系統(tǒng)被描述為“對抗性網(wǎng)絡”。
對于GAN的應用實例,最典型的就是“假臉生成工具”。為網(wǎng)站提供動力的網(wǎng)絡已經(jīng)學會了制作人臉的超逼真圖像,雖然這些人臉圖像幾乎完美再現(xiàn)了真實人臉圖像的一切細節(jié)特征和規(guī)則,但無一例外都是計算機程序生成的,現(xiàn)實世界中并不存在。
人們可能存在這樣的固有印象,即計算機是將人們的眼睛、耳朵、嘴巴和頭發(fā)的數(shù)據(jù)庫中的碎片數(shù)據(jù)組合在一起,來構(gòu)建面部圖像的,但事實并非如此。生成網(wǎng)絡的“輸入”數(shù)據(jù)只是一串數(shù)字,只有判別網(wǎng)絡才能看到訓練數(shù)據(jù)。生成網(wǎng)絡需要完全基于判別網(wǎng)絡的輸出來改善自己的輸出。
作為判別網(wǎng)絡給出的唯一反饋,是對生成網(wǎng)絡輸出是否與訓練數(shù)據(jù)匹配的“是或否”的判斷,這個生成—判斷—再生成的過程要循環(huán)多次,生成網(wǎng)絡和判別網(wǎng)絡的性能不斷提升后,才可能產(chǎn)生與訓練輸入足夠相似的人臉圖像輸出。
(這個例子實際上借用了去年由Nvidia開發(fā)的proGAN模型,該模型在與運行過程中會逐漸增加生成網(wǎng)絡輸出的圖像分辨率,從4*4超低分辨率開始,最終生成逼真的人臉。)
用于訓練對抗性網(wǎng)絡的數(shù)據(jù)不必為標記數(shù)據(jù),因為判別網(wǎng)絡可以完全基于訓練數(shù)據(jù)本身的特征來對生成網(wǎng)絡的輸出做出判斷。所以,GAN既可以用于監(jiān)督學習,也可以用于無監(jiān)督學習和強化學習。
GAN的另一個用處是為其他AI應用程序高效地創(chuàng)建訓練數(shù)據(jù)集。大多數(shù)當前的AI技術,特別是深度學習技術,都依賴于海量的訓練數(shù)據(jù)。
GAN可以生成遵循“自然”數(shù)據(jù)集的所有規(guī)則的數(shù)據(jù)集,因此理論上可以用于深度學習模型的訓練。這一點對于醫(yī)學成像領域非常有用,收集真實數(shù)據(jù)成本高、耗時久,而且需要患者同意,以及大量的醫(yī)學專業(yè)知識才能對其進行數(shù)據(jù)標記。利用GAN可以有效克服這些障礙。
GAN可用于創(chuàng)建虛構(gòu)的圖像,移動視頻,文本甚至是音樂。雖然近期對GAN存在著大量炒作,但它顯然是近年來從AI領域出現(xiàn)的最有趣的新概念之一,我們可以期待在不久的將來看到更多基于GAN的令人興奮的新應用。
-
AI
+關注
關注
87文章
31028瀏覽量
269381 -
GaN
+關注
關注
19文章
1944瀏覽量
73650
原文標題:GAN零基礎入門:從偽造視頻到生成假臉
文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關推薦
評論