4月1日,張國榮“復(fù)活”了。網(wǎng)友用AI+特效技術(shù),給張國榮換臉,并且演唱了兩首經(jīng)典歌曲。6分鐘的“復(fù)活”視頻,紀(jì)念哥哥。
再次見到你,真好。
4月1日愚人節(jié),也是張國榮的忌日。今天,在哥哥張國榮離開的第16個年頭,有網(wǎng)友用AI讓張國榮“復(fù)活”,并且演唱了經(jīng)典歌曲《千千闕歌》、《玻璃之情》。
在視頻中,AI“復(fù)活”的哥哥正在錄音棚中錄著歌曲,開場一開口,從唱歌的表情、動作都與張國榮頗為神似。網(wǎng)友們不經(jīng)大呼:“太像了”、“淚目”、“哭了”、“想你了,哥哥”。
張國榮是那般的傳奇,芳華絕代,盡管去世16年,但每年的4月1日,人們一直想努力把他的每一面都留下來,今年是AI。
AI“復(fù)活”張國榮6分鐘
這段視頻長達(dá)6分鐘,“張國榮”分別穿著兩套衣服唱完兩首歌,而這些鏡頭,也讓網(wǎng)友們不禁感慨:他仿佛從未離開過。
而在錄制第二首歌曲時,出現(xiàn)了一個特別有意思的鏡頭:哥哥竟然在直播!
新智元了解到,“復(fù)活”張國榮視頻的作者是來自B站的Up主QuantumLiu(知乎“天清”),目前在國內(nèi)視覺特效公司Studio51做技術(shù)。
據(jù)該Up主描述,張國榮的視頻使用了自主研發(fā)的AI換臉技術(shù),清晰度、還原度均領(lǐng)先于業(yè)內(nèi)其他使用Deepfakes的效果,張國榮視頻的分辨率也達(dá)到了1080P。
QuantumLiu告訴新智元,換臉視頻中的男生跟張國榮長相差距很大,“是個北方漢子”,但是歌曲是“北方漢子”原聲,沒有用張國榮的原聲,也沒經(jīng)過處理。
這個6分鐘左右的視頻,從拍攝和錄音、剪輯,前后花了一個多星期左右時間,積累的原素材大概是20分鐘,做換臉真正的運算時間只有8個小時左右。
“我們用的是變分自動編碼器,借鑒了deepfakes的思路,但是解決了很多問題,比如高質(zhì)量數(shù)據(jù),魯棒性,訓(xùn)練速度,分布式訓(xùn)練,還結(jié)合公司特效業(yè)務(wù)的經(jīng)驗,優(yōu)化了合成環(huán)節(jié),讓放回視頻里的人臉融合得更自然。相比于其他使用開源程序的愛好者,我們是一個即將商用的系統(tǒng),高達(dá)1080p+的分辨率是其他人做不到的。”
QuantumLiu說,下一步,公司會利用高清的優(yōu)勢和在影視行業(yè)的業(yè)務(wù),進(jìn)軍影視級別高清換臉,并開發(fā)換臉開放平臺,讓所有人都可以玩轉(zhuǎn)視頻換臉。
朱茵變楊冪,分辨率低好操作
其實,AI換臉并不是非常新鮮的技術(shù)了。前一陣子便有朱茵變楊冪,海王變徐錦江的相關(guān)報道。
《射雕英雄傳》中,朱茵變楊冪
海王變徐錦江
這些技術(shù)的背后,是2017年年底的Deepfakes軟件帶來的結(jié)果。當(dāng)時Reddit用戶Deepfakes,將《神奇女俠》的女主角蓋爾·加朵、以及艾瑪沃森、斯嘉麗等眾多女明星的臉跟AV***進(jìn)行了交換,制作出足以以假亂真的愛情動作片。
不過,QuantumLiu認(rèn)為,目前的網(wǎng)上的作品都是用一個基礎(chǔ)fakeapp軟件去做的,純娛樂,所以只能找那些很低分辨率的片段去更換(比如朱茵變楊冪)。
國內(nèi)也有過銀幕上的換臉。在2017年科幻喜劇《不可思異》中,當(dāng)時由于演員的原因,片方不得不臨時換角,由大鵬代替杜汶澤所有戲份,進(jìn)行了一次“特效換臉”手術(shù)。
但這次換臉,是用通過純手工的方式一幀幀地修改畫面,耗時將近6個月,才將影片中所有的鏡頭都換完。在價格上,可以說是“一秒千金”。
而AI換臉和后期換臉有著根本區(qū)別。后者還需要各種建模,以及一楨一楨的修改,前者在操作上只需要提供足夠多的素材讓機器學(xué)習(xí)。
另外,目前以fakeApp為代表的應(yīng)用存在分辨率低、效果不穩(wěn)定、渲染時間長的問題。QuantumLiu介紹,用AI和特效技術(shù)解決連續(xù)針斷點再融入難題,one shot面部自適應(yīng),機器自主學(xué)習(xí)光感和畫面匹配度,每一次的訓(xùn)練都會自動疊帶,成功率,效果和渲染速度大幅提高,動態(tài)視頻的切換更加完美的匹配。目前已經(jīng)取得了高分辨率光感匹配的突破和疊加式渲染的突破。已經(jīng)可以在幾個小時內(nèi)完成一整部片的替換,而且計算機學(xué)習(xí)的速度越來越快,時間周期還在不斷的縮短,品質(zhì)不斷提高。
Deepfakes技術(shù)詳解
QuantumLiu將在近期發(fā)布張國榮“復(fù)活”視頻的具體實現(xiàn)方法,在他發(fā)布之前,我們先來了解下Deepfakes的技術(shù)內(nèi)容。
Deepfakes 使用生成對抗網(wǎng)絡(luò)(GAN),其中兩個機器學(xué)習(xí)模型進(jìn)行了較量。一個ML模型在數(shù)據(jù)集上進(jìn)行訓(xùn)練,然后創(chuàng)建偽造的視頻,而另一個模型嘗試檢測偽造。偽造者創(chuàng)建假視頻,直到另一個ML模型無法檢測到偽造。訓(xùn)練數(shù)據(jù)集越大,偽造者越容易創(chuàng)建可信的deepfake視頻。
上圖顯示了一個圖像(在本例中是一張臉)被輸入到編碼器(encoder)中。其結(jié)果是同一張臉的低維表示,有時被稱為latent face。根據(jù)網(wǎng)絡(luò)架構(gòu)的不同,latent face可能根本不像人臉。當(dāng)通過解碼器(decoder)時,latent face被重建。自動編碼器是有損的,因此重建的臉不太可能有原來的細(xì)節(jié)水平。
程序員可以完全控制網(wǎng)絡(luò)的形狀:有多少層,每層有多少節(jié)點,以及它們?nèi)绾芜B接。網(wǎng)絡(luò)的真實知識存儲在連接節(jié)點的邊緣。每條邊都有一個權(quán)重,找到使自動編碼器能夠像描述的那樣工作的正確權(quán)重集是一個耗時的過程。
訓(xùn)練神經(jīng)網(wǎng)絡(luò)意味著優(yōu)化其權(quán)重以達(dá)到特定的目標(biāo)。在傳統(tǒng)的自動編碼器的情況下,網(wǎng)絡(luò)的性能取決于它如何根據(jù)其潛在空間的表示重建原始圖像。
訓(xùn)練Deepfakes
需要注意的是,如果我們單獨訓(xùn)練兩個自動編碼器,它們將互不兼容。latent faces基于每個網(wǎng)絡(luò)在其訓(xùn)練過程中認(rèn)為有意義的特定特征。但是如果將兩個自動編碼器分別在不同的人臉上訓(xùn)練,它們的潛在空間將代表不同的特征。
使人臉交換技術(shù)成為可能的是找到一種方法來強制將兩個潛在的人臉在相同的特征上編碼。Deepfakes通過讓兩個網(wǎng)絡(luò)共享相同的編碼器,然后使用兩個不同的解碼器來解決這個問題。
在訓(xùn)練階段,這兩個網(wǎng)絡(luò)需要分開處理。解碼器A僅用A的人臉來訓(xùn)練;解碼器B只用B的人臉來訓(xùn)練,但是所有的latent face都是由同一個編碼器產(chǎn)生的。這意味著編碼器本身必須識別兩個人臉中的共同特征。因為所有的人臉都具有相似的結(jié)構(gòu),所以編碼器學(xué)習(xí)“人臉”本身的概念是合理的。
生成Deepfakes
當(dāng)訓(xùn)練過程完成后,我們可以將A生成的一個latent face傳遞給解碼器B。如下圖所示,解碼器B將嘗試從與A相關(guān)的信息中重構(gòu)B。
如果網(wǎng)絡(luò)已經(jīng)很好地概括了人臉的構(gòu)成,那么潛在空間將表示面部表情和方向。這意味著可以為B生成與A的表情和方向相同的人臉。
請看下面的動圖。左邊,UI藝術(shù)家Anisa Sanusi的臉被從一個視頻中提取并對齊。右邊,一個訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)正在重建游戲設(shè)計師Henry Hoffman的臉,以匹配Anisa的表情。
顯然,Deepfakes背后的技術(shù)并不受人臉的限制。例如,它可以用來把蘋果變成獼猴桃。
重要的是,訓(xùn)練中使用的兩個主體要有盡可能多的相似之處。這是為了確保共享編碼器能夠泛化易于傳輸?shù)挠幸饬x的特性。雖然這項技術(shù)對人臉和水果都有效,但不太可能將人臉變成水果。
若是你的記憶中也有哥哥的身影,那就分享這篇文章,讓更多的人看到哥哥的視頻吧!
最后,一首《當(dāng)愛已成往事》結(jié)尾。
-
視頻
+關(guān)注
關(guān)注
6文章
1954瀏覽量
73037 -
AI
+關(guān)注
關(guān)注
87文章
31338瀏覽量
269746 -
機器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8434瀏覽量
132868
原文標(biāo)題:AI“復(fù)活”張國榮,逝去16年哥哥又重生!
文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論