遮天辰东小说,大主宰,雪鹰领主

近日DeepMind發(fā)布VQ-VAE-2算法，也就是之前VQ-VAE算法2代，這個(gè)算法從感觀效果上來看比生成對(duì)抗神經(jīng)網(wǎng)絡(luò)（GAN)的來得更加真實(shí)，堪稱AI換臉界的大殺器，如果我不說，相信讀者也很難想象到上面幾幅人臉圖像都是AI自動(dòng)生成出來的。

不過如此重要的論文，筆者還沒看到專業(yè)性很強(qiáng)的解讀，那么筆者就將VQ-VAE-2算法分為VQ,VAE,VQVAE2三部分來介紹原理，權(quán)當(dāng)拋磚引玉。

什么是VQ

VQ是vector quantisationk（一般譯作矢量量化）的縮寫，他的主要思想是通過k-means算法進(jìn)行聚類，將相近的點(diǎn)全部近似點(diǎn)簇的重心，從而在不損失太多信息的情況下對(duì)輸入進(jìn)行壓縮。

k-means聚類算法：我在之前博客《終于把軟微BING搜索-SPTAG算法的原理搞清了（https://blog.csdn.net/BEYONDMA/article/details/90578111）

也曾經(jīng)介紹過k-means算法。算法先隨機(jī)指定選取K個(gè)點(diǎn)做為初始聚集的簇心,分別計(jì)算每個(gè)樣本點(diǎn)到 K個(gè)簇核心的余弦距離，找到距離最近的核心點(diǎn)，將它歸屬到對(duì)應(yīng)的簇，所有點(diǎn)都?xì)w屬到簇之后， M個(gè)點(diǎn)就分為了 K個(gè)簇。之后重新計(jì)算每個(gè)簇的重心，將其定為新的“核心”，重復(fù)上述步驟直到新核心不再改變?yōu)橹够蛘吒淖兙嚯x達(dá)到一定值后中止。那么最終的K個(gè)簇就是最終的聚類結(jié)果。

k-means算法試圖最小化失真，其定義為每個(gè)觀測向量與其主質(zhì)心之間距離的平方之和。通過迭代地將觀測結(jié)果重新分類為星系團(tuán)，并重新計(jì)算中心體，直到得到一個(gè)中心體穩(wěn)定的構(gòu)型，從而達(dá)到最小值。

那么VQ實(shí)際就是先把輸入的圖像進(jìn)行-means聚類，完成后只保留最終留下的K個(gè)簇質(zhì)心，簇上的其它點(diǎn)全部近似化為質(zhì)心來進(jìn)行存儲(chǔ)，用這樣的方式來進(jìn)行壓縮。

什么是VAE

VAE是variational auto encoding（一般譯作變分自動(dòng)編碼），不過筆者感覺譯為隱變更自動(dòng)編碼可能更貼切。VAE的主要思想是他認(rèn)為圖像、聲音等信息是由多個(gè)隱變量（latent arrtibute)，比如對(duì)于人的面部圖像來說就由笑容，膚色、發(fā)色、發(fā)型等變量決定，那么VAE網(wǎng)絡(luò)就先把圖像中的笑容，膚色、發(fā)色、發(fā)型等變量識(shí)別出來，然后將這些變量傳遞給解碼器生成圖像。具體工作原理圖如下：

VQ-VAE1代算法整體的工作方式

簡單來講VQ-VAE1代算法，在Encoder層計(jì)算latent arrtibute(隱向量）的向量族z,然后傳遞給隱層，在隱層按照剛剛所述的VQ算法進(jìn)行壓縮，然后輸出給Decoder進(jìn)行生成，其具體原理見下圖。

如果要進(jìn)行換臉，那么只要將人臉A的Encoder進(jìn)行編碼計(jì)算latent arrtibute(隱向量），然后輸出給FaceB的Decoder進(jìn)行生成即可完成。

VQ-VAE2代算法的更新

VQ-VAE2代其實(shí)總體和1代差別不大，主要將latent arrtibute(隱向量）分為top和bottom兩層，其中top層記錄整體細(xì)節(jié)主要是明亮度、色調(diào)等信息，而bottom層主要記錄細(xì)節(jié)信息，從實(shí)際效果上看甚至包括了發(fā)絲、瞳孔等超級(jí)細(xì)微的層面。具體原理圖如下：

VQ-VAE-2將AI換臉的技術(shù)提升到了真假難辯的高度

我在之前的博客《終于把AI換臉的原理搞清了》（https://blog.csdn.net/BEYONDMA/article/details/88365203）曾經(jīng)介紹過deepfakes等項(xiàng)目的原理，不過之前那些換臉?biāo)惴▽?duì)于細(xì)節(jié)的把握程度遠(yuǎn)遠(yuǎn)達(dá)不到VQ-VAE-2的程度，從DeepMind的論文中可以看到，其生成效果之好、分辨率之高已經(jīng)到達(dá)了刷新了筆者的認(rèn)知極限。所以筆者最后也再次呼吁，不要將AI換臉技術(shù)用在歪路上。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

AI

AI

+關(guān)注

關(guān)注
87

文章
31262

瀏覽量
269627
DeepMind

DeepMind

+關(guān)注

關(guān)注
0

文章
131

瀏覽量
10890

原文標(biāo)題：AI換臉技術(shù)再創(chuàng)新高度，DeepMind發(fā)布的VQ-VAE二代算法有多厲害？

文章出處：【微信號(hào)：rgznai100，微信公眾號(hào)：rgznai100】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

評(píng)論

相關(guān)推薦

谷歌加速AI部門整合：AI Studio團(tuán)隊(duì)并入DeepMind

近日，谷歌正緊鑼密鼓地推進(jìn)其人工智能(AI)部門的整合工作。據(jù)谷歌AI Studio主管Logan Kilpatrick在領(lǐng)英頁面上的透露，谷歌已將AI Studio團(tuán)隊(duì)整體轉(zhuǎn)移至DeepMi

發(fā)表于 01-13 14:40 ?117次閱讀

SOLIDWORKS 2025：顯著增強(qiáng)的智能自動(dòng)化功能

SOLIDWORKS作為3D CAD設(shè)計(jì)軟件，一直以來都在不斷探索和創(chuàng)新，以提升設(shè)計(jì)師的工作效率和設(shè)計(jì)質(zhì)量。其新版本——SOLIDWORKS 2025，更是將智能自動(dòng)化功能提升到了一個(gè)全新的高

發(fā)表于 12-04 15:46 ?220次閱讀

ADS1298將SPI提升到更高頻率將無法讀取任何信息，為什么？

，通過DRDY引腳的外部中斷中能正確的讀取測量的數(shù)據(jù)。最多能實(shí)現(xiàn)2KHz的數(shù)據(jù)采集。現(xiàn)在要將數(shù)據(jù)采集率設(shè)置為8KHz，1MHz的SPI不夠用了。我嘗試將SPI的時(shí)鐘頻率提升到2，4

發(fā)表于 11-18 06:25

NPU技術(shù)如何提升AI性能

隨著人工智能技術(shù)的飛速發(fā)展，深度學(xué)習(xí)作為AI領(lǐng)域的核心驅(qū)動(dòng)力，對(duì)計(jì)算能力的需求日益增長。NPU技術(shù)應(yīng)運(yùn)而生，為AI性能的提升提供了強(qiáng)大的硬件

發(fā)表于 11-15 09:11 ?569次閱讀

《AI for Science：人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第二章AI for Science的技術(shù)支撐學(xué)習(xí)心得

的物理可信度，還為科學(xué)研究提供了新的視角和方法。 5. 挑戰(zhàn)與未來展望第二章也提到了AI for Science面臨的挑戰(zhàn)和未來展望。盡管AI技術(shù)在科學(xué)研究中取得了顯著進(jìn)展，但仍存在

發(fā)表于 10-14 09:16

探索機(jī)器人快換盤技術(shù)的未來之路：智能化與協(xié)作的革新

機(jī)器人快換盤技術(shù)正經(jīng)歷變革，AI、機(jī)器學(xué)習(xí)、傳感器、機(jī)器視覺及協(xié)作技術(shù)將推動(dòng)其智能化、高效化、靈活化發(fā)展，

發(fā)表于 09-26 11:26 ?282次閱讀

平衡創(chuàng)新與倫理：AI時(shí)代的隱私保護(hù)和算法公平

，如果醫(yī)生和患者都能了解AI推薦治療方案的原因，將大大增加對(duì)技術(shù)的接受度和信任。算法公平性的保障同樣不可或缺。AI系統(tǒng)在設(shè)計(jì)時(shí)就需要考

發(fā)表于 07-16 15:07

基于ESP32S進(jìn)行BLE MESH開發(fā)，基于的是BLE4.2，是否可以提升到BLE5.0？

1.現(xiàn)在基于ESP32S進(jìn)行BLE MESH開發(fā)，基于的是BLE4.2，是否可以提升到BLE5.0？ 2.BLE4.2是否可以接收到BLE5.0 Beacon？Code: Select all

發(fā)表于 06-12 07:49

智能消毒柜語音識(shí)別芯片推動(dòng)智能家居技術(shù)發(fā)展

智能消毒柜語音識(shí)別芯片，作為現(xiàn)代智能家居技術(shù)的重要一環(huán)，其背后蘊(yùn)含著豐富的技術(shù)背景與廣泛的功能應(yīng)用。這款芯片，如同一個(gè)敏銳的聽覺器官，時(shí)刻準(zhǔn)備捕捉并理解用戶的語音指令，將智能消毒柜的便捷性提升

發(fā)表于 05-29 13:28 ?403次閱讀

將測試提升到一個(gè)新的水平

的自動(dòng)測試設(shè)備專業(yè)知識(shí)，重點(diǎn)介紹了技術(shù)創(chuàng)新以及公司的未來增長計(jì)劃。 SPEA于1976年在意大利北部成立。創(chuàng)始人曾在著名的意大利公司Olivetti工作，后來在通用電氣工作，然后創(chuàng)立了SPEA。最初

發(fā)表于 04-09 17:13 ?351次閱讀

日月光半導(dǎo)體推出VIPack? 平臺(tái)先進(jìn)互連技術(shù)協(xié)助實(shí)現(xiàn)AI創(chuàng)新應(yīng)用

日月光半導(dǎo)體宣布VIPack? 平臺(tái)先進(jìn)互連技術(shù)最新進(jìn)展，透過微凸塊(microbump)技術(shù)將芯片與晶圓互連間距制程能力從 40um提升到 20um，可以滿足人工智能 (

發(fā)表于 03-22 14:15 ?516次閱讀

NVIDIA發(fā)布專為大規(guī)模AI量身訂制的全新網(wǎng)絡(luò)交換機(jī)-X800系列

NVIDIA Quantum-X800 InfiniBand 網(wǎng)絡(luò)和 NVIDIA Spectrum?-X800 以太網(wǎng)絡(luò)是全球首批高達(dá) 800Gb/s 端到端吞吐量的網(wǎng)絡(luò)平臺(tái)，將計(jì)算和 AI 工作負(fù)載的網(wǎng)絡(luò)性能提升到了一個(gè)新的水平

發(fā)表于 03-20 09:54 ?535次閱讀

NanoEdge AI的技術(shù)原理、應(yīng)用場景及優(yōu)勢(shì)

NanoEdge AI 是一種基于邊緣計(jì)算的人工智能技術(shù)，旨在將人工智能算法應(yīng)用于物聯(lián)網(wǎng)（IoT）設(shè)備和傳感器。這種技術(shù)的核心思想是

發(fā)表于 03-12 08:09

谷歌DeepMind推新AI模型Genie，能生成2D游戲平臺(tái)

據(jù)報(bào)道，谷歌公司的DeepMind團(tuán)隊(duì)近期發(fā)布了AI模型Genie，此模型擁有多達(dá)110億個(gè)參數(shù)，能夠依據(jù)用戶提供的圖片及提示詞創(chuàng)建出相當(dāng)完整的2D游戲場景。

發(fā)表于 02-27 14:53 ?813次閱讀

谷歌DeepMind資深AI研究員創(chuàng)辦AI Agent創(chuàng)企

近日，剛從谷歌DeepMind離職的資深AI研究員Ioannis Antonoglou宣布創(chuàng)辦了一家名為“AI Agent”的創(chuàng)企。Ioannis Antonoglou常駐倫敦，此前曾擔(dān)任谷歌

發(fā)表于 02-04 10:02 ?816次閱讀

在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

搜索歷史

DeepMind發(fā)布VQ-VAE-2算法,將AI換臉的技術(shù)提升到了真假難辯的高度

評(píng)論

谷歌加速AI部門整合：AI Studio團(tuán)隊(duì)并入DeepMind

SOLIDWORKS 2025：顯著增強(qiáng)的智能自動(dòng)化功能

ADS1298將SPI提升到更高頻率將無法讀取任何信息，為什么？

NPU技術(shù)如何提升AI性能

《AI for Science：人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第二章AI for Science的技術(shù)支撐學(xué)習(xí)心得

探索機(jī)器人快換盤技術(shù)的未來之路：智能化與協(xié)作的革新

平衡創(chuàng)新與倫理：AI時(shí)代的隱私保護(hù)和算法公平

基于ESP32S進(jìn)行BLE MESH開發(fā)，基于的是BLE4.2，是否可以提升到BLE5.0？

智能消毒柜語音識(shí)別芯片推動(dòng)智能家居技術(shù)發(fā)展

將測試提升到一個(gè)新的水平

日月光半導(dǎo)體推出VIPack? 平臺(tái)先進(jìn)互連技術(shù)協(xié)助實(shí)現(xiàn)AI創(chuàng)新應(yīng)用

NVIDIA發(fā)布專為大規(guī)模AI量身訂制的全新網(wǎng)絡(luò)交換機(jī)-X800系列

NanoEdge AI的技術(shù)原理、應(yīng)用場景及優(yōu)勢(shì)

谷歌DeepMind推新AI模型Genie，能生成2D游戲平臺(tái)

谷歌DeepMind資深AI研究員創(chuàng)辦AI Agent創(chuàng)企