91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

DeepMind發(fā)布VQ-VAE-2算法,將AI換臉的技術(shù)提升到了真假難辯的高度

WpOh_rgznai100 ? 來(lái)源:YXQ ? 2019-06-19 09:57 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近日DeepMind發(fā)布VQ-VAE-2算法,也就是之前VQ-VAE算法2代,這個(gè)算法從感觀效果上來(lái)看比生成對(duì)抗神經(jīng)網(wǎng)絡(luò)(GAN)的來(lái)得更加真實(shí),堪稱AI換臉界的大殺器,如果我不說(shuō),相信讀者也很難想象到上面幾幅人臉圖像都是AI自動(dòng)生成出來(lái)的。

不過(guò)如此重要的論文,筆者還沒看到專業(yè)性很強(qiáng)的解讀,那么筆者就將VQ-VAE-2算法分為VQ,VAE,VQVAE2三部分來(lái)介紹原理,權(quán)當(dāng)拋磚引玉。

什么是VQ

VQ是vector quantisationk(一般譯作矢量量化)的縮寫,他的主要思想是通過(guò)k-means算法進(jìn)行聚類,將相近的點(diǎn)全部近似點(diǎn)簇的重心,從而在不損失太多信息的情況下對(duì)輸入進(jìn)行壓縮。

k-means聚類算法:我在之前博客《終于把軟微BING搜索-SPTAG算法的原理搞清了(https://blog.csdn.net/BEYONDMA/article/details/90578111)

也曾經(jīng)介紹過(guò)k-means算法。算法先隨機(jī)指定選取K個(gè)點(diǎn)做為初始聚集的簇心,分別計(jì)算每個(gè)樣本點(diǎn)到 K個(gè)簇核心的余弦距離,找到距離最近的核心點(diǎn),將它歸屬到對(duì)應(yīng)的簇,所有點(diǎn)都?xì)w屬到簇之后, M個(gè)點(diǎn)就分為了 K個(gè)簇。之后重新計(jì)算每個(gè)簇的重心,將其定為新的“核心”,重復(fù)上述步驟直到新核心不再改變?yōu)橹够蛘吒淖兙嚯x達(dá)到一定值后中止。那么最終的K個(gè)簇就是最終的聚類結(jié)果。

k-means算法試圖最小化失真,其定義為每個(gè)觀測(cè)向量與其主質(zhì)心之間距離的平方之和。通過(guò)迭代地將觀測(cè)結(jié)果重新分類為星系團(tuán),并重新計(jì)算中心體,直到得到一個(gè)中心體穩(wěn)定的構(gòu)型,從而達(dá)到最小值。

那么VQ實(shí)際就是先把輸入的圖像進(jìn)行-means聚類,完成后只保留最終留下的K個(gè)簇質(zhì)心,簇上的其它點(diǎn)全部近似化為質(zhì)心來(lái)進(jìn)行存儲(chǔ),用這樣的方式來(lái)進(jìn)行壓縮。

什么是VAE

VAE是variational auto encoding(一般譯作變分自動(dòng)編碼),不過(guò)筆者感覺譯為隱變更自動(dòng)編碼可能更貼切。VAE的主要思想是他認(rèn)為圖像、聲音等信息是由多個(gè)隱變量(latent arrtibute),比如對(duì)于人的面部圖像來(lái)說(shuō)就由笑容,膚色、發(fā)色、發(fā)型等變量決定,那么VAE網(wǎng)絡(luò)就先把圖像中的笑容,膚色、發(fā)色、發(fā)型等變量識(shí)別出來(lái),然后將這些變量傳遞給解碼器生成圖像。具體工作原理圖如下:

VQ-VAE1代算法整體的工作方式

簡(jiǎn)單來(lái)講VQ-VAE1代算法,在Encoder層計(jì)算latent arrtibute(隱向量)的向量族z,然后傳遞給隱層,在隱層按照剛剛所述的VQ算法進(jìn)行壓縮,然后輸出給Decoder進(jìn)行生成,其具體原理見下圖。

如果要進(jìn)行換臉,那么只要將人臉A的Encoder進(jìn)行編碼計(jì)算latent arrtibute(隱向量),然后輸出給FaceB的Decoder進(jìn)行生成即可完成。

VQ-VAE2代算法的更新

VQ-VAE2代其實(shí)總體和1代差別不大,主要將latent arrtibute(隱向量)分為top和bottom兩層,其中top層記錄整體細(xì)節(jié)主要是明亮度、色調(diào)等信息,而bottom層主要記錄細(xì)節(jié)信息,從實(shí)際效果上看甚至包括了發(fā)絲、瞳孔等超級(jí)細(xì)微的層面。具體原理圖如下:

VQ-VAE-2將AI換臉的技術(shù)提升到了真假難辯的高度

我在之前的博客《終于把AI換臉的原理搞清了》(https://blog.csdn.net/BEYONDMA/article/details/88365203)曾經(jīng)介紹過(guò)deepfakes等項(xiàng)目的原理,不過(guò)之前那些換臉?biāo)惴▽?duì)于細(xì)節(jié)的把握程度遠(yuǎn)遠(yuǎn)達(dá)不到VQ-VAE-2的程度,從DeepMind的論文中可以看到,其生成效果之好、分辨率之高已經(jīng)到達(dá)了刷新了筆者的認(rèn)知極限。所以筆者最后也再次呼吁,不要將AI換臉技術(shù)用在歪路上。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    39755

    瀏覽量

    301361
  • DeepMind
    +關(guān)注

    關(guān)注

    0

    文章

    131

    瀏覽量

    12285

原文標(biāo)題:AI換臉技術(shù)再創(chuàng)新高度,DeepMind發(fā)布的VQ-VAE二代算法有多厲害?

文章出處:【微信號(hào):rgznai100,微信公眾號(hào):rgznai100】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    使用NORDIC AI的好處

    提升能效,適合音頻、圖像和高采樣率傳感器等更重的 AI 負(fù)載。[Axon NPU 技術(shù)頁(yè)] 模型更小、更快、更省電 Neuton 模型相較 TensorFlow Lite:* 內(nèi)存占用可小 10
    發(fā)表于 01-31 23:16

    軍規(guī)級(jí)可靠性:BT-CCD01-AI電芯正負(fù)極檢測(cè)機(jī)在極端環(huán)境下的穩(wěn)定性驗(yàn)證

    電芯正負(fù)極檢測(cè)的精度與穩(wěn)定性直接關(guān)系到產(chǎn)品安全與生產(chǎn)效率。然而,極端環(huán)境(如高溫、高濕、粉塵污染等)往往成為檢測(cè)設(shè)備的“試金石”。深圳比斯特自動(dòng)化設(shè)備有限公司推出的BT-CCD01-AI電芯正負(fù)極檢測(cè)機(jī),憑借高可靠性設(shè)計(jì),成功突破環(huán)境限制,質(zhì)量管控
    的頭像 發(fā)表于 11-29 15:05 ?249次閱讀

    信息流全面轉(zhuǎn)向AI推薦!馬斯克稱X本周內(nèi)發(fā)布AI算法更新

    X 平臺(tái)將于本周內(nèi)發(fā)布更新后的“新”算法,據(jù)其表示,新算法更新后,X 實(shí)現(xiàn)完全的 AI 推薦。
    的頭像 發(fā)表于 10-21 10:19 ?411次閱讀
    信息流全面轉(zhuǎn)向<b class='flag-5'>AI</b>推薦!馬斯克稱X本周內(nèi)<b class='flag-5'>將</b><b class='flag-5'>發(fā)布</b><b class='flag-5'>AI</b><b class='flag-5'>算法</b>更新

    華為發(fā)布全球最強(qiáng)算力超節(jié)點(diǎn)和集群

    在華為全聯(lián)接大會(huì)2025(HUAWEI CONNECT 2025)上,華為發(fā)布最強(qiáng)算力超節(jié)點(diǎn)和集群,并表示發(fā)展生態(tài)作為公司核心戰(zhàn)略,提升到前所未有的戰(zhàn)略高度。在計(jì)算領(lǐng)域,鯤鵬昇騰堅(jiān)持
    的頭像 發(fā)表于 10-10 17:29 ?2237次閱讀

    利用主動(dòng)短路技術(shù)電動(dòng)自行車安全提升到高度

    自行車需求不斷增長(zhǎng),設(shè)計(jì)人員和制造商面臨著確保安全與可靠的重大設(shè)計(jì)挑戰(zhàn)。 電動(dòng)出行系統(tǒng)的核心架構(gòu)是 低壓牽引逆變電機(jī) ,可在正常騎行時(shí)輔助蹬踏,并在上坡時(shí)減輕騎行者負(fù)擔(dān)。通常位于車輪處的電機(jī)能將電能轉(zhuǎn)化為機(jī)械能,或機(jī)械能
    的頭像 發(fā)表于 10-10 10:19 ?1.3w次閱讀
    利用主動(dòng)短路<b class='flag-5'>技術(shù)</b><b class='flag-5'>將</b>電動(dòng)自行車安全<b class='flag-5'>提升到</b>新<b class='flag-5'>高度</b>

    于無(wú)聲處聽驚雷:振動(dòng)傳感器在核電鼓泡測(cè)試中的精密守護(hù)—森瑟科技

    振動(dòng)傳感器與鼓泡測(cè)試的結(jié)合,是傳統(tǒng)工藝與現(xiàn)代傳感技術(shù)完美融合的典范。它讓核電工程師擁有了能夠“聽見”納米級(jí)泄漏的“超級(jí)耳朵”,泄漏檢測(cè)的精度和可靠性提升到了前所未有的高度。
    的頭像 發(fā)表于 09-22 16:20 ?1116次閱讀
    于無(wú)聲處聽驚雷:振動(dòng)傳感器在核電鼓泡測(cè)試中的精密守護(hù)—森瑟科技

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI芯片到AGI芯片

    實(shí)例,從而保持高計(jì)算效率。 2、Q算法 Q項(xiàng)目大模型功能與A*和Q-learning等復(fù)雜算法結(jié)合,進(jìn)一步推動(dòng)了AI領(lǐng)域的蓬勃發(fā)展,標(biāo)志著
    發(fā)表于 09-18 15:31

    AI 芯片浪潮下,職場(chǎng)晉升新契機(jī)?

    、新架構(gòu)不斷涌現(xiàn)。能夠在工作中提出創(chuàng)新性的解決方案,推動(dòng) AI 芯片性能、功耗、成本等關(guān)鍵指標(biāo)的優(yōu)化,極大提升在職稱評(píng)審中的競(jìng)爭(zhēng)力。例如,在芯片設(shè)計(jì)中引入新的計(jì)算范式,如存算一體技術(shù)
    發(fā)表于 08-19 08:58

    通信不發(fā)愁,PROFINET轉(zhuǎn)DEVICENET網(wǎng)關(guān)診斷解決方案狀態(tài)監(jiān)測(cè)提升到新水平

    PROFINET 診斷解決方案狀態(tài)監(jiān)測(cè)提升到新水平 生產(chǎn)基地,用于生產(chǎn)鎂合金部件。該基地新增了四臺(tái)超現(xiàn)代化壓鑄機(jī),壓鑄壓力分別為2500噸和1800噸。自新壓鑄機(jī)投入使用以來(lái),客戶一直使用開放式
    的頭像 發(fā)表于 08-05 17:25 ?479次閱讀
    通信不發(fā)愁,PROFINET轉(zhuǎn)DEVICENET網(wǎng)關(guān)診斷解決方案<b class='flag-5'>將</b>狀態(tài)監(jiān)測(cè)<b class='flag-5'>提升到</b>新水平

    【書籍評(píng)測(cè)活動(dòng)NO.64】AI芯片,從過(guò)去走向未來(lái):《AI芯片:科技探索與AGI愿景》

    到AGI,一起來(lái)探索AI芯片 本書從創(chuàng)新視角出發(fā),系統(tǒng)梳理了AI芯片的前沿技術(shù)與未來(lái)方向,串聯(lián)起從算法到系統(tǒng)的實(shí)現(xiàn)路徑,全景式展現(xiàn)AI芯片的
    發(fā)表于 07-28 13:54

    AlphaEvolve有望革新AI玩具芯片設(shè)計(jì),算法進(jìn)化驅(qū)動(dòng)能效與成本雙突破

    電子發(fā)燒友網(wǎng)綜合報(bào)道,近期,谷歌?DeepMind發(fā)布了一款A(yù)lphaEvolve,是一款通用科學(xué)AI代理,基于大語(yǔ)言模型Gemini系列與進(jìn)化計(jì)算框架,專注于算法發(fā)現(xiàn)與優(yōu)化??梢灾С?/div>
    的頭像 發(fā)表于 06-18 00:09 ?3765次閱讀

    DevEco Studio AI輔助開發(fā)工具兩大升級(jí)功能 鴻蒙應(yīng)用開發(fā)效率再提升

    : 1、 實(shí)時(shí)檢索驗(yàn)證:在生成階段,系統(tǒng)首先從官方語(yǔ)料庫(kù)中檢索與用戶輸入最相關(guān)的片段,形成上下文約束。 主要實(shí)現(xiàn)技術(shù): (1) 向量搜索:查詢和文檔嵌入到高維向量空間,通過(guò)計(jì)算相似度進(jìn)行檢索。 (2
    發(fā)表于 04-18 14:43

    首創(chuàng)開源架構(gòu),天璣AI開發(fā)套件讓端側(cè)AI模型接入得心應(yīng)手

    套件2.0全面支持 DeepSeek四大關(guān)鍵技術(shù):混合專家模型(MoE)、多Token預(yù)測(cè)(MTP)多頭潛在注意力(MLA)、FP8推理(FP8 Inferencing),實(shí)現(xiàn)Token產(chǎn)生速度提升2倍以上
    發(fā)表于 04-13 19:52

    《DNESP32S3使用指南-IDF版_V1.6》第六十章 貓檢測(cè)實(shí)驗(yàn)

    驗(yàn)證 60.1 硬件設(shè)計(jì)1. 例程功能本章實(shí)驗(yàn)功能簡(jiǎn)介:使用樂鑫官方的ESP32-WHO AI庫(kù)對(duì)OV2640和OV5640攝像頭輸出的數(shù)據(jù)進(jìn)行貓檢測(cè)。2. 硬件資源1)LED燈 LED-IO12
    發(fā)表于 04-01 09:28

    Banana Pi 發(fā)布 BPI-AI2N &amp; BPI-AI2N Carrier,助力 AI 計(jì)算與嵌入式開發(fā)

    和 Renesas一直致力于推動(dòng)開源生態(tài)的發(fā)展,并積極合作打造高效、開放的計(jì)算平臺(tái)。BPI-AI2N & BPI-AI2N Carrier 的發(fā)布,不僅為開發(fā)者提供了強(qiáng)大的硬件支持,也
    發(fā)表于 03-19 17:54