91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲日韩欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

<button id="ygy4o"></button>

<code id="ygy4o"></code>

搜索歷史

清空

搜索熱詞

0

聊天消息
系統(tǒng)消息
評論與回復(fù)

查看更多

查看更多

查看更多

VIP于到期續(xù)費(fèi)

登錄后你可以

下載海量資料
學(xué)習(xí)在線課程
觀看技術(shù)視頻
寫文章/發(fā)帖/加入社區(qū)

會員中心

創(chuàng)作中心

發(fā)布

創(chuàng)作活動

完善資料讓更多小伙伴認(rèn)識你，還能領(lǐng)取20積分哦，立即完善>

3天內(nèi)不再提示

阿里達(dá)摩院提出ABPN：高清人像美膚模型

一、論文&代碼

論文：

https://openaccess.thecvf.com/content/CVPR2022/papers/Lei_ABPN_Adaptive_Blend_Pyramid_Network_for_Real-Time_Local_Retouching_of_CVPR_2022_paper.pdf
模型&代碼：

https://www.modelscope.cn/models/damo/cv_unet_skin-retouching/summary

二、背景

隨著數(shù)字文化產(chǎn)業(yè)的蓬勃發(fā)展，人工智能技術(shù)開始廣泛應(yīng)用于圖像編輯和美化領(lǐng)域。其中，人像美膚無疑是應(yīng)用最廣、需求最大的技術(shù)之一。傳統(tǒng)美顏算法利用基于濾波的圖像編輯技術(shù)，實(shí)現(xiàn)了自動化的磨皮去瑕疵效果，在社交、直播等場景取得了廣泛的應(yīng)用。然而，在門檻較高的專業(yè)攝影行業(yè)，由于對圖像分辨率以及質(zhì)量標(biāo)準(zhǔn)的較高要求，人工修圖師還是作為人像美膚修圖的主要生產(chǎn)力，完成包括勻膚、去瑕疵、美白等一系列工作。通常，一位專業(yè)修圖師對一張高清人像進(jìn)行美膚操作的平均處理時(shí)間為1-2分鐘，在精度要求更高的廣告、影視等領(lǐng)域，該處理時(shí)間則更長。

相較于互娛場景的磨皮美顏，廣告級、影樓級的精細(xì)化美膚給算法帶來了更高的要求與挑戰(zhàn)。一方面，瑕疵種類眾多，包含痘痘、痘印、雀斑、膚色不均等，算法需要對不同瑕疵進(jìn)行自適應(yīng)地處理；另一方面，在去除瑕疵的過程中，需要盡可能的保留皮膚的紋理、質(zhì)感，實(shí)現(xiàn)高精度的皮膚修飾；最后也是十分重要的一點(diǎn)，隨著攝影設(shè)備的不斷迭代，專業(yè)攝影領(lǐng)域目前常用的圖像分辨率已經(jīng)達(dá)到了4K甚至8K，這對算法的處理效率提出了極其嚴(yán)苛的要求。為此，我們以實(shí)現(xiàn)專業(yè)級的智能美膚為出發(fā)點(diǎn)，研發(fā)了一套高清圖像的超精細(xì)局部修圖算法ABPN，在超清圖像中的美膚與服飾去皺任務(wù)中都實(shí)現(xiàn)了很好的效果與應(yīng)用。

三、相關(guān)工作

3.1 傳統(tǒng)美顏算法

傳統(tǒng)美顏算法的核心就是讓皮膚區(qū)域的像素變得更平滑，降低瑕疵的顯著程度，從而使皮膚看起來更加光滑。一般來說，現(xiàn)有的美顏算法可劃分為三步：1）圖像濾波算法，2）圖像融合，3）銳化。整體流程如下：

其中為了實(shí)現(xiàn)皮膚區(qū)域的平滑，同時(shí)保留圖像中的邊緣，傳統(tǒng)美顏算法首先使用保邊濾波器（如雙邊濾波、導(dǎo)向?yàn)V波等）來對圖像進(jìn)行處理。不同于常用的均值濾波、高斯濾波，保邊濾波器考慮了不同區(qū)域像素值的變化，對像素變化較大的邊緣部分以及變化較為平緩的中間區(qū)域像素采取不同的加權(quán)，從而實(shí)現(xiàn)對于圖像邊緣的保留。而后，為了不影響背景區(qū)域，分割檢測算法通常被用于定位皮膚區(qū)域，引導(dǎo)原圖與平滑后的圖像進(jìn)行融合。最后，銳化操作可以進(jìn)一步提升邊緣的顯著性以及感官上的清晰度。下圖展示了目前傳統(tǒng)美顏算法的效果：

原圖像來自unsplash[31]

從效果來看，傳統(tǒng)美顏算法存在兩大問題：1）對于瑕疵的處理是非自適應(yīng)的，無法較好的處理不同類型的瑕疵。2）平滑處理造成了皮膚紋理、質(zhì)感的丟失。這些問題在高清圖像中尤為明顯。

3.2 現(xiàn)有深度學(xué)習(xí)算法

為了實(shí)現(xiàn)皮膚不同區(qū)域、不同瑕疵的自適應(yīng)修飾，基于數(shù)據(jù)驅(qū)動的深度學(xué)習(xí)算法似乎是更好的解決方案?？紤]任務(wù)的相關(guān)性，我們對Image-to-Image Translation、Photo Retouching、Image Inpainting、High-resolution Image Editing這四類現(xiàn)有方法對于美膚任務(wù)的適用性進(jìn)行了討論和對比。

3.2.1 Image-to-Image Translation

圖像翻譯(Image-to-Image Translation)任務(wù)最開始由pix2pix[1]所定義，其將大量計(jì)算機(jī)視覺任務(wù)總結(jié)為像素到像素的預(yù)測任務(wù)，并且提出了一個(gè)基于條件生成對抗網(wǎng)絡(luò)的通用框架來解決這類問題?；趐ix2pix[1]，各類方法被陸續(xù)提出以解決圖像翻譯問題，其中包括利用成對數(shù)據(jù)(paired images)的方法[2,3,4,5]以及利用非成對數(shù)據(jù)(unpaired images）的方法[6,7,8,9]。一些工作聚焦于某些特定的圖像翻譯任務(wù)（比如語義圖像合成[2,3,5]，風(fēng)格遷移等[9,10,11,12]），取得了令人印象深刻效果。然而，上述大部分的圖像翻譯主要關(guān)注于圖像到圖像的整體變換，缺乏對于局部區(qū)域的注意力，這限制了其在美膚任務(wù)中的表現(xiàn)。

3.2.2 Photo Retouching

受益于深度卷積神經(jīng)網(wǎng)絡(luò)的發(fā)展，基于學(xué)習(xí)的方法[13,14,15,16]近年來在修圖領(lǐng)域展現(xiàn)了出色的效果。然而，與大多數(shù)圖像翻譯方法相似的是，現(xiàn)有的retouching算法主要聚焦于操控圖像的一些整體屬性，比如色彩、光照、曝光等。很少關(guān)注局部區(qū)域的修飾，而美膚恰恰是一個(gè)局部修飾任務(wù)（Local Photo Retouching），需要在修飾目標(biāo)區(qū)域的同時(shí)，保持背景區(qū)域不動。

3.2.3 Image Inpainting

圖像補(bǔ)全(image inpainting)算法常用于對圖像缺失的部分進(jìn)行補(bǔ)全生成，與美膚任務(wù)有著較大的相似性。憑借著強(qiáng)大的特征學(xué)習(xí)能力，基于深度生成網(wǎng)絡(luò)的方法[17,18,19,20]這些年在inpainting任務(wù)中取得了巨大的進(jìn)步。然而，inpainting方法依賴于目標(biāo)區(qū)域的mask作為輸入，而在美膚以及其他局部修飾任務(wù)中，獲取精確的目標(biāo)區(qū)域mask本身就是一個(gè)非常具有挑戰(zhàn)性的任務(wù)。因而，大部分的image inpainting任務(wù)無法直接用于美膚。近年來，一些blind image inpainting的方法[21,22,23]擺脫了對于mask的依賴，實(shí)現(xiàn)了目標(biāo)區(qū)域的自動檢測與補(bǔ)全。盡管如此，同大多數(shù)其他image inpainting方法一樣，這些方法存在兩個(gè)問題：a)缺乏對于目標(biāo)區(qū)域紋理及語義信息的充分利用，b)計(jì)算量較大，難以應(yīng)用于超高分辨率圖像。

3.2.4 High-resolution Image Editing

為了實(shí)現(xiàn)高分辨率圖像的編輯，[15,24,25,26]等方法通過將主要的計(jì)算量從高分辨率圖轉(zhuǎn)移到低分辨率圖像中，以減輕空間和時(shí)間的負(fù)擔(dān)。盡管在效率上取得了出色的表現(xiàn)，由于缺乏對于局部區(qū)域的關(guān)注，其中大部分方法都不適用于美膚這類局部修飾任務(wù)。
綜上，現(xiàn)有的深度學(xué)習(xí)方法大都難以直接應(yīng)用于美膚任務(wù)中，主要原因在于缺乏對局部區(qū)域的關(guān)注或者是計(jì)算量較大難以應(yīng)用于高分辨率圖像。

四、基于自適應(yīng)混合金字塔的局部修圖框架

美膚本質(zhì)在于對圖像的編輯，不同于大多數(shù)其他圖像轉(zhuǎn)換任務(wù)的是，這種編輯是局部的。與其相似的還有服飾去皺，商品修飾等任務(wù)。這類局部修圖任務(wù)具有很強(qiáng)的共通性，我們總結(jié)其三點(diǎn)主要的困難與挑戰(zhàn)：1）目標(biāo)區(qū)域的精準(zhǔn)定位。2）具有全局一致性以及細(xì)節(jié)保真度的局部生成（修飾）。3）超高分辨率圖像處理。為此，我們提出了一個(gè)基于自適應(yīng)混合金字塔的局部修圖框架（ABPN: Adaptive Blend Pyramid Network for Real-Time Local Retouching of Ultra High-Resolution Photo, CVPR2022,[27]），以實(shí)現(xiàn)超高分辨率圖像的精細(xì)化局部修圖，下面我們對其實(shí)現(xiàn)細(xì)節(jié)進(jìn)行介紹。

4.1 網(wǎng)絡(luò)整體結(jié)構(gòu)

如上圖所示，網(wǎng)絡(luò)結(jié)構(gòu)主要由兩個(gè)部分組成：上下文感知的局部修飾層（LRL）和自適應(yīng)混合金字塔層（BPL）。其中LRL的目的是對降采樣后的低分辨率圖像進(jìn)行局部修飾，生成低分辨率的修飾結(jié)果圖，充分考慮全局的上下文信息以及局部的紋理信息。進(jìn)一步，BPL用于將LRL中生成的低分辨率結(jié)果逐步向上拓展到高分辨率結(jié)果。其中，我們設(shè)計(jì)了一個(gè)自適應(yīng)混合模塊（ABM）及其逆向模塊（R-ABM），利用中間混合圖層Bi，可實(shí)現(xiàn)原圖與結(jié)果圖之間的自適應(yīng)轉(zhuǎn)換以及向上拓展，展現(xiàn)了強(qiáng)大的可拓展性和細(xì)節(jié)保真能力。我們在臉部修飾及服飾修飾兩個(gè)數(shù)據(jù)集中進(jìn)行了大量實(shí)驗(yàn)，結(jié)果表明我們的方法在效果和效率上都大幅度地領(lǐng)先了現(xiàn)有方法。值得一提的是，我們的模型在單卡P100上實(shí)現(xiàn)了4K超高分辨率圖像的實(shí)時(shí)推理。下面，我們對LRL、BPL及網(wǎng)絡(luò)的訓(xùn)練loss分別進(jìn)行介紹。

4.2 上下文感知的局部修飾層（Context-aware Local Retouching Layer）

在LRL中，我們想要解決三中提到的兩個(gè)挑戰(zhàn)：目標(biāo)區(qū)域的精準(zhǔn)定位以及具有全局一致性的局部生成。如Figure 3所示，LRL由一個(gè)共享編碼器、掩碼預(yù)測分支(MPB)以及局部修飾分支(LRB)構(gòu)成。

總得來說，我們使用了一個(gè)多任務(wù)的結(jié)構(gòu)，以實(shí)現(xiàn)顯式的目標(biāo)區(qū)域預(yù)測，與局部修飾的引導(dǎo)。其中，共享編碼器的結(jié)構(gòu)可以利用兩個(gè)分支的共同訓(xùn)練優(yōu)化特征，提高修飾分支對于目標(biāo)全局的語義信息和局部的感知。大多數(shù)的圖像翻譯方法使用傳統(tǒng)的encoder-decoder結(jié)構(gòu)直接實(shí)現(xiàn)局部的編輯，沒有將目標(biāo)定位與生成進(jìn)行解耦，從而限制了生成的效果（網(wǎng)絡(luò)的容量有限），相比之下多分支的結(jié)構(gòu)更利于任務(wù)的解耦以及互利。在局部修飾分支LRB中我們設(shè)計(jì)了LAM（Figure 4），將空間注意力機(jī)制與特征注意力機(jī)制同時(shí)作用，以實(shí)現(xiàn)特征的充分融合以及目標(biāo)區(qū)域的語義、紋理的捕捉。消融實(shí)驗(yàn)（Figure 6）展現(xiàn)了各個(gè)模塊設(shè)計(jì)的有效性。

4.3 自適應(yīng)混合金字塔層（Adaptive Blend Pyramid Layer）

LRL在低分辨率上實(shí)現(xiàn)了局部修飾，如何將修飾的結(jié)果拓展到高分辨率同時(shí)增強(qiáng)其細(xì)節(jié)保真度？這是我們在這部分想要解決的問題。

4.3.1 自適應(yīng)混合模塊（Adaptive Blend Module）

在圖像編輯領(lǐng)域，混合圖層（blend layer）常被用于與圖像（base layer）以不同的模式混合以實(shí)現(xiàn)各種各樣的圖像編輯任務(wù)，比如對比度的增強(qiáng)，加深、減淡操作等。通常地，給定一張圖片，以及一個(gè)混合圖層，我們可以將兩個(gè)圖層進(jìn)行混合得到圖像編輯結(jié)果

，如下：

其中 f 是一個(gè)固定的逐像素映射函數(shù)，通常由混合模式所決定。受限于轉(zhuǎn)化能力，一個(gè)特定的混合模式及固定的函數(shù) f 難以直接應(yīng)用于種類多樣的編輯任務(wù)中去。為了更好的適應(yīng)數(shù)據(jù)的分布以及不同任務(wù)的轉(zhuǎn)換模式，我們借鑒了圖像編輯中常用的柔光模式，設(shè)計(jì)了一個(gè)自適應(yīng)混合模塊 (ABM），如下：

其中表示 Hadmard product，和為可學(xué)習(xí)的參數(shù)，被網(wǎng)絡(luò)中所有的 ABM 模塊以及接下來的 R-ABM 模塊所共享，

表示所有值為 1 的常數(shù)矩陣。 4.3.2 逆向自適應(yīng)混合模塊（Reverse Adaptive Blend Module）實(shí)際上，ABM 模塊是基于混合圖層 B 已經(jīng)獲得的前提假設(shè)。然而，我們在 LRL 中只獲得了低分辨率的結(jié)果，為了得到混合圖層 B，我們對公式 3 進(jìn)行求解，構(gòu)建了一個(gè)逆向自適應(yīng)混合模塊 (R-ABM），如下： ?

總的來說，通過利用混合圖層作為中間媒介，ABM 模塊和 R-ABM 模塊實(shí)現(xiàn)了圖像 I 和結(jié)果 R 之間的自適應(yīng)轉(zhuǎn)換，相比于直接對低分辨率結(jié)果利用卷積上采樣等操作進(jìn)行向上拓展（如 Pix2PixHD），我們利用混合圖層來實(shí)現(xiàn)這個(gè)目標(biāo)，有其兩方面的優(yōu)勢：1）在局部修飾任務(wù)中，混合圖層主要記錄了兩張圖像之間的局部轉(zhuǎn)換信息，這意味著其包含更少的無關(guān)信息，且更容易由一個(gè)輕量的網(wǎng)絡(luò)進(jìn)行優(yōu)化。2）混合圖層直接作用于原始圖像來實(shí)現(xiàn)最后的修飾，可以充分利用圖像本身的信息，進(jìn)而實(shí)現(xiàn)高度的細(xì)節(jié)保真。

實(shí)際上，關(guān)于自適應(yīng)混合模塊有許多可供選擇的函數(shù)或者策略，我們在論文中對設(shè)計(jì)的動機(jī)以及其他方案的對比進(jìn)行了詳細(xì)介紹，這里不進(jìn)行更多的闡述了，F(xiàn)igure 7 展示了我們的方法和其他混合方法的消融對比。 4.3.3 Refining Module

4.4 損失函數(shù)

實(shí)驗(yàn)結(jié)果5.1 與 SOTA 方法對比

5.2 消融實(shí)驗(yàn)

5.3 運(yùn)行速度與內(nèi)存消耗

效果展示美膚效果展示：

原圖像來自 unsplash [31]

原圖像來自人臉數(shù)據(jù)集 FFHQ [32]

原圖像來自人臉數(shù)據(jù)集 FFHQ [32] 可以看到，相較于傳統(tǒng)的美顏算法，我們提出的局部修圖框架在去除皮膚瑕疵的同時(shí)，充分的保留了皮膚的紋理和質(zhì)感，實(shí)現(xiàn)了精細(xì)、智能化的膚質(zhì)優(yōu)化。進(jìn)一步，我們將該方法拓展到服飾去皺領(lǐng)域，也實(shí)現(xiàn)了不錯(cuò)的效果，如下：

審核編輯：李倩

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報(bào)投訴

濾波器

濾波器

+關(guān)注

關(guān)注
162

文章
8412

瀏覽量
185764
算法

算法

+關(guān)注

關(guān)注
23

文章
4784

瀏覽量
98088
圖像

圖像

+關(guān)注

關(guān)注
2

文章
1096

瀏覽量
42340

原文標(biāo)題：CVPR 2022 | 阿里達(dá)摩院提出ABPN：高清人像美膚模型

文章出處：【微信號：CVer，微信公眾號：CVer】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

評論

電子發(fā)燒友

My ElecFans

APP
網(wǎng)站地圖

設(shè)計(jì)技術(shù)

可編程邏輯

電源/新能源

MEMS/傳感技術(shù)

測量儀表

嵌入式技術(shù)

制造/封裝

模擬技術(shù)

RF/無線

接口/總線/驅(qū)動

處理器/DSP

EDA/IC設(shè)計(jì)

存儲技術(shù)

光電顯示

EMC/EMI設(shè)計(jì)

連接器

行業(yè)應(yīng)用

LEDs

汽車電子

音視頻及家電

通信網(wǎng)絡(luò)

醫(yī)療電子

人工智能

虛擬現(xiàn)實(shí)

可穿戴設(shè)備

機(jī)器人

安全設(shè)備/系統(tǒng)

軍用/航空電子

移動通信

工業(yè)控制

便攜設(shè)備

觸控感測

物聯(lián)網(wǎng)

智能電網(wǎng)

區(qū)塊鏈

新科技

特色內(nèi)容

專欄推薦

學(xué)院

設(shè)計(jì)資源

設(shè)計(jì)技術(shù)

電子百科

電子視頻

元器件知識

工具箱

VIP會員

最新技術(shù)文章

產(chǎn)品地圖

品牌地圖

社區(qū)

小組

論壇

問答

評測試用

企業(yè)服務(wù)

產(chǎn)品

資料

文章

方案

企業(yè)

供應(yīng)鏈服務(wù)

硬件開發(fā)

媒體服務(wù)

網(wǎng)站廣告

在線研討會

活動策劃

新聞發(fā)布

新品發(fā)布

小測驗(yàn)

設(shè)計(jì)大賽

電子發(fā)燒友

關(guān)于我們

聯(lián)系我們

舉報(bào)投訴

社交網(wǎng)絡(luò)

微博

移動端

發(fā)燒友APP

WAP

聯(lián)系我們

廣告合作

王婉珠：wangwanzhu@elecfans.com

內(nèi)容合作

張迎輝：mikezhang@elecfans.com

關(guān)注我們的微信

下載發(fā)燒友APP

電子發(fā)燒友觀察

版權(quán)所有 ? 長沙勒克斯教育咨詢有限公司

湖南省長沙市開福區(qū)月湖街道匍園路20號聚恒科技園1棟2301-1房
電子發(fā)燒友 （電路圖） 湘公網(wǎng)安備43011202000918 工商網(wǎng)監(jiān) 湘ICP備2023036445號-105-1

感谢您访问我们的网站，您可能还对以下资源感兴趣：
91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲日韩欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级