91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

圖像修復(fù)與處理經(jīng)典論文回顧和精讀

OpenCV學(xué)堂 ? 來源:OpenCV學(xué)堂 ? 作者:OpenCV學(xué)堂 ? 2022-07-13 16:18 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

筆者最近在集中時(shí)間學(xué)習(xí)對(duì)抗生成網(wǎng)絡(luò)(GAN),特別是深度生成先驗(yàn)進(jìn)行多用途圖像修復(fù)與處理,需要對(duì)圖像修復(fù)與處理經(jīng)典論文進(jìn)行回顧和精讀。

將從圖像修復(fù)與處理的經(jīng)典之作DGP《Exploiting Deep Generative Prior for Versatile Image Restoration and Manipulation》開始,重啟精讀之路。

d4193df6-0283-11ed-ba43-dac502259ad0.png

DGP提出了一種挖掘GAN中圖像先驗(yàn)的方式,在多個(gè)任務(wù)上揭示了GAN作為一種通用圖像先驗(yàn)的潛力。

論文提出了同時(shí)插值隱變量和生成器的漸變式圖像反演方法,可以應(yīng)用于復(fù)雜圖片的對(duì)抗防御,在實(shí)驗(yàn)中DGP所展現(xiàn)出的強(qiáng)大的像素間空間關(guān)系模擬能力也十分有趣。

d43f1a1c-0283-11ed-ba43-dac502259ad0.gif

Deep generative prior的圖像復(fù)原效果

01深度生成先驗(yàn)

深度圖像先驗(yàn)DIP僅依靠輸入圖像的統(tǒng)計(jì)信息,無法應(yīng)用于需要更一般的圖像統(tǒng)計(jì)信息的任務(wù),如圖像上色和圖像編輯。

d46d2f42-0283-11ed-ba43-dac502259ad0.png

我們更感興趣的是研究一種更通用的圖像先驗(yàn),即在大規(guī)模自然圖像上訓(xùn)練的GAN生成器用于圖像合成。具體來說,是一個(gè)基于GAN-inversion的圖像重構(gòu)過程。

在實(shí)踐中,僅僅通過優(yōu)化隱向量z難以準(zhǔn)確重建ImageNet這樣的復(fù)雜真實(shí)圖像。訓(xùn)練GAN的數(shù)據(jù)集(ImageNet)本身是自然圖片中很少的一部分,GAN受限于有限的模型性能和mode collapse,其模擬的圖片分布與訓(xùn)練集圖片分布也存在鴻溝。

即使存在以上限制,GAN仍然學(xué)習(xí)了豐富的圖片信息,為了利用這些信息并且實(shí)現(xiàn)精確重建,我們讓生成器online地適應(yīng)于每張目標(biāo)圖片,即聯(lián)合優(yōu)化隱向量z和生成器參數(shù)。

d4926fdc-0283-11ed-ba43-dac502259ad0.png

我們將此新的目標(biāo)稱為深度生成先驗(yàn)(DGP),DGP顯著提高了圖像重構(gòu)的效果。設(shè)計(jì)合適的距離度量和優(yōu)化策略非常關(guān)鍵,在重建過程中,生成器原始的生成先驗(yàn)被修改了,輸出真實(shí)自然圖像的能力可能會(huì)下降。

02判別器指引的漸進(jìn)式重建

從 latent space Z 中隨機(jī)抽取幾百個(gè)候選的初始 latent code,并選擇在度量L下重構(gòu)效果最好的一個(gè)。

在GAN重建中,傳統(tǒng)的距離度量方法是 MSE 或 Perceptual loss。優(yōu)化生成器參數(shù)時(shí),將這些傳統(tǒng)距離度量用在圖像恢復(fù)如上色任務(wù)中,常常無法準(zhǔn)確恢復(fù)顏色,并且重建過程中圖像會(huì)變得模糊,需要設(shè)計(jì)更好的優(yōu)化方式來保留生成器的原有信息。

我們在該工作中選擇使用與生成器對(duì)應(yīng)的判別器來作為距離度量。與Perceptual loss所采用的VGGNet不同,判別器并非在一個(gè)第三方的任務(wù)上訓(xùn)練,而是在預(yù)訓(xùn)練時(shí)就與生成器高度耦合,它天然地適用于調(diào)整生成器的輸出分布。

使用這種基于判別器的距離度量時(shí),重建的過程更加自然和真實(shí),最終顏色恢復(fù)的效果也更好。

d4c46f50-0283-11ed-ba43-dac502259ad0.png

其中D(x, i)代表以x作為輸入時(shí)判別器第i個(gè)block輸出的特征

雖然改進(jìn)的距離度量帶來了更好的效果,但是圖像復(fù)原的結(jié)果仍存在非自然痕跡,因?yàn)樯善髟卺槍?duì)目標(biāo)圖片優(yōu)化時(shí),淺層參數(shù)匹配好圖片整體布局之前,深層參數(shù)就開始匹配細(xì)節(jié)紋理了。

d4d8fee8-0283-11ed-ba43-dac502259ad0.png

上面的蘋果圖是幾種訓(xùn)練策略的對(duì)比,從三行效果可以看出,有的蘋果在訓(xùn)練初期沒被染上色后期還是沒被染上色,我們把這種現(xiàn)象稱作“信息滯留”。

對(duì)策就是:使用漸進(jìn)式重建的策略,即在微調(diào)生成器時(shí),先優(yōu)化淺層,再逐漸過渡到深層,讓重建過程“先整體后局部”。

與非漸進(jìn)策略相比,這種漸進(jìn)策略更好地保留了缺失語義和現(xiàn)有語義之間的一致性。

d4ee357e-0283-11ed-ba43-dac502259ad0.png

03重建結(jié)果

使用BigGAN模型,基于ImageNet進(jìn)行訓(xùn)練,使用ImageNet驗(yàn)證集中的1000張圖像進(jìn)行實(shí)驗(yàn),取每類的第一張,相比于其他方法,DGP取得了非常高的PSNR和SSIM,視覺上的重建誤差幾乎難以察覺。

d51bea28-0283-11ed-ba43-dac502259ad0.png

04實(shí)驗(yàn)

因?yàn)镚AN刻畫了自然圖像的先驗(yàn),因此可以完成很多的任務(wù):比如上色、補(bǔ)全、超分辨率等等,還能進(jìn)行圖像處理。下面放一些效果圖。

圖像上色

使用ResNet50上的分類精度作為定量評(píng)估結(jié)果, 下列方法的精度分別為 51.5%, 56.2%, 56.0%, 62.8%。

d56bab58-0283-11ed-ba43-dac502259ad0.png

圖像補(bǔ)全

d58cc4f0-0283-11ed-ba43-dac502259ad0.png

超分辨率

d5b1deb6-0283-11ed-ba43-dac502259ad0.png

靈活性

d5c8ecdc-0283-11ed-ba43-dac502259ad0.png

隨機(jī)擾動(dòng)

d5e3a16c-0283-11ed-ba43-dac502259ad0.png

總結(jié)

GAN作為圖像領(lǐng)域最強(qiáng)大的生成式模型之一,學(xué)習(xí)到了豐富的自然圖像流形,可以對(duì)自然圖像的恢復(fù)和編輯帶來巨大幫助。

利用好大規(guī)模預(yù)訓(xùn)練模型的能力是深度學(xué)習(xí)目前各個(gè)領(lǐng)域的流行前沿,可以減少對(duì)訓(xùn)練數(shù)據(jù)的需求,整合相近的研究領(lǐng)域。

未來更強(qiáng)大的生成式模型,將帶來更具實(shí)際應(yīng)用價(jià)值的圖像恢復(fù)和編輯應(yīng)用,有望在更廣泛的領(lǐng)域落地

d609a812-0283-11ed-ba43-dac502259ad0.png

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • GaN
    GaN
    +關(guān)注

    關(guān)注

    21

    文章

    2366

    瀏覽量

    82268
  • 生成器
    +關(guān)注

    關(guān)注

    7

    文章

    322

    瀏覽量

    22711
  • 圖像修復(fù)
    +關(guān)注

    關(guān)注

    0

    文章

    11

    瀏覽量

    2377

原文標(biāo)題:深度學(xué)習(xí)論文精讀[GAN]:利用深度生成先驗(yàn)進(jìn)行多用途圖像修復(fù)與處理

文章出處:【微信號(hào):CVSCHOOL,微信公眾號(hào):OpenCV學(xué)堂】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    電池修復(fù)漏液的原因與處理

    大家在修復(fù)電池的過程中,是否遇到電池漏液的現(xiàn)象頻發(fā),非常的棘手,不知原因在哪,怎么去解決。   接下來我給大家詳細(xì)的從專業(yè)角度講一講電池漏液的幾種原因以及解決的方案,請大家點(diǎn)贊收藏。   第一種就是
    發(fā)表于 12-14 16:43

    兼容性高,延遲低,慧視定制CVBS接口AI圖像處理

    ,定制開發(fā)出多款CVBS接口的AI圖像處理板。Viztra-LE034圖像處理板利用RV1126開發(fā)的Viztra-LE034圖像
    的頭像 發(fā)表于 11-10 17:58 ?1581次閱讀
    兼容性高,延遲低,慧視定制CVBS接口AI<b class='flag-5'>圖像</b><b class='flag-5'>處理</b>板

    慧視光電——全棧圖像處理板供應(yīng)商

    隨著AI日益滲透到各行各業(yè),作為支撐平臺(tái)的圖像處理板日益成為人們關(guān)注的焦點(diǎn),由于原來的系統(tǒng)集成商或一級(jí)配套單位不具備或者不完全具備圖像處理案板的整體研發(fā)整理,因此全棧
    的頭像 發(fā)表于 10-23 18:02 ?554次閱讀
    慧視光電——全棧<b class='flag-5'>圖像</b><b class='flag-5'>處理</b>板供應(yīng)商

    中科億海微Link-Sea-H6A圖像處理套件

    Link-Sea-H6A圖像處理套件是中科億海微基于自研芯片EQ6HL130開發(fā)的適用于圖像處理應(yīng)用的開發(fā)套件。該套件主要由圖像接口板、HL
    的頭像 發(fā)表于 09-29 15:49 ?665次閱讀
    中科億海微Link-Sea-H6A<b class='flag-5'>圖像</b><b class='flag-5'>處理</b>套件

    光纖圖像處理卡設(shè)計(jì)原理圖:520-基于ZU15EG 適配AWR2243的雷達(dá)驗(yàn)證底板 XCZU15EG架構(gòu)高速信號(hào)處理

    高速信號(hào)處理, FPGA光纖, 光纖圖像處理, XCZU15EG架構(gòu)
    的頭像 發(fā)表于 08-28 10:39 ?627次閱讀
    光纖<b class='flag-5'>圖像</b><b class='flag-5'>處理</b>卡設(shè)計(jì)原理圖:520-基于ZU15EG 適配AWR2243的雷達(dá)驗(yàn)證底板 XCZU15EG架構(gòu)高速信號(hào)<b class='flag-5'>處理</b>板

    FPGA 加持,友思特圖像采集卡高速預(yù)處理助力視覺系統(tǒng)運(yùn)行提速增效

    圖像預(yù)處理圖像處理關(guān)鍵環(huán)節(jié),可優(yōu)化數(shù)據(jù)傳輸、減輕主機(jī)負(fù)擔(dān),其算法可在FPGA等硬件上執(zhí)行。友思特FPGA圖像采集卡憑借FPGA特性,能縮短
    的頭像 發(fā)表于 08-13 17:41 ?1115次閱讀
    FPGA 加持,友思特<b class='flag-5'>圖像</b>采集卡高速預(yù)<b class='flag-5'>處理</b>助力視覺系統(tǒng)運(yùn)行提速增效

    【高云GW5AT-LV60 開發(fā)套件試用體驗(yàn)】基于開發(fā)板進(jìn)行深度學(xué)習(xí)實(shí)踐,并盡量實(shí)現(xiàn)皮膚病理圖片的識(shí)別,第二階段

    豪兄重新學(xué)習(xí)了一下有關(guān)的AI論文精讀系列,里面有很多model都是比較成熟的,而且子豪兄也給出了相關(guān)的代碼: https://github.com/TommyZihao
    發(fā)表于 06-23 18:37

    HarmonyOS應(yīng)用圖像stride處理方案

    當(dāng)圖像存儲(chǔ)在內(nèi)存中時(shí),內(nèi)存緩沖區(qū)可能在每行像素之后包含額外的填充字節(jié)。填充字節(jié)會(huì)影響圖像在內(nèi)存中的存儲(chǔ)方式,但不會(huì)影響圖像的顯示方式。stride是內(nèi)存中一行像素到內(nèi)存中下一行像素的字節(jié)數(shù);如果存在填充字節(jié),則步幅比
    的頭像 發(fā)表于 06-10 14:17 ?1228次閱讀
    HarmonyOS應(yīng)用<b class='flag-5'>圖像</b>stride<b class='flag-5'>處理</b>方案

    降低電視液晶屏修復(fù)線的信號(hào)延遲及液晶線路修光修復(fù)

    摘要 針對(duì)電視液晶屏修復(fù)過程中信號(hào)延遲導(dǎo)致的修復(fù)效率下降及液晶線路損傷問題,本文提出一種基于硬件結(jié)構(gòu)優(yōu)化與激光修復(fù)技術(shù)的綜合解決方案。通過重構(gòu)修復(fù)線布局、引入高速傳輸接口及優(yōu)化激光參數(shù)
    的頭像 發(fā)表于 05-30 09:53 ?683次閱讀
    降低電視液晶屏<b class='flag-5'>修復(fù)</b>線的信號(hào)延遲及液晶線路修光<b class='flag-5'>修復(fù)</b>

    云知聲四篇論文入選自然語言處理頂會(huì)ACL 2025

    近日,第63屆國際計(jì)算語言學(xué)年會(huì)ACL 2025(Annual Meeting of the Association for Computational Linguistics,簡稱ACL)論文接收
    的頭像 發(fā)表于 05-26 14:15 ?1310次閱讀
    云知聲四篇<b class='flag-5'>論文</b>入選自然語言<b class='flag-5'>處理</b>頂會(huì)ACL 2025

    降低液晶面板修復(fù)線的信號(hào)延遲及液晶線路修光修復(fù)

    引言 在液晶面板生產(chǎn)與修復(fù)過程中,修復(fù)線的信號(hào)延遲會(huì)嚴(yán)重影響修復(fù)效率與質(zhì)量,同時(shí)液晶線路的損傷也需要有效的修復(fù)手段。研究降低信號(hào)延遲的方法以及液晶線路修光
    的頭像 發(fā)表于 05-12 15:17 ?729次閱讀
    降低液晶面板<b class='flag-5'>修復(fù)</b>線的信號(hào)延遲及液晶線路修光<b class='flag-5'>修復(fù)</b>

    使用ALINX VD100開發(fā)板實(shí)現(xiàn)圖像處理

    這是一塊基于 AMD Versal Edge AI 平臺(tái)的開發(fā)板,功能特別強(qiáng)大,可以用來做圖像處理、人工智能等各種高階應(yīng)用。
    的頭像 發(fā)表于 05-12 09:23 ?1144次閱讀
    使用ALINX VD100開發(fā)板實(shí)現(xiàn)<b class='flag-5'>圖像</b><b class='flag-5'>處理</b>

    基于嵌入式人工智能的高速圖像處理的微處理器RZ/A2M數(shù)據(jù)手冊

    RZ/A2M MPU設(shè)計(jì)用于需要高速e-AI圖像處理的智能電器,網(wǎng)絡(luò)攝像機(jī),服務(wù)機(jī)器人,掃描儀產(chǎn)品和工業(yè)機(jī)械。它采用獨(dú)特的圖像識(shí)別和機(jī)器視覺混合方法,結(jié)合了專有的DRP技術(shù),對(duì)圖像數(shù)據(jù)
    的頭像 發(fā)表于 03-11 15:54 ?1021次閱讀
    基于嵌入式人工智能的高速<b class='flag-5'>圖像</b><b class='flag-5'>處理</b>的微<b class='flag-5'>處理</b>器RZ/A2M數(shù)據(jù)手冊