91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

GAN應(yīng)用缺陷的解決方法分享

電子工程師 ? 來源:陳翠 ? 2019-02-22 09:44 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

盡管 GAN 領(lǐng)域的進(jìn)步令人印象深刻,但其在應(yīng)用過程中仍然存在一些困難。本文梳理了 GAN 在應(yīng)用過程中存在的一些難題,并提出了最新的解決方法。

使用 GAN 的缺陷

眾所周知,GAN 是由 Generator 生成網(wǎng)絡(luò)和 Discriminator 判別網(wǎng)絡(luò)組成的。

1. Modecollapse(模型奔潰)

注:Mode collapse 是指 GAN 生成的樣本單一,其認(rèn)為滿足某一分布的結(jié)果為 true,其他為 False,導(dǎo)致以上結(jié)果。

自然數(shù)據(jù)分布是非常復(fù)雜,且是多峰值的(multimodal)。也就是說數(shù)據(jù)分布有很多的峰值(peak)或眾數(shù)(mode)。每個 mode 都表示相似數(shù)據(jù)樣本的聚集,但與其他 mode 是不同的。

在 modecollapse 過程中,生成網(wǎng)絡(luò) G 會生成屬于有限集 mode 的樣本。當(dāng) G 認(rèn)為可以在單個 mode 上欺騙判別網(wǎng)絡(luò) D 時,G 就會生成該 mode 外的樣本。

GAN應(yīng)用缺陷的解決方法分享

上圖表示 GAN 的輸出沒有 mode collapse. 下圖則出現(xiàn)了 mode collapse。

判別網(wǎng)絡(luò)最后會判別來自該 mode 的樣本是假的。最后,生成網(wǎng)絡(luò) G 會簡單地鎖定到另一個 mode。該循環(huán)會無限進(jìn)行,就會限制生成樣本的多樣性。

2. Convergence(收斂)

GAN 訓(xùn)練過程中遇到的一個問題是什么時候停止訓(xùn)練?因為判別網(wǎng)絡(luò) D 損失降級會改善生成網(wǎng)絡(luò) G 的損失(反之亦然),因此無法根據(jù)損失函數(shù)的值來判斷收斂,如下圖所示:

GAN應(yīng)用缺陷的解決方法分享

典型的GAN損失函數(shù)圖。注意該如何從這個圖中解釋收斂性。

3. Quality(質(zhì)量)

與前面提到的收斂問題一樣,很難量化地判斷生成網(wǎng)絡(luò) G 什么時候會生成高質(zhì)量的樣本。另外,在損失函數(shù)中加入感知正則化則在一定程度上可緩解該問題。

4. Metrics(度量)

GAN 的目標(biāo)函數(shù)解釋了生成網(wǎng)絡(luò) G 或 判別網(wǎng)絡(luò) D 如何根據(jù)組件來執(zhí)行,但它卻不表示輸出的質(zhì)量和多樣性。因此,需要許多不同的度量指標(biāo)來進(jìn)行衡量。

改善性能的技術(shù)

下面總結(jié)了一些可以使 GAN 更加穩(wěn)定使用的技術(shù)。

1. Alternative Loss Functions (替代損失函數(shù))

修復(fù) GAN 缺陷的最流行的補丁是 Wasserstein GAN (https://arxiv.org/pdf/1701.07875.pdf)。該 GAN 用 Earth Mover distance( Wasserstein-1 distance 或 EM distance) 來替換傳統(tǒng) GAN 的 Jensen Shannon divergence ( J-S 散度)。EM 距離的原始形式很難理解,因此使用了雙重形式。這需要判別網(wǎng)絡(luò)是 1-Lipschitz,通過修改判別網(wǎng)絡(luò)的權(quán)重來維護(hù)。

使用 Earth Mover distance 的優(yōu)勢在于即使真實的生成數(shù)據(jù)分布是不相交的,它也是連續(xù)的。同時,在生成的圖像質(zhì)量和損失值之間存在一定關(guān)系。使用 Earth Mover distance 的劣勢在于對于每個生成模型 G 都要執(zhí)行許多判別網(wǎng)絡(luò) D 的更新。而且,研究人員認(rèn)為權(quán)重修改是確保 1-Lipschitz 限制的極端方式。

GAN應(yīng)用缺陷的解決方法分享

左圖中 earth mover distance 是連續(xù)的, 即便其分布并不連續(xù), 這不同于優(yōu)圖中的 the Jensen Shannon divergence。

另一個解決方案是使用均方損失( mean squared loss )替代對數(shù)損失( log loss )。LSGAN (https://arxiv.org/abs/1611.04076)的作者認(rèn)為傳統(tǒng) GAN 損失函數(shù)并不會使收集的數(shù)據(jù)分布接近于真實數(shù)據(jù)分布。

原來 GAN 損失函數(shù)中的對數(shù)損失并不影響生成數(shù)據(jù)與決策邊界(decision boundary)的距離。另一方面,LSGAN 也會對距離決策邊界較遠(yuǎn)的樣本進(jìn)行懲罰,使生成的數(shù)據(jù)分布與真實數(shù)據(jù)分布更加靠近,這是通過將均方損失替換為對數(shù)損失來完成的。

2. Two Timescale Update Rule(TTUR)

在 TTUR 方法中,研究人員對判別網(wǎng)絡(luò) D 和生成網(wǎng)絡(luò) G 使用不同的學(xué)習(xí)速度。低速更新規(guī)則用于生成網(wǎng)絡(luò) G ,判別網(wǎng)絡(luò) D使用 高速更新規(guī)則。使用 TTUR 方法,研究人員可以讓生成網(wǎng)絡(luò) G 和判別網(wǎng)絡(luò) D 以 1:1 的速度更新。 SAGAN (https://arxiv.org/abs/1805.08318) 就使用了 TTUR 方法。

3. GradientPenalty (梯度懲罰)

論文Improved Training of WGANs(https://arxiv.org/abs/1704.00028)中,作者稱權(quán)重修改會導(dǎo)致優(yōu)化問題。權(quán)重修改會迫使神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)學(xué)習(xí)更簡單的相似(simpler approximations)達(dá)到最優(yōu)數(shù)據(jù)分布,導(dǎo)致結(jié)果質(zhì)量不高。同時如果 WGAN 超參數(shù)設(shè)置不合理,權(quán)重修改可能會出現(xiàn)梯度消失或梯度爆炸的問題,論文作者在損失函數(shù)中加入了一個簡單的梯度懲罰機制以緩解該問題。

GAN應(yīng)用缺陷的解決方法分享

加入 GradientPenalty 作為正則化器

DRAGAN (https://arxiv.org/abs/1705.07215)的作者稱,當(dāng) GAN 的博弈達(dá)到一個局部平衡態(tài)(local equilibrium state),就會出現(xiàn) mode collapse 的問題。而且判別網(wǎng)絡(luò) D 在這種狀態(tài)下產(chǎn)生的梯度是非常陡(sharp)的。一般來說,使用梯度懲罰機制可以幫助避免這種狀態(tài)的產(chǎn)生,極大增強 GAN 的穩(wěn)定性,盡可能減少 mode collapse 問題的產(chǎn)生。

4. Spectral Normalization(譜歸一化)

Spectral normalization 是用在判別網(wǎng)絡(luò) D 來增強訓(xùn)練過程的權(quán)重正態(tài)化技術(shù) (weight normalization technique),可以確保判別網(wǎng)絡(luò) D 是 K-Lipschitz 連續(xù)的。SAGAN(https://arxiv.org/abs/1805.08318)這樣的實現(xiàn)也在判別網(wǎng)絡(luò) D 上使用了譜正則化。而且該方法在計算上要比梯度懲罰方法更加高效。

5. Unrolling andPacking (展開和打包)

文章 Mode collapse in GANs(http://aiden.nibali.org/blog/2017-01-18-mode-collapse-gans/)中提到一種預(yù)防 mode hopping 的方法就是在更新參數(shù)時進(jìn)行預(yù)期對抗(anticipate counterplay)。展開的 GAN ( Unrolled GANs )可以使用生成網(wǎng)絡(luò) G 欺騙判別網(wǎng)絡(luò) D,然后判別網(wǎng)絡(luò) D 就有機會進(jìn)行響應(yīng)。

另一種預(yù)防 mode collapse 的方式就是把多個屬于同一類的樣本進(jìn)行打包,然后傳遞給判別網(wǎng)絡(luò) D 。PacGAN (https://arxiv.org/abs/1712.04086)就融入了該方法,并證明可以減少 mode collapse 的發(fā)生。

6. 多個 GAN

一個 GAN 可能不足以有效地處理任務(wù),因此研究人員提出使用多個連續(xù)的 GAN ,每個 GAN 解決任務(wù)中的一些簡單問題。比如,F(xiàn)ashionGAN(https://www.cs.toronto.edu/~urtasun/publications/zhu_etal_iccv17.pdf)就使用 2 個 GAN 來執(zhí)行圖像定位翻譯。

GAN應(yīng)用缺陷的解決方法分享

FashionGAN 使用兩個 GANs 進(jìn)行圖像定位翻譯。

因此,可以讓 GAN 慢慢地解決更難的問題。比如 Progressive GANs (ProGANs,https://arxiv.org/abs/1710.10196) 就可以生成分辨率極高的高質(zhì)量圖像。

7. Relativistic GANs(相對生成對抗網(wǎng)絡(luò))

傳統(tǒng)的 GAN 會測量生成數(shù)據(jù)為真的可能性。Relativistic GANs 則會測量生成數(shù)據(jù)“逼真”的可能性。研究人員可以使用相對距離測量方法(appropriate distance measure)來測量相對真實性(relative realism),相關(guān)論文鏈接:https://arxiv.org/abs/1807.00734。

GAN應(yīng)用缺陷的解決方法分享

圖 A 表示 JS 散度的最優(yōu)解,圖 B 表示使用標(biāo)準(zhǔn) GAN 損失時判別網(wǎng)絡(luò) D 的輸出,圖 C 表示輸出曲線的實際圖。

在論文中,作者提到判別網(wǎng)絡(luò) D 達(dá)到最優(yōu)狀態(tài)時,D 的輸出應(yīng)該聚集到 0.5。但傳統(tǒng)的 GAN 訓(xùn)練算法會讓判別網(wǎng)絡(luò) D 對圖像輸出“真實”(real,1)的可能性,這會限制判別網(wǎng)絡(luò) D 達(dá)到最優(yōu)性能。不過這種方法可以很好地解決這個問題,并得到不錯的結(jié)果。

經(jīng)過 5000 次迭代后,標(biāo)準(zhǔn) GAN (左)和相對 GAN (右)的輸出。

8. Self Attention Mechanism(自注意力機制)

Self Attention GANs(https://arxiv.org/abs/1805.08318)作者稱用于生成圖像的卷積會關(guān)注本地傳播的信息。也就是說,由于限制性接收域這會錯過廣泛傳播關(guān)系。

GAN應(yīng)用缺陷的解決方法分享

將 attention map (在黃色框中計算)添加到標(biāo)準(zhǔn)卷積操作中。

Self-Attention Generative Adversarial Network 允許圖像生成任務(wù)中使用注意力驅(qū)動的、長距依賴的模型。自注意力機制是對正常卷積操作的補充,全局信息(長距依賴)會用于生成更高質(zhì)量的圖像,而用來忽略注意力機制的神經(jīng)網(wǎng)絡(luò)會考慮注意力機制和正常的卷積。(相關(guān)論文鏈接:https://arxiv.org/pdf/1805.08318.pdf)。

使用紅點標(biāo)記的可視化 attention map。

9. 其他技術(shù)

其他可以用來改善 GAN 訓(xùn)練過程的技術(shù)包括:

特征匹配

Mini Batch Discrimination(小批量判別)

歷史平均值

One-sided Label Smoothing(單側(cè)標(biāo)簽平滑)

Virtual Batch Normalization(虛擬批量正態(tài)化)

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • GaN
    GaN
    +關(guān)注

    關(guān)注

    21

    文章

    2366

    瀏覽量

    82227
  • Model
    +關(guān)注

    關(guān)注

    0

    文章

    343

    瀏覽量

    26447

原文標(biāo)題:GAN性能不穩(wěn)?這九大技術(shù)可“鎮(zhèn)住”四類缺陷

文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    SMT車間錫膏印刷5大缺陷解析

    ?:焊料覆蓋不全,虛焊缺陷率上升。 解決方法?: 1.采用電拋光工藝處理鋼網(wǎng),內(nèi)壁粗糙度控制在Ra≤0.4μm; 2.每30分鐘用無塵布清潔鋼網(wǎng); 3.選擇觸變指數(shù)(TI)≥0.8的錫膏。 ?圖形玷污
    發(fā)表于 02-09 15:05

    C編譯器錯誤與解決方法

    C語言keil編譯器提示錯誤的解決方法,可以幫你解決程序編譯中的煩惱!! C編譯器錯誤與解決方法 1. Warning 280:’i’:unreferenced local variable
    發(fā)表于 01-22 08:03

    ODF配線架常見故障及解決方法?

    ODF配線架常見故障及解決方法如下: 一、接地故障 故障表現(xiàn): 防雷性能下降,靜電積累,甚至引發(fā)設(shè)備損壞。 光信號傳輸不穩(wěn)定,出現(xiàn)誤碼或中斷。 常見原因: 接地端子氧化、松動或接觸不良。 接地線
    的頭像 發(fā)表于 01-05 10:43 ?318次閱讀

    請問C語言中整形溢出的解決方法有哪些?

    C語言中整形溢出的解決方法有哪些?
    發(fā)表于 12-29 07:33

    Neway第三代GaN系列模塊的生產(chǎn)成本

    采購與維護(hù)成本。例如,中微公司已實現(xiàn)5nm刻蝕機量產(chǎn),GaN設(shè)備國產(chǎn)化可期。智能制造升級:引入AI算法優(yōu)化生產(chǎn)流程(如缺陷檢測、工藝參數(shù)調(diào)整),提升良率至90%以上,進(jìn)一步攤薄成本。生態(tài)合作供應(yīng)鏈垂直
    發(fā)表于 12-25 09:12

    Vivado仿真之后沒有出現(xiàn)仿真結(jié)果的解決方法

    ;Run Behavioral Simulation之后,會出現(xiàn)如下圖界面,此時,在Tcl Console中并沒有出現(xiàn)仿真結(jié)果。 沒有出現(xiàn)仿真結(jié)果的原因是沒有給Vivado時間進(jìn)行仿真,解決方法
    發(fā)表于 10-31 06:24

    程序加載過程中遇到的問題及其解決方法

    /quick_start/ide.html。 (1)遇到的問題1:在創(chuàng)建好項目后,運行配置設(shè)置為ILM,可以編譯成功;當(dāng)修改運行配置為Flash后,編譯失??;重啟軟件,仍會遇到類似問題。 解決方法
    發(fā)表于 10-30 07:59

    Leadway GaN系列模塊的功率密度

    Leadway GaN系列模塊以120W/in3的功率密度為核心,通過材料創(chuàng)新、電路優(yōu)化與封裝設(shè)計,實現(xiàn)了體積縮減40%、效率提升92%+的突破。其價值在于為工業(yè)自動化、機器人、電動汽車等空間受限
    發(fā)表于 10-22 09:09

    LVDS接口的顯示屏,顯示偏暗問題的解決方法

    問題:點亮屏幕后畫面顯示偏暗 可能原因: 主板輸出的LVDS 模式與屏幕的不一致; PWM亮度并未調(diào)節(jié)到最亮; 解決方法 檢查主板的LVDS輸出模式是否和屏幕一致; 一般主板端的LVDS模式是可以配置的,配置成與屏幕相同的模式即可; 檢查PWM亮度調(diào)節(jié)是否正常?或者直接給高電平測試;
    發(fā)表于 10-09 15:55

    國產(chǎn)主板無法開機的狀況及解決方法

    在計算機的硬件系統(tǒng)中,主板作為連接各個組件的關(guān)鍵樞紐,其穩(wěn)定運行至關(guān)重要。隨著國產(chǎn)主板技術(shù)的不斷發(fā)展與普及,了解其常見故障及解決方法,能幫助用戶在遇到問題時快速排查修復(fù),保障計算機正常使用。
    的頭像 發(fā)表于 07-02 09:33 ?1272次閱讀
    國產(chǎn)主板無法開機的狀況及<b class='flag-5'>解決方法</b>

    電機常見的噪音、振動問題及解決方法

    ,甚至引發(fā)安全隱患。本文將系統(tǒng)分析電機常見的噪音和振動問題,并提供切實可行的解決方法。 ? 一、電機噪音問題及解決方法 電機噪音主要來源于電磁噪音、機械噪音和空氣動力噪音三個方面。 1. 電磁噪音 電磁噪音是由于電機內(nèi)部
    的頭像 發(fā)表于 06-08 10:25 ?3559次閱讀

    電機常見故障分析及解決方法

    電機在運行過程中可能會出現(xiàn)多種故障,以下是一些常見故障的分析及解決方法: 一、機械故障 1. 軸承損壞或磨損 ? ?● 故障表現(xiàn):電機運轉(zhuǎn)不平穩(wěn),產(chǎn)生異響,嚴(yán)重時甚至停轉(zhuǎn)。 ? ?● 原因分析:通常
    的頭像 發(fā)表于 04-25 15:20 ?5581次閱讀
    電機常見故障分析及<b class='flag-5'>解決方法</b>

    SMT加工虛焊大揭秘:判斷與解決方法全攻略

    一站式PCBA智造廠家今天為大家講講SMT加工虛焊的判斷與解決方法有哪些?SMT加工虛焊的判斷與解決方法。在電子制造過程中,SMT貼片加工是確保電路板功能穩(wěn)定的重要環(huán)節(jié)。然而,虛焊(Cold
    的頭像 發(fā)表于 03-18 09:34 ?1810次閱讀

    激光焊接十大常見缺陷解決方法

    無所不能,有時也會因為操作或者參數(shù)設(shè)定上的原因,導(dǎo)致加工出現(xiàn)差錯。只有充分了解這些缺陷并學(xué)習(xí)如何避免它們,才能更好地發(fā)揮激光焊接的價值。以下是激光焊接過程中常見的十大缺陷及其解決方法。 ?1. 焊接飛濺 ●
    的頭像 發(fā)表于 03-17 16:02 ?5864次閱讀

    321Y驅(qū)動器的常見故障及解決方法

    ? 321Y驅(qū)動器常見故障及解決方法 ?: ? 過載故障 ? ? 現(xiàn)象 ?:驅(qū)動器連續(xù)使用超過額定負(fù)載兩倍時,會產(chǎn)生異常警報?1。 ? 解決方法 ?:降低負(fù)載、調(diào)整減速箱傳動比、增加電動機容量等?1
    的頭像 發(fā)表于 03-07 15:50 ?1797次閱讀