91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌采用GANs與神經(jīng)網(wǎng)絡(luò)打造圖像壓縮新算法

中科院長春光機所 ? 來源:雪球 ? 作者:雪球 ? 2020-09-14 09:26 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

還在為圖像加載犯愁嗎? 最新的好消息是,谷歌團(tuán)隊采用了一種GANs與基于神經(jīng)網(wǎng)絡(luò)的壓縮算法相結(jié)合的圖像壓縮方式HiFiC,在碼率高度壓縮的情況下,仍能對圖像高保真還原。

GAN(Generative Adversarial Networks,生成式對抗網(wǎng)絡(luò))顧名思義,系統(tǒng)讓兩個神經(jīng)網(wǎng)絡(luò)相互「磨煉」,一個神經(jīng)網(wǎng)絡(luò)負(fù)責(zé)生成接近真實的數(shù)據(jù),另一個神經(jīng)網(wǎng)絡(luò)負(fù)責(zé)區(qū)分真實數(shù)據(jù)與生成的數(shù)據(jù)。

簡單來說,就是一個神經(jīng)網(wǎng)絡(luò)「造假」,另一個神經(jīng)網(wǎng)絡(luò)「打假」,而當(dāng)系統(tǒng)達(dá)到平衡時,生成的數(shù)據(jù)看起來便會非常接近真實數(shù)據(jù),達(dá)到「以假亂真」的效果。

下面是這種算法展現(xiàn)出來的圖像與JPG格式圖像的對比。 可見,在圖像大小接近的情況下(HiFiC大小74kB,JPG圖像大小78kB),算法所展現(xiàn)出來的圖像壓縮效果要好得多。

而在與原圖進(jìn)行對比時,HiFiC所展現(xiàn)出來的還原效果仍然非常優(yōu)秀。(真的不是在原圖中間畫了條線嗎?)

目前處于特殊時期,大量國外網(wǎng)友仍在家中隔離,Netflix和油管的播放量暴增,一些視頻網(wǎng)站甚至不得不被迫降低視頻在線播放的清晰度,以適應(yīng)激增的數(shù)據(jù)量。

但看慣了高清視頻的網(wǎng)友們,面對突如其來的「模糊打擊」自然怨聲載道。

用一位網(wǎng)友的話來說,如果視頻行業(yè)也能被應(yīng)用類似的技術(shù),相信Netflix和油管會特別高興,畢竟這種高清低碼率的圖像復(fù)原實在太誘惑。

哇,如果他們可以對視頻做同樣的事情的話,我相信Netflix和YouTube會很高興的。

事實上,在了解HiFiC算法的原理后,會發(fā)現(xiàn)它的確不難實現(xiàn)。

接近原圖的圖像重構(gòu)算法

此前,相關(guān)研究已有采用神經(jīng)網(wǎng)絡(luò)進(jìn)行圖像壓縮的算法,而隨著近年來生成式對抗網(wǎng)絡(luò)興起,采用GANs生成以假亂真圖像的算法也不在少數(shù)。

如果能有辦法將二者結(jié)合,圖像壓縮的效果是不是會更好、更接近于人類的感知?

這次圖像壓縮的模型便是基于二者的特性設(shè)計,在基于神經(jīng)網(wǎng)絡(luò)的壓縮圖像算法基礎(chǔ)上,采用GANs進(jìn)一步讓生成的圖片更接近于人類視覺,在圖像大小和視覺感知間達(dá)到一個平衡。

可以看見,HiFiC的架構(gòu)被分成了4個主要部分,其中E為編碼器,G為生成器,D為判別器,而P則是E的輸出E(x)的概率模型(這里用y表示),也就是P用于模擬y的概率分布。

GANs運作的核心思想在于,需要讓架構(gòu)中的生成器G通過某種方法,「欺騙」判別器D判定樣本為真。

而概率模型P,則是達(dá)成這步操作的條件。

然后,將E、G、P參數(shù)化為卷積神經(jīng)網(wǎng)絡(luò),這樣就可以通過率失真優(yōu)化的條件,對這些網(wǎng)絡(luò)進(jìn)行共同訓(xùn)練。

同時,研究者也對已有的幾種GANs算法架構(gòu)進(jìn)行了微調(diào),使其更適于HiFiC架構(gòu)。

研究發(fā)現(xiàn),將GANs與深度學(xué)習(xí)相結(jié)合的HiFiC算法取得了意想不到的效果。

模型評估

下圖是采用目前幾種主流圖像質(zhì)量評估標(biāo)準(zhǔn),對幾種前沿的圖像壓縮算法與HiFiC算法進(jìn)行比較的結(jié)果。

在圖中,評估標(biāo)準(zhǔn)后面自帶的箭頭,表示數(shù)據(jù)更低(↓)或數(shù)據(jù)更高(↑)表示圖像質(zhì)量更好。

為了更好地對比,結(jié)果分別采用了HiFiC算法(圖中紅點連線)、不帶GANs的對比算法(圖中橙方連線)、目前較為前沿的M&S算法(圖中藍(lán)方連線)和BPG算法(圖中藍(lán)點連線)。

從結(jié)果來看,HiFiC算法在FID、KID、NIQE、LPIPS幾種評估標(biāo)準(zhǔn)均為最優(yōu),而在MS-SSIM和PSNR標(biāo)準(zhǔn)中表現(xiàn)一般。

由評估標(biāo)準(zhǔn)間的差異可見,各項圖像質(zhì)量標(biāo)準(zhǔn)不一定是判斷壓縮技術(shù)的最好辦法。

用戶評測對比

畢竟,圖像是用來看的,最終的判斷權(quán)還得交回用戶手里。

圖像究竟是否「清晰」,某種程度上得通過人眼的判斷來決定。

出于這個考慮,團(tuán)隊采取了調(diào)研模式,讓一部分志愿者參與算法的比較。

他們先展示一張測試圖片的隨機裁切圖樣,當(dāng)志愿者對其中某張裁切圖樣感興趣時,便用這一部分來進(jìn)行所有算法的對比。

志愿者將原圖與經(jīng)過算法處理后的圖像對比后,選出他們認(rèn)為「視覺上」更接近于原圖的壓縮算法。

在所有算法經(jīng)過選取后,將會出現(xiàn)一個排名,以衡量HiFiC的實際效果。(其中,HiFiC的角標(biāo)Hi、Mi和Lo分別為設(shè)置由高至低3種不同碼率閾值時的算法)

上圖中,評分越低,則代表圖像在用戶眼中「越清晰」。從圖中來看,HiFiC(Mi)在0.237bpp的壓縮效果下,甚至比兩倍碼率的0.504bpp的BPG算法在用戶眼里還要更好。

即使壓縮效果達(dá)到了0.120bpp,也比0.390bpp的BPG算法更好。

這項研究再次推動了圖像壓縮技術(shù)的發(fā)展,正如網(wǎng)友所說,隨著圖像壓縮技術(shù)的發(fā)展,在線看4k電影也許真能實現(xiàn)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6254

    瀏覽量

    111407
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4838

    瀏覽量

    107794
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    面向嵌入式部署的神經(jīng)網(wǎng)絡(luò)優(yōu)化:模型壓縮深度解析

    1.為什么需要神經(jīng)網(wǎng)絡(luò)模型壓縮? 神經(jīng)網(wǎng)絡(luò)已經(jīng)成為解決復(fù)雜機器學(xué)習(xí)問題的強大工具。然而,這種能力往往伴隨著模型規(guī)模和計算復(fù)雜度的增加。當(dāng)輸入維度較大(例如長時序窗口、高分辨率特征空間)時,模型需要
    的頭像 發(fā)表于 02-24 15:37 ?4795次閱讀
    面向嵌入式部署的<b class='flag-5'>神經(jīng)網(wǎng)絡(luò)</b>優(yōu)化:模型<b class='flag-5'>壓縮</b>深度解析

    神經(jīng)網(wǎng)絡(luò)的初步認(rèn)識

    日常生活中的智能應(yīng)用都離不開深度學(xué)習(xí),而深度學(xué)習(xí)則依賴于神經(jīng)網(wǎng)絡(luò)的實現(xiàn)。什么是神經(jīng)網(wǎng)絡(luò)?神經(jīng)網(wǎng)絡(luò)的核心思想是模仿生物神經(jīng)系統(tǒng)的結(jié)構(gòu),特別是大腦中神經(jīng)
    的頭像 發(fā)表于 12-17 15:05 ?333次閱讀
    <b class='flag-5'>神經(jīng)網(wǎng)絡(luò)</b>的初步認(rèn)識

    自動駕駛中常提的卷積神經(jīng)網(wǎng)絡(luò)是個啥?

    在自動駕駛領(lǐng)域,經(jīng)常會聽到卷積神經(jīng)網(wǎng)絡(luò)技術(shù)。卷積神經(jīng)網(wǎng)絡(luò),簡稱為CNN,是一種專門用來處理網(wǎng)格狀數(shù)據(jù)(比如圖像)的深度學(xué)習(xí)模型。CNN在圖像處理中尤其常見,因為
    的頭像 發(fā)表于 11-19 18:15 ?2078次閱讀
    自動駕駛中常提的卷積<b class='flag-5'>神經(jīng)網(wǎng)絡(luò)</b>是個啥?

    CNN卷積神經(jīng)網(wǎng)絡(luò)設(shè)計原理及在MCU200T上仿真測試

    數(shù)的提出很大程度的解決了BP算法在優(yōu)化深層神經(jīng)網(wǎng)絡(luò)時的梯度耗散問題。當(dāng)x&gt;0 時,梯度恒為1,無梯度耗散問題,收斂快;當(dāng)x&lt;0 時,該層的輸出為0。 CNN
    發(fā)表于 10-29 07:49

    NMSIS神經(jīng)網(wǎng)絡(luò)庫使用介紹

    NMSIS NN 軟件庫是一組高效的神經(jīng)網(wǎng)絡(luò)內(nèi)核,旨在最大限度地提高 Nuclei N 處理器內(nèi)核上的神經(jīng)網(wǎng)絡(luò)的性能并最??大限度地減少其內(nèi)存占用。 該庫分為多個功能,每個功能涵蓋特定類別
    發(fā)表于 10-29 06:08

    在Ubuntu20.04系統(tǒng)中訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型的一些經(jīng)驗

    , batch_size=512, epochs=20)總結(jié) 這個核心算法中的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)和訓(xùn)練過程,是用來對MNIST手寫數(shù)字圖像進(jìn)行分類的。模型將圖像作為輸入,通過卷積和池化
    發(fā)表于 10-22 07:03

    CICC2033神經(jīng)網(wǎng)絡(luò)部署相關(guān)操作

    在完成神經(jīng)網(wǎng)絡(luò)量化后,需要將神經(jīng)網(wǎng)絡(luò)部署到硬件加速器上。首先需要將所有權(quán)重數(shù)據(jù)以及輸入數(shù)據(jù)導(dǎo)入到存儲器內(nèi)。 在仿真環(huán)境下,可將其存于一個文件,并在 Verilog 代碼中通過 readmemh 函數(shù)
    發(fā)表于 10-20 08:00

    液態(tài)神經(jīng)網(wǎng)絡(luò)(LNN):時間連續(xù)性與動態(tài)適應(yīng)性的神經(jīng)網(wǎng)絡(luò)

    1.算法簡介液態(tài)神經(jīng)網(wǎng)絡(luò)(LiquidNeuralNetworks,LNN)是一種新型的神經(jīng)網(wǎng)絡(luò)架構(gòu),其設(shè)計理念借鑒自生物神經(jīng)系統(tǒng),特別是秀麗隱桿線蟲的
    的頭像 發(fā)表于 09-28 10:03 ?1225次閱讀
    液態(tài)<b class='flag-5'>神經(jīng)網(wǎng)絡(luò)</b>(LNN):時間連續(xù)性與動態(tài)適應(yīng)性的<b class='flag-5'>神經(jīng)網(wǎng)絡(luò)</b>

    神經(jīng)網(wǎng)絡(luò)的并行計算與加速技術(shù)

    隨著人工智能技術(shù)的飛速發(fā)展,神經(jīng)網(wǎng)絡(luò)在眾多領(lǐng)域展現(xiàn)出了巨大的潛力和廣泛的應(yīng)用前景。然而,神經(jīng)網(wǎng)絡(luò)模型的復(fù)雜度和規(guī)模也在不斷增加,這使得傳統(tǒng)的串行計算方式面臨著巨大的挑戰(zhàn),如計算速度慢、訓(xùn)練時間長等
    的頭像 發(fā)表于 09-17 13:31 ?1129次閱讀
    <b class='flag-5'>神經(jīng)網(wǎng)絡(luò)</b>的并行計算與加速技術(shù)

    無刷電機小波神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)子位置檢測方法的研究

    摘要:論文通過對無刷電機數(shù)學(xué)模型的推導(dǎo),得出轉(zhuǎn)角:與三相相電壓之間存在映射關(guān)系,因此構(gòu)建了一個以三相相電壓為輸人,轉(zhuǎn)角為輸出的小波神經(jīng)網(wǎng)絡(luò)來實現(xiàn)轉(zhuǎn)角預(yù)測,并采用改進(jìn)遺傳算法來訓(xùn)練網(wǎng)絡(luò)結(jié)
    發(fā)表于 06-25 13:06

    神經(jīng)網(wǎng)絡(luò)專家系統(tǒng)在電機故障診斷中的應(yīng)用

    的診斷誤差。仿真結(jié)果驗證了該算法的有效性。 純分享帖,需要者可點擊附件免費獲取完整資料~~~*附件:神經(jīng)網(wǎng)絡(luò)專家系統(tǒng)在電機故障診斷中的應(yīng)用.pdf【免責(zé)聲明】本文系網(wǎng)絡(luò)轉(zhuǎn)載,版權(quán)歸原作者所有。本文所用視頻、圖片、文字如涉及作品版
    發(fā)表于 06-16 22:09

    神經(jīng)網(wǎng)絡(luò)RAS在異步電機轉(zhuǎn)速估計中的仿真研究

    眾多方法中,由于其結(jié)構(gòu)簡單,穩(wěn)定性好廣泛受到人們的重視,且已被用于產(chǎn)品開發(fā)。但是MRAS仍存在在低速區(qū)速度估計精度下降和對電動機參數(shù)變化非常敏感的問題。本文利用神經(jīng)網(wǎng)絡(luò)的特點,使估計更為簡單、快速
    發(fā)表于 06-16 21:54

    基于FPGA搭建神經(jīng)網(wǎng)絡(luò)的步驟解析

    本文的目的是在一個神經(jīng)網(wǎng)絡(luò)已經(jīng)通過python或者M(jìn)ATLAB訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)模型,將訓(xùn)練好的模型的權(quán)重和偏置文件以TXT文件格式導(dǎo)出,然后通過python程序?qū)xt文件轉(zhuǎn)化為coe文件,(coe
    的頭像 發(fā)表于 06-03 15:51 ?1217次閱讀
    基于FPGA搭建<b class='flag-5'>神經(jīng)網(wǎng)絡(luò)</b>的步驟解析

    AI神經(jīng)網(wǎng)絡(luò)降噪算法在語音通話產(chǎn)品中的應(yīng)用優(yōu)勢與前景分析

    隨著人工智能技術(shù)的快速發(fā)展,AI神經(jīng)網(wǎng)絡(luò)降噪算法在語音通話產(chǎn)品中的應(yīng)用正逐步取代傳統(tǒng)降噪技術(shù),成為提升語音質(zhì)量的關(guān)鍵解決方案。相比傳統(tǒng)DSP(數(shù)字信號處理)降噪,AI降噪具有更強的環(huán)境適應(yīng)能力、更高
    的頭像 發(fā)表于 05-16 17:07 ?1515次閱讀
    AI<b class='flag-5'>神經(jīng)網(wǎng)絡(luò)</b>降噪<b class='flag-5'>算法</b>在語音通話產(chǎn)品中的應(yīng)用優(yōu)勢與前景分析

    NVIDIA實現(xiàn)神經(jīng)網(wǎng)絡(luò)渲染技術(shù)的突破性增強功能

    近日,NVIDIA 宣布了 NVIDIA RTX 神經(jīng)網(wǎng)絡(luò)渲染技術(shù)的突破性增強功能。NVIDIA 與微軟合作,將在 4 月的 Microsoft DirectX 預(yù)覽版中增加神經(jīng)網(wǎng)絡(luò)著色技術(shù),讓開
    的頭像 發(fā)表于 04-07 11:33 ?1182次閱讀