91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

探究對(duì)深度學(xué)習(xí)模型VAE的時(shí)序性解耦

電子工程師 ? 來(lái)源:DeepBlue深蘭科技 ? 作者:DeepBlue深蘭科技 ? 2021-06-04 11:10 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

現(xiàn)代深度學(xué)習(xí)架構(gòu)一直被描述為一個(gè)黑匣子:被輸入數(shù)據(jù),并期望從中得到一些結(jié)果。然而,由于此類(lèi)架構(gòu)存在許多的復(fù)雜性,過(guò)程中發(fā)生的事情,通常難以解釋和分析。這已發(fā)展成為整個(gè)社會(huì)未能廣泛接受深度學(xué)習(xí)的主要原因之一,尤其是對(duì)于關(guān)鍵任務(wù)應(yīng)用程序。

因此,“黑匣子”的解體已成為機(jī)器學(xué)習(xí)研究人員的一個(gè)重大開(kāi)放問(wèn)題,并且是該領(lǐng)域當(dāng)前感興趣的問(wèn)題之一,這一研究領(lǐng)域通常被稱(chēng)為機(jī)器學(xué)習(xí)架構(gòu)的“可解釋性”。在本文中,我們將討論可解釋性研究中的一個(gè)重要主題,即解耦問(wèn)題。

Disentangled

Sequential VAE

光的解耦(Ddisentangled)

我們舉個(gè)常見(jiàn)的例子:在日常生活中,太陽(yáng)光看起來(lái)是白色的,但是如果我們讓陽(yáng)光通過(guò)三棱鏡,就會(huì)發(fā)現(xiàn)陽(yáng)光分別折射出多種色彩。這說(shuō)明白光其實(shí)是多種顏色混合的體現(xiàn),而我們可以通過(guò)三棱鏡把它分解成基本七種顏色,其中包括紅、綠、藍(lán)三原色。

我們繼續(xù)聊聊白光:在廣泛意義上說(shuō)光是由RGB三種顏色組成的。這也就定義了光的解耦過(guò)程:光可以分離成R、G、B三種顏色,同時(shí)我們也可以用這三種顏色,進(jìn)行不同程度的疊加,產(chǎn)生豐富而廣泛的顏色。

計(jì)算機(jī)定義顏色時(shí)R、G、 B三種成分的取值范圍是0-255,0表示沒(méi)有刺激量,255表示刺激量達(dá)最大值。R、G、B均為255時(shí)就合成了白光,R、G、B均為0時(shí)就形成了黑色。在這個(gè)區(qū)間范圍內(nèi),我們可以通過(guò)任意的數(shù)值組合構(gòu)造出無(wú)數(shù)種不同的顏色,讓我們的生活充滿色彩。

白光和解耦又有什么關(guān)系呢?那關(guān)系就大了!我們下面簡(jiǎn)單聊一下一種深度學(xué)習(xí)模型——變分自編碼器模型(VAE:variational autoencoder),然后用它來(lái)解釋解耦。

什么是VAE?

什么是VAE呢?那要先從AE開(kāi)始說(shuō)起了。

AE(Autoencoder)

87c81b48-c4e0-11eb-9e57-12bb97331649.png

上圖由兩個(gè)部分組成,第一個(gè)部分是編碼器(Encoder),第二部分是解碼器(Decoder),圖片經(jīng)過(guò)編碼器得到一個(gè)潛在的編碼(code),編碼再通過(guò)解碼器還原輸入的圖片,因此得到的編碼就是圖片在一個(gè)潛在空間的表示。而編碼器和解碼器就是由神經(jīng)網(wǎng)絡(luò)組成的。圖中例子就是希望能夠生成一張一樣的圖片。

VAE (Variational Autoencoder)

變分編碼器是自動(dòng)編碼器的升級(jí)版本,其結(jié)構(gòu)跟自動(dòng)編碼器相似,也由編碼器和解碼器構(gòu)成。在AE中,輸入一個(gè)圖片得到一個(gè)的編碼(code),但這個(gè)編碼是一個(gè)固定的編碼,使得模型沒(méi)有很好的泛化功能。所以VAE引入了一種新的方式有效解決了上述的問(wèn)題,就是將編碼問(wèn)題變成一個(gè)分布問(wèn)題,具體操作是在AE的基礎(chǔ)上增加一個(gè)限制,迫使編碼器得到的編碼(code)能夠粗略地遵循一個(gè)標(biāo)準(zhǔn)正態(tài)分布,這就是其與一般的自動(dòng)編碼器最大的不同。

這樣我們生成一張新圖片就很簡(jiǎn)單了,我們只需要給它一個(gè)標(biāo)準(zhǔn)正態(tài)分布的隨機(jī)隱含向量,這樣通過(guò)解碼器就能夠生成我們想要的圖片,而不需要給它一張?jiān)紙D片先進(jìn)行編碼。

87d5973c-c4e0-11eb-9e57-12bb97331649.png

VAE的演變?cè)黾恿四P偷姆夯?,以上圖VAE的過(guò)程為例,當(dāng)輸入的圖片是貓時(shí),通過(guò)貓的特征來(lái)生成新的圖片,VAE的好處就在于當(dāng)輸入的圖片不是完整的圖片時(shí)(訓(xùn)練集外),它依舊可以還原成原來(lái)的樣子。

在深度學(xué)習(xí)中,不管是什么樣的模型,數(shù)據(jù)都很重要,而VAE的好處就在于 :

它可以通過(guò)編碼和解碼的過(guò)程,通過(guò)抽樣,生成新的數(shù)據(jù)。這樣對(duì)于機(jī)器學(xué)習(xí)就有了更多的數(shù)據(jù)支撐從而得到更好的模型效果。

VAE在中間層會(huì)得到一個(gè)編碼(code),也就是一個(gè)語(yǔ)義層,我們可以通過(guò)對(duì)于這個(gè)語(yǔ)義的理解,從而達(dá)到圖片的分類(lèi)、變換的效果。

如果我們類(lèi)比光的解耦(將光分離成R、G、B三種顏色),VAE(Variational Autoencoder)就可以理解成是深度學(xué)習(xí)框架的三棱鏡。

這是為什么呢?我們先給一個(gè)淺顯的技術(shù)介紹,然后再回來(lái)聊顏色分離。

VAE是一種深度學(xué)習(xí)框架,更具體來(lái)說(shuō),它是一種生成模型。生成模型的操作很簡(jiǎn)單:它可以讀取數(shù)據(jù)(多為圖片),抽取數(shù)據(jù)的特征,然后自動(dòng)生成有這些特征的新數(shù)據(jù)。我們這里關(guān)心的是提取特征這個(gè)環(huán)節(jié)。大多生成模型的特征提取模式,便是經(jīng)過(guò)所謂的“潛在變量”(latent variables)來(lái)編碼提取到的特征。

這里的一個(gè)明顯的問(wèn)題便是:我們?cè)趺磁袛嗾綌?shù)據(jù)里的某一個(gè)特征對(duì)應(yīng)的是哪個(gè)語(yǔ)義變量?我們可以回到類(lèi)比成顏色分離和生成的過(guò)程,將一種顏色先編碼(encoder)成R,G,B,再通過(guò)解碼(decoder)形成一種顏色。

Disentangled Sequential VAE

隨著對(duì)VAE的研究,越來(lái)越多的研究重點(diǎn)就放在了如何在VAE的基礎(chǔ)上做到disentangled的過(guò)程。以下簡(jiǎn)單介紹一下深蘭科學(xué)院對(duì)于該項(xiàng)目的研究?jī)?nèi)容:對(duì)于時(shí)序的數(shù)據(jù)解耦出其數(shù)據(jù)的動(dòng)態(tài)信息和靜態(tài)信息,并理解靜態(tài)信息和動(dòng)態(tài)信息的語(yǔ)義,后續(xù)團(tuán)隊(duì)的目標(biāo)也是基于當(dāng)前的項(xiàng)目,進(jìn)行這個(gè)主流方向的基礎(chǔ)研究。

本項(xiàng)目采用的數(shù)據(jù)是Sprites,這是個(gè)具有時(shí)序性的數(shù)據(jù)。小精靈有著不同的顏色和動(dòng)作,團(tuán)隊(duì)的任務(wù)就是通過(guò)這些小精靈的圖片,解耦出小精靈的動(dòng)態(tài)信息(小精靈的動(dòng)作)和靜態(tài)信息(小精靈的顏色)。通過(guò)深度學(xué)習(xí)來(lái)獲得小精靈動(dòng)靜態(tài)信息的語(yǔ)義,并理解這語(yǔ)義從而生成新的小精靈。

如下圖所示,通過(guò)深度學(xué)習(xí)得到小精靈的動(dòng)態(tài)信息和靜態(tài)信息,并改變他們的值的生成效果(上排是原始數(shù)據(jù),下排是生成數(shù)據(jù))。

1. 改變靜態(tài)信息(顏色)

2.改變動(dòng)態(tài)信息

對(duì)于VAE時(shí)序性解耦的工作可以更容易地說(shuō)明神經(jīng)網(wǎng)絡(luò)的可解釋性,這樣的任務(wù)不僅可以對(duì)神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)研究作出貢獻(xiàn),還可以應(yīng)用到很多人工智能的項(xiàng)目中,例如對(duì)圖像視頻的處理;動(dòng)靜的解耦可以實(shí)現(xiàn)換臉等效果;在自然語(yǔ)言處理中,可以改變聲音的種類(lèi)等。

編輯:jq

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 解碼器
    +關(guān)注

    關(guān)注

    9

    文章

    1218

    瀏覽量

    43393
  • 數(shù)據(jù)
    +關(guān)注

    關(guān)注

    8

    文章

    7335

    瀏覽量

    94755
  • 計(jì)算機(jī)
    +關(guān)注

    關(guān)注

    19

    文章

    7806

    瀏覽量

    93190
  • Code
    +關(guān)注

    關(guān)注

    0

    文章

    71

    瀏覽量

    16230
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5598

    瀏覽量

    124396

原文標(biāo)題:探究 | 對(duì)深度學(xué)習(xí)模型VAE的時(shí)序性解耦

文章出處:【微信號(hào):kmdian,微信公眾號(hào):深蘭科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    如何突破AI存儲(chǔ)墻?深度解析ONFI 6.0高速接口與Chiplet架構(gòu)

    系列產(chǎn)品(如 ML100 IO Die)實(shí)現(xiàn)硬件級(jí)交付。? 架構(gòu):將存儲(chǔ)接口與核心SoC物理解,弱化熱效應(yīng)對(duì)存儲(chǔ)顆粒的影響,提升系統(tǒng)可靠。? 降本增效:通過(guò)國(guó)產(chǎn)化供應(yīng)鏈和先進(jìn)
    發(fā)表于 01-29 17:32

    機(jī)器學(xué)習(xí)深度學(xué)習(xí)中需避免的 7 個(gè)常見(jiàn)錯(cuò)誤與局限性

    無(wú)論你是剛?cè)腴T(mén)還是已經(jīng)從事人工智能模型相關(guān)工作一段時(shí)間,機(jī)器學(xué)習(xí)深度學(xué)習(xí)中都存在一些我們需要時(shí)刻關(guān)注并銘記的常見(jiàn)錯(cuò)誤。如果對(duì)這些錯(cuò)誤置之不理,日后可能會(huì)引發(fā)諸多麻煩!只要我們密切關(guān)注
    的頭像 發(fā)表于 01-07 15:37 ?185次閱讀
    機(jī)器<b class='flag-5'>學(xué)習(xí)</b>和<b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>中需避免的 7 個(gè)常見(jiàn)錯(cuò)誤與局限性

    TDK ADL4532VK電感:汽車(chē)電路的理想之選

    TDK ADL4532VK電感:汽車(chē)電路的理想之選 在汽車(chē)電子的復(fù)雜世界里,電感作為關(guān)鍵的電子元件,對(duì)電路的性能起著至關(guān)重要的作用。今天,我們就來(lái)深入探討TDK推出的ADL - VK系列中
    的頭像 發(fā)表于 12-25 15:20 ?451次閱讀

    TDK ADL4524VL電感:汽車(chē)電路的理想之選

    TDK ADL4524VL電感:汽車(chē)電路的理想之選 在汽車(chē)電子系統(tǒng)中,電路對(duì)于穩(wěn)定電源和信號(hào)傳輸至關(guān)重要。TDK的ADL4524VL系列電感專(zhuān)為汽車(chē)
    的頭像 發(fā)表于 12-25 14:15 ?201次閱讀

    探索TDK MLZ1608C電感:汽車(chē)PoC電路的理想之選

    探索TDK MLZ1608C電感:汽車(chē)PoC電路的理想之選 在電子工程師的日常設(shè)計(jì)工作中,電感作為一種基礎(chǔ)且關(guān)鍵的電子元件,其性能的優(yōu)劣直接影響著整個(gè)電路系統(tǒng)的穩(wěn)定性和可靠。今天,我們就來(lái)
    的頭像 發(fā)表于 12-25 11:40 ?448次閱讀

    穿孔機(jī)頂頭檢測(cè)儀 機(jī)器視覺(jué)深度學(xué)習(xí)

    頂頭狀態(tài)。 檢測(cè)頂頭算法 引入人工智深度學(xué)習(xí)技術(shù),通過(guò)Keras實(shí)現(xiàn)卷積神經(jīng)網(wǎng)絡(luò)(CNN),用Numpy實(shí)現(xiàn)采集數(shù)據(jù)的訓(xùn)練,得到符合現(xiàn)場(chǎng)需求的模型,進(jìn)一步提升檢測(cè)的準(zhǔn)確和現(xiàn)場(chǎng)的適應(yīng)
    發(fā)表于 12-22 14:33

    自動(dòng)駕駛中Transformer大模型會(huì)取代深度學(xué)習(xí)嗎?

    [首發(fā)于智駕最前沿微信公眾號(hào)]近年來(lái),隨著ChatGPT、Claude、文心一言等大語(yǔ)言模型在生成文本、對(duì)話交互等領(lǐng)域的驚艷表現(xiàn),“Transformer架構(gòu)是否正在取代傳統(tǒng)深度學(xué)習(xí)”這一話題一直被
    的頭像 發(fā)表于 08-13 09:15 ?4184次閱讀
    自動(dòng)駕駛中Transformer大<b class='flag-5'>模型</b>會(huì)取代<b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>嗎?

    無(wú)軸承異步電機(jī)氣隙磁場(chǎng)定向逆控制

    軸承異步電機(jī)進(jìn)行動(dòng)態(tài)控制。經(jīng)解后的徑向位移子系統(tǒng)只與懸浮繞組電流和轉(zhuǎn)矩系統(tǒng)氣隙磁鏈有關(guān),耦合變量減少;而且逆系統(tǒng)模型中不再有負(fù)載轉(zhuǎn)矩變量,更便于逆系統(tǒng)的實(shí)現(xiàn)。 純分享帖,點(diǎn)擊下方
    發(fā)表于 07-14 17:43

    無(wú)軸承異步電機(jī)的RFOC逆動(dòng)態(tài)控制

    進(jìn)行了轉(zhuǎn)速和轉(zhuǎn)子磁鏈之間、兩個(gè)徑向位移分量之間的動(dòng)態(tài)控制方法研究,給出了逆動(dòng)態(tài)控制系統(tǒng)結(jié)構(gòu)。仿真結(jié)果表明,系統(tǒng)各狀態(tài)變量之間實(shí)現(xiàn)了可靠的動(dòng)態(tài)
    發(fā)表于 07-14 17:35

    模型推理顯存和計(jì)算量估計(jì)方法研究

    GPU、FPGA等硬件加速。通過(guò)分析硬件加速器的性能參數(shù),可以估算模型在硬件加速下的計(jì)算量。 四、實(shí)驗(yàn)與分析 為了驗(yàn)證上述估計(jì)方法的有效,我們選取了幾個(gè)具有代表深度
    發(fā)表于 07-03 19:43

    軟硬+模塊化:深度拆解開(kāi)放架構(gòu)的“自由”基因

    ET2500系列應(yīng)運(yùn)而生——這款基于開(kāi)放架構(gòu)的智能業(yè)務(wù)處理平臺(tái),通過(guò)算網(wǎng)融合芯片與模塊化設(shè)計(jì),實(shí)現(xiàn)軟硬件,將網(wǎng)絡(luò)、路由、安全等功能集成于單一設(shè)備,為中小企業(yè)提供高性能、易維護(hù)的一體化解決方案
    的頭像 發(fā)表于 06-09 15:42 ?1136次閱讀
    軟硬<b class='flag-5'>解</b><b class='flag-5'>耦</b>+模塊化:<b class='flag-5'>深度</b>拆解開(kāi)放架構(gòu)的“自由”基因

    模型時(shí)代的深度學(xué)習(xí)框架

    作者:算力魔方創(chuàng)始人/英特爾創(chuàng)新大使劉力 在 CNN時(shí)代 ,AI模型的參數(shù)規(guī)模都在百萬(wàn)級(jí)別,僅需在單張消費(fèi)類(lèi)顯卡上即可完成訓(xùn)練。例如,以業(yè)界知名的CNN模型: ResNet50 為例,模型參數(shù)
    的頭像 發(fā)表于 04-25 11:43 ?835次閱讀
    大<b class='flag-5'>模型</b>時(shí)代的<b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>框架

    永磁同步電機(jī)電流環(huán)改進(jìn)內(nèi)模控制的研究

    取,因此控制效果難以達(dá)到最佳 。依據(jù)自由度原理,在保證內(nèi)模效果的基礎(chǔ)上,引入 2 個(gè)內(nèi)模電流調(diào) 節(jié)因子,對(duì)內(nèi)模控制器進(jìn)行改進(jìn) 。仿真結(jié)果表明,改進(jìn)算法的魯棒
    發(fā)表于 03-26 14:25

    在OpenVINO?工具套件的深度學(xué)習(xí)工作臺(tái)中無(wú)法導(dǎo)出INT8模型怎么解決?

    無(wú)法在 OpenVINO? 工具套件的深度學(xué)習(xí) (DL) 工作臺(tái)中導(dǎo)出 INT8 模型
    發(fā)表于 03-06 07:54