91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一篇解決表示學(xué)習(xí)坍塌問(wèn)題的工作報(bào)告

深度學(xué)習(xí)自然語(yǔ)言處理 ? 來(lái)源:圓圓的算法筆記 ? 作者:Fareise ? 2022-08-31 11:12 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

1 表示學(xué)習(xí)中的坍塌問(wèn)題

在表示學(xué)習(xí)中,一種很常見(jiàn)的做法是利用孿生網(wǎng)絡(luò)的結(jié)構(gòu),讓同一個(gè)樣本的不同數(shù)據(jù)增強(qiáng)后的表示相似。比如對(duì)于一張圖像,使用翻轉(zhuǎn)、裁剪等方法生成另一個(gè)增強(qiáng)圖像,兩個(gè)圖像分別經(jīng)過(guò)兩個(gè)共享參數(shù)的編碼器,得到表示,模型的優(yōu)化目標(biāo)是讓這兩個(gè)表示的距離近。

這種方法一個(gè)比較大的挑戰(zhàn)在于,模型在訓(xùn)練過(guò)程中容易出現(xiàn)坍塌問(wèn)題。模型可以把所有樣本的表示都學(xué)成完全相同的常數(shù)向量(比如每個(gè)樣本模型的輸出都是全0向量),這樣就能滿足上述兩個(gè)表示距離近的要求了。

2 解決坍塌問(wèn)題的方法

業(yè)內(nèi)有很多解決坍塌問(wèn)題的方法,主要可以分為4種類(lèi)型:

對(duì)比學(xué)習(xí)方法:在訓(xùn)練一對(duì)正樣本對(duì)時(shí),同時(shí)采樣大量的負(fù)樣本,讓正樣本之間離得近,負(fù)樣本之間離得遠(yuǎn),避免模型偷懶把所有樣本的表示都學(xué)成一樣的。

聚類(lèi)方法:在訓(xùn)練過(guò)程中增加一個(gè)聚類(lèi)過(guò)程,將樣本分配給不同的類(lèi)簇,然后在類(lèi)簇級(jí)別進(jìn)行對(duì)比學(xué)習(xí)。

基于蒸餾的方法:通過(guò)模型結(jié)構(gòu)的角度避免坍塌問(wèn)題,學(xué)習(xí)一個(gè)student network來(lái)預(yù)測(cè)teacher network的表示,teacher network是student network參數(shù)的滑動(dòng)平均,teacher network不通過(guò)反向傳播更新參數(shù)。

信息最大化方法:讓生成的embedding中每一維的向量相互正交,使其信息量最大化,這樣可以避免各個(gè)維度的值信息過(guò)于冗余,防止坍塌問(wèn)題。

目前常用的負(fù)樣本采樣方法,一個(gè)比較大的問(wèn)題是計(jì)算開(kāi)銷(xiāo)大,取得好的效果往往需要大量負(fù)樣本,因此有了MoCo等對(duì)比學(xué)習(xí)框架。本文提出的方法基于信息最大化的思路,能夠只使用正樣本對(duì)實(shí)現(xiàn)表示學(xué)習(xí)的同時(shí),防止坍現(xiàn)象的發(fā)生。關(guān)于對(duì)比學(xué)習(xí)的常用經(jīng)典方法,可以參考這篇文章:對(duì)比學(xué)習(xí)中的4種經(jīng)典訓(xùn)練模式。

3 信息最大化方法歷史工作

基于信息最大化的方法典型的工作有兩篇ICLM 2021的文章,分別是Whitening for Self-Supervised Representation Learning(ICML 2021,W-MSE)Barlow twins: Self-supervised learning via redundancy reduction(ICML 2021)。下面介紹一下這兩篇文章的整體思路,F(xiàn)acebook的這篇論文也是基于這個(gè)思路設(shè)計(jì)的。

d3146b2a-284d-11ed-ba43-dac502259ad0.png

W-MSE的整體網(wǎng)絡(luò)結(jié)構(gòu)如上圖,模型中輸入一對(duì)互為正樣本的樣本對(duì)(例如一個(gè)圖像的不同增強(qiáng)形式),使用共享參數(shù)Encoder分別編碼后,增加一個(gè)whitening模塊,對(duì)每個(gè)batch內(nèi)的所有embedding進(jìn)行白化,讓embedding的各個(gè)維度變量線性無(wú)關(guān),后面再接norm處理。下圖形式化表明了W-MSE的用途,通過(guò)白化+norm讓樣本形成一個(gè)球形分布,正樣本之間距離近,每個(gè)樣本需要調(diào)整自己在圓周上的位置拉進(jìn)正樣本之間的距離,形成最終的簇。

d33098f4-284d-11ed-ba43-dac502259ad0.png


Barlow twins方法也是同樣的思路,只是做法不同。在得到一對(duì)正樣本的兩個(gè)embedding后,計(jì)算兩個(gè)向量各個(gè)變量之間的相關(guān)性矩陣,優(yōu)化這個(gè)矩陣接近對(duì)角矩陣,以此實(shí)現(xiàn)embedding中各個(gè)變量之間線性無(wú)關(guān)。

d3550ca2-284d-11ed-ba43-dac502259ad0.png

4 VICREG

Facebook團(tuán)隊(duì)提出的VICREG是上述基于信息最大化表示學(xué)習(xí)方法的一個(gè)擴(kuò)展,損失函數(shù)主要包括variance、invariance、covariance三個(gè)部分。模型的主體結(jié)構(gòu)如下,仍然是一個(gè)孿生網(wǎng)絡(luò)結(jié)構(gòu),輸入一個(gè)樣本的不同view互為正樣本。

d370b272-284d-11ed-ba43-dac502259ad0.png

variance部分主要是讓batch內(nèi)每個(gè)樣本embedding向量的每一維變量之間的方差不小于一個(gè)值,這樣可以有效防止每個(gè)樣本的向量都對(duì)應(yīng)同一個(gè)點(diǎn)的情況,防止坍塌的發(fā)生。

invariance部分即讓正樣本對(duì)的表示embedding距離盡可能小,是正常的表示學(xué)習(xí)loss。

covariance借鑒了Barlow twins中的思路,讓batch內(nèi)的embedding非對(duì)角線元素盡可能為0,即讓表示向量各個(gè)維度變量線性無(wú)關(guān)。

最終的表示學(xué)習(xí)loss是由上述3個(gè)loss的加和:

d3817d8c-284d-11ed-ba43-dac502259ad0.png

5 實(shí)驗(yàn)結(jié)果

作者進(jìn)行了一些實(shí)驗(yàn)驗(yàn)證VICREG表示學(xué)習(xí)方法的效果。在ImageNet數(shù)據(jù)集上,使用不同方法預(yù)訓(xùn)練的表示接一個(gè)線性層進(jìn)行分類(lèi),或者基于預(yù)訓(xùn)練的表示使用部分?jǐn)?shù)據(jù)進(jìn)行finetune,對(duì)比圖像分類(lèi)效果,實(shí)驗(yàn)結(jié)果如下:

d38f8f9e-284d-11ed-ba43-dac502259ad0.png

作者也對(duì)比了在不同方法上是否采用variance或covariance等loss的效果變化:

d3a9c04e-284d-11ed-ba43-dac502259ad0.png

6 總結(jié)

本文介紹了Facebook AI團(tuán)隊(duì)在2022年ICLR的一篇解決表示學(xué)習(xí)坍塌問(wèn)題的工作,順帶介紹了基于信息最大化的防坍塌工作,有助于幫助我們更深層次理解表示學(xué)習(xí)的原理,以及如何解決實(shí)際應(yīng)用表示學(xué)習(xí)、對(duì)比學(xué)習(xí)時(shí)遇到的坍塌問(wèn)題。



審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 矩陣
    +關(guān)注

    關(guān)注

    1

    文章

    448

    瀏覽量

    36081
  • Network
    +關(guān)注

    關(guān)注

    0

    文章

    64

    瀏覽量

    30522

原文標(biāo)題:ICLR2022 | Facebook AI提出解決表示學(xué)習(xí)坍塌問(wèn)題新方法

文章出處:【微信號(hào):zenRRan,微信公眾號(hào):深度學(xué)習(xí)自然語(yǔ)言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    《具身智能發(fā)展報(bào)告(2025年)》

    《具身智能發(fā)展報(bào)告(2025年)》由中國(guó)信息通信研究院與清華大學(xué)電子工程系聯(lián)合發(fā)布,是我國(guó)首部系統(tǒng)梳理具身智能產(chǎn)業(yè)發(fā)展現(xiàn)狀與趨勢(shì)的權(quán)威藍(lán)皮書(shū)。報(bào)告立足2025年《政府工作報(bào)告》首次將“具身智能”列入
    的頭像 發(fā)表于 02-03 11:17 ?716次閱讀
    《具身智能發(fā)展<b class='flag-5'>報(bào)告</b>(2025年)》

    聊那些改變低空經(jīng)濟(jì)的核心技術(shù)

    低空經(jīng)濟(jì)(Low-altitude economy)詞火于2024年,當(dāng)年3月首次被寫(xiě)入中國(guó)的政府工作報(bào)告份中國(guó)信息協(xié)會(huì)年初的報(bào)告顯示,截止2024年我國(guó)已有42家eVTOL整機(jī)
    的頭像 發(fā)表于 01-28 17:03 ?1047次閱讀

    施耐德電氣聯(lián)合發(fā)布2025零碳園區(qū)行業(yè)影響力洞察報(bào)告

    今年,“零碳園區(qū)”首次被寫(xiě)入政府工作報(bào)告,正式邁入規(guī)?;l(fā)展“元年”,園區(qū)作為產(chǎn)業(yè)發(fā)展的重要載體,其綠色低碳轉(zhuǎn)型成為了“雙碳”目標(biāo)實(shí)現(xiàn)的強(qiáng)有力抓手。
    的頭像 發(fā)表于 11-26 11:43 ?694次閱讀

    【「高速數(shù)字設(shè)計(jì)(基礎(chǔ))」閱讀體驗(yàn)】 + 書(shū)籍評(píng)測(cè)第一篇

    者系統(tǒng)深刻地學(xué)習(xí)與理解高速數(shù)字設(shè)計(jì)有著非常實(shí)用的價(jià)值! 最后,本人主要是做PCB設(shè)計(jì)方面的工作,收到本書(shū)后,優(yōu)先閱讀了關(guān)于高速PCB設(shè)計(jì)的內(nèi)容,感到十分興奮!為什么呢,請(qǐng)聽(tīng)我細(xì)細(xì)道來(lái)。閱讀第八章電源
    發(fā)表于 11-09 10:31

    學(xué)習(xí)物聯(lián)網(wǎng)可以做什么工作?

    學(xué)習(xí)物聯(lián)網(wǎng)專(zhuān)業(yè)后,你可以從事多種與物聯(lián)網(wǎng)相關(guān)的工作。物聯(lián)網(wǎng)是個(gè)非常新穎和實(shí)用的領(lǐng)域,各種應(yīng)用場(chǎng)景都還在不斷地探索和創(chuàng)新。學(xué)習(xí)這門(mén)專(zhuān)業(yè)可以為人們提供廣闊的就業(yè)機(jī)會(huì),特別是在智慧城市、智
    發(fā)表于 10-11 16:40

    廣電計(jì)量打造適航取證與試驗(yàn)驗(yàn)證新高地

    2025 年政府工作報(bào)告明確提出,“開(kāi)展新技術(shù)新產(chǎn)品新場(chǎng)景大規(guī)模應(yīng)用示范行動(dòng),推動(dòng)商業(yè)航天、低空裝備等新興產(chǎn)業(yè)安全健康發(fā)展”。作為新質(zhì)生產(chǎn)力的典型代表,低空產(chǎn)業(yè)連續(xù)兩年被寫(xiě)入政府工作報(bào)告,從 “積極打造” 到 “推動(dòng)應(yīng)用落地”,低空產(chǎn)業(yè)已進(jìn)入規(guī)?;l(fā)展的關(guān)鍵窗口期。
    的頭像 發(fā)表于 09-01 16:27 ?1689次閱讀
    廣電計(jì)量打造適航取證與試驗(yàn)驗(yàn)證新高地

    章 W55MH32 高性能以太網(wǎng)單片機(jī)的學(xué)習(xí)方法概述

    本章介紹W55MH32的學(xué)習(xí)方法,建議先了解硬件資源,按基礎(chǔ)、入門(mén)循序漸進(jìn)學(xué)習(xí)。參考兩份手冊(cè),提供例程資料,還給出官網(wǎng)、github 等學(xué)習(xí)
    的頭像 發(fā)表于 05-26 09:07 ?878次閱讀
    第<b class='flag-5'>一</b>章 W55MH32 高性能以太網(wǎng)單片機(jī)的<b class='flag-5'>學(xué)習(xí)</b>方法概述

    從“單腦”到“雙腦”:具身智能機(jī)器人邁向L4時(shí)代的核心架構(gòu)革新

    、浙江、安徽等20余省市已將具身智能寫(xiě)入地方政府工作報(bào)告,并出臺(tái)行動(dòng)計(jì)劃。這系列政策信號(hào)釋放了國(guó)家對(duì)具身智能產(chǎn)業(yè)發(fā)展的高度重視,為行業(yè)發(fā)展注入了強(qiáng)勁動(dòng)力。2024年
    的頭像 發(fā)表于 05-22 16:26 ?1416次閱讀
    從“單腦”到“雙腦”:具身智能機(jī)器人邁向L4時(shí)代的核心架構(gòu)革新

    1000+例各類(lèi)獲獎(jiǎng)電賽作品資料集(電路、代碼、教程文末免費(fèi)領(lǐng)?。?/a>

    本資料匯集了歷屆電賽的優(yōu)秀獲獎(jiǎng)作品,并對(duì)所有作品資料進(jìn)行仔細(xì)分類(lèi)方便用戶(hù)們選擇學(xué)習(xí),是套價(jià)值極高的參考學(xué)習(xí)資料,適合每位電子愛(ài)好者、電子工程師和對(duì)電賽感興趣的學(xué)生,相信通過(guò)這套資料
    的頭像 發(fā)表于 05-22 11:41 ?768次閱讀
    1000+例各類(lèi)獲獎(jiǎng)電賽作品資料集(電路<b class='flag-5'>篇</b>、代碼<b class='flag-5'>篇</b>、教程<b class='flag-5'>篇</b>文末免費(fèi)領(lǐng)?。? />    </a>
</div>                              <div   id=

    180發(fā)燒功放制作學(xué)習(xí)資料【經(jīng)典】

    一百多經(jīng)典學(xué)習(xí)資料,部分資料內(nèi)容截?。? 純分享貼,有需要可以直接下載附件獲取完整資料! (如果內(nèi)容有幫助可以關(guān)注、點(diǎn)贊、評(píng)論支持下哦~)
    發(fā)表于 05-19 16:38

    【「零基礎(chǔ)開(kāi)發(fā)AI Agent」閱讀體驗(yàn)】+ 入門(mén)學(xué)習(xí)

    的是基礎(chǔ),主要從為什么要學(xué)習(xí)AI Agent和開(kāi)發(fā)AI Agent的知識(shí)儲(chǔ)備入手進(jìn)行介紹。作為入門(mén)AI Agent的小白還是很有必要學(xué)習(xí)的。這里將些重要觀點(diǎn)作個(gè)歸納 1.AI Ag
    發(fā)表于 05-02 09:26

    STM32Cube學(xué)習(xí)筆記 (十六全)

    資料介紹: STM32Cube學(xué)習(xí)筆記,步手把手帶你進(jìn)入STM32Cube的世界,包括點(diǎn)燈,按鍵,串口,ADC,DAC等等共16。
    發(fā)表于 03-22 17:02

    兩會(huì)定調(diào)!2025政府工作報(bào)告未提“安防”二字,但......

    《2025政府工作報(bào)告》發(fā)布,安防行業(yè)將迎來(lái)多項(xiàng)工作任務(wù)。智能家居、消費(fèi)安防、智慧養(yǎng)老和AI產(chǎn)業(yè)應(yīng)用將推動(dòng)行業(yè)發(fā)展。政府將出臺(tái)多項(xiàng)補(bǔ)貼政策,為安防企業(yè)提供市場(chǎng)機(jī)遇。
    的頭像 發(fā)表于 03-13 09:28 ?843次閱讀

    6G首次進(jìn)入政府工作報(bào)告2025是關(guān)鍵之年

    行業(yè)資訊
    電子發(fā)燒友網(wǎng)官方
    發(fā)布于 :2025年03月06日 11:35:38

    AI看點(diǎn):中國(guó)AI人才缺口達(dá)500萬(wàn)人 政府工作報(bào)告:支持AI大模型廣泛應(yīng)用

    業(yè)界既需要技術(shù)和理論創(chuàng)新型AI人才,也需要能夠結(jié)合各行業(yè)實(shí)際需求的實(shí)操型AI人才。相關(guān)人才將迎來(lái)更廣闊的發(fā)展空間。 政府工作報(bào)告:支持AI大模型廣泛應(yīng)用 正值兩會(huì)期間,我們看到AI備受關(guān)注,在今年的政府工作報(bào)告中提出,激發(fā)數(shù)字經(jīng)濟(jì)創(chuàng)新活力。
    的頭像 發(fā)表于 03-05 14:59 ?1262次閱讀