91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

微軟亞研院提出用于語義分割的結(jié)構(gòu)化知識蒸餾

電子工程師 ? 來源:lp ? 2019-03-18 10:15 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

今天跟大家分享一篇關(guān)于語義分割的論文,剛剛上傳到arXiv的CVPR 2019接收論文《Structured Knowledge Distillation for Semantic Segmentation》,通訊作者單位為微軟亞洲研究院。

作者信息:

作者分別來自澳大利亞阿德萊德大學(xué)、微軟亞洲研究院、北航、Keep公司、三星中國研究院,該文為第一作者Yifan Liu在微軟亞洲研究院實習(xí)期間的工作。

該文研究了在語義分割模型的知識蒸餾中引入結(jié)構(gòu)化信息的損失函數(shù),在不改變模型計算量的情況下,使用該方法在Cityscapes數(shù)據(jù)集上mIoU精度取得了最高達(dá)15.17%的提升。

什么是知識蒸餾?

顧名思義,知識蒸餾是把知識濃縮到“小”網(wǎng)絡(luò)模型中。一般情況下,在相同的數(shù)據(jù)上訓(xùn)練,模型參數(shù)量較大、計算量大的模型往往精度比較高,而用精度高、模型復(fù)雜度高的模型即Teacher網(wǎng)絡(luò)的輸出訓(xùn)練Student網(wǎng)絡(luò),以期達(dá)到使計算量小參數(shù)少的小網(wǎng)絡(luò)精度提升的方法,就是知識蒸餾。

知識蒸餾的好處是顯而易見的,使用知識蒸餾后的Student網(wǎng)絡(luò)能夠達(dá)到較高的精度,而且更有利于實際應(yīng)用部署,尤其是在移動設(shè)備中。

下面兩幅圖中,作者展示了使用該文提出的結(jié)構(gòu)化知識蒸餾的語義分割模型在計算量和參數(shù)量不變的情況下,精度獲得了大幅提升。

算法原理

知識蒸餾的目標(biāo)是希望對于Teacher網(wǎng)絡(luò)和Student網(wǎng)絡(luò)給定相同的圖像,輸出結(jié)果盡量一樣。

所以,知識蒸餾的關(guān)鍵,是如何衡量Teacher網(wǎng)絡(luò)和Student網(wǎng)絡(luò)輸出結(jié)果的一致性,也就是訓(xùn)練過程中的損失函數(shù)設(shè)計。

該文中作者將語義分割問題看為像素分類問題,所以很自然的可以使用衡量分類差異的逐像素(Pixel-wise)的損失函數(shù)Cross entropy loss,這是在最終的輸出結(jié)果Score map中計算的。

同時作者引入了圖像的結(jié)構(gòu)化信息損失,如下圖所示。

如何理解圖像的結(jié)構(gòu)化信息?一種很顯然的結(jié)構(gòu)化信息即圖像中局部的一致性。在語義分割中,可以簡單理解為,預(yù)測結(jié)果中存在的自相似性,作者衡量這種結(jié)構(gòu)化信息的方式是Teacher預(yù)測的兩像素結(jié)果和Student網(wǎng)絡(luò)預(yù)測的兩像素結(jié)果一致。衡量這種損失,作者稱之為Pair-wise loss(也許可以翻譯為“逐成對像素”損失)。

另一種更高層次的結(jié)構(gòu)化信息是來自對圖像整體結(jié)構(gòu)相似性的度量,作者引入了對抗網(wǎng)絡(luò)的思想,設(shè)計專門的網(wǎng)絡(luò)分支分類Teacher網(wǎng)絡(luò)和Student網(wǎng)絡(luò)預(yù)測的結(jié)果,網(wǎng)絡(luò)收斂的結(jié)果是該網(wǎng)絡(luò)不能再區(qū)分Teacher網(wǎng)絡(luò)和Student網(wǎng)絡(luò)的輸出。作者稱這塊損失函數(shù)為Holistic loss(整體損失)。

仔細(xì)想想,作者設(shè)計的損失函數(shù)的三部分,逐像素的損失(Pixel-wise loss,PI)、逐像素對的損失(Pair-wise loss,PA)、整體損失(Holistic loss,HO)都很有道理,是不是?

作者使用ResNet18網(wǎng)絡(luò)模型在Cityscapes數(shù)據(jù)集上研究了作者提出的損失函數(shù)各部分對結(jié)果的影響。(ImN代表用ImageNet預(yù)訓(xùn)練模型初始化網(wǎng)絡(luò))

結(jié)果如下圖。

可知,作者提出的損失函數(shù)的各個部分都能使得Student網(wǎng)絡(luò)獲得精度增益,最高達(dá)15.17%!CV君發(fā)現(xiàn)逐像素對的損失(Pair-wise loss,PA)獲得的增益最大。

實驗結(jié)果

作者使用多個輕量級網(wǎng)絡(luò)模型,在三個主流語義分割數(shù)據(jù)庫上進(jìn)行了實驗。

下圖為在Cityscapes數(shù)據(jù)集上的結(jié)果,使用該文方法知識蒸餾后Student網(wǎng)絡(luò)精度獲得了大幅提升!

下圖為一些預(yù)測結(jié)果示例,視覺效果上改進(jìn)明顯。

下圖為在CamVid數(shù)據(jù)集上的結(jié)果,同樣改進(jìn)明顯。

CamVid數(shù)據(jù)集上的Student網(wǎng)絡(luò)預(yù)測示例,視覺上也好了很多。

下圖為在ADE20K數(shù)據(jù)集上的實驗結(jié)果,同樣所有網(wǎng)絡(luò)模型的精度都獲得了大幅提升!

目前還未發(fā)現(xiàn)該文作者公布代碼。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 微軟
    +關(guān)注

    關(guān)注

    4

    文章

    6742

    瀏覽量

    107912
  • 函數(shù)
    +關(guān)注

    關(guān)注

    3

    文章

    4418

    瀏覽量

    67595
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1236

    瀏覽量

    26214

原文標(biāo)題:微軟亞研院提出用于語義分割的結(jié)構(gòu)化知識蒸餾 | CVPR 2019

文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    鋰離子電池高性能負(fù)極結(jié)構(gòu)化復(fù)合集流體綜述

    結(jié)構(gòu)化集流體通過精心的表面與體相結(jié)構(gòu)設(shè)計,為上述問題提供了系統(tǒng)性解決方案。Flexfilm探針式臺階儀可以實現(xiàn)表面微觀特征的精準(zhǔn)表征與關(guān)鍵參數(shù)的定量測量,精確測
    的頭像 發(fā)表于 02-04 18:03 ?1128次閱讀
    鋰離子電池高性能負(fù)極<b class='flag-5'>結(jié)構(gòu)化</b>復(fù)合集流體綜述

    大模型實戰(zhàn)(SC171開發(fā)套件V3)2026版

    部署案例----基于廣和通自FiboSeg語義分割模型 4分22秒 https://t.elecfans.com/v/28533.html *附件:文檔:自模型部署案例----基于
    發(fā)表于 01-15 12:05

    AI功能(SC171開發(fā)套件V3)2026版

    分割(deeplabv3)案例----基于SC171開發(fā)套件V3 8分02秒 https://t.elecfans.com/v/28529.html *附件:文檔:圖像語義分割(deeplabv3
    發(fā)表于 01-15 11:18

    【NPU實戰(zhàn)】在迅為RK3588上玩轉(zhuǎn)YOLOv8:目標(biāo)檢測與語義分割一站式部署指南

    【NPU實戰(zhàn)】在迅為RK3588上玩轉(zhuǎn)YOLOv8:目標(biāo)檢測與語義分割一站式部署指南
    的頭像 發(fā)表于 12-12 14:30 ?6171次閱讀
    【NPU實戰(zhàn)】在迅為RK3588上玩轉(zhuǎn)YOLOv8:目標(biāo)檢測與<b class='flag-5'>語義</b><b class='flag-5'>分割</b>一站式部署指南

    結(jié)構(gòu)化布線中使用電纜標(biāo)簽的4個主要優(yōu)勢

    在現(xiàn)代通信和網(wǎng)絡(luò)基礎(chǔ)設(shè)施建設(shè)中,結(jié)構(gòu)化布線系統(tǒng)扮演著至關(guān)重要的角色。它不僅確保了網(wǎng)絡(luò)的高效傳輸和穩(wěn)定運行,還為未來的擴(kuò)展和維護(hù)提供了便利。而在結(jié)構(gòu)化布線中,電纜標(biāo)簽的使用雖看似是一個小小的細(xì)節(jié),卻能
    的頭像 發(fā)表于 11-24 10:34 ?351次閱讀

    導(dǎo)遠(yuǎn)科技與中國移動上深化合作

    近日,導(dǎo)遠(yuǎn)科技與中移(上海)信息通信科技有限公司(簡稱“上”)在湖南株洲舉辦的第四屆北斗規(guī)模應(yīng)用國際峰會上宣布深化合作。雙方將聯(lián)合打造適配多種移動機(jī)器人的“IMU+GNSS模組+RTK服務(wù)”一體高精度定位解決方案。
    的頭像 發(fā)表于 10-09 11:31 ?816次閱讀

    北京迅為itop-3588開發(fā)板NPU例程測試deeplabv3 語義分割

    北京迅為itop-3588開發(fā)板NPU例程測試deeplabv3 語義分割
    的頭像 發(fā)表于 07-22 15:51 ?1014次閱讀
    北京迅為itop-3588開發(fā)板NPU例程測試deeplabv3 <b class='flag-5'>語義</b><b class='flag-5'>分割</b>

    智能體AI面臨非結(jié)構(gòu)化數(shù)據(jù)難題:IBM推出解決方案

    ,同時提供一個開放的混合數(shù)據(jù)基礎(chǔ)架構(gòu)和企業(yè)級的結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)管理。 智能體AI面臨非結(jié)構(gòu)化數(shù)據(jù)難題:IBM推出解決方案 測試結(jié)果顯示,與傳統(tǒng)RAG相比,IBM watsonx.data的AI準(zhǔn)確性
    的頭像 發(fā)表于 07-02 09:40 ?571次閱讀

    ModbusRTU轉(zhuǎn)EtherCAT網(wǎng)關(guān):蒸餾裝置通信提速方案

    裝置作為化工過程中重要的分離設(shè)備,其穩(wěn)定運行對整個生產(chǎn)過程至關(guān)重要。在這類裝置中,Modbus RTU通常被用于連接傳感器、執(zhí)行器等傳統(tǒng)現(xiàn)場設(shè)備。它采用串行通訊方式,具有結(jié)構(gòu)簡單、成本低廉的特點,但傳輸速率較低,且難以構(gòu)建大規(guī)模的網(wǎng)絡(luò)。
    的頭像 發(fā)表于 06-26 18:29 ?396次閱讀

    【正點原子STM32MP257開發(fā)板試用】基于 DeepLab 模型的圖像分割

    是谷歌團(tuán)隊提出的一種用于語義分割的深度學(xué)習(xí)模型,屬于 DeepLab 系列模型的第三代版本。它在圖像語義
    發(fā)表于 06-21 21:11

    DDN攜手NVIDIA釋放非結(jié)構(gòu)化數(shù)據(jù)的AI價值

    DDN 通過與 NVIDIA AI 數(shù)據(jù)平臺的合作,推出聯(lián)合解決方案,簡化了企業(yè)對非結(jié)構(gòu)化數(shù)據(jù)的存儲、訪問和激活方式,助力客戶釋放生成式 AI 的巨大商業(yè)潛能。DDN 全球合作伙伴負(fù)責(zé)人
    的頭像 發(fā)表于 06-10 10:31 ?976次閱讀

    深控技術(shù)的不需要點表網(wǎng)關(guān)的隱藏價值:工程師離職不再等于知識流失

    深控技術(shù)推出的無點表工業(yè)網(wǎng)關(guān),通過配置信息云端知識資產(chǎn)自動沉淀,將離散的工程師經(jīng)驗轉(zhuǎn)化為結(jié)構(gòu)化數(shù)字資產(chǎn),重新定義了工業(yè)知識管理范式。
    的頭像 發(fā)表于 04-24 11:36 ?532次閱讀
    深控技術(shù)的不需要點表網(wǎng)關(guān)的隱藏價值:工程師離職不再等于<b class='flag-5'>知識</b>流失

    從零到一:如何利用非結(jié)構(gòu)化數(shù)據(jù)中臺快速部署AI解決方案

    在企業(yè)數(shù)字轉(zhuǎn)型的浪潮中,AI已從概念走向落地應(yīng)用。然而,真正能高效、安全地部署AI解決方案的企業(yè)仍屬少數(shù),瓶頸往往出在“數(shù)據(jù)”——尤其是非結(jié)構(gòu)化數(shù)據(jù)的管理與應(yīng)用上。文件、音頻、視頻、圖像、郵件
    的頭像 發(fā)表于 04-14 13:50 ?787次閱讀

    AI知識庫的搭建與應(yīng)用:企業(yè)數(shù)字轉(zhuǎn)型的關(guān)鍵步驟

    和應(yīng)用數(shù)據(jù),從而為AI應(yīng)用提供源源不斷的支持,幫助企業(yè)實現(xiàn)全面的數(shù)字轉(zhuǎn)型。 ? AI知識庫的定義與作用 ? AI知識庫是一個由結(jié)構(gòu)化和非結(jié)構(gòu)化
    的頭像 發(fā)表于 03-27 15:18 ?1350次閱讀

    VirutualLab Fusion應(yīng)用:結(jié)構(gòu)光照明的顯微鏡系統(tǒng)

    摘要 與阿貝理論預(yù)測的分辨率相比,用于熒光樣品的結(jié)構(gòu)照明顯微鏡系統(tǒng)可以將顯微鏡系統(tǒng)的分辨率提高2倍。 VirutualLab Fusion提供了一種通過入射波屬性來研究結(jié)構(gòu)化照明模式的快速方法
    發(fā)表于 03-21 09:26