91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

計算機視覺任務里常常會碰到類別不平衡的問題

新機器視覺 ? 來源:機器學習AI算法工程 ? 作者:機器學習AI算法工 ? 2022-06-13 11:14 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

計算機視覺(CV)任務里常常會碰到類別不平衡的問題, 例如:

1. 圖片分類任務,有的類別圖片多,有的類別圖片少

2. 檢測任務?,F(xiàn)在的檢測方法如SSD和RCNN系列,都使用anchor機制。訓練時正負anchor的比例很懸殊。

3. 分割任務, 背景像素數(shù)量通常遠大于前景像素。

從實質上來講, 它們可以歸類成分類問題中的類別不平衡問題:對圖片/anchor/像素的分類。

再者,除了類不平衡問題, 還有easy sample overwhelming的問題。easy sample如果太多,可能會將有效梯度稀釋掉。

這兩個問題通常都會一起出現(xiàn)。如果不處理, 可能會對模型性能造成很大傷害。用Focal Loss里的話說,就是訓練不給力, 且會造成模型退化:

(1) training is inefficient as most locations are easy negatives…

(2) the easy negatives can overwhelming training and lead to degenerate models.

如果要處理,那么該怎么處理呢?在CV領域里, 若不考慮修改模型本身, 通常會在loss上做文章, 確切地說,是在樣本選擇或loss weight上做文章。

常見的解決辦法介紹

常見的方法有online的, 也有非online的;有只處理類間不平衡的,有只處理easy example的, 也有同時處理兩者的。

Hard Negative Mining, 非online的mining/boosting方法, 以‘古老’的RCNN(2014)為代表, 但在CV里現(xiàn)在應該沒有人使用了(吧?)。若感興趣,推薦去看看OHEM論文里的related work部分。

Mini-batch Sampling,以Fast R-CNN(2015)和Faster R-CNN(2016)為代表。Fast RCNN在訓練分類器, Faster R-CNN在訓練RPN時,都會從N = 1或2張圖片上隨機選取mini_batch_size/2個RoI或anchor, 使用正負樣本的比例為1:1。若正樣本數(shù)量不足就用負樣本填充。使用這種方法的人應該也很少了。從這個方法開始, 包括后面列出的都是online的方法。

Online Hard Example Mining, OHEM(2016)。將所有sample根據當前l(fā)oss排序,選出loss最大的N個,其余的拋棄。這個方法就只處理了easy sample的問題。

Oline Hard Negative Mining, OHNM, SSD(2016)里使用的一個OHEM變種, 在Focal Loss里代號為OHEM 1:3。在計算loss時, 使用所有的positive anchor, 使用OHEM選擇3倍于positive anchor的negative anchor。同時考慮了類間平衡與easy sample。

Class Balanced Loss。計算loss時,正負樣本上的loss分別計算, 然后通過權重來平衡兩者。暫時沒找到是在哪提出來的,反正就這么被用起來了。它只考慮了類間平衡。

Focal Loss(2017), 最近提出來的。不會像OHEM那樣拋棄一部分樣本, 而是和Class Balance一樣考慮了每個樣本, 不同的是難易樣本上的loss權重是根據樣本難度計算出來的。

從更廣義的角度來看,這些方法都是在計算loss時通過給樣本加權重來解決不平衡與easy example的問題。不同的是,OHEM使用了hard weight(只有0或1),而Focal Loss使用了soft weight(0到1之間)。

現(xiàn)在依然常用的方法特性比較如下:

458cebe2-ea59-11ec-ba43-dac502259ad0.png

接下來, 通過修改過的Cifar數(shù)據集來比較這幾種方法在分類任務上的表現(xiàn),當然, 主要還是期待Focal Loss的表現(xiàn)。

實驗數(shù)據

實驗數(shù)據集

Cifar-10, Cifar-100。使用Cifar的原因沒有別的, 就因為窮,畢竟要像Focal Loss論文里那樣跑那么多的大實驗對大部分學校和企業(yè)來說是不現(xiàn)實的。

處理數(shù)據得到類間不平衡

將多分類任務轉換成二分類:

new_label = label == 1

原始Cifar-10和100里有很多類別,每類圖片的數(shù)量基本一樣。按照這種方式轉變后,多分類變成了二分類, 且正負樣本比例相差懸殊:9倍和99倍。

實驗模型

一個5層的CNN,完成一個不平衡的二分類任務。使用Cross Entropy Loss,按照不同的方法使用不同的權值方案。以不加任何權重的CE Loss作為baseline。

衡量方式

在這種不平衡的二分類問題里, 準確率已經不適合用來衡量模型的好與壞了。此處使用F-Score作標準。

實現(xiàn)細節(jié)

CE(Cross Entroy Loss)

45ba2f1c-ea59-11ec-ba43-dac502259ad0.png

OHEM

分為以下三步:

1. 計算ce_loss, 同CE

2. 根據ce_loss排序, 選出top N 個sample:

45f341c6-ea59-11ec-ba43-dac502259ad0.png

4656a9a0-ea59-11ec-ba43-dac502259ad0.png

Class Balance CE

形式多種多樣,我個人最喜歡使用:

4692d3a8-ea59-11ec-ba43-dac502259ad0.png

46c6a868-ea59-11ec-ba43-dac502259ad0.png

46f254d6-ea59-11ec-ba43-dac502259ad0.png

優(yōu)化方法

最簡單的SGD, 初始lr=0.1, 每200,000步衰減一次, 衰減系數(shù)為0.1。Cifar-100上focal_loss的初始lr=0.01。

batch_size = 128.

實驗結果

CIFAR-10:

473441d4-ea59-11ec-ba43-dac502259ad0.png

47621ea6-ea59-11ec-ba43-dac502259ad0.png

Focal Loss的一個補丁

對于CIFAR-100,batch_size=128時, 一個batch內可能會一個positive sample都沒有, 即n_pos == 0, 這時,paper里用n_pos來normalize loss 的方式就不可行了。測試過兩種簡單的選擇:一是用所有weight之和來normalize, 二是直接不normalize。前者很難訓練甚至訓練不出來, 后者可用。所以上面的Focal loss計算代碼應該補充為:

478de338-ea59-11ec-ba43-dac502259ad0.png

經驗總結

47e05fc8-ea59-11ec-ba43-dac502259ad0.png

Code Available On Github

https://github.com/dengdan/test_tf_models

Branch:focal_loss

References Focal Loss for Dense Object Detection, https://arxiv.org/pdf/1708.02002.pdf

RCNN, https://arxiv.org/abs/1311.2524

Fast RCNN, http://arxiv.org/abs/1504.08083

Faster-RCNN, http://arxiv.org/abs/1506.01497

Training Region-based Object Detectors with Online Hard Example Mining, https://arxiv.org/abs/1604.03540

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • CV
    CV
    +關注

    關注

    0

    文章

    54

    瀏覽量

    17615
  • 計算機視覺
    +關注

    關注

    9

    文章

    1715

    瀏覽量

    47631
  • 檢測方法
    +關注

    關注

    0

    文章

    50

    瀏覽量

    10137

原文標題:視覺分類任務中處理不平衡問題的loss比較

文章出處:【微信號:vision263com,微信公眾號:新機器視覺】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    繞線式電機轉子三相不平衡的主要原因

    繞線式電機轉子三相不平衡是電機運行中常見的故障現(xiàn)象,可能導致振動加劇、溫升異常甚至燒毀繞組。這種現(xiàn)象的成因復雜多樣,需從設計、制造、安裝、運行維護等多方面綜合分析。
    的頭像 發(fā)表于 03-02 17:24 ?506次閱讀

    上海計算機視覺企業(yè)行學術沙龍走進西井科技

    12月5日,由中國圖象圖形學學會青年工作委員會(下簡稱“青工委”)、上海市計算機學會計算機視覺專委會(下簡稱“專委會”)聯(lián)合主辦,上海西井科技股份有限公司、江蘇路街道商會承辦的“上海計算機
    的頭像 發(fā)表于 12-16 15:39 ?585次閱讀

    高精度CT在測量電流不平衡度中具體是如何工作的?

    高精度 CT(電流互感器)在電流不平衡度測量中,是通過 電磁感應實現(xiàn)大電流信號的精準變換 ,并依托自身優(yōu)異的精度、一致性和抗干擾特性,為后續(xù)不平衡計算提供可靠原始數(shù)據,其具體工作流程可分為 5 個
    的頭像 發(fā)表于 12-05 16:37 ?776次閱讀
    高精度CT在測量電流<b class='flag-5'>不平衡</b>度中具體是如何工作的?

    電能質量在線監(jiān)測裝置三相不平衡度實時顯嗎?

    一、三相不平衡度顯示能力確認 所有現(xiàn)代電能質量在線監(jiān)測裝置 (無論 A/B/C 類精度) 均 標配三相不平衡度實時監(jiān)測功能 ,具體表現(xiàn)為: 顯示形式 :液晶屏幕 (LCD/TFT) 直接顯示數(shù)值
    的頭像 發(fā)表于 11-25 17:48 ?519次閱讀
    電能質量在線監(jiān)測裝置三相<b class='flag-5'>不平衡</b>度實時顯嗎?

    電流不平衡度的測量誤差范圍是多少?

    電流不平衡度的測量誤差范圍由國家標準嚴格規(guī)定,具體數(shù)值根據設備等級、硬件性能、算法設計及應用場景有所差異。以下是核心誤差范圍及影響因素的詳細解析: 一、國標規(guī)定的基礎誤差范圍 根據《GB/T
    的頭像 發(fā)表于 11-06 09:38 ?887次閱讀

    電流不平衡度測量精度受諧波影響嗎?

    是的,電流不平衡度的測量精度 會顯著受諧波影響 。這是因為電流不平衡度基于 “對稱分量法” 計算(分解正序、負序、零序分量),而諧波會改變三相電流的基波和諧波分量分布,導致序分量計算
    的頭像 發(fā)表于 11-05 16:08 ?1144次閱讀

    電能質量在線監(jiān)測裝置的電流不平衡度測量精度能達到多少?

    電能質量在線監(jiān)測裝置的電流不平衡度測量精度 取決于設備等級、硬件性能、算法設計及應用場景 ,其核心指標符合國家標準(GB/T 15543-2019)和國際規(guī)范(IEC 61000-4-30)。以下
    的頭像 發(fā)表于 11-05 15:50 ?485次閱讀

    電能質量在線監(jiān)測裝置三相不平衡度能實時算嗎?

    是的,現(xiàn)代電能質量在線監(jiān)測裝置能夠實時計算三相不平衡度,且精度和響應速度已達到工程實用水平。以下從技術實現(xiàn)、標準規(guī)范、硬件支撐和實際應用四個維度展開分析: 一、核心算法與動態(tài)響應能力 對稱分量法
    的頭像 發(fā)表于 10-15 16:22 ?479次閱讀

    三相不平衡度的國標是怎樣規(guī)定電能質量在線監(jiān)測裝置的監(jiān)測精度的?

    根據現(xiàn)行國家標準 GB/T 15543-2008《電能質量 三相電壓不平衡》 及相關配套規(guī)范(如 GB/T 19862-2016《電能質量監(jiān)測設備通用要求》 ),電能質量在線監(jiān)測裝置對三相不平衡
    的頭像 發(fā)表于 10-11 16:31 ?1601次閱讀
    三相<b class='flag-5'>不平衡</b>度的國標是怎樣規(guī)定電能質量在線監(jiān)測裝置的監(jiān)測精度的?

    變頻器輸出不平衡及對策

    變頻器輸出不平衡是工業(yè)自動化領域中常見的問題,它可能導致電機運行異常、設備損壞甚至生產事故。本文將深入分析變頻器輸出不平衡的原因,并提出相應的解決方案,幫助工程師和技術人員有效應對這一挑戰(zhàn)。 一
    的頭像 發(fā)表于 08-23 17:09 ?2199次閱讀
    變頻器輸出<b class='flag-5'>不平衡</b>及對策

    無軸承異步電機的不平衡振動補償控制

    針對由質量偏心引起的無軸承異步電機轉子不平衡振動問題,首先對不平衡振動的產生機理進行了分析;然后,研究給出了無軸承磁懸浮轉子的不平衡振動位移提取算法、不平衡振動前饋補償控制力的實時估算
    發(fā)表于 07-14 17:37

    ANSNP中線安防保護器讓諧波和不平衡無處可逃!

    安科瑞 許寒月 社會經濟和科技的發(fā)展推動著通信技術、計算機技術、光電技術等的不斷進步,在實際生產和生活中現(xiàn)代電力電子設備、變頻空調、LED屏、計算機、數(shù)字辦公設備以及通信設備等被廣泛應用,這些設備
    的頭像 發(fā)表于 06-10 22:42 ?609次閱讀
    ANSNP中線安防保護器讓諧波和<b class='flag-5'>不平衡</b>無處可逃!

    輪轂電機不平衡電磁力對車輪定位參數(shù)的影響

    [摘要] 輪轂電機驅動電動汽車將電機、減速機構和制動器等高度集成于車輪內。不同路面激勵下的輪胎跳動、載荷不均和軸承磨損等造成電機氣隙沿圓周分布不均,其所產生的不平衡電磁力將會通過減速機構或直接傳遞
    發(fā)表于 06-10 13:17

    伺服電機三相不平衡原因及解決方法

    伺服電機作為現(xiàn)代工業(yè)自動化系統(tǒng)中的核心執(zhí)行元件,其穩(wěn)定運行直接關系到生產效率和設備壽命。然而在實際應用中,三相電流不平衡問題頻發(fā),輕則導致電機發(fā)熱、效率下降,重則引發(fā)設備停機甚至繞組燒毀。本文將
    的頭像 發(fā)表于 05-06 07:40 ?1947次閱讀
    伺服電機三相<b class='flag-5'>不平衡</b>原因及解決方法

    3A325薄型平衡不平衡變壓器Anaren

    3A325薄型平衡不平衡變壓器Anaren 3A325 是一款由 Anaren Microwave 生產的表面貼裝(SMD)巴倫變壓器(Balun Transformer),適用于無線通信和射頻
    發(fā)表于 03-11 09:31