91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

阿里達摩院提出MogFace:人臉檢測新工作

CVer ? 來源:CVer ? 作者:CVer ? 2022-11-29 15:24 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

一、開源

77fd25c0-6f37-11ed-8abf-dac502259ad0.png

MogFace: Towards a Deeper Appreciation on Face Detection

1. 論文鏈接:

https://openaccess.thecvf.com/content/CVPR2022/papers/Liu_MogFace_Towards_a_Deeper_Appreciation_on_Face_Detection_CVPR_2022_paper.pdf

2. 代碼模型:

https://modelscope.cn/models/damo/cv_resnet101_face-detection_cvpr22papermogface/summary

3. 可玩應用:

https://modelscope.cn/studios/baigui/face_album/summary

二、背景

人臉檢測算法是在一幅圖片或者視頻序列中檢測出來人臉的位置,給出人臉的具體坐標,一般是矩形坐標。它是人臉關鍵點、屬性、編輯、風格化、識別等模塊的基礎。本文通過實驗觀察發(fā)現(xiàn),對應設計出如下三個模塊構建出一個高性能的人臉檢測器MogFace:1.)動態(tài)標簽分配策略(dynamic label assignment),2.)誤檢上下文相關性分析(FP context analysis),3.)金字塔層級監(jiān)督信號分配(pyramid layer level GT assignment)。該方法的模型在WIDER FACE榜單上取得了截止目前將近兩年的六項第一。

三、觀察

1.1 動態(tài)標簽分配策略(dynamic label assignment)

為每個anchor點定義cls和reg目標是訓練檢測器的必要過程,在人臉檢測中這個過程稱之為標簽分配(Label Assignment)。最近,標簽分配吸引了諸多研究人員的注意,在人臉檢測及通用物體檢測領域提出了一系列方法,例如:OTA、PAA,ATSS以及HAMBox。如示例圖(a),標簽分配過程依賴4個元素。分別是:1.)offline information: a.)IoU (anchor與ground-truth框的IoU) , b.)CPD (anchor與ground-truth中心點的距離) ,2.)online information: a.)PCS (cls分支對anchor的前景分類概率值) ,b.)PLC (reg分支對anchor的預測坐標值)。

781a5fd2-6f37-11ed-8abf-dac502259ad0.png

但是,目前的標簽分配方法存在三個問題。1.)若只用offline information做靜態(tài)標簽分配,那么會有很多具備更強回歸能力的negative anchor無法被有效利用起來,會導致標簽分配策略欠飽和。2.)若過度信任online information動態(tài)調整正負anchor時(如OTA和Hambox),由于online information屬于預測信息可信度不高,會導致標簽分配策略錯誤多, 極端情況下會陷入trivial 的分配結果。3.) 若引入大量超參 (K in ATSS, alpha in OTA)做標簽分配,則當數(shù)據(jù)集分布發(fā)生變化時,需要大量的調參時間。

1.2 誤檢上下文相關性分析(FP context analysis)

在實際應用中,人臉檢測器并不會十分care AP的指標,而對誤檢(false positive [FP])的數(shù)量十分敏感。針對這個問題,目前的做法是收集大量帶有FP的圖片去fine-tune或者from scratch訓練檢測器,來幫助檢測器了解更多范式的FP,但是我們發(fā)現(xiàn)有些頻繁出現(xiàn)在訓練集中的的FP在這種策略下無法有效解決。這篇文章,我們發(fā)現(xiàn)了一個有趣的現(xiàn)象:對于同一個FP,當它的context發(fā)生變化時,對于同一個檢測器來說它可能就不是FP了。如下圖(c),最左面的圖片里日歷是FP,剩余兩張日歷都不是FP。

783f0d50-6f37-11ed-8abf-dac502259ad0.png

1.3 金字塔層級監(jiān)督信號分配(pyramid layer level GT assignment)

scale-level 數(shù)據(jù)增強策略常常作通用物體檢測以及人臉檢測中解決scale variance主要手段。如圖(b)所示,相對于COCO,人臉檢測數(shù)據(jù)集Wider Face 中人臉的尺度分布更為嚴峻。為此,我們分提出了一個新的問題,如何合理的分配ground-truth 在不同pyramidlayer上的分布?即檢測器的性能與每個pyramidlayer匹配ground-truth的個數(shù)之間的關系是什么?是否越多越好?通過嚴格的對比實驗我們發(fā)現(xiàn):“對于所有的pyramid layer來說,并不是這個pyramid layer匹配到越多的ground-truth就越好”。這說明要挖掘每一個pyramidlayer的最好性能,需要控制在這個pyramidlayer上的ground-truth分配的比例。

785e88d8-6f37-11ed-8abf-dac502259ad0.png

四、方法

2.1 Adaptive Online Incremental Anchor Mining Strategy (Ali-AMS)

針對上述“動態(tài)標簽分配策略(dynamic label assignment)”觀察分析,本文提出了在里面一種自適應的在線增量錨挖掘策略(Ali-AMS),它基于standard anchor matching 策略,并進一步adaptive 幫助outlier face匹配anchor。如下:

7880139a-6f37-11ed-8abf-dac502259ad0.png

2.2 Hierachical Context-Aware Module (HCAM)

基于上述“誤檢上下文相關性分析(FP context analysis)”觀察分析,發(fā)現(xiàn)“對于同一個FP,當它的context發(fā)生變化時,對于同一個檢測器來說他可能就不是FP了”,我們進一步提出了一個two-step的模塊來顯示的encode context 信息來幫助區(qū)分FP和TP,顯著減少了FP的數(shù)量。

7895de46-6f37-11ed-8abf-dac502259ad0.png

2.3 Selective Scale Enhancement Strategy (SSE)

基于上述的“金字塔層級監(jiān)督信號分配(pyramid layer level GT assignment)”觀察分析,發(fā)現(xiàn)“對于所有的pyramid layer來說,并不是這個pyramid layer匹配到越多的ground-truth就越好”,我們提出通過控制pyramid layer 匹配的ground-truth的數(shù)量來最大化pyramid layer 的性能。

78b71a5c-6f37-11ed-8abf-dac502259ad0.png

五、實驗

3.1 Ablation Study

78d401a8-6f37-11ed-8abf-dac502259ad0.png

3.2 Comparison with sota

79003fac-6f37-11ed-8abf-dac502259ad0.png

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 模塊
    +關注

    關注

    7

    文章

    2837

    瀏覽量

    53300
  • 檢測器
    +關注

    關注

    1

    文章

    934

    瀏覽量

    49948
  • 檢測算法
    +關注

    關注

    0

    文章

    122

    瀏覽量

    25758

原文標題:WIDER FACE六項第一!阿里達摩院提出MogFace:人臉檢測新工作 | CVPR 2022

文章出處:【微信號:CVer,微信公眾號:CVer】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    瑞芯微(EASY EAI)RV1126B 人臉檢測使用

    1.人臉檢測簡介人臉檢測人臉識別、人臉屬性分類、人臉
    的頭像 發(fā)表于 01-09 09:52 ?7096次閱讀
    瑞芯微(EASY EAI)RV1126B <b class='flag-5'>人臉</b><b class='flag-5'>檢測</b>使用

    廣電計量兩大創(chuàng)新工作室喜獲佳績

    近日,廣州市總工會公布了2025年廣州市勞模和工匠人才創(chuàng)新工作室(含女職工創(chuàng)新工作室)支持建設對象及優(yōu)秀等次名單。廣電計量兩大創(chuàng)新工作室喜獲佳績。其中,“陸裕東工匠人才創(chuàng)新工作室”被確
    的頭像 發(fā)表于 12-12 11:14 ?704次閱讀

    新思科技HAPS-200助力阿里巴巴達摩加速玄鐵C930開發(fā)驗證

    在AI驅動的時代,驗證不僅僅是功能正確,更要確保性能、功耗和軟件兼容性。HAPS-200的引入,助力達摩玄鐵團隊能夠在設計早期完成系統(tǒng)級驗證,顯著縮短上市時間,降低風險,并推動RISC-V生態(tài)加速成熟,開啟RISC-V高性能新時代。
    的頭像 發(fā)表于 11-18 11:12 ?919次閱讀

    RISC-V創(chuàng)新中心與達摩合作簽約

    10月30日,RISC-V創(chuàng)新中心與達摩合作簽約暨創(chuàng)新發(fā)展交流會在蘇州市集成電路創(chuàng)新中心隆重舉行,來自全國各地的重點企業(yè)、科研機構、行業(yè)協(xié)會、投資機構等代表出席活動,共話RISC-V產業(yè)創(chuàng)新發(fā)展新圖景。
    的頭像 發(fā)表于 11-03 15:43 ?836次閱讀

    基于級聯(lián)分類器的人臉檢測基本原理

    本次分享的內容是基于級聯(lián)分類器的人臉檢測基本原理 1) 人臉檢測概述 關于人臉檢測算法,目前
    發(fā)表于 10-30 06:14

    【Milk-V Duo S 開發(fā)板免費體驗】人臉檢測

    【Milk-V Duo S 開發(fā)板免費體驗】人臉檢測 本文介紹了 Milk-V Duo S 開發(fā)板結合 OV5647 攝像頭模塊,實現(xiàn)人臉檢測的項目設計。 準備
    發(fā)表于 07-27 16:53

    阿里巴巴達摩劉志偉:QEMU RISC-V 的進展、特性與未來規(guī)劃

    2025 年 7 月 18 日,在第五屆(2025)RISC-V 中國峰會的軟件與生態(tài)系統(tǒng)分論壇上,阿里巴巴達摩 RISC-V 及生態(tài)部技術專家劉志偉帶來了關于 QEMU RISC-V 的報告
    發(fā)表于 07-18 11:20 ?5718次閱讀
    <b class='flag-5'>阿里</b>巴巴<b class='flag-5'>達摩</b><b class='flag-5'>院</b>劉志偉:QEMU RISC-V 的進展、特性與未來規(guī)劃

    【Milk-V Duo S 開發(fā)板免費體驗】人臉檢測測試(視頻)

    https://bbs.elecfans.com/jishu_2494616_1_1.html我們編譯了人臉檢測的應用,現(xiàn)在攝像頭到了, 我們就進行實際測試。 視頻見https
    發(fā)表于 07-11 22:33

    【HarmonyOS 5】VisionKit人臉活體檢測詳解

    【HarmonyOS 5】VisionKit人臉活體檢測詳解 ##鴻蒙開發(fā)能力 ##HarmonyOS SDK應用服務##鴻蒙金融類應用 (金融理財# 一、VisionKit人臉活體檢測
    的頭像 發(fā)表于 06-21 11:52 ?932次閱讀
    【HarmonyOS 5】VisionKit<b class='flag-5'>人臉</b>活體<b class='flag-5'>檢測</b>詳解

    基于RV1126開發(fā)板實現(xiàn)人臉檢測方案

    在RV1126開發(fā)板上實現(xiàn)人臉檢測:在圖像中找出人臉,以及每張人臉的landmarks位置。 方案設計邏輯流程圖,方案代碼分為分為兩個業(yè)務流程,主體代碼負責抓取、合成圖像,
    的頭像 發(fā)表于 04-21 17:59 ?1036次閱讀
    基于RV1126開發(fā)板實現(xiàn)<b class='flag-5'>人臉</b><b class='flag-5'>檢測</b>方案

    基于RV1126開發(fā)板實現(xiàn)人臉檢測方案

    在RV1126開發(fā)板上實現(xiàn)人臉檢測:在圖像中找出人臉,以及每張人臉的landmarks位置。 方案設計邏輯流程圖,方案代碼分為分為兩個業(yè)務流程,主體代碼負責抓取、合成圖像,
    的頭像 發(fā)表于 04-21 14:00 ?13次閱讀
    基于RV1126開發(fā)板實現(xiàn)<b class='flag-5'>人臉</b><b class='flag-5'>檢測</b>方案

    基于RV1126開發(fā)板實現(xiàn)人臉檢測方案

    在RV1126開發(fā)板上實現(xiàn)人臉檢測:在圖像中找出人臉,以及每張人臉的landmarks位置。 方案設計邏輯流程圖,方案代碼分為分為兩個業(yè)務流程,主體代碼負責抓取、合成圖像,
    的頭像 發(fā)表于 04-21 10:21 ?99次閱讀
    基于RV1126開發(fā)板實現(xiàn)<b class='flag-5'>人臉</b><b class='flag-5'>檢測</b>方案

    基于RV1126開發(fā)板實現(xiàn)人臉檢測方案

    在RV1126上實現(xiàn)人臉檢測:在圖像中找出人臉,以及每張人臉的landmarks位置。方案設計邏輯流程圖,方案代碼分為分為兩個業(yè)務流程,主體代碼負責抓取、合成圖像, 算法代碼負責
    的頭像 發(fā)表于 04-18 16:47 ?277次閱讀
    基于RV1126開發(fā)板實現(xiàn)<b class='flag-5'>人臉</b><b class='flag-5'>檢測</b>方案

    RV1126 實現(xiàn)人臉檢測方案

    基于RV1126開發(fā)板實現(xiàn)人臉檢測方案,充分體現(xiàn)了電子方面的實踐經驗和目標檢測技術。
    的頭像 發(fā)表于 04-14 09:25 ?897次閱讀
    RV1126 實現(xiàn)<b class='flag-5'>人臉</b><b class='flag-5'>檢測</b>方案

    普華基礎軟件蒞臨阿里巴巴達摩調研交流

    近日, 普華基礎軟件股份有限公司(以下簡稱普華基礎軟件)董事、總經理劉宏倩一行前往阿里巴巴達摩(杭州)科技有限公司(以下簡稱達摩)調研交
    的頭像 發(fā)表于 04-08 10:10 ?1151次閱讀