91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

一個集檢測與檢索與一身的作品

gVTR_Unf ? 來源:AI人工智能初學者 ? 作者:ChaucerG ? 2020-09-28 16:09 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

本文轉(zhuǎn)載自 AI人工智能初學者,作者ChaucerG

傳統(tǒng)的目標檢索任務旨在學習具有內(nèi)部相似度和內(nèi)部相異度的區(qū)分特征表示,它假設圖像中的對象是手動或自動精確裁剪的。但是,在許多現(xiàn)實世界中的搜索場景(例如,視頻監(jiān)視)中,很少準確地檢測或標注對象(例如,人、車輛等)。因此,在沒有邊界框注釋的情況下,物體級檢索變得很棘手,這導致了一個新的但具有挑戰(zhàn)性的主題,即圖像搜索。

1、簡介

行人搜索是圖像搜索問題的第一個嘗試。在此之前,雖然對人的檢測和重識別做了大量的努力,但大多數(shù)都是獨立處理這兩個問題的。也就是說,傳統(tǒng)方法將行人搜索任務劃分為兩個獨立的子任務。

首先,利用行人檢測器從圖像中預測人物的邊界盒,然后根據(jù)預測的邊界盒的坐標對被檢測人物的矩形區(qū)域進行裁剪。其次,提取檢測框內(nèi)行人的特征用于重新識別人物。

在一般的行人重識別(Re-ID)任務中,對行人圖像進行人工注釋和裁剪,然后用于訓練的鑒別特征表示網(wǎng)絡。一方面是因為在真實的視頻監(jiān)控任務中,大多數(shù)檢測器不可避免地會出現(xiàn)誤檢和框選不準的情況,在一定程度上可能會導致ReID精度的性能顯著下降。另一方面,這兩個獨立的子任務似乎對實際應用程序中的最終Re-ID不太友好。

圖1 傳統(tǒng)ReID+檢索的過程和本文所提方法的對比圖

在本文中,為了解決圖像搜索問題,我們首先介紹一個端到端集成網(wǎng)(I-Net),它具有三個優(yōu)點:

1)通過設計Siamese架構(gòu)來進行在線匹配相似和不相似樣本對。

2)引入了新穎的在線配對(OLP)損失和動態(tài)特征字典,該字典通過自動生成多個負數(shù)對來限制正數(shù),從而減輕了多任務訓練停滯問題。

3)提出了一種Hard example priority(HEP)的softmax損失,以通過選擇Hard類別來提高分類任務的魯棒性。

借助分而治之的理念,文章進一步提出了一種改進的I-Net,稱為DC-I-Net,它做出了兩個新的貢獻:

1)量身定制了兩個模塊以在集成框架中分別處理不同的任務,從而使任務規(guī)格得到保證。

2)提出了通過利用memory的類中心進行類中心指導的HEP Loss(),從而可以捕獲內(nèi)部相似度和內(nèi)部相似度以進行最終檢索。

在著名的面向圖像級搜索的基準數(shù)據(jù)集上的大量實驗表明,所提出的DC-I-Net優(yōu)于最新的tasks-integrated和tasks-separated的圖像搜索模型。

2、本文方法

這篇論文是I-Net的一個實質(zhì)性擴展,在網(wǎng)絡架構(gòu)和損失函數(shù)方面做出了以下新貢獻:

2.1、I-Net

為了實現(xiàn)更好的圖像搜索任務,I-Net(Siamese I-Net)將行人檢測和行人重識別設計為端到端(End-to-End)的框架,如下圖:

對于每一次迭代,包含相同身份id的圖像對將被輸入到Siamese I-Net中。利用骨干網(wǎng)絡進行初步特征的提取。然后,通過兩個RPN結(jié)構(gòu)得到候選區(qū)域。再然后將這些候選區(qū)域特征輸入到ROIPooling中并輸出的特征圖,最后是兩個全連接層分別用于檢測任務和檢索檢索(即ReID)任務。同時該結(jié)構(gòu)的提出的同時也提出了兩個損失函數(shù),即OLP Loss和HEPLoss,用于學習與ReID相關(guān)的有效特征。

通過兩個RPN生成的候選區(qū)域,ROI池化層被集成到I-Net中。然后,兩個Stream匯集的特征被輸入到有4096個神經(jīng)元的兩個FC中。為了消除行人候選區(qū)域的假陽性使用二值交叉熵損失區(qū)分訓練。(注意,對于一般的圖像搜索任務都會使用softmax分類器來進行目標檢測);除此之外L1損失用來約束候選框的位置,同時會有一對256-D的特征用通過OLP Loss和HEP Loss來訓練ReID Branch的模型。

2.2、On-line Pairing Loss (OLP Loss)

設計OLP損失函數(shù)主要從以下幾個角度考慮的:

1 減小類內(nèi)差距、增加類間差距

2 由于輸入的圖像數(shù)量不足,且每幅圖像中目標的鎖定,容易出現(xiàn)容易對多而身份少的情況,會導致傳統(tǒng)度量損失(如Triplet Loss)的停滯問題,嚴重阻礙了模型的有效訓練。

OLP Loss的設計形式如下:

OLP損失可以按照如下步驟進行復現(xiàn):

1.收集兩幅相同身份輸入圖像的特性,并構(gòu)造成正樣本對。

2.為每個正樣本對特征中的和被設置為Anchor。負樣本特征存儲在特征字典中,與Anchor對配對,構(gòu)建負樣本對。

3.計算OLP損失,然后計算OLP梯度,進行梯度反向傳播優(yōu)化。

4.存儲輸入的特征,逐步更新特征字典。

2.3、Hard Example Priority Loss (HEP Loss)

OLP損失函數(shù)使正樣本對的余弦距離更小,負樣本對的余弦距離更大,這并不能直接對損失函數(shù)中的id標簽進行回歸。另外,傳統(tǒng)的基于softmax的分類器交叉損失訓練方法沒有考慮樣本在數(shù)據(jù)中的難易程度?;谏鲜隹紤],提出了HEP Loss,目的是回歸具有高優(yōu)先級的身份標簽。

在圖4中,Hard Example的選擇如下:

首先確定每個有身份的輸入圖像對的標簽索引,以確保groundtruth類。

對于每個子組,將距離最大的最上面r個負樣本的標簽索引存儲在優(yōu)先級類池P中,使難例的優(yōu)先級類得到集中。

如果池P的大小仍然小于預設的T,便隨機選擇幾個類填充池。

最后,利用傳統(tǒng)的基于softmax的交叉熵損失和選擇的優(yōu)先級類,將提出的HEP損失函數(shù)表示為:

其中,表示分類器給出的第i個proposal的分數(shù),j表示第j個類。在損失函數(shù)中,只使用選定的類別進行損失計算,進而使得損失函數(shù)集中在硬類別上。

2.4、Overall Loss of I-Net

I-Net是一種將檢測和重識別結(jié)合起來進行訓練的端到端模型。因此損失由兩部分組成:檢測損失()和重識別損失(和),表示如下:

2.5、DC-I-NET

相較于I-Net,DC-I-NET:

1.通過使用來自不同層的特征,很好地考慮了檢測和重新識別的任務專注度;

2.利用ROI-Align模塊生成2級檢測器來提取refined目標以用于訓練度量損失;

3.提出了class-center引導困難樣本優(yōu)先的()損失,用于訓練的id的分類損失。

Detector:在DC-I-Net中,檢測任務和行人重識別任務的特征是從不同網(wǎng)絡層次中提取的。經(jīng)過分類損失和回歸損失監(jiān)督的兩階段檢測,完成準確Bounding Boxes(即目標行人)的檢測。

Re-identifier:經(jīng)過兩階段檢測后,將refined bounding Boxes的坐標輸入ROIAlign層,計算refined目標建議的特征,用于行人重識別。對于ReID任務,匯集的feature map的大小為7x14,其寬高比與person的邊框相似。然后將特征圖輸入全連通層,學習用于行人重識別的特征向量表示。最后,通過全連通層生成目標方案的256-D的經(jīng)過L2歸一化后特征,并將其輸入到和中進行重識別模塊的訓練。

損失函數(shù)定義如下:

DC-I-Net總損失為:

3、實驗結(jié)果

原文標題:【檢測+檢索】一個模型讓你不僅看得見也可以找得到,集檢測與檢索與一身的作品

文章出處:【微信公眾號:機器視覺CV】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

責任編輯:haq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 圖像采集
    +關(guān)注

    關(guān)注

    2

    文章

    313

    瀏覽量

    42126
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    39807

    瀏覽量

    301479

原文標題:【檢測+檢索】一個模型讓你不僅看得見也可以找得到,集檢測與檢索與一身的作品

文章出處:【微信號:Unfinished_coder,微信公眾號:機器視覺CV】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    M41ST85W:實時時鐘、微處理器與NVRAM管理于一身的芯片

    M41ST85W:實時時鐘、微處理器與NVRAM管理于一身的芯片 在電子設計領域,款功能全面且性能穩(wěn)定的芯片往往能為項目帶來事半功倍的效果。M41ST85W就是這樣款值得關(guān)注的芯
    的頭像 發(fā)表于 03-02 16:55 ?543次閱讀

    LTC3559/LTC3559 - 1:充電與穩(wěn)壓于一身的理想之選

    LTC3559/LTC3559 - 1:充電與穩(wěn)壓于一身的理想之選 在電子設備設計中,電源管理模塊的性能直接影響到整個系統(tǒng)的穩(wěn)定性、續(xù)航能力和用戶體驗。今天,我們就來深入探討 Linear
    的頭像 發(fā)表于 02-24 16:45 ?471次閱讀

    RAG(檢索增強生成)原理與實踐

    引言 在大語言模型(LLM)蓬勃發(fā)展的今天,如何讓AI更準確地回答特定領域的問題成為了關(guān)鍵挑戰(zhàn)。RAG(Retrieval-Augmented Generation,檢索增強生成)技術(shù)應運而生
    發(fā)表于 02-11 12:46

    解析MAX14529E:多功能于一身的過壓保護芯片

    解析MAX14529E/MAX14530E:多功能于一身的過壓保護芯片 在電子設備的設計中,過壓保護、充電器檢測、低功耗穩(wěn)壓以及靜電放電(ESD)保護等功能都是至關(guān)重要的。今天,我們就來深入探討
    的頭像 發(fā)表于 02-09 16:35 ?120次閱讀

    IR2166:PFC與鎮(zhèn)流器控制于一身的高效芯片

    IR2166:PFC與鎮(zhèn)流器控制于一身的高效芯片 在電子工程師的日常設計工作中,尋找款能高效集成多種功能且具備可靠保護機制的芯片至關(guān)重要。今天,我們就來深入探討國際整流器公司
    的頭像 發(fā)表于 12-24 17:25 ?741次閱讀

    RE46C105:多功能于一身的壓電喇叭驅(qū)動芯片

    RE46C105:多功能于一身的壓電喇叭驅(qū)動芯片 在電子設備的設計中,款性能優(yōu)良且功能豐富的驅(qū)動芯片往往能為產(chǎn)品增色不少。今天要給大家介紹的是Microchip Technology旗下RE
    的頭像 發(fā)表于 12-17 16:40 ?491次閱讀

    探索Type 2FR:多功能于一身的無線模塊

    探索Type 2FR:多功能于一身的無線模塊 在當今的物聯(lián)網(wǎng)(IoT)領域,無線連接技術(shù)的發(fā)展日新月異。對于電子工程師來說,選擇款性能卓越、功能豐富且易于集成的無線模塊至關(guān)重要。今天,我們就來
    的頭像 發(fā)表于 12-16 15:55 ?394次閱讀

    DP1363F 多協(xié)議NFC 兼容CLRC663開發(fā)資料

    ?DP1363F是高度集成的收發(fā)器芯片,用于13.56Mhz的非接觸式通訊。強大的多協(xié)議支持、最高射頻輸出功率,以及突破性技術(shù)低功耗卡片檢測等優(yōu)勢于一身,滿足市場對更高集成度、更小外殼和互操作性
    發(fā)表于 11-03 14:01

    甲醛顆粒物溫濕度等多合檢測設備

    以下作品由安信可社區(qū)用戶 WT_0213 制作 歡迎大家來安信可論壇,筆者發(fā)布的原貼下起交流討論: 原貼地址 【電子DIY作品】甲醛顆粒物溫濕度等多合
    的頭像 發(fā)表于 10-23 10:23 ?333次閱讀
    甲醛顆粒物溫濕度等多合<b class='flag-5'>一</b><b class='flag-5'>檢測</b>設備

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+具智能芯片

    可以被稱為第人稱視角。 第人稱視角:指實體本身在觀察或經(jīng)歷事物時,所能夠看到或感知到的角度。 二、AI感知技術(shù)與芯片 具智能3
    發(fā)表于 09-18 11:45

    寫給小白的“具智能”入門科普

    最近具智能這個概念很火。那么,究竟什么是具智能?它包括哪些類別和關(guān)鍵技術(shù)?通過這篇文章,我們來深入了解下。什么是具智能“智能”,大家都懂,也就是AI。那么,什么是“具
    的頭像 發(fā)表于 08-21 14:15 ?2300次閱讀
    寫給小白的“具<b class='flag-5'>身</b>智能”入門科普

    AIcube1.4目標檢測模型導入yolotxt格式數(shù)據(jù)直顯示數(shù)據(jù)正在解析,為什么?

    AIcube1.4目標檢測模型導入yolotxt格式數(shù)據(jù)直顯示數(shù)據(jù)正在解析 數(shù)據(jù)有問題,把數(shù)據(jù)情況說的詳細點
    發(fā)表于 08-13 07:16

    圣邦微電子即將量產(chǎn)高精度磁編碼器VCE2765

    今天為大家介紹圣邦微電子即將量產(chǎn)的高精度磁編碼器 VCE2765。這是款專門針對離軸安裝應用設計的編碼器芯片,自校準、高精度、強抗干擾能力于一身,基于 AMR 技術(shù)的創(chuàng)新產(chǎn)品將為嚴苛環(huán)境下的角度
    的頭像 發(fā)表于 07-31 17:19 ?1499次閱讀

    芯盾時代助力寧夏銀行統(tǒng)一身份認證平臺建設

    芯盾時代中標寧夏銀行!芯盾時代依托自主研發(fā)的用戶身份與訪問管理產(chǎn)品,為寧夏銀行建設統(tǒng)化、標準化、自動化的統(tǒng)一身份認證平臺,實現(xiàn)統(tǒng)一身份管理,統(tǒng)一身份認證,統(tǒng)
    的頭像 發(fā)表于 07-10 16:33 ?1052次閱讀

    天吃透條產(chǎn)業(yè)鏈:具智能(AI+機器人)

    01 產(chǎn)業(yè)鏈全景圖 02 具智能簡介 簡單來說,具智能就是給人工智能賦予實體,讓它能夠像人類樣在現(xiàn)實世界中行動、感知和學習,而不是
    的頭像 發(fā)表于 06-19 09:21 ?2105次閱讀
    <b class='flag-5'>一</b>天吃透<b class='flag-5'>一</b>條產(chǎn)業(yè)鏈:具<b class='flag-5'>身</b>智能(AI+機器人)