91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

通過場(chǎng)景l(fā)andmark做定位的新思路(CVPR 2022)

3D視覺工坊 ? 來源:3D視覺工坊 ? 作者:3D視覺工坊 ? 2022-12-16 11:32 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

主要內(nèi)容:提出了一種基于學(xué)習(xí)的相機(jī)定位算法,其無需存儲(chǔ)圖像特征和場(chǎng)景三維點(diǎn)云,降低了存儲(chǔ)限制,通過識(shí)別場(chǎng)景中稀疏但顯著有代表性的landmark來找到2D-3D對(duì)應(yīng)關(guān)系進(jìn)行后續(xù)的魯棒姿態(tài)估計(jì),通過訓(xùn)練檢測(cè)landmark的場(chǎng)景特定的CNN來實(shí)現(xiàn)所提出的想法,即回歸輸入圖像中對(duì)應(yīng)landmark的2D坐標(biāo)。

634694fc-7ce5-11ed-8abf-dac502259ad0.png

創(chuàng)新點(diǎn)與Contributions:1)與大多數(shù)landmark通??梢姷娜梭w姿態(tài)估計(jì)不同,由于相機(jī)視野有限并且無法同時(shí)觀察場(chǎng)景的不同部分,相機(jī)姿態(tài)估計(jì)任務(wù)中大多數(shù)場(chǎng)景l(fā)andmark不會(huì)同時(shí)可見,文章通過提出一種新的神經(jīng)方位估計(jì)器(Neural Bearing Estimator,NBE)來解決這一問題,該估計(jì)器可以直接回歸相機(jī)坐標(biāo)系中場(chǎng)景l(fā)andmark的3D方位向量,NBE學(xué)習(xí)全局場(chǎng)景表示的同時(shí)學(xué)習(xí)預(yù)測(cè)場(chǎng)景l(fā)andmark的方向向量,即使它們不可見。 2)提出了一個(gè)新的室內(nèi)定位數(shù)據(jù)集,INDOOR-6,相對(duì)于傳統(tǒng)的7-Scenes室內(nèi)數(shù)據(jù)集,包含更多變化的場(chǎng)景、晝夜圖像和強(qiáng)烈的照明變化 3)與現(xiàn)有的無存儲(chǔ)定位方法相比,具有低存儲(chǔ)的優(yōu)點(diǎn)且性能較好 文章提出了兩種預(yù)測(cè)圖像中場(chǎng)景l(fā)andmark的方法,在第一種方法中訓(xùn)練了一個(gè)模型來識(shí)別圖像中的2D場(chǎng)景地標(biāo),稱之為場(chǎng)景地標(biāo)檢測(cè)器(SLD),由于假設(shè)已知的相機(jī)內(nèi)參,這些2D檢測(cè)可以轉(zhuǎn)換為3D方位矢量或射線。在第二種方法中訓(xùn)練了一個(gè)不同的模型直接預(yù)測(cè)相機(jī)坐標(biāo)系中l(wèi)andmark的3D方位向量,稱之為神經(jīng)方位估計(jì)器(NBE)。注:使用SLD,只能檢測(cè)到相機(jī)視場(chǎng)(FoV)中可見的landmark,而NBE預(yù)測(cè)所有l(wèi)andmark的方位,包括相機(jī)視場(chǎng)外不可見的landmark。

63d732a0-7ce5-11ed-8abf-dac502259ad0.png

首先會(huì)有一個(gè)SFM構(gòu)建的點(diǎn)云模型,會(huì)在這些點(diǎn)云中挑選出有代表性的點(diǎn)云子集,用這些子集以及建圖時(shí)SFM算法生成的數(shù)據(jù)庫圖像的偽真值來訓(xùn)練兩個(gè)提出的網(wǎng)絡(luò)模型。SLD:SLD被設(shè)計(jì)為將RGB圖像I作為輸入并輸出一組像素似然圖(熱圖)表示每個(gè)可見地標(biāo)的位置,其模型架構(gòu)如下:

68351844-7ce5-11ed-8abf-dac502259ad0.png

由四個(gè)主要組件組成:使用ResNet-18為backbone,刪除最后三個(gè)最大池化層以保留高分辨率特征圖(輸出分辨率為輸入圖像分辨率的四分之一),其次在ResNet-18之后使用擴(kuò)張卷積塊,擴(kuò)張率設(shè)置為1、2、3和4,接下來轉(zhuǎn)置卷積層執(zhí)行上采樣,并負(fù)責(zé)生成分辨率為輸入圖像一半的熱圖,最后一層由1×1卷積組成,預(yù)測(cè)L個(gè)熱圖通道,每個(gè)地標(biāo)一個(gè)。 訓(xùn)練損失:

684cdd6c-7ce5-11ed-8abf-dac502259ad0.png

在推斷過程中,假設(shè)當(dāng)其最大熱圖值超過閾值τ=0.2時(shí)表明檢測(cè)到地標(biāo),利用亞像素精度計(jì)算熱圖峰值位置處裁剪的17×17 patch的期望值。NBE:設(shè)計(jì)了一個(gè)模型在給定圖像I的情況下回歸全部場(chǎng)景l(fā)andmark(即使它不可見)的方位向量。 CNN將圖像I作為輸入以生成深度特征圖,然后是多個(gè)MLP(多層感知器)塊,每個(gè)塊輸出指向landmark的方向向量,MLP包含兩個(gè)全連接層,具有128個(gè)ReLU激活節(jié)點(diǎn)。

686f7782-7ce5-11ed-8abf-dac502259ad0.png

6899dd88-7ce5-11ed-8abf-dac502259ad0.png

訓(xùn)練好兩個(gè)模型后,將每個(gè)查詢圖像輸入SLD網(wǎng)絡(luò)以獲得2D檢測(cè),然后根據(jù)內(nèi)參將其轉(zhuǎn)換為一組landmark方位向量B1,如果檢測(cè)到超過八個(gè)場(chǎng)景l(fā)andmark,使用魯棒最小解算器(P3P+RANSAC)計(jì)算相機(jī)姿態(tài),然后使用基于Levenberg-Marquardt的非線性細(xì)化。如果沒有8個(gè),將相同的圖像輸入NBE網(wǎng)絡(luò)并獲得預(yù)測(cè)方位B2,然后合并方位估計(jì)B1和B2的集合以形成新的集合B3,當(dāng)集合B1和B2中的方位指向同一地標(biāo)時(shí),保留來自B1的估計(jì),因?yàn)镾LD通常比NBE更準(zhǔn)確。最后使用上面描述的相同過程但使用B3計(jì)算相機(jī)姿態(tài)。如何從點(diǎn)云中選擇有代表性的場(chǎng)景l(fā)andmark提供給網(wǎng)絡(luò)進(jìn)行訓(xùn)練?從SfM點(diǎn)云P中找到L個(gè)場(chǎng)景l(fā)andmark的最佳子集是一個(gè)組合問題,其中評(píng)估每個(gè)子集都是困難的。本文受之前以貪婪的方式尋找有區(qū)別的關(guān)鍵點(diǎn)或場(chǎng)景元素工作的啟發(fā),去選擇魯棒性(具有更長(zhǎng)的軌跡)、可重復(fù)性(在多個(gè)場(chǎng)景中看到)和可概括性(從許多不同的觀看方向和深度觀察)的場(chǎng)景l(fā)andmark,測(cè)量軌跡長(zhǎng)度大于閾值t的3D點(diǎn)x的顯著性得分A(x),如下所示:

68d42042-7ce5-11ed-8abf-dac502259ad0.png

除了最大化總體顯著性得分之外還尋找在空間上覆蓋3D場(chǎng)景的場(chǎng)景l(fā)andmark以便從場(chǎng)景內(nèi)的任何地方都可以看到一些地標(biāo),例如無論攝像機(jī)在場(chǎng)景中的哪個(gè)位置都希望一些地標(biāo)可見。為此使用算法1中描述的約束貪婪方法

68e57806-7ce5-11ed-8abf-dac502259ad0.png

下圖表述一些挑選到的landmark在二維圖像中的投影的裁剪patch

68fb4a1e-7ce5-11ed-8abf-dac502259ad0.png

實(shí)驗(yàn):訓(xùn)練模型的細(xì)節(jié)可去論文中查看 實(shí)驗(yàn)數(shù)據(jù)集是在自己提出的INDOOR-6數(shù)據(jù)集和7Scenes數(shù)據(jù)集上

69223e26-7ce5-11ed-8abf-dac502259ad0.png

評(píng)估了單獨(dú)使用NBE, SLD,聯(lián)合使用NBE+SLD, NBE+SLD(E)(是更緊湊的網(wǎng)絡(luò)),和SOTA的基于分層定位方法結(jié)合HLoc+SLD Baseline為Posenet、DSAC、HLoc 在INDOOR-6數(shù)據(jù)集上的結(jié)果:

697d9d3e-7ce5-11ed-8abf-dac502259ad0.png

69c240b0-7ce5-11ed-8abf-dac502259ad0.png

存儲(chǔ)比較和消融研究:

6a35e38a-7ce5-11ed-8abf-dac502259ad0.png

7Scenes數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果:

6a53983a-7ce5-11ed-8abf-dac502259ad0.png

總結(jié):算法是一種存儲(chǔ)要求低但精度高的方法。主要見解是在人和物體姿態(tài)估計(jì)中廣泛用于關(guān)鍵點(diǎn)檢測(cè)的現(xiàn)代CNN架構(gòu)也適用于檢測(cè)顯著的、場(chǎng)景特定的3D landmark。 實(shí)驗(yàn)結(jié)果表明,其方法優(yōu)于以前的無存儲(chǔ)方法,但不如HLoc(頂級(jí)檢索和匹配方法之一)準(zhǔn)確,但是HLoc需要高存儲(chǔ)。而且基于landmark的2D–3D對(duì)應(yīng)關(guān)系補(bǔ)充了HLoc的對(duì)應(yīng)關(guān)系,并且在計(jì)算姿態(tài)之前結(jié)合這些對(duì)應(yīng)關(guān)系進(jìn)一步提高了HLoc精度。局限性:首先神經(jīng)網(wǎng)絡(luò)是特定于場(chǎng)景的,像其他學(xué)習(xí)方法一樣每個(gè)場(chǎng)景需要許多訓(xùn)練圖像,而且在使用之前需要仔細(xì)選擇場(chǎng)景l(fā)andmark集。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4838

    瀏覽量

    107864
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4784

    瀏覽量

    98099
  • cnn
    cnn
    +關(guān)注

    關(guān)注

    3

    文章

    355

    瀏覽量

    23432

原文標(biāo)題:通過場(chǎng)景l(fā)andmark做定位的新思路(CVPR 2022)

文章出處:【微信號(hào):3D視覺工坊,微信公眾號(hào):3D視覺工坊】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    從智慧醫(yī)療到多元商業(yè)場(chǎng)景的室內(nèi)人員定位技術(shù)應(yīng)用詳解

    GPS室內(nèi)失效?藍(lán)牙信標(biāo)定位技術(shù)應(yīng)運(yùn)而生!通過信標(biāo)部署、信號(hào)接收與算法解算,實(shí)現(xiàn)1–5米高精度定位。已廣泛應(yīng)用于智慧醫(yī)療(導(dǎo)診/設(shè)備管理)、文旅(智能導(dǎo)覽)、工業(yè)(安全監(jiān)控)、商業(yè)(尋車/精準(zhǔn)營(yíng)銷)等
    的頭像 發(fā)表于 03-02 17:16 ?537次閱讀

    Nullmax研發(fā)團(tuán)隊(duì)靜態(tài)元素檢測(cè)和拓?fù)渫评硇鲁晒脒xCVPR 2026

    思路,顯著提升自動(dòng)駕駛在無圖場(chǎng)景下的實(shí)時(shí)感知理解能力。Nullmax 致力于鞏固 ADAS 產(chǎn)品能力,為更多用戶提供全場(chǎng)景、可泛化、性能佳的智駕體驗(yàn)。
    的頭像 發(fā)表于 02-28 10:08 ?491次閱讀

    數(shù)字音頻放大器新思路:MAX98360全方位解析

    數(shù)字音頻放大器新思路:MAX98360全方位解析 在數(shù)字化浪潮的推動(dòng)下,音頻設(shè)備市場(chǎng)對(duì)音質(zhì)、效率和成本的要求日益嚴(yán)苛。在這個(gè)背景下,我們迎來了Analog Devices推出的MAX98360系列
    的頭像 發(fā)表于 01-16 14:15 ?175次閱讀

    北斗衛(wèi)星導(dǎo)航定位技術(shù)從核心誤差修正方法、不同定位模式到工業(yè)場(chǎng)景融合應(yīng)用詳解(二)

    斗系統(tǒng)通過“空間星座+地面控制+用戶終端”協(xié)同,以偽距測(cè)量和空間后方交會(huì)實(shí)現(xiàn)高精度定位。文章詳解六大誤差源及三層修正技術(shù),涵蓋開放、授權(quán)與增強(qiáng)三類定位模式,精度從米級(jí)至厘米級(jí)。結(jié)合UWB、藍(lán)牙等技術(shù),實(shí)現(xiàn)工業(yè)
    的頭像 發(fā)表于 12-30 17:02 ?710次閱讀

    室內(nèi)人員定位手環(huán)從核心技術(shù)的差異、核心功能、應(yīng)用場(chǎng)景及選購要點(diǎn)詳解

    室內(nèi)人員定位手環(huán)通過藍(lán)牙、UWB等技術(shù)實(shí)現(xiàn)精準(zhǔn)定位,具備防拆、健康監(jiān)測(cè)、電子圍欄等功能,廣泛應(yīng)用于醫(yī)療、司法、倉儲(chǔ)等領(lǐng)域,本文從技術(shù)差異、功能、場(chǎng)景及選購要點(diǎn)全面解析,助力高效安全管理
    的頭像 發(fā)表于 12-23 16:41 ?1014次閱讀
    室內(nèi)人員<b class='flag-5'>定位</b>手環(huán)從核心技術(shù)的差異、核心功能、應(yīng)用<b class='flag-5'>場(chǎng)景</b>及選購要點(diǎn)詳解

    uwb人員定位卡的功能、原理和應(yīng)用場(chǎng)景詳解

    UWB人員定位卡基于超寬帶技術(shù),實(shí)現(xiàn)亞米級(jí)高精度定位,支持SOS報(bào)警、低功耗運(yùn)行及多場(chǎng)景融合定位。廣泛應(yīng)用于工業(yè)、醫(yī)療、司法等領(lǐng)域,提升安全監(jiān)管與管理效率。
    的頭像 發(fā)表于 12-04 17:36 ?1597次閱讀
    uwb人員<b class='flag-5'>定位</b>卡的功能、原理和應(yīng)用<b class='flag-5'>場(chǎng)景</b>詳解

    開源鴻蒙技術(shù)大會(huì)2025丨定位與感知分論壇:構(gòu)建開源鴻蒙全場(chǎng)景定位感知用戶體驗(yàn)

    在萬物智聯(lián)加速演進(jìn)的當(dāng)下,高精度定位、設(shè)備協(xié)同感知等技術(shù),將持續(xù)提升開源鴻蒙在移動(dòng)設(shè)備導(dǎo)航、人員定位場(chǎng)景的用戶體驗(yàn)。
    的頭像 發(fā)表于 11-20 17:34 ?861次閱讀
    開源鴻蒙技術(shù)大會(huì)2025丨<b class='flag-5'>定位</b>與感知分論壇:構(gòu)建開源鴻蒙全<b class='flag-5'>場(chǎng)景</b><b class='flag-5'>定位</b>感知用戶體驗(yàn)

    GPS定位和地磁定位有什么區(qū)別?

    GPS定位和地磁定位是兩種原理完全不同、應(yīng)用場(chǎng)景也差異巨大的技術(shù)。簡(jiǎn)單來說:GPS定位是絕對(duì)定位,告訴你“你在世界的哪個(gè)經(jīng)緯度”。地磁
    的頭像 發(fā)表于 11-19 12:01 ?522次閱讀
    GPS<b class='flag-5'>定位</b>和地磁<b class='flag-5'>定位</b>有什么區(qū)別?

    常見的室內(nèi)定位技術(shù)有哪些?深度剖析UWB、藍(lán)牙定位等技術(shù)的優(yōu)劣與應(yīng)用場(chǎng)景

    本文解析UWB、藍(lán)牙BLE、Wi-Fi三大室內(nèi)定位技術(shù)的原理、優(yōu)缺點(diǎn)及應(yīng)用場(chǎng)景,涵蓋高精度定位、低功耗部署與成本考量,助力選擇最優(yōu)方案。
    的頭像 發(fā)表于 11-17 16:45 ?2029次閱讀
    常見的室內(nèi)<b class='flag-5'>定位</b>技術(shù)有哪些?深度剖析UWB、藍(lán)牙<b class='flag-5'>定位</b>等技術(shù)的優(yōu)劣與應(yīng)用<b class='flag-5'>場(chǎng)景</b>

    毫米級(jí)定位+全場(chǎng)景記錄:鐵路高精度定位工作記錄儀助力鐵路線路巡查

    鐵路高精度定位工作記錄儀通過毫米級(jí)定位與全場(chǎng)景記錄技術(shù),實(shí)現(xiàn)了鐵路線路巡查的智能化升級(jí),顯著提升了巡檢效率、安全性和數(shù)據(jù)可靠性,成為保障鐵路安全運(yùn)營(yíng)的關(guān)鍵工具。云翎智能高精度
    的頭像 發(fā)表于 10-20 22:02 ?446次閱讀
    毫米級(jí)<b class='flag-5'>定位</b>+全<b class='flag-5'>場(chǎng)景</b>記錄:鐵路高精度<b class='flag-5'>定位</b>工作記錄儀助力鐵路線路巡查

    諧波 THD 超標(biāo),如何通過監(jiān)測(cè)數(shù)據(jù)定位諧波源?

    ),從 “宏觀區(qū)域定位” 到 “微觀設(shè)備定位” 逐步縮小范圍。以下是基于監(jiān)測(cè)數(shù)據(jù)的具體定位方法,覆蓋工業(yè)、商業(yè)、電網(wǎng)等常見場(chǎng)景: 一、第一步:宏觀區(qū)域
    的頭像 發(fā)表于 09-23 11:43 ?1098次閱讀
    諧波 THD 超標(biāo),如何<b class='flag-5'>通過</b>監(jiān)測(cè)數(shù)據(jù)<b class='flag-5'>定位</b>諧波源?

    易控智駕榮獲計(jì)算機(jī)視覺頂會(huì)CVPR 2025認(rèn)可

    近日,2025年國際計(jì)算機(jī)視覺與模式識(shí)別頂級(jí)會(huì)議(IEEE/CVF Conference on Computer Vision and Pattern Recognition,CVPR 2025)在美國田納西州納什維爾召開。
    的頭像 發(fā)表于 07-29 16:54 ?1231次閱讀

    傳音多媒體團(tuán)隊(duì)攬獲CVPR NTIRE 2025兩項(xiàng)挑戰(zhàn)賽冠亞軍

    近日,在計(jì)算機(jī)視覺領(lǐng)域最具影響力的國際競(jìng)賽 CVPR NTIRE 2025中,傳音多媒體團(tuán)隊(duì)與上海交通大學(xué)圖像所MediaLab聯(lián)合團(tuán)隊(duì)分別斬獲 高效超分辨率挑戰(zhàn)賽(NTIRE 2025
    的頭像 發(fā)表于 06-24 16:08 ?1642次閱讀
    傳音多媒體團(tuán)隊(duì)攬獲<b class='flag-5'>CVPR</b> NTIRE 2025兩項(xiàng)挑戰(zhàn)賽冠亞軍

    輸電線路分布式故障定位裝置的原理、優(yōu)勢(shì)與應(yīng)用場(chǎng)景解析

    輸電線路分布式故障定位裝置的原理、優(yōu)勢(shì)與應(yīng)用場(chǎng)景解析
    的頭像 發(fā)表于 05-16 09:25 ?995次閱讀

    UWB 定位測(cè)距

    指示、可通過撥碼開關(guān)設(shè)置參數(shù),包括標(biāo)簽還是基站的判別,地址的確定等。 應(yīng)用場(chǎng)景 :室內(nèi)定位、資產(chǎn)追蹤、智能倉儲(chǔ)等。 2、實(shí)物照 實(shí)物圖片UWB測(cè)距定位,UWB3000+Nrf52832
    發(fā)表于 05-12 09:36