91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

TransGeo:第一種用于交叉視圖圖像地理定位的純Transformer方法

3D視覺工坊 ? 來源:3D視覺工坊 ? 2023-01-16 11:02 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

主要內(nèi)容:

提出了第一種用于交叉視圖圖像地理定位的純Transformer方法,在對(duì)齊和未對(duì)齊的數(shù)據(jù)集上都實(shí)現(xiàn)了最先進(jìn)的結(jié)果,與基于CNN的方法相比,計(jì)算成本更低,所提出的方法不依賴于極坐標(biāo)變換和數(shù)據(jù)增強(qiáng),具有通用性和靈活性。

論文出發(fā)點(diǎn):

基于CNN的交叉視圖圖像地理定位主要依賴于極坐標(biāo)變換,無法對(duì)全局相關(guān)性進(jìn)行建模,為了解決這些限制,論文提出的算法利用Transformer在全局信息建模和顯式位置信息編碼方面的優(yōu)勢(shì),還進(jìn)一步利用Transformer輸入的靈活性,提出了一種注意力引導(dǎo)的非均勻裁剪方法去除無信息的圖像塊,性能下降可以忽略不計(jì),從而降低了計(jì)算成本,節(jié)省下來的計(jì)算可以重新分配來提高信息patch的分辨率,從而在不增加額外計(jì)算成本的情況下提高性能。

這種“關(guān)注并放大”策略與觀察圖像時(shí)的人類行為高度相似。

圖像地理定位(名詞解釋):

基于圖像的地理定位旨在通過檢索GPS標(biāo)記的參考數(shù)據(jù)庫中最相似的圖像來確定查詢圖像的位置,其應(yīng)用在大城市環(huán)境中改善具有大的噪聲GPS和導(dǎo)航,在Transformer出現(xiàn)之前,通常使用度量學(xué)習(xí)損失來訓(xùn)練雙通道CNN框架,但是這樣交叉視圖檢索系統(tǒng)在街道視圖和鳥瞰視圖之間存在很大的領(lǐng)域差距,因?yàn)镃NN不能明確編碼每個(gè)視圖的位置信息,之后為了改善域間隙,算法在鳥瞰圖像上應(yīng)用預(yù)定義的極坐標(biāo)變換,變換后的航空?qǐng)D像具有與街景查詢圖像相似的幾何布局,然而極坐標(biāo)變換依賴于與兩個(gè)視圖相對(duì)應(yīng)的幾何體的先驗(yàn)知識(shí),并且當(dāng)街道查詢?cè)诳臻g上未在航空?qǐng)D像的中心對(duì)齊時(shí),極坐標(biāo)轉(zhuǎn)換可能會(huì)失敗。

Contribution:

提出了第一種基于Transformer的方法用于交叉視圖圖像地理定位,無需依賴極坐標(biāo)變換或數(shù)據(jù)增強(qiáng)。

提出了一種注意力引導(dǎo)的非均勻裁剪策略,去除參考航空?qǐng)D像中的大量非信息補(bǔ)丁以減少計(jì)算量,性能下降可忽略不計(jì),通過將省下來的計(jì)算資源重新分配到信息patch的更高圖像分辨率進(jìn)一步提高了性能。

與基于CNN的方法相比,在數(shù)據(jù)集上的最先進(jìn)性能具有更低的計(jì)算成本、GPU內(nèi)存消耗和推理時(shí)間。

網(wǎng)絡(luò)架構(gòu):

251123c0-952a-11ed-bfe3-dac502259ad0.png

25375ea0-952a-11ed-bfe3-dac502259ad0.png

Patch Embedding:

256d4ab0-952a-11ed-bfe3-dac502259ad0.png

Class Token:

最后一層輸出的類token被送到一個(gè)MLP頭以生成最終的分類向量,使用最終輸出向量作為嵌入特征,并使用上面說的損失對(duì)其進(jìn)行訓(xùn)練。

可學(xué)習(xí)的位置嵌入:

位置嵌入被添加到每個(gè)token以保持位置信息,采用了可學(xué)習(xí)的位置嵌入,這是包括class token在內(nèi)的所有(N+1)token的可學(xué)習(xí)矩陣,可學(xué)習(xí)的位置嵌入使雙通道Transformer能夠?qū)W習(xí)每個(gè)視圖的最佳位置編碼,而無需任何關(guān)于幾何對(duì)應(yīng)的先驗(yàn)知識(shí),因此比基于CNN的方法更通用和靈活。

多頭注意力:

Transformer編碼器內(nèi)部架構(gòu)是L個(gè)級(jí)聯(lián)的基本Transformer,關(guān)鍵組成部分是多頭注意力塊,它首先使用三個(gè)可學(xué)習(xí)的線性投影將輸入轉(zhuǎn)換為查詢、鍵和值,表示為Q、K、V,維度為D,然后將注意力輸出計(jì)算為

258decca-952a-11ed-bfe3-dac502259ad0.png

,一個(gè)k-head注意力塊用k個(gè)不同的head對(duì)Q、k、V進(jìn)行線性投影,然后對(duì)所有k個(gè)head并行執(zhí)行attention,輸出被連接并投影回模型維度D,多頭注意力可以模擬從第一層開始的任意兩個(gè)標(biāo)記之間的強(qiáng)全局相關(guān)性,這在CNN中是不可能學(xué)習(xí)的,因?yàn)榫矸e的接受域有限。

Attention引導(dǎo)的非均勻裁剪:

當(dāng)尋找圖像匹配的線索時(shí),人類通常會(huì)第一眼找到最重要的區(qū)域,然后只關(guān)注重要的區(qū)域并放大以找到高分辨率的更多細(xì)節(jié),把“關(guān)注并放大”的思想用在交叉圖像地理定位中可能更有益,因?yàn)閮蓚€(gè)視圖只共享少量可見區(qū)域,一個(gè)視圖中的大量區(qū)域,例如鳥瞰圖中的高樓屋頂,在另一個(gè)視圖可能看不見,這些區(qū)域?qū)ψ罱K相似性的貢獻(xiàn)微不足道,可以去除這些區(qū)域以減少計(jì)算和存儲(chǔ)成本,然而重要的區(qū)域通常分散在圖像上,因此CNN中的均勻裁剪不能去除分散的區(qū)域,因此提出了注意力引導(dǎo)的非均勻裁剪

25af1c06-952a-11ed-bfe3-dac502259ad0.png

在鳥瞰分支的最后一個(gè)transformer編碼器中使用注意力圖,它代表了每個(gè)token對(duì)最終輸出的貢獻(xiàn),由于只有class token對(duì)應(yīng)的輸出與MLP head連接,因此選擇class token與所有其他patch token之間的相關(guān)性作為注意力圖,并將其重塑為原始圖像形狀。

模型優(yōu)化:

為了在沒有數(shù)據(jù)增強(qiáng)的情況下訓(xùn)練Transformer模型,采用了正則化/泛化技術(shù)ASAM。在優(yōu)化損失時(shí)使用ASAM來最小化損失landscape的自適應(yīng)銳度使得該模型以平滑的損失曲率收斂以實(shí)現(xiàn)強(qiáng)大的泛化能力。

25e54cd6-952a-11ed-bfe3-dac502259ad0.png

通過同時(shí)最小化的損失和自適應(yīng)銳度,能夠在不使用任何數(shù)據(jù)增強(qiáng)的情況下克服過擬合問題

實(shí)驗(yàn):

在兩個(gè)城市規(guī)模的數(shù)據(jù)集上進(jìn)行了實(shí)驗(yàn),即CVUSA和VIGOR,分別代表了空間對(duì)齊和非對(duì)齊設(shè)置

評(píng)估度量:在top-k召回準(zhǔn)確率,表示為“R@k”,基于每個(gè)查詢的余弦相似度檢索嵌入空間中的k個(gè)最近參考鄰居,如果地面真實(shí)參考圖像出現(xiàn)在前k個(gè)檢索圖像中,則認(rèn)為其正確。

預(yù)測(cè)GPS位置和地面真實(shí)GPS位置之間的真實(shí)世界距離作為VIGOR數(shù)據(jù)集上的米級(jí)別的評(píng)估。

命中率,即覆蓋查詢圖像(包括地面真相)的前1個(gè)檢索參考圖像的百分比

2600fff8-952a-11ed-bfe3-dac502259ad0.png

26217bf2-952a-11ed-bfe3-dac502259ad0.png

264e90e2-952a-11ed-bfe3-dac502259ad0.png

和之前SOTA方法SAFA在計(jì)算代價(jià)上的比較

26602d3e-952a-11ed-bfe3-dac502259ad0.png

總結(jié):

提出了第一種用于交叉視圖圖像地理定位的純Transformer方法,在對(duì)齊和未對(duì)齊的數(shù)據(jù)集上都實(shí)現(xiàn)了最先進(jìn)的結(jié)果,與基于CNN的方法相比,計(jì)算成本更低。

缺點(diǎn)是使用兩個(gè)管道,且patch選擇簡(jiǎn)單地使用不可通過參數(shù)學(xué)習(xí)的注意力圖。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 圖像
    +關(guān)注

    關(guān)注

    2

    文章

    1096

    瀏覽量

    42340
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1236

    瀏覽量

    26207
  • cnn
    cnn
    +關(guān)注

    關(guān)注

    3

    文章

    355

    瀏覽量

    23431

原文標(biāo)題:CVPR 2022 | TransGeo:第一種用于交叉視圖圖像地理定位的純Transformer方法

文章出處:【微信號(hào):3D視覺工坊,微信公眾號(hào):3D視覺工坊】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    Linux 下交叉編譯實(shí)戰(zhàn):跑起來你的第一個(gè) STM32 程序

    很多開發(fā)者第一次接觸STM32,總會(huì)被“交叉編譯”、“燒錄程序”等概念繞暈。其實(shí)方法很簡(jiǎn)單:在Linux下配置交叉編譯環(huán)境,編寫簡(jiǎn)單程序,然后燒錄到STM32,就可以看到成果了。本文帶
    的頭像 發(fā)表于 11-24 19:04 ?828次閱讀
    Linux 下<b class='flag-5'>交叉</b>編譯實(shí)戰(zhàn):跑起來你的<b class='flag-5'>第一</b>個(gè) STM32 程序

    指令集測(cè)試的一種糾錯(cuò)方法

    本文描述在進(jìn)行指令集測(cè)試的一種糾錯(cuò)方法 1.打開測(cè)試指令集對(duì)應(yīng)的dump文件 dump文件是指由匯編文件進(jìn)行反匯編之后,可以供人閱讀指令的反匯編文件。其包含了每條指令的具體操作的信息。指令集測(cè)試
    發(fā)表于 10-24 14:04

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+第二章 實(shí)現(xiàn)深度學(xué)習(xí)AI芯片的創(chuàng)新方法與架構(gòu)

    、Transformer 模型的后繼者 二、用創(chuàng)新方法實(shí)現(xiàn)深度學(xué)習(xí)AI芯片 1、基于開源RISC-V的AI加速器 RISC-V是一種開源、模塊化的指令集架構(gòu)(ISA)。優(yōu)勢(shì)如下: ①模塊化特性②標(biāo)準(zhǔn)接口③開源
    發(fā)表于 09-12 17:30

    基于 SSID 的 Wi-Fi 定位:與其他定位服務(wù)的性能比較

    一種著名的無線網(wǎng)絡(luò)技術(shù),用于設(shè)備的局域網(wǎng)和互聯(lián)網(wǎng)接入。Wi-Fi 通過 Wi-Fi 網(wǎng)絡(luò)為家庭、辦公室和學(xué)校等環(huán)境提供便捷的無線互聯(lián)網(wǎng)接入服務(wù)。 Wi-Fi 定位一種地理定位功能
    發(fā)表于 08-31 21:01

    一種新的無刷直流電機(jī)反電動(dòng)勢(shì)檢測(cè)方法

    無位置傳感器無刷直流電機(jī)的控制算法是近年來研究的熱點(diǎn)之,有霍爾位置信號(hào)直流電機(jī)根據(jù)霍爾狀態(tài)來確定通斷功率器件。利用無刷直流電機(jī)的數(shù)學(xué)模型,根據(jù)反電動(dòng)勢(shì)檢測(cè)原理,提出了一種新的線反電動(dòng)勢(shì)檢測(cè)方法
    發(fā)表于 08-07 14:29

    基于硬件的無位置傳感器無刷直流電機(jī)啟動(dòng)新方法

    針對(duì)傳統(tǒng)的無位置傳感器無刷直流電機(jī)控制的起動(dòng)需采用復(fù)雜的軟件、成本高、定位不準(zhǔn)確、容易堵轉(zhuǎn)的缺陷,提出了一種通過檢測(cè)線電壓差獲得轉(zhuǎn)子位置的方法。提出的方法能在2%的額定轉(zhuǎn)速下準(zhǔn)確檢測(cè)到
    發(fā)表于 08-07 13:30

    一種永磁同步電機(jī)轉(zhuǎn)子位置傳感器零位偏差高精度測(cè)量方法

    電勢(shì)模型的基礎(chǔ)上,結(jié)合旋轉(zhuǎn)變壓器解碼數(shù)據(jù),提出了一種通過拖動(dòng)電機(jī)被動(dòng)轉(zhuǎn)動(dòng),測(cè)量電機(jī)繞組反電勢(shì)及旋變解碼數(shù)據(jù)高位信號(hào)的零位偏差直接測(cè)量方法。實(shí)驗(yàn)表明該方法具有測(cè)試方法簡(jiǎn)單、測(cè)量精度高等特
    發(fā)表于 08-04 15:01

    一種新的無刷直流電機(jī)反電動(dòng)勢(shì)檢測(cè)方法

    無位置傳感器無刷直流電機(jī)的控制算法是近年來研究的熱點(diǎn)之,有霍爾位置信號(hào)直流電機(jī)根據(jù)霍爾狀態(tài)來確定通斷功率器件。利用無刷直流電機(jī)的數(shù)學(xué)模型,根據(jù)反電動(dòng)勢(shì)檢測(cè)原理,提出了一種新的線反電動(dòng)勢(shì)檢測(cè)方法
    發(fā)表于 08-04 14:59

    一種基于PWM的電壓輸出DAC電路設(shè)計(jì)

    誤差的方法,論文給出了兩從PWM到0~5V電壓輸出的電路實(shí)現(xiàn)方法,第2電路具有很高的轉(zhuǎn)換精度。 分享帖,點(diǎn)擊下方附件免費(fèi)獲取完整資
    發(fā)表于 08-04 14:58

    一種帶通濾波器在無位置傳感器轉(zhuǎn)子檢測(cè)中的應(yīng)用

    摘 要:論文研究了一種直流無刷電機(jī)的無位置傳感器的轉(zhuǎn)子位置的硬件電路檢測(cè)方法。結(jié)合傳統(tǒng)“反電動(dòng)勢(shì)\"方法,分析并設(shè)計(jì)了一種新的帶通濾波器延時(shí)檢測(cè)電路。該電路不僅可以抑制高頻分量和消除直
    發(fā)表于 08-04 14:56

    用于電機(jī)控制的電流濾波方法

    分享帖,需要者可點(diǎn)擊附件免費(fèi)獲取完整資料~~~*附件:適用于電機(jī)控制的電流濾波方法.pdf【免責(zé)聲明】本文系網(wǎng)絡(luò)轉(zhuǎn)載,版權(quán)歸原作者所有。本文所用視頻、圖片、文字如涉及作品版權(quán)問題,請(qǐng)第一
    發(fā)表于 06-18 16:04

    電源效率測(cè)量方法

    本課程講義用于將向大家介紹測(cè)量開關(guān)電源 轉(zhuǎn)換效率的兩不同方法。 第一種方法使用個(gè)瓦特表和兩個(gè)萬用表; 第二
    發(fā)表于 05-12 16:13

    Wi-Fi 定位服務(wù)

    Wi-Fi 是一種著名的無線網(wǎng)絡(luò)技術(shù),用于設(shè)備的局域網(wǎng)和互聯(lián)網(wǎng)接入。Wi-Fi 通過 Wi-Fi 網(wǎng)絡(luò)為家庭、辦公室和學(xué)校等環(huán)境提供便捷的無線互聯(lián)網(wǎng)接入服務(wù)。 Wi-Fi 定位一種地理定位
    發(fā)表于 04-17 15:01

    AI驅(qū)動(dòng)的板載地理定位-由瑞蘇盈科FPGA SoM加速!

    在當(dāng)今數(shù)字化與智能化深度融合的時(shí)代,地理定位技術(shù)作為連接虛擬數(shù)字世界與現(xiàn)實(shí)物理空間的關(guān)鍵紐帶,其重要性與日俱增。從人們?nèi)粘J褂玫某鲂袑?dǎo)航APP,到關(guān)乎國家安全的軍事國防應(yīng)用,從商業(yè)領(lǐng)域精準(zhǔn)的市場(chǎng)營銷
    的頭像 發(fā)表于 04-11 09:04 ?735次閱讀
    AI驅(qū)動(dòng)的板載<b class='flag-5'>地理定位</b>-由瑞蘇盈科FPGA SoM加速!

    一種永磁電機(jī)用轉(zhuǎn)子組件制作方法

    。 本文著重闡述了這種電機(jī)轉(zhuǎn)子使用膠粘劑對(duì)磁鋼和芯軸直接粘接的制造方法,不需要進(jìn)行同軸度機(jī)加工,并為這種制造方法提供了一種自動(dòng)調(diào)心定位機(jī)構(gòu);并研究了磁鋼零件的同軸度與產(chǎn)品最終裝配后組件
    發(fā)表于 03-25 15:20