91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一種全新開源SfM框架MASt3R

3D視覺工坊 ? 來源:3D視覺工坊 ? 2024-10-28 14:13 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

來源:3D視覺工坊

1. 導(dǎo)讀

運(yùn)動(dòng)重建(SfM)是一項(xiàng)在給定一組圖像的情況下聯(lián)合恢復(fù)相機(jī)姿態(tài)和場景三維幾何的任務(wù),盡管取得了幾十年的重大進(jìn)展,但仍然是一個(gè)具有許多開放挑戰(zhàn)的難題。SfM的傳統(tǒng)解決方案由復(fù)雜的最小解算器流水線組成,當(dāng)圖像沒有充分重疊、運(yùn)動(dòng)過少等時(shí),該流水線容易傳播錯(cuò)誤并失敗。最近的方法試圖重新審視這一范式,但我們的經(jīng)驗(yàn)表明,他們沒有解決這些核心問題。在本文中,我們提出在最近發(fā)布的3D視覺基礎(chǔ)模型上構(gòu)建,該模型可以魯棒地產(chǎn)生局部3D重建和精確匹配。我們引入了一種低內(nèi)存的方法來精確地對(duì)齊全局坐標(biāo)系中的這些局部重建。我們進(jìn)一步表明,這種基礎(chǔ)模型可以作為有效的圖像檢索器,而沒有任何開銷,將整體復(fù)雜性從二次降低到線性??偟膩碚f,我們的新型SfM流水線是簡單的、可擴(kuò)展的、快速的和真正不受約束的,也就是說,它可以處理任何有序或不有序的圖像集合。在多個(gè)基準(zhǔn)上的大量實(shí)驗(yàn)表明,我們的方法在不同的設(shè)置上提供了穩(wěn)定的性能,特別是在中小規(guī)模的設(shè)置上優(yōu)于現(xiàn)有的方法。

2. 引言

運(yùn)動(dòng)恢復(fù)結(jié)構(gòu)(SfM)是計(jì)算機(jī)視覺領(lǐng)域一個(gè)長期存在的問題,旨在根據(jù)每個(gè)相機(jī)拍攝的圖像來估計(jì)場景的3D幾何結(jié)構(gòu)以及觀測該場景的相機(jī)的參數(shù)。由于它方便地同時(shí)為相機(jī)和地圖提供信息,因此構(gòu)成了許多實(shí)用計(jì)算機(jī)視覺應(yīng)用的重要組成部分,如導(dǎo)航(包括地圖繪制和視覺定位)、密集多視圖立體重建(MVS)、新視角合成、自校準(zhǔn)甚至考古學(xué)。

實(shí)際上,SfM是一個(gè)“大海撈針”式的問題,通常涉及高度非凸的目標(biāo)函數(shù),存在許多局部最小值。由于在這種情況下找到全局最小值直接實(shí)現(xiàn)起來過于困難,因此傳統(tǒng)的SfM方法,如COLMAP,將問題分解為一系列(或流程)最小問題,例如關(guān)鍵點(diǎn)提取與匹配、相對(duì)姿態(tài)估計(jì)以及通過三角測量和捆綁調(diào)整實(shí)現(xiàn)的增量重建。異常值(如錯(cuò)誤的像素匹配)的存在帶來了額外的挑戰(zhàn),迫使現(xiàn)有方法在流程中的多個(gè)環(huán)節(jié)反復(fù)進(jìn)行假設(shè)的提出和驗(yàn)證,通常使用隨機(jī)抽樣一致算法(RANSAC)或其多種變體。這種方法幾十年來一直是標(biāo)準(zhǔn)做法,但它仍然很脆弱,當(dāng)輸入圖像重疊不足或視點(diǎn)之間的運(yùn)動(dòng)(即平移)不足時(shí),就會(huì)失效。

最近,一系列創(chuàng)新方法提出重新審視SfM,以減輕傳統(tǒng)流程的復(fù)雜性和解決其缺點(diǎn)。例如,VGGSfM引入了一種端到端的可微版本流程,簡化了其中的一些組件。同樣,無檢測器SfM用學(xué)習(xí)到的組件替換了經(jīng)典流程中的關(guān)鍵點(diǎn)提取和匹配步驟。然而,這些變化必須放在適當(dāng)?shù)谋尘跋驴紤],因?yàn)樗鼈儾]有從根本上挑戰(zhàn)傳統(tǒng)流程的整體結(jié)構(gòu)。相比之下,F(xiàn)lowMap和Ace-Zero分別提出了一種全新的解決SfM問題的方法,該方法基于全局損失函數(shù)的簡單一階梯度下降。它們的訣竅是在場景優(yōu)化過程中訓(xùn)練一個(gè)幾何回歸網(wǎng)絡(luò),作為重新參數(shù)化和正則化場景幾何結(jié)構(gòu)的一種方式。不幸的是,這種方法僅在特定配置下有效,即對(duì)于重疊度高且光照變化小的輸入圖像。最后,DUSt3R證明,單個(gè)Transformer架構(gòu)的前向傳遞就可以很好地估計(jì)出一個(gè)小型雙圖像場景的幾何結(jié)構(gòu)和相機(jī)參數(shù)。這些特別穩(wěn)健的估計(jì)然后可以使用簡單的梯度下降再次拼接在一起,從而放寬了前面提到的許多約束。然而,它產(chǎn)生的全局SfM重建結(jié)果相當(dāng)不準(zhǔn)確,且擴(kuò)展性不好。

在本文中,我們提出了MASt3R-SfM,這是一個(gè)完全集成的SfM流程,能夠處理完全不受約束的輸入圖像集合,即從單個(gè)視圖到大規(guī)模場景,甚至可能沒有相機(jī)運(yùn)動(dòng),如圖1所示。我們?cè)谧罱l(fā)布的DUSt3R(一個(gè)3D視覺的基礎(chǔ)模型)的基礎(chǔ)上構(gòu)建,特別是其最近的擴(kuò)展MASt3R,它能夠在單個(gè)前向傳遞中執(zhí)行局部3D重建和匹配。由于MASt3R從根本上僅限于處理圖像對(duì),因此它在大規(guī)模圖像集合上的擴(kuò)展性很差。為了解決這個(gè)問題,我們利用其凍結(jié)的編碼器進(jìn)行快速圖像檢索,計(jì)算開銷可忽略不計(jì),從而得到了一種具有圖像數(shù)量準(zhǔn)線性復(fù)雜度的可擴(kuò)展SfM方法。由于MASt3R對(duì)異常值具有魯棒性,因此所提出的方法能夠完全擺脫RANSAC。SfM優(yōu)化基于MASt3R輸出的凍結(jié)局部重建結(jié)果,通過兩次連續(xù)的梯度下降進(jìn)行:首先,使用3D空間中的匹配損失;然后使用2D重投影損失來細(xì)化先前的估計(jì)。

3. 效果展示

有趣的是,我們的方法超越了運(yùn)動(dòng)恢復(fù)結(jié)構(gòu),因?yàn)樗跊]有運(yùn)動(dòng)(即純旋轉(zhuǎn)情況)時(shí)也能工作,如圖1所示。

上圖:使用隨機(jī)子采樣改變輸入視圖數(shù)量時(shí)CO3Dv2數(shù)據(jù)集的相對(duì)旋轉(zhuǎn)(RRA)和平移(RTA)精度(視圖越多,重疊越大)。與我們的競爭對(duì)手相比,MASt3R-SfM在整個(gè)范圍內(nèi)提供了幾乎恒定的性能,即使是很少的視圖。下圖:MASt3R-SfM也可以在沒有運(yùn)動(dòng)的情況下工作,即在純旋轉(zhuǎn)設(shè)置下工作。我們?cè)谶@里展示了共享同一個(gè)光學(xué)中心的6個(gè)視圖的重建。推薦課程:為什么說colmap仍然是三維重建的核心?

8b1e5d56-94db-11ef-a511-92fbcf53809c.png

4. 主要貢獻(xiàn)

我們做出了三項(xiàng)主要貢獻(xiàn)。首先,我們提出了MASt3R-SfM,這是一個(gè)功能完備的SfM流程,能夠處理不受約束的圖像集合。其次,為了實(shí)現(xiàn)圖像數(shù)量的線性復(fù)雜度,我們展示了如何利用MASt3R的編碼器進(jìn)行大規(guī)模圖像檢索,這是我們的第二項(xiàng)貢獻(xiàn)。請(qǐng)注意,只要提供現(xiàn)成的MASt3R檢查點(diǎn),我們的整個(gè)SfM流程就無需訓(xùn)練。最后,我們?cè)谝幌盗胁煌臄?shù)據(jù)集上進(jìn)行了廣泛的基準(zhǔn)測試,結(jié)果表明,盡管取得了顯著進(jìn)展,但現(xiàn)有方法在小規(guī)模設(shè)置中仍然容易失敗。相比之下,如圖1所示,MASt3R-SfM在多種條件下均表現(xiàn)出最先進(jìn)的性能。

5. 方法

我們提出了一種新穎的大規(guī)模3D重建方法,該方法包括圖2中概述的四個(gè)步驟。首先,我們使用高效且可擴(kuò)展的圖像檢索技術(shù)構(gòu)建共視圖。該圖的邊連接可能重疊的圖像對(duì)。其次,我們使用MASt3R對(duì)該圖的每條邊進(jìn)行成對(duì)局部3D重建和匹配。第三,我們使用3D空間中的匹配損失和梯度下降,將所有局部點(diǎn)圖粗略對(duì)齊到同一世界坐標(biāo)系中。這作為第四步的初始化,在這一步中,我們執(zhí)行第二階段的全局優(yōu)化,這次是最小化2D像素重投影誤差。下面我們將詳細(xì)介紹每個(gè)步驟。

8b3daf44-94db-11ef-a511-92fbcf53809c.png

6. 實(shí)驗(yàn)結(jié)果

8b5ab6ca-94db-11ef-a511-92fbcf53809c.png

8b7d2e30-94db-11ef-a511-92fbcf53809c.png

8b8f2c7a-94db-11ef-a511-92fbcf53809c.png

7. 總結(jié) & 未來工作

我們引入了MASt3R-SfM,這是一種針對(duì)無約束結(jié)構(gòu)從運(yùn)動(dòng)恢復(fù)(Structure from Motion, SfM)的相對(duì)簡單且完全集成的解決方案。

與當(dāng)前存在的SfM流程相比,MASt3R-SfM能夠處理非常小的圖像集合,而不會(huì)出現(xiàn)明顯的問題。得益于我們方法所依賴的底層MASt3R基礎(chǔ)模型中編碼的強(qiáng)先驗(yàn)知識(shí),它甚至可以處理無運(yùn)動(dòng)的情況,并且完全不依賴于隨機(jī)抽樣一致性算法(RANSAC),這兩項(xiàng)特性通常在使用標(biāo)準(zhǔn)基于三角測量的SfM方法中無法實(shí)現(xiàn)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 相機(jī)
    +關(guān)注

    關(guān)注

    5

    文章

    1578

    瀏覽量

    55804
  • 開源
    +關(guān)注

    關(guān)注

    3

    文章

    4207

    瀏覽量

    46144
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3752

    瀏覽量

    52111
  • 計(jì)算機(jī)視覺
    +關(guān)注

    關(guān)注

    9

    文章

    1715

    瀏覽量

    47631

原文標(biāo)題:完虐COLMAP!全新開源SfM框架MASt3R:簡單、快速、可擴(kuò)展的三維重建

文章出處:【微信號(hào):3D視覺工坊,微信公眾號(hào):3D視覺工坊】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    一種開源的NET系統(tǒng)推薦

    。Microsoft .NET Remoting 提供了一種允許對(duì)象通過應(yīng)用程序域與另對(duì)象進(jìn)行交互的框架,一種分布式處理方式。MES(Manufacturing Execution.
    發(fā)表于 07-01 06:20

    如何去實(shí)現(xiàn)一種ThreadX內(nèi)核框架的設(shè)計(jì)呢

    ThreadX內(nèi)核模板框架是怎樣去設(shè)計(jì)的?如何去實(shí)現(xiàn)一種ThreadX內(nèi)核框架的設(shè)計(jì)呢?
    發(fā)表于 11-29 07:08

    一種較通用的界面切換框架分享,絕對(duì)實(shí)用

    一種較通用的界面切換框架分享,絕對(duì)實(shí)用
    發(fā)表于 12-27 06:02

    一種新的Ad Hoc網(wǎng)絡(luò)QoS框架

    提出一種新的Ad Hoc網(wǎng)絡(luò)QoS保障框架。該框架能夠區(qū)分不同優(yōu)先級(jí)的業(yè)務(wù)和不同QoS要求的業(yè)務(wù)。能夠保障在網(wǎng)絡(luò)可用資源不足的情況下,高優(yōu)先級(jí)的業(yè)務(wù)通過“搶占”的方式接入網(wǎng)絡(luò)
    發(fā)表于 04-14 09:43 ?20次下載

    一種成分取證的理論分析模式的分類框架

    一種成分取證的理論分析模式的分類框架
    發(fā)表于 03-20 11:04 ?0次下載

    一種激光雷達(dá)增強(qiáng)的SfM流程

    摘要 盡管運(yùn)動(dòng)恢復(fù)結(jié)構(gòu)(SfM)作為一種成熟的技術(shù)已經(jīng)在許多應(yīng)用中得到了廣泛的應(yīng)用,但現(xiàn)有的SfM算法在某些情況下仍然不夠魯棒。例如,比如圖像通常在近距離拍攝以獲得詳細(xì)的紋理才能更好的重建場景細(xì)節(jié)
    的頭像 發(fā)表于 01-07 13:59 ?3608次閱讀

    一種基于框架特征的共指消解方法

    基于框架語義的推理是實(shí)現(xiàn)語篇理解、冋答系統(tǒng)等任務(wù)中語義理解的一種有效手段,框架語乂推理通過構(gòu)建漢語篇章句子框架之間的聯(lián)系尋找推理路徑,但框架
    發(fā)表于 03-19 11:35 ?7次下載
    <b class='flag-5'>一種</b>基于<b class='flag-5'>框架</b>特征的共指消解方法

    一種新的音樂交互方式開源分享

    電子發(fā)燒友網(wǎng)站提供《一種新的音樂交互方式開源分享.zip》資料免費(fèi)下載
    發(fā)表于 11-03 11:36 ?0次下載
    <b class='flag-5'>一種</b>新的音樂交互方式<b class='flag-5'>開源</b>分享

    Global SfM和ncremental SfM知識(shí)講解

    Sfm 可以分為以下幾類:Global SfM、Incremental SfM、Hybrid SfM、Distributed SfM,這里主
    的頭像 發(fā)表于 12-30 09:16 ?3147次閱讀

    一種火災(zāi)報(bào)警系統(tǒng)開源分享

    電子發(fā)燒友網(wǎng)站提供《一種火災(zāi)報(bào)警系統(tǒng)開源分享.zip》資料免費(fèi)下載
    發(fā)表于 02-08 16:15 ?1次下載
    <b class='flag-5'>一種</b>火災(zāi)報(bào)警系統(tǒng)<b class='flag-5'>開源</b>分享

    一種防霉裝置開源設(shè)計(jì)

    電子發(fā)燒友網(wǎng)站提供《一種防霉裝置開源設(shè)計(jì).zip》資料免費(fèi)下載
    發(fā)表于 07-11 16:54 ?0次下載
    <b class='flag-5'>一種</b>防霉裝置<b class='flag-5'>開源</b>設(shè)計(jì)

    基于特征點(diǎn)的SfM在弱紋理場景下的表現(xiàn)

    取圖像中的特征點(diǎn),然后進(jìn)行特征匹配。但是在無紋理?xiàng)l件下,很難提取穩(wěn)定且重復(fù)的特征點(diǎn),這就導(dǎo)致SfM恢復(fù)出的位姿和三維點(diǎn)云非常雜亂。 很直接的個(gè)想法就是,如果不提取特征點(diǎn),直接進(jìn)行匹配呢? 最近,浙江大學(xué)就基于這種思想提出了一種
    的頭像 發(fā)表于 08-21 09:22 ?3407次閱讀
    基于特征點(diǎn)的<b class='flag-5'>SfM</b>在弱紋理場景下的表現(xiàn)

    一種基于MASt3R的實(shí)時(shí)稠密SLAM系統(tǒng)

    本文提出了一種即插即用的單目SLAM系統(tǒng),能夠在15FPS的幀率下生成全局致的位姿和稠密幾何圖形。 01 ? 本文核心內(nèi)容 視覺SLAM乃是當(dāng)今機(jī)器人技術(shù)與增強(qiáng)現(xiàn)實(shí)產(chǎn)品的基礎(chǔ)性構(gòu)建模塊。通過
    的頭像 發(fā)表于 12-27 15:25 ?2760次閱讀

    NVIDIA推出面向語言、機(jī)器人和生物學(xué)的全新開源AI技術(shù)

    NVIDIA 秉持對(duì)開源的長期承諾,推出了面向語言、機(jī)器人和生物學(xué)的全新開源 AI 技術(shù),為構(gòu)建開源生態(tài)系統(tǒng)做出貢獻(xiàn),擴(kuò)展 AI 的普及并推動(dòng)創(chuàng)新。NVIDIA 正將這些模型、數(shù)據(jù)和訓(xùn)練框架
    的頭像 發(fā)表于 11-06 11:49 ?1069次閱讀

    月之暗面全新開源旗艦?zāi)P蚄imi K2.5上線模力方舟

    模力方舟平臺(tái)現(xiàn)已上線來自月之暗面(Moonshot AI)發(fā)布的全新開源旗艦?zāi)P蚄imi K2.5。
    的頭像 發(fā)表于 01-29 10:20 ?882次閱讀
    月之暗面<b class='flag-5'>全新開源</b>旗艦?zāi)P蚄imi K2.5上線模力方舟