91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

MG-SLAM:融合結(jié)構(gòu)化線特征優(yōu)化高斯SLAM算法

3D視覺工坊 ? 來源:計(jì)算機(jī)視覺工坊 ? 2024-11-11 16:17 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

0. 這篇文章干了啥?

同步定位與地圖構(gòu)建 (SLAM) 是計(jì)算機(jī)視覺中的一個(gè)基本問題,旨在在同時(shí)跟蹤相機(jī)姿勢的同時(shí)對環(huán)境進(jìn)行地圖構(gòu)建?;趯W(xué)習(xí)的密集 SLAM 方法,尤其是神經(jīng)輻射場 (NeRF) 方法,在捕獲密集光度信息和提供準(zhǔn)確的全局重建方面表現(xiàn)出顯著的進(jìn)步,而傳統(tǒng)系統(tǒng)則基于稀疏點(diǎn)云或體素。然而,NeRF 方法仍然存在過度平滑、場景表示受限和計(jì)算效率低下等缺點(diǎn)。最近,基于高斯的 SLAM已成為一種利用體積輻射場的有前途的方法。利用顯式 3D 高斯表示,高斯 SLAM 可提供高保真渲染和細(xì)粒度場景重建,從而克服了基于 NeRF 的方法的局限性。

盡管高斯 SLAM 具有優(yōu)勢,但它在室內(nèi)場景中仍面臨顯著挑戰(zhàn),因?yàn)槭覂?nèi)場景通常以無紋理表面和復(fù)雜的空間布局為特征。這些環(huán)境由于缺乏相機(jī)姿勢優(yōu)化所必需的足夠紋理細(xì)節(jié)而阻礙了穩(wěn)健的跟蹤。此外,由于遮擋或視野覆蓋有限,室內(nèi)場景的復(fù)雜幾何形狀通常會(huì)導(dǎo)致大量未觀察到的區(qū)域。這些看不見的區(qū)域?qū)Ω咚?SLAM 構(gòu)成了關(guān)鍵但尚未探索的挑戰(zhàn),因?yàn)楦咚贡硎竞茈y在沒有多視圖優(yōu)化的情況下插入未觀察到的幾何形狀。因此,地圖上看不見的區(qū)域留下了大量的漏洞和空白,這個(gè)問題在以前的高斯 SLAM 研究中基本上被忽視了。

為了克服這些挑戰(zhàn),我們利用著名的曼哈頓世界假設(shè)作為細(xì)化和完成場景幾何圖形的基礎(chǔ)策略。該假設(shè)認(rèn)為,構(gòu)建的環(huán)境主要遵循網(wǎng)格狀結(jié)構(gòu),表面和線條與三個(gè)正交方向?qū)R。這些線條和平面對高斯 SLAM 系統(tǒng)中的跟蹤和映射過程施加了有意義的約束。具體來說,我們涵蓋了跟蹤、映射和場景完成方面的增強(qiáng)。在跟蹤中,我們利用從結(jié)構(gòu)化場景中得出的線特征作為無紋理區(qū)域中的穩(wěn)健特征基礎(chǔ),對這些線段進(jìn)行反向投影和重新投影以進(jìn)行姿勢優(yōu)化和全束調(diào)整。在映射中,我們對重新投影的線特征應(yīng)用光度損失來細(xì)化地圖。這種方法確保重建的場景緊密遵循環(huán)境的真實(shí)結(jié)構(gòu),從而提高其幾何精度和渲染質(zhì)量。此外,曼哈頓世界假設(shè)有助于識(shí)別和插值結(jié)構(gòu)化表面,例如地板和天花板。這些平面對于定義空間的整體幾何形狀至關(guān)重要,但在捕獲的視圖中通常會(huì)被部分遮擋或缺失。通過分割這些不完整的表面(通過提取的線作為邊界進(jìn)行細(xì)化),我們可以通過生成新的高斯函數(shù)來預(yù)測它們在直接觀察到的部分之外的延續(xù)。這種策略使我們能夠優(yōu)化場景中大表面的表示,從而增強(qiáng)渲染地圖的完整性。最后,我們通過泊松重構(gòu)合并正則化項(xiàng),將高斯表示壓縮為網(wǎng)格表面。這種方法能夠提取以前在高斯 SLAM 系統(tǒng)中無法獲得的高質(zhì)量網(wǎng)格,使其隨時(shí)可用于下游任務(wù)。

下面一起來閱讀一下這項(xiàng)工作~

1. 論文信息

標(biāo)題:Structure Gaussian SLAM with Manhattan World Hypothesis

作者:Shuhong Liu, Heng Zhou, Liuzhuozheng Li, Yun Liu, Tianchen Deng, Yiming Zhou, Mingrui Li

機(jī)構(gòu):東京大學(xué)、哥倫比亞大學(xué)、國家信息學(xué)研究所、上海交通大學(xué)、薩爾州應(yīng)用科學(xué)大學(xué)、大連理工大學(xué)

原文鏈接:https://arxiv.org/abs/2405.20031v1

2. 摘要

高斯 SLAM 系統(tǒng)在提高實(shí)時(shí)重建的效率和保真度方面取得了重大進(jìn)展。然而,這些系統(tǒng)在復(fù)雜的室內(nèi)環(huán)境中經(jīng)常會(huì)遇到不完整的重建,其特點(diǎn)是由于障礙物或有限的視角導(dǎo)致未觀察到的幾何形狀而產(chǎn)生大量空洞。為了應(yīng)對這一挑戰(zhàn),我們提出了曼哈頓高斯 SLAM (MG-SLAM),這是一個(gè)利用曼哈頓世界假設(shè)來提高幾何準(zhǔn)確性和完整性的 RGB-D 系統(tǒng)。通過無縫集成來自結(jié)構(gòu)化場景的融合線段,MG-SLAM 可確保在無紋理的室內(nèi)區(qū)域中進(jìn)行穩(wěn)健的跟蹤。此外,提取的線和平面假設(shè)允許在缺失幾何形狀的區(qū)域中戰(zhàn)略性地插入新的高斯函數(shù),從而實(shí)現(xiàn)高效的場景完成。在合成場景和真實(shí)世界場景上進(jìn)行的大量實(shí)驗(yàn)表明,這些進(jìn)步使我們的方法能夠?qū)崿F(xiàn)最先進(jìn)的性能,標(biāo)志著高斯 SLAM 系統(tǒng)功能的顯著提升。

3. 效果展示

MG-SLAM 利用線段在相機(jī)姿態(tài)估計(jì)和場景重建方面實(shí)現(xiàn) SOTA 結(jié)果。此外,通過應(yīng)用結(jié)構(gòu)表面約束,我們通過對缺失的幾何體進(jìn)行新的高斯插值來增強(qiáng)和完善場景。

10f385ec-9053-11ef-a511-92fbcf53809c.png

在Replica Apartment 數(shù)據(jù)集場景 frl_apartment_4 上的線段提取結(jié)果的消融實(shí)驗(yàn)。

113851ea-9053-11ef-a511-92fbcf53809c.png

4. 主要貢獻(xiàn)

? 我們提出了 MG-SLAM,這是一種新穎的 RGB-D 高斯 SLAM 系統(tǒng),它利用了曼哈頓世界假設(shè) [5]。該假設(shè)引入了線和平面,用于神經(jīng)密集型 SLAM 系統(tǒng)的穩(wěn)健跟蹤、地圖細(xì)化和表面補(bǔ)全。

? 我們使用提取的代表平面邊界的線段建立假設(shè)表面。這些表面指導(dǎo)我們有效地插入新的高斯函數(shù)來填補(bǔ)重建地圖中的間隙和空洞,無縫解決當(dāng)前高斯 SLAM 系統(tǒng)由于未觀察到的幾何形狀而面臨限制的區(qū)域。

? 在大型合成和真實(shí)世界數(shù)據(jù)集上進(jìn)行的大量實(shí)驗(yàn)表明,我們的系統(tǒng)提供了最先進(jìn)的 (SOTA) 跟蹤和全面的地圖重建,在真實(shí)世界場景中實(shí)現(xiàn)了 ATE 降低 50% 和 PSNR 增強(qiáng) 5dB,同時(shí)以極高的幀速率運(yùn)行。這些進(jìn)步明顯優(yōu)于以前的高斯 SLAM 系統(tǒng)。

5. 基本原理是啥?

所提出的 MG-SLAM 的兩階段流水線圖示。上部可視化了跟蹤和建圖系統(tǒng)的并行過程。下部展示了場景完成和網(wǎng)格提取的后優(yōu)化。在曼哈頓世界假設(shè)的約束下,MG-SLAM 引入了線段和結(jié)構(gòu)化表面來增強(qiáng)相機(jī)姿態(tài)估計(jì)和地圖重建。我們利用一種特定的策略來融合線段,以確??煽康刈R(shí)別線特征。高斯表示,包括專用于線段重建的專用損失項(xiàng)。

115f94f8-9053-11ef-a511-92fbcf53809c.png

6. 實(shí)驗(yàn)結(jié)果

使用表 1 中的 ScanNet 數(shù)據(jù)集和Replica-V1 數(shù)據(jù)集對重建質(zhì)量進(jìn)行了定量評(píng)估。我們的方法提供了 SOTA 結(jié)果,在兩個(gè)數(shù)據(jù)集上的 PSNR 均顯著優(yōu)于其他基于高斯的方法 4dB。跟蹤評(píng)估結(jié)果如表 2 所示。我們的方法顯著降低了 ATE RMSE(cm)誤差,比高斯基線提高了 50%。此外,得益于我們的線融合策略,MG-SLAM 還表現(xiàn)出優(yōu)于傳統(tǒng) SLAM 系統(tǒng)的跟蹤性能。

1190cc76-9053-11ef-a511-92fbcf53809c.png

11c6c948-9053-11ef-a511-92fbcf53809c.png

為了評(píng)估系統(tǒng)在大型室內(nèi)環(huán)境中的穩(wěn)健性,我們在 Replica Apartment 數(shù)據(jù)集上評(píng)估了 MG-SLAM。該數(shù)據(jù)集包含廣泛的多房間場景、復(fù)雜的物體幾何形狀和跨房間的循環(huán)軌跡。表 3 展示了我們的方法與 SplaTAM和 MonoGS在五個(gè)選定場景中的渲染質(zhì)量對比。MG-SLAM 在這些基線上顯示出顯著的改進(jìn),特別是在具有兩層八室布局的廣泛公寓 0 場景中實(shí)現(xiàn)了 7dB 的改進(jìn)。這種最佳性能主要?dú)w功于融合線段的加入,這為環(huán)路閉合和姿勢優(yōu)化奠定了堅(jiān)實(shí)的基礎(chǔ)。圖 5 展示了公寓場景的新視圖渲染結(jié)果。我們的方法在幾何精度和精細(xì)細(xì)節(jié)豐富度方面比高斯基線有顯著的增強(qiáng)。

11fce0dc-9053-11ef-a511-92fbcf53809c.png

12294866-9053-11ef-a511-92fbcf53809c.png

7. 總結(jié)

在本研究中,我們提出了 MG-SLAM,這是一種基于曼哈頓世界假設(shè)的高斯 SLAM 方法。MG-SLAM 采用線段進(jìn)行穩(wěn)健的姿態(tài)估計(jì)和地圖細(xì)化。此外,通過利用線段和平面假設(shè),我們可以在缺失幾何的間隙上有效地插入新的高斯函數(shù)。大量實(shí)驗(yàn)表明,我們的方法提供了最先進(jìn)的跟蹤和映射性能。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 結(jié)構(gòu)化
    +關(guān)注

    關(guān)注

    0

    文章

    27

    瀏覽量

    10466
  • SLAM算法
    +關(guān)注

    關(guān)注

    0

    文章

    11

    瀏覽量

    2685

原文標(biāo)題:GS SLAM最新SOTA!MG-SLAM:使用結(jié)構(gòu)化線特征提升高斯SLAM

文章出處:【微信號(hào):3D視覺工坊,微信公眾號(hào):3D視覺工坊】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    什么是激光雷達(dá) 3D SLAM技術(shù)?

    在智能移動(dòng)設(shè)備自主運(yùn)行的賽道上,激光雷達(dá)3DSLAM技術(shù)正成為破局關(guān)鍵,但多數(shù)人對其認(rèn)知仍停留在表層。要讀懂這一核心技術(shù),不妨先回溯“SLAM”的本質(zhì)——SLAM
    的頭像 發(fā)表于 12-02 19:23 ?583次閱讀
    什么是激光雷達(dá) 3D <b class='flag-5'>SLAM</b>技術(shù)?

    FPGA和GPU加速的視覺SLAM系統(tǒng)中特征檢測器研究

    特征檢測是SLAM系統(tǒng)中常見但耗時(shí)的模塊,隨著SLAM技術(shù)日益廣泛應(yīng)用于無人機(jī)等功耗受限平臺(tái),其效率優(yōu)化尤為重要。本文首次針對視覺SLAM
    的頭像 發(fā)表于 10-31 09:30 ?660次閱讀
    FPGA和GPU加速的視覺<b class='flag-5'>SLAM</b>系統(tǒng)中<b class='flag-5'>特征</b>檢測器研究

    自動(dòng)駕駛中如何將稀疏地圖與視覺SLAM相結(jié)合?

    [首發(fā)于智駕最前沿微信公眾號(hào)]在自動(dòng)駕駛場景中,稀疏地圖通常是由一系列關(guān)鍵幀和若干三維稀疏特征點(diǎn)構(gòu)成的地圖,每個(gè)特征點(diǎn)包含三維坐標(biāo)和描述外觀的描述子;而視覺SLAM是運(yùn)行在車輛上的實(shí)時(shí)算法
    的頭像 發(fā)表于 10-28 09:07 ?684次閱讀
    自動(dòng)駕駛中如何將稀疏地圖與視覺<b class='flag-5'>SLAM</b>相結(jié)合?

    全新輕量級(jí)ViSTA-SLAM系統(tǒng)介紹

    無需相機(jī)內(nèi)參、極致輕量的前端(前端模型大小僅為同類35%),實(shí)時(shí)單目視覺SLAM,ViSTA-SLAM。與現(xiàn)有方法相比,ViSTA-SLAM不僅更輕、更快,在相機(jī)跟蹤和密集3D重建質(zhì)量方面也均表現(xiàn)出色。
    的頭像 發(fā)表于 09-22 15:53 ?920次閱讀
    全新輕量級(jí)ViSTA-<b class='flag-5'>SLAM</b>系統(tǒng)介紹

    一種適用于動(dòng)態(tài)環(huán)境的自適應(yīng)先驗(yàn)場景-對象SLAM框架

    由于傳統(tǒng)視覺SLAM在動(dòng)態(tài)場景中容易會(huì)出現(xiàn)嚴(yán)重的定位漂移,本文提出了一種新穎的基于場景-對象的可靠性評(píng)估框架,該框架通過當(dāng)前幀質(zhì)量指標(biāo)以及相對于可靠參考幀的場景變化,全面評(píng)估SLAM的穩(wěn)定性。
    的頭像 發(fā)表于 08-19 14:17 ?873次閱讀
    一種適用于動(dòng)態(tài)環(huán)境的自適應(yīng)先驗(yàn)場景-對象<b class='flag-5'>SLAM</b>框架

    UWB自動(dòng)跟隨技術(shù)原理、算法融合優(yōu)化和踩坑實(shí)錄

    UWB為什么是最靠譜的自動(dòng)跟隨技術(shù)?原理是什么?需要做什么算法融合、優(yōu)化?我們在開發(fā)過程中踩過的坑。
    的頭像 發(fā)表于 08-14 17:45 ?1541次閱讀
    UWB自動(dòng)跟隨技術(shù)原理、<b class='flag-5'>算法</b><b class='flag-5'>融合</b><b class='flag-5'>優(yōu)化</b>和踩坑實(shí)錄

    基于深度學(xué)習(xí)的增強(qiáng)版ORB-SLAM3詳解

    ORB-SLAM3雖是當(dāng)前最先進(jìn)的SLAM之一,但由于使用傳統(tǒng)的ORB(定向FAST和旋轉(zhuǎn)BRIEF)特征,在尺度、旋轉(zhuǎn)和光照發(fā)生顯著變化時(shí)可能會(huì)表現(xiàn)出局限性。
    的頭像 發(fā)表于 07-14 17:21 ?1698次閱讀
    基于深度學(xué)習(xí)的增強(qiáng)版ORB-<b class='flag-5'>SLAM</b>3詳解

    一種適用于動(dòng)態(tài)環(huán)境的實(shí)時(shí)RGB-D SLAM系統(tǒng)

    近期用于視覺SLAM的3D高斯潑濺(3DGS)技術(shù)在跟蹤和高保真建圖方面取得了顯著進(jìn)展。然而,其順序優(yōu)化框架以及對動(dòng)態(tài)物體的敏感性限制了其在現(xiàn)實(shí)場景中的實(shí)時(shí)性能和魯棒性。為此,我們提出
    的頭像 發(fā)表于 07-04 15:14 ?1288次閱讀
    一種適用于動(dòng)態(tài)環(huán)境的實(shí)時(shí)RGB-D <b class='flag-5'>SLAM</b>系統(tǒng)

    一種適用于動(dòng)態(tài)環(huán)境的3DGS-SLAM系統(tǒng)

    當(dāng)前基于神經(jīng)輻射場(NeRF)或3D高斯潑濺(3DGS)的SLAM方法在重建靜態(tài)3D場景方面表現(xiàn)出色,但在動(dòng)態(tài)環(huán)境中的跟蹤和重建方面卻面臨著挑戰(zhàn)。
    的頭像 發(fā)表于 06-13 10:10 ?1389次閱讀
    一種適用于動(dòng)態(tài)環(huán)境的3DGS-<b class='flag-5'>SLAM</b>系統(tǒng)

    三維高斯潑濺大規(guī)模視覺SLAM系統(tǒng)解析

    近期興起的神經(jīng)輻射場(NeRF)與三維高斯潑濺(3DGS)技術(shù)在視覺SLAM中展現(xiàn)出令人鼓舞的突破性成果。然而,當(dāng)前主流方法多依賴RGBD傳感器,并且僅適用于室內(nèi)環(huán)境。在大規(guī)模室外場景中的重建魯棒性
    的頭像 發(fā)表于 05-27 14:13 ?1567次閱讀
    三維<b class='flag-5'>高斯</b>潑濺大規(guī)模視覺<b class='flag-5'>SLAM</b>系統(tǒng)解析

    基于高斯的稠密視覺SLAM研究

    基于高斯的場景表示在新視角下會(huì)出現(xiàn)幾何失真,這大大降低了基于高斯的跟蹤方法的準(zhǔn)確性。這些幾何不一致主要源于高斯基元的深度建模以及在深度融合過程中表面之間的相互干擾。為了解決這些問題,我
    的頭像 發(fā)表于 05-15 10:36 ?1076次閱讀
    基于<b class='flag-5'>高斯</b>的稠密視覺<b class='flag-5'>SLAM</b>研究

    【「# ROS 2智能機(jī)器人開發(fā)實(shí)踐」閱讀體驗(yàn)】視覺實(shí)現(xiàn)的基礎(chǔ)算法的應(yīng)用

    SLAM結(jié)構(gòu)化環(huán)境中更穩(wěn)定,而視覺SLAM(如ORB-SLAM3)更適合動(dòng)態(tài)場景。 SLAM Toolbox的實(shí)踐應(yīng)用
    發(fā)表于 05-03 19:41

    【「# ROS 2智能機(jī)器人開發(fā)實(shí)踐」閱讀體驗(yàn)】+ROS2應(yīng)用案例

    方法,包括SLAM Toolbox的使用。 通過學(xué)習(xí)這一部分,我了解到SLAM的基本原理,包括特征提取、特征匹配、地圖構(gòu)建和定位等關(guān)鍵步驟。書中還介紹了如何在ROS 2中使用
    發(fā)表于 04-27 11:42

    一種基于點(diǎn)、和消失點(diǎn)特征的單目SLAM系統(tǒng)設(shè)計(jì)

    本文提出了一種穩(wěn)健的單目視覺SLAM系統(tǒng),該系統(tǒng)同時(shí)利用點(diǎn)、和消失點(diǎn)特征來進(jìn)行精確的相機(jī)位姿估計(jì)和地圖構(gòu)建,有效解決了傳統(tǒng)基于點(diǎn)特征SLAM
    的頭像 發(fā)表于 03-21 17:07 ?1050次閱讀
    一種基于點(diǎn)、<b class='flag-5'>線</b>和消失點(diǎn)<b class='flag-5'>特征</b>的單目<b class='flag-5'>SLAM</b>系統(tǒng)設(shè)計(jì)

    工業(yè)4.0革命利器!明遠(yuǎn)智睿SSD2351核心板:低成本+高算力,破解產(chǎn)智能難題

    力: 算力突破: 四核A35主頻1.5GHz,支持Neon/FPU加速,并行處理PLC控制指令與視覺算法; IVE引擎實(shí)現(xiàn)高斯濾波、形態(tài)學(xué)運(yùn)算(膨脹/腐蝕)硬件加速,圖像預(yù)處理效率提升5倍
    發(fā)表于 03-21 14:22