91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

英偉達(dá)新方法入選CVPR 2023:對(duì)未知物體的6D姿態(tài)追蹤和三維重建

3D視覺工坊 ? 來源:凹非寺 ? 2023-04-10 11:12 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

普通手機(jī)“隨手”拍的雕像,一下就變成了精細(xì)的三維重建圖。

水杯來回動(dòng)的動(dòng)態(tài)場景下,細(xì)節(jié)清晰可見:

38654f44-d72b-11ed-bfe3-dac502259ad0.gif

靜態(tài)場景效果也同樣nice,狗狗突出的肋骨都被還原了出來:

38743edc-d72b-11ed-bfe3-dac502259ad0.gif

對(duì)比來看其他方法,效果是醬嬸的……

388fbc84-d72b-11ed-bfe3-dac502259ad0.png

這就是英偉達(dá)最新提出的方法BundleSDF。

這是一種可對(duì)未知物體的6D姿態(tài)追蹤和三維重建的方法。

用于從單目RGBD視頻序列中跟蹤未知物體的6自由度運(yùn)動(dòng),同時(shí)進(jìn)行物體的隱式神經(jīng)三維重建,方法接近于實(shí)時(shí)(10Hz)。

這種方法適用于任意剛性物體,即使視覺紋理大部分確實(shí),僅需在第一幀中分割出物體,不需要任何額外的信息,并且不對(duì)智能體與物體的交互模式做任何假設(shè)。

目前,該方法已被CVPR 2023接收。

可處理大幅度姿態(tài)變化、有遮擋視頻

該方法的關(guān)鍵是一個(gè)神經(jīng)物體場,它與姿態(tài)圖優(yōu)化過程同時(shí)進(jìn)行,以便將信息穩(wěn)健地累積到一致的3D表示中,捕捉幾何和外觀。

方法自動(dòng)維護(hù)了一組動(dòng)態(tài)的姿態(tài)內(nèi)存幀,以便這些線程之間進(jìn)行通信。

它能處理具有大幅度姿態(tài)變化、部分和完全遮擋、無紋理表面和高光反射等具有挑戰(zhàn)性的視頻。

作者展示了HO3D、YCBInEOAT和BEHAVE數(shù)據(jù)集上的結(jié)果,證明了我們的方法顯著優(yōu)于現(xiàn)有方法。

野外測試

用于iPhone 12 Pro Max的效果:

38a7c02c-d72b-11ed-bfe3-dac502259ad0.gif

用于Intel RealSense的效果:

38dd70a0-d72b-11ed-bfe3-dac502259ad0.gif

該方法不僅適用于更具挑戰(zhàn)性的動(dòng)態(tài)場景,還適用于此前經(jīng)常被考慮的靜態(tài)場景(移動(dòng)相機(jī))。

因此實(shí)現(xiàn)了比專門設(shè)計(jì)用于靜態(tài)場景的那些方法更好或相當(dāng)?shù)慕Y(jié)果(即文章開頭展示動(dòng)圖)。

391d3c6c-d72b-11ed-bfe3-dac502259ad0.png

與SOTA對(duì)比

HO3D數(shù)據(jù)集上三種最具競爭力方法的定性比較。

左圖:6自由度姿態(tài)跟蹤可視化,其中輪廓(青色)以估計(jì)的姿態(tài)渲染。

值得注意的是,如第二列所示,我們的預(yù)測姿態(tài)有時(shí)甚至?xí)m正GT的錯(cuò)誤。

右圖:每種方法輸出的最終3D重建的正面和背面視圖。

由于手部遮擋,視頻中的某些部分永遠(yuǎn)不可見。雖然從相同的視角渲染網(wǎng)格,但是DROID-SLAM和BundleTrack的顯著漂移導(dǎo)致網(wǎng)格錯(cuò)誤旋轉(zhuǎn)。

3924d4f4-d72b-11ed-bfe3-dac502259ad0.png

定量結(jié)果對(duì)比如下:

3943413c-d72b-11ed-bfe3-dac502259ad0.png

394be404-d72b-11ed-bfe3-dac502259ad0.png

3952cb34-d72b-11ed-bfe3-dac502259ad0.png

問題設(shè)置

給定一段單目RGBD輸入視頻以及僅在第一幀中目標(biāo)物體的分割掩碼,該方法能持續(xù)追蹤物體的6-DoF姿態(tài)并重建物體的3D模型。

所有處理都是在線自回歸的(沒有假設(shè)未來幀可用)。

處理的物體是剛性的,但不依賴其特定豐富的紋理 - 方法適用于無紋理的物體。

此外,不需要物體的實(shí)例級(jí)CAD模型,也不需要物體類別的先驗(yàn)知識(shí)(例如事先對(duì)同一物體類別進(jìn)行預(yù)訓(xùn)練)。

具體框架

395af3d6-d72b-11ed-bfe3-dac502259ad0.png

首先,在連續(xù)的分割圖像之間匹配特征,以獲得粗略的姿態(tài)估計(jì)(第3.1節(jié))。

其中一些帶姿態(tài)的幀被存儲(chǔ)在內(nèi)存池中,以便稍后使用和精化(第3.2節(jié))。

從內(nèi)存池的子集動(dòng)態(tài)創(chuàng)建位姿圖(第3.3節(jié));在線優(yōu)化與當(dāng)前姿態(tài)一起聯(lián)合細(xì)化圖中的所有姿態(tài)。

然后,這些更新的姿態(tài)被存儲(chǔ)回內(nèi)存池中。

最后,內(nèi)存池中的所有帶姿態(tài)的幀用于學(xué)習(xí)神經(jīng)物體場(在單獨(dú)的線程中),該場建模了物體的幾何和視覺紋理(第3.4節(jié)),同時(shí)調(diào)整其先前估計(jì)的姿態(tài),使姿態(tài)跟蹤更加魯棒。

項(xiàng)目地址:
https://bundlesdf.github.io/

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 3D
    3D
    +關(guān)注

    關(guān)注

    9

    文章

    3011

    瀏覽量

    115022
  • 三維重建
    +關(guān)注

    關(guān)注

    0

    文章

    28

    瀏覽量

    10216
  • 姿態(tài)
    +關(guān)注

    關(guān)注

    0

    文章

    3

    瀏覽量

    8043

原文標(biāo)題:英偉達(dá)新方法入選CVPR 2023:對(duì)未知物體的6D姿態(tài)追蹤和三維重建

文章出處:【微信號(hào):3D視覺工坊,微信公眾號(hào):3D視覺工坊】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    用于窄帶匹配高速射頻ADC的全新方法

    本期,為大家?guī)淼氖恰队糜谡瓗ヅ涓咚偕漕l ADC 的全新方法》,介紹了一種用于窄帶匹配高速射頻 ADC 的全新方法,以解決高中間頻率系統(tǒng)中 ADC 前端窄帶匹配的設(shè)計(jì)難題,可在 ADC 額定帶寬內(nèi)應(yīng)用,能提升 ADC 性能、減少模擬停機(jī)時(shí)間。
    的頭像 發(fā)表于 01-04 15:56 ?6253次閱讀
    用于窄帶匹配高速射頻ADC的全<b class='flag-5'>新方法</b>

    一文讀懂 | 三維視覺領(lǐng)域國家級(jí)制造業(yè)單項(xiàng)冠軍——先臨三維的品牌布局

    ,推動(dòng)高精度三維視覺技術(shù)的普及應(yīng)用。2024年,先臨三維營業(yè)收入超12億元,業(yè)務(wù)遍及全球100+個(gè)國家和地區(qū)。 先臨三維的高精度三維視覺技術(shù)深度應(yīng)用于高精度工業(yè)3
    的頭像 發(fā)表于 11-11 14:55 ?692次閱讀
    一文讀懂 | <b class='flag-5'>三維</b>視覺領(lǐng)域國家級(jí)制造業(yè)單項(xiàng)冠軍——先臨<b class='flag-5'>三維</b>的品牌布局

    從“重建”到“可用”:aiSim3DGS方案如何閉環(huán)自動(dòng)駕駛仿真場景?

    3DGaussianSplatting(3DGS)憑借高效渲染與逼真場景還原能力,逐漸成為三維重建與仿真領(lǐng)域的焦點(diǎn)。然而,實(shí)際應(yīng)用中,如何將多源異構(gòu)數(shù)據(jù)高效轉(zhuǎn)化為可用的3DGS場景,如
    的頭像 發(fā)表于 10-24 17:33 ?28次閱讀
    從“<b class='flag-5'>重建</b>”到“可用”:aiSim3DGS方案如何閉環(huán)自動(dòng)駕駛仿真場景?

    拆解3D Gaussian Splatting:原理框架、實(shí)戰(zhàn) demo 與自駕仿真落地探索!

    ▍文章來源于康謀自動(dòng)駕駛01引言當(dāng)前,三維重建技術(shù)正處于從"實(shí)驗(yàn)室演示"邁向"工業(yè)級(jí)應(yīng)用"的關(guān)鍵時(shí)期。每一次對(duì)場景細(xì)節(jié)的精準(zhǔn)還原,每一幀實(shí)時(shí)流暢的渲染效果
    的頭像 發(fā)表于 10-17 17:33 ?3285次閱讀
    拆解3<b class='flag-5'>D</b> Gaussian Splatting:原理框架、實(shí)戰(zhàn) demo 與自駕仿真落地探索!

    一種基于多次觀測融合的可交互三維高斯場景重建框架

    在計(jì)算機(jī)視覺和機(jī)器人領(lǐng)域,如何完整、真實(shí)地重建一個(gè)可交互的三維場景,一直是一個(gè)難題。傳統(tǒng)方法往往依賴復(fù)雜的多階段流程,比如先做分割,再進(jìn)行背景補(bǔ)全或修復(fù),或者需要對(duì)每個(gè)物體進(jìn)行密集掃描
    的頭像 發(fā)表于 09-29 11:12 ?658次閱讀
    一種基于多次觀測融合的可交互<b class='flag-5'>三維</b>高斯場景<b class='flag-5'>重建</b>框架

    NVIDIA助力湯元科技突破智能駕駛數(shù)據(jù)獲取與生成瓶頸

    蘇州湯元科技有限公司(以下簡稱“湯元科技”)是一家專注于三維重建與世界模型的科技公司,為自動(dòng)駕駛與具身智能提供高質(zhì)量、多樣化的訓(xùn)練數(shù)據(jù)。通過將自研的世界模型技術(shù)與 NVIDIA Cosmos 結(jié)合,實(shí)現(xiàn)真實(shí)物理世界的三維重建、場景泛化,并提升數(shù)據(jù)生成的效率與擬真度。
    的頭像 發(fā)表于 09-06 15:16 ?1479次閱讀

    AI 驅(qū)動(dòng)三維逆向:點(diǎn)云降噪算法工具與機(jī)器學(xué)習(xí)建模能力的前沿應(yīng)用

    數(shù)據(jù)處理效率與模型構(gòu)建質(zhì)量,成為行業(yè)前沿發(fā)展方向。 傳統(tǒng)三維逆向工程的技術(shù)瓶頸 點(diǎn)云數(shù)據(jù)處理難題 傳統(tǒng)點(diǎn)云降噪方法依賴固定閾值和人工經(jīng)驗(yàn),難以應(yīng)對(duì)復(fù)雜場景下的數(shù)據(jù)噪聲。在掃描表面紋理復(fù)雜或存在反光現(xiàn)象的物體時(shí),采集的
    的頭像 發(fā)表于 08-20 10:00 ?701次閱讀
    AI 驅(qū)動(dòng)<b class='flag-5'>三維</b>逆向:點(diǎn)云降噪算法工具與機(jī)器學(xué)習(xí)建模能力的前沿應(yīng)用

    為何激光三維掃描無需噴粉也能精準(zhǔn)測量高反光物體?—— 基于光學(xué)抗反射技術(shù)的突破

    在精密制造、文物保護(hù)等領(lǐng)域,高反光物體三維測量長期依賴噴粉預(yù)處理,以增強(qiáng)表面漫反射特性輔助測量。然而,噴粉不僅會(huì)損傷被測物體,還會(huì)影響測量數(shù)據(jù)的原始性。隨著光學(xué)抗反射技術(shù)的發(fā)展,激光三維
    的頭像 發(fā)表于 06-27 09:58 ?642次閱讀
    為何激光<b class='flag-5'>三維</b>掃描無需噴粉也能精準(zhǔn)測量高反光<b class='flag-5'>物體</b>?—— 基于光學(xué)抗反射技術(shù)的突破

    航天宏圖全棧式3DGS實(shí)景三維重建系統(tǒng)解決方案

    表達(dá)的核心技術(shù),通過相機(jī)、傳感器等設(shè)備獲取物理空間數(shù)據(jù),并結(jié)合計(jì)算機(jī)視覺與圖形學(xué)算法,將二圖像轉(zhuǎn)換為三維模型。目前,主流的三維重建方法包括傾斜攝影(多視角立體
    的頭像 發(fā)表于 06-27 09:28 ?1650次閱讀
    航天宏圖全棧式3DGS實(shí)景<b class='flag-5'>三維重建</b>系統(tǒng)解決方案

    無刷直流電機(jī)反電勢過零檢測新方法

    新方法。在相采樣等效電路上分別并聯(lián)一組極管控制的電阻分壓開關(guān)電路,參考電機(jī)轉(zhuǎn)速線性調(diào)節(jié)控制信號(hào)占空比,以此控制極管通斷,從而調(diào)節(jié)電阻分樂開關(guān)電路阻值,可以避免高速時(shí)反電勢幅值高于
    發(fā)表于 06-26 13:50

    激光三維掃描技術(shù):無噴粉條件下高反光表面三維重建的光學(xué)原理與應(yīng)用

    高反光表面的三維重建是工業(yè)檢測、文化遺產(chǎn)保護(hù)等領(lǐng)域的關(guān)鍵技術(shù)瓶頸。傳統(tǒng)激光掃描依賴噴粉增強(qiáng)漫反射,但會(huì)對(duì)精密器件或文物造成不可逆損傷。本文通過融合結(jié)構(gòu)光調(diào)制、偏振分析及多視角協(xié)同技術(shù),構(gòu)建無噴粉測量
    的頭像 發(fā)表于 06-25 10:19 ?895次閱讀

    非接觸式激光三維掃描應(yīng)對(duì)鏡面反射表面的無噴粉測量方案:原理與創(chuàng)新

    偏折術(shù)、多角度偏振編碼與結(jié)構(gòu)光動(dòng)態(tài)調(diào)制的無噴粉測量方案,通過光學(xué)原理創(chuàng)新與算法優(yōu)化,實(shí)現(xiàn)鏡面表面的高精度三維重建。 測量原理與技術(shù)挑戰(zhàn) 非接觸式激光三維掃描的核心基于角測距原理,當(dāng)激光束投射到鏡面表面時(shí),
    的頭像 發(fā)表于 06-24 13:10 ?615次閱讀
    非接觸式激光<b class='flag-5'>三維</b>掃描應(yīng)對(duì)鏡面反射表面的無噴粉測量方案:原理與創(chuàng)新

    VirtualLab:光學(xué)系統(tǒng)的三維可視化

    配置文件”并選擇“系統(tǒng):三維”作為結(jié)果,然后運(yùn)行模擬。 2.點(diǎn)擊視圖系統(tǒng)(僅三維顯示組件,沒有光傳播)。 系統(tǒng):三維(光線結(jié)果配置文件)和三維系統(tǒng)視圖 這兩種
    發(fā)表于 05-30 08:45

    奧比中光助力創(chuàng)想三維登頂世界消費(fèi)級(jí)3D掃描儀市場

    Lite及Raptor Pro提供基于自研多核異構(gòu)三維重建芯片技術(shù)的軟硬件引擎,助力戰(zhàn)略合作伙伴創(chuàng)想三維登頂世界消費(fèi)級(jí)3D掃描儀市場。
    的頭像 發(fā)表于 04-11 11:38 ?1531次閱讀

    一種基于基礎(chǔ)模型對(duì)齊的自監(jiān)督三維空間理解方法

    三維空間理解是推動(dòng)自動(dòng)駕駛、具身智能等領(lǐng)域中智能系統(tǒng)實(shí)現(xiàn)環(huán)境感知、交互的核心任務(wù),其中3D語義占據(jù)預(yù)測 (Semantic Occupancy Prediction) 對(duì)三維場景進(jìn)行精準(zhǔn)的體素級(jí)建模。然而,當(dāng)前主流
    的頭像 發(fā)表于 03-18 15:01 ?973次閱讀
    一種基于基礎(chǔ)模型對(duì)齊的自監(jiān)督<b class='flag-5'>三維</b>空間理解<b class='flag-5'>方法</b>