91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

一個用于6D姿態(tài)估計和跟蹤的統(tǒng)一基礎模型

3D視覺工坊 ? 來源:3D視覺工坊 ? 2023-12-19 09:58 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

0. 筆者個人體會

今天筆者將為大家分享NVIDIA的最新開源方案FoundationPose,是一個用于 6D 姿態(tài)估計和跟蹤的統(tǒng)一基礎模型。只要給出CAD模型或少量參考圖像,F(xiàn)oundationPose就可以在測試時立即應用于新物體,無需任何微調,關鍵是各項指標明顯優(yōu)于專為每個任務設計的SOTA方案。

下面一起來閱讀一下這項工作,文末附論文和代碼鏈接~

1. 效果展示

FoundationPose實現(xiàn)了新物體的6D姿態(tài)估計和跟蹤,支持基于模型和無模型設置。在這四個任務中的每一個上,F(xiàn)oundationPose都優(yōu)于專用任務的SOTA方案。(·表示僅RGB,×表示RGBD)。這里也推薦工坊推出的新課程《單目深度估計方法:算法梳理與代碼實現(xiàn)》。

adfd5652-9dfa-11ee-8b88-92fbcf53809c.jpg

2. 具體原理是什么?

為減少大規(guī)模訓練的人工工作,F(xiàn)oundationPose利用3D模型數(shù)據(jù)庫、大型語言模型和擴散模型等新技術,開發(fā)了一種新的合成數(shù)據(jù)生成Pipeline。為了彌補無模型和基于模型的設置之間的差距,F(xiàn)oundationPose利用以對象為中心的神經(jīng)場來進行隨后的渲染和新視圖RGBD渲染。

對于姿態(tài)估計,首先在物體周圍均勻地初始化全局姿態(tài),然后通過細化網(wǎng)絡對其進行細化。最后將改進的位姿轉發(fā)給姿態(tài)選擇模塊,預測位姿的分數(shù),輸出得分最高的位姿。

ae1028e0-9dfa-11ee-8b88-92fbcf53809c.jpg

3. 和其他SOTA方法對比如何?

YCB-Video數(shù)據(jù)集上Model-free方案的位姿估計定量結果對比。

ae219558-9dfa-11ee-8b88-92fbcf53809c.jpg

YCB-Video數(shù)據(jù)集上位姿跟蹤的定量對比。這里也推薦工坊推出的新課程《單目深度估計方法:算法梳理與代碼實現(xiàn)》。

ae35a2aa-9dfa-11ee-8b88-92fbcf53809c.jpg

對更多實驗結果和文章細節(jié)感興趣的讀者,可以閱讀一下論文原文~

4. 論文信息

標題:FoundationPose: Unified 6D Pose Estimation and Tracking of Novel Objects

作者:Bowen Wen, Wei Yang, Jan Kautz, Stan Birchfield

機構:NVIDIA

原文鏈接:https://arxiv.org/abs/2312.08344

代碼鏈接:https://github.com/NVlabs/FoundationPose








審核編輯:劉清

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    5594

    瀏覽量

    109756
  • RGB
    RGB
    +關注

    關注

    4

    文章

    831

    瀏覽量

    61948

原文標題:通用性超強!同時實現(xiàn)6D位姿估計和跟蹤!

文章出處:【微信號:3D視覺工坊,微信公眾號:3D視覺工坊】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    為什么國產(chǎn)MCU的工程生態(tài)很難統(tǒng)一?

    背景 國產(chǎn) MCU 種類多、廠商眾多,生態(tài)碎片化明顯。 主要原因 廠商 SDK 不統(tǒng)一 :API、驅動結構差異大 開發(fā)工具閉源 :無法統(tǒng)一配置流程 工程模板缺失 :初始化步驟、外設配置不致 社區(qū)
    發(fā)表于 01-28 09:25

    LSM6DSV16B:面向TWS與可穿戴設備的6軸IMU,融合傳感與低功耗智能

    STMicroelectronics LSM6DSV16B iNEMO慣性模塊具有3軸數(shù)字加速度計和3軸數(shù)字陀螺儀。 STMicr
    的頭像 發(fā)表于 10-25 14:28 ?1135次閱讀
    LSM<b class='flag-5'>6</b>DSV16B:面向TWS與可穿戴設備的<b class='flag-5'>6</b>軸IMU,融合傳感與低功耗智能

    在Ubuntu20.04系統(tǒng)中訓練神經(jīng)網(wǎng)絡模型些經(jīng)驗

    模型。 我們使用MNIST數(shù)據(jù)集,訓練卷積神經(jīng)網(wǎng)絡(CNN)模型,用于手寫數(shù)字識別。
    發(fā)表于 10-22 07:03

    ANSA人體模型姿態(tài)調整工具的使用案例

    中國體征人體數(shù)字模型(AC-HUMs)是中國汽研主持研發(fā)的人體有限元模型。BETA CAE Systems與中國汽研保持緊密合作,前、后處理軟件(ANSA/META)會全面支持AC-HUMs系列模型。在軟件中提供對應工具
    的頭像 發(fā)表于 09-28 15:44 ?1208次閱讀
    ANSA人體<b class='flag-5'>模型</b><b class='flag-5'>姿態(tài)</b>調整工具的使用案例

    ANSA人體模型姿態(tài)調整工具介紹

    ANSA的人體模型姿態(tài)調整工具(HBM Articulation Tool)通過網(wǎng)格變形技術實現(xiàn)基于人體不同部位進行調節(jié),定位人體模型最終的姿態(tài)
    的頭像 發(fā)表于 09-28 15:40 ?1269次閱讀
    ANSA人體<b class='flag-5'>模型</b><b class='flag-5'>姿態(tài)</b>調整工具介紹

    【2025嵌賽等獎】|基于三維姿態(tài)估計與邊緣智能的獨居老人監(jiān)護系統(tǒng)

    在2025年嵌入式大賽全國總決賽中,山西大學“慧眸無憂幫”團隊憑借參賽項目“瞳芯頤護——基于三維姿態(tài)估計與邊緣智能的獨居老人監(jiān)護系統(tǒng)”,舉斬獲全國等獎。該團隊由計算機與信息技術學院
    的頭像 發(fā)表于 09-17 09:19 ?6562次閱讀
    【2025嵌賽<b class='flag-5'>一</b>等獎】|基于三維<b class='flag-5'>姿態(tài)</b><b class='flag-5'>估計</b>與邊緣智能的獨居老人監(jiān)護系統(tǒng)

    玩轉 KiCad 3D模型的使用

    時間都在與 2D 的焊盤、走線和絲印打交道。但完整的產(chǎn)品,終究是要走向物理世界的。元器件的高度、接插件的朝向、與外殼的配合,這些都是 2D 視圖難以表達的。 幸運的是,KiCad
    的頭像 發(fā)表于 09-16 19:21 ?1.2w次閱讀
    玩轉 KiCad 3<b class='flag-5'>D</b><b class='flag-5'>模型</b>的使用

    SCH1633 6DoF傳感器三大姿態(tài)功能

    村田推出高精度汽車用6軸慣性傳感器~顆傳感器可同時用于車輛自身位置推算、車輛姿態(tài)測量和前照燈調平~村田已開發(fā)出高性能的汽車用6軸慣性力傳感
    的頭像 發(fā)表于 09-15 12:12 ?857次閱讀
    SCH1633 <b class='flag-5'>6</b>DoF傳感器三大<b class='flag-5'>姿態(tài)</b>功能

    如何使用樹莓派+OpenCV實現(xiàn)姿態(tài)估計和面部特征點追蹤?

    大家好,這是樹莓派和OpenCV的連載專題。使用樹莓派與OpenCV實現(xiàn)姿態(tài)估計和面部特征點追蹤使用樹莓派與OpenCV實現(xiàn)面部和運動追蹤的云臺系統(tǒng)使用樹莓派和OpenCV實現(xiàn)手部
    的頭像 發(fā)表于 08-13 17:44 ?1314次閱讀
    如何使用樹莓派+OpenCV實現(xiàn)<b class='flag-5'>姿態(tài)</b><b class='flag-5'>估計</b>和面部特征點追蹤?

    如何在樹莓派 AI HAT+上進行YOLO姿態(tài)估計

    大家好,接下來會為大家開樹莓派5和YOLO的連載專題。內容包括四部分:在樹莓派5上使用YOLO進行物體和動物識別-入門指南在樹莓派5上開啟YOLO姿態(tài)
    的頭像 發(fā)表于 07-20 20:34 ?1012次閱讀
    如何在樹莓派 AI HAT+上進行YOLO<b class='flag-5'>姿態(tài)</b><b class='flag-5'>估計</b>?

    在樹莓派5上開啟YOLO姿態(tài)估計識別之旅!

    大家好,接下來會為大家開樹莓派5和YOLO的連載文章。內容包括四部分:在樹莓派5上使用YOLO進行物體和動物識別-入門指南在樹莓派5上開啟YOLO人體姿態(tài)
    的頭像 發(fā)表于 07-18 15:31 ?2499次閱讀
    在樹莓派5上開啟YOLO<b class='flag-5'>姿態(tài)</b><b class='flag-5'>估計</b>識別之旅!

    模型推理顯存和計算量估計方法研究

    隨著人工智能技術的飛速發(fā)展,深度學習大模型在各個領域得到了廣泛應用。然而,大模型的推理過程對顯存和計算資源的需求較高,給實際應用帶來了挑戰(zhàn)。為了解決這問題,本文將探討大模型推理顯存和
    發(fā)表于 07-03 19:43

    如何將FA模型開發(fā)的聲明式范式應用切換到Stage模型

    模型切換概述 本文介紹如何將FA模型開發(fā)的聲明式范式應用切換到Stage模型,您需要完成如下動作: 工程切換:新建
    發(fā)表于 06-04 06:22

    商湯科技日日新V6模型斬獲“雙料第項國內榜首,全球第

    衛(wèi)冕“雙冠”! 通用語言能力并列國內榜首、多模態(tài)能力全球最強,商湯「日日新V6」近期斬獲“雙料第”。 5月28日,權威大模型測評機構SuperCLUE《中文大模型基準測評2025年5
    的頭像 發(fā)表于 05-30 11:13 ?1593次閱讀
    商湯科技日日新V<b class='flag-5'>6</b>大<b class='flag-5'>模型</b>斬獲“雙料第<b class='flag-5'>一</b>” <b class='flag-5'>一</b>項國內榜首,<b class='flag-5'>一</b><b class='flag-5'>個</b>全球第<b class='flag-5'>一</b>

    基于RV1126開發(fā)板的人臉姿態(tài)估計算法開發(fā)

    人臉姿態(tài)估計是通過對張人臉圖像進行分析,獲得臉部朝向的角度信息。姿態(tài)估計是多姿態(tài)問題中較為關鍵
    的頭像 發(fā)表于 04-14 17:21 ?2212次閱讀
    基于RV1126開發(fā)板的人臉<b class='flag-5'>姿態(tài)</b><b class='flag-5'>估計</b>算法開發(fā)