91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

3D 點(diǎn)云的無(wú)監(jiān)督膠囊網(wǎng)絡(luò) 多任務(wù)上實(shí)現(xiàn)SOTA

工程師鄧生 ? 來(lái)源:機(jī)器之心Pro ? 作者:杜偉、小舟 ? 2021-01-02 09:39 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

這是一種為 3D 點(diǎn)云提出的無(wú)監(jiān)督膠囊架構(gòu),并且在 3D 點(diǎn)云重構(gòu)、配準(zhǔn)和無(wú)監(jiān)督分類方面優(yōu)于 SOTA 方法。

理解對(duì)象是計(jì)算機(jī)視覺(jué)的核心問(wèn)題之一。傳統(tǒng)方法而言,理解對(duì)象任務(wù)可以依賴于大型帶注釋的數(shù)據(jù)集,而無(wú)監(jiān)督方法已經(jīng)消除了對(duì)標(biāo)簽的需求。近來(lái),研究人員試圖將這些方法擴(kuò)展到 3D 點(diǎn)云問(wèn)題上,但無(wú)監(jiān)督 3D 學(xué)習(xí)領(lǐng)域卻進(jìn)展寥寥。

近日,包括 Weiwei Sun、Andrea Tagliasacchi、Geoffrey Hinton 等來(lái)自英屬哥倫比亞大學(xué)、谷歌研究院、多倫多大學(xué)的研究者提出了用于 3D 點(diǎn)云的無(wú)監(jiān)督膠囊網(wǎng)絡(luò)。Hinton 對(duì)此表示:在不受監(jiān)督的情況下找到一個(gè)對(duì)象的自然組件以及這些組件的內(nèi)在參照系是學(xué)習(xí)將解析圖像轉(zhuǎn)換為局部整體層級(jí)結(jié)構(gòu)的重要一步。如果以點(diǎn)云開(kāi)始,則可以做到。

具體而言,研究者通過(guò)排列等變(permutation-equivariant)的注意力計(jì)算對(duì)象的膠囊分解,并通過(guò)訓(xùn)練成對(duì)的隨機(jī)旋轉(zhuǎn)對(duì)象來(lái)自監(jiān)督該過(guò)程。本研究的核心思想是將注意力掩模聚合為語(yǔ)義關(guān)鍵點(diǎn),并使用它們來(lái)監(jiān)督滿足膠囊不變性或等方差的分解。這不僅可以訓(xùn)練語(yǔ)義上一致的分解,還能夠?qū)W習(xí)以對(duì)象為中心的推理的規(guī)范化操作。在這種情況下,既不需要分類標(biāo)簽,也不需要手動(dòng)對(duì)齊的訓(xùn)練數(shù)據(jù)集進(jìn)行訓(xùn)練。

最后,通過(guò)以無(wú)監(jiān)督的方式學(xué)習(xí)以對(duì)象為中心的表征,該方法在 3D 點(diǎn)云重構(gòu)、配準(zhǔn)和無(wú)監(jiān)督分類方面優(yōu)于 SOTA 方法。研究者表示將很快公布源代碼和數(shù)據(jù)集。

4eaf897ed7574ed59f400ace87532372.png

論文鏈接:https://arxiv.org/abs/2012.04718

項(xiàng)目主頁(yè):https://canonical-capsules.github.io/

方法

該網(wǎng)絡(luò)在未對(duì)齊的點(diǎn)云上進(jìn)行訓(xùn)練,如下圖 2 所示:研究者訓(xùn)練了一個(gè)將點(diǎn)云分解為多個(gè)組件的網(wǎng)絡(luò),并通過(guò) Siamese 訓(xùn)練設(shè)置實(shí)現(xiàn)不變性 / 等方差。

5bebc405bb414dbb9a5dce0bc059afeb.png

然后研究者將點(diǎn)云規(guī)范化為學(xué)習(xí)的參照系,并在該坐標(biāo)空間中執(zhí)行自動(dòng)編碼。

損失

正如無(wú)監(jiān)督方法中常見(jiàn)的那樣,該研究的框架依賴于大量的損失,這些損失控制著力圖在表征中獲得的不同特征。請(qǐng)注意所有這些損失是如何不受監(jiān)督且不需要標(biāo)簽的。研究者根據(jù)他們監(jiān)督的網(wǎng)絡(luò)部分組織損失,包括分解、規(guī)范化和重建。

網(wǎng)絡(luò)架構(gòu)

研究者簡(jiǎn)要介紹了實(shí)現(xiàn)細(xì)節(jié),包括網(wǎng)絡(luò)架構(gòu)。

編碼器 E。我們的架構(gòu)是基于 [42] 提出一種類似于點(diǎn)網(wǎng)的架構(gòu),具有殘差連接和注意力上下文歸一化;

解碼器 D。公式 (4) 中的解碼器基于每個(gè)膠囊運(yùn)行。本研究采用的解碼器架構(gòu)類似于 AtlasNetV2 [13](帶有可訓(xùn)練的網(wǎng)格)。不同之處在于本研究通過(guò)相應(yīng)的膠囊姿態(tài)轉(zhuǎn)換每個(gè)膠囊的解碼點(diǎn)云;

dbd4a1f441fd4c9a89d4d0aa1c45b1c3.png

回歸器 K。研究者只需連接描述符,并通過(guò) ReLU 激活函數(shù)調(diào)用一系列全連接層,以回歸 P 膠囊定位。在輸出層,研究者使用線性激活函數(shù),并進(jìn)一步減去輸出平均值,以使回歸位置在規(guī)范化框架中以零為中心(zero-centered);

規(guī)范化描述符。由于本研究的描述符只是近似旋轉(zhuǎn)不變(通過(guò)擴(kuò)展),研究者發(fā)現(xiàn)在規(guī)范化之后重新提取膠囊描述符β_k 很有用。

實(shí)驗(yàn)及結(jié)果

自動(dòng)編碼

研究者針對(duì)兩個(gè)訓(xùn)練基線(在單類別和多類別變體中經(jīng)過(guò)了訓(xùn)練)評(píng)估了用于訓(xùn)練網(wǎng)絡(luò)任務(wù)(重建 / 自動(dòng)編碼)的方法的性能:

AtlasNetV2 [13],一種使用基于補(bǔ)?。╬atch-based)多頭解碼器的 SOTA 自動(dòng)編碼器;

3D-PointCapsNet [58],一種利用膠囊架構(gòu)的 3D 點(diǎn)云自動(dòng)編碼器。

下表 1 是定量分析的結(jié)果,本文方法在對(duì)齊和未對(duì)齊的設(shè)置下均取得了 SOTA 的性能結(jié)果。

7d47aedc4e5d4d9f89153a3912802b6d.png

下圖 3 是定性分析的結(jié)果。研究者給出了基于分解的 3D 點(diǎn)云重建方法以及 3D-PointCapsNet [58]、AtlasNetV2 [13]的重建結(jié)果。

f08ee44ceab24b2fb22d4217aee82c19.jpeg

配準(zhǔn)

研究者在配準(zhǔn) 3D 點(diǎn)云的能力方面評(píng)估了該方法的性能,并與以下 3 個(gè)基準(zhǔn)進(jìn)行了比較:

Deep Closest Points (DCP) [52]:一種基于深度學(xué)習(xí)的點(diǎn)云配準(zhǔn)方法;

DeepGMR–RRI [56],一種 SOTA 方法,該方法可以將云分解為具有旋轉(zhuǎn)不變特征的高斯混合;

DeepGMR–XYZ [56],其中將原始 XYZ 坐標(biāo)用作輸入,而不使用旋轉(zhuǎn)不變特征;

本研究采用的變體方法 RRI,其中使用 RRI 特征 [6] 作為該架構(gòu)的唯一輸入。本文使用 RRI 特征的方法遵循 DeepGMR 訓(xùn)練協(xié)議,并訓(xùn)練 100 個(gè)周期,而對(duì)于 DCP 和 DeepGMR,本研究使用了原作者的官方實(shí)現(xiàn)。定量分析的結(jié)果如下表 2 所示:

f7a4ad2beb7e4ee394eb40f5d523d540.png

無(wú)監(jiān)督分類

除了重建和配準(zhǔn)(這兩者是與訓(xùn)練損失直接相關(guān)的任務(wù))之外,本研究還通過(guò)分類任務(wù)評(píng)估了方法的有效性,該分類任務(wù)與訓(xùn)練損失沒(méi)有任何關(guān)系。結(jié)果如下表 3 所示,本文方法均實(shí)現(xiàn)了 SOTA 的 Top-1 準(zhǔn)確率。

6ca8fd7c6ef74954b39d2ea9f3b673cd.png

控制變量實(shí)驗(yàn)

此外,為了進(jìn)一步分析規(guī)范化膠囊(Canonical Capsules)的不同組件對(duì)性能的影響,本研究進(jìn)行了一系列控制變量實(shí)驗(yàn),結(jié)果如下表 4、表 6、表 7 所示:

74e0564e8a694571bda86714282352a4.png

表 4:損失的影響。

9d4ee60782ac40cd8ace2a6e714b3355.png

表 6:規(guī)范描述符的有效性。

2f6de421c8d845359ac147b7ebea0952.png

表 7:點(diǎn)的數(shù)量對(duì)性能的影響。

責(zé)任編輯:PSY

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 3D
    3D
    +關(guān)注

    關(guān)注

    9

    文章

    3011

    瀏覽量

    115021
  • 云計(jì)算
    +關(guān)注

    關(guān)注

    39

    文章

    8021

    瀏覽量

    144378
  • 網(wǎng)絡(luò)
    +關(guān)注

    關(guān)注

    14

    文章

    8264

    瀏覽量

    94716
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    一文說(shuō)透了如何實(shí)現(xiàn)單片機(jī)的多任務(wù)并發(fā)!

    在嵌入式系統(tǒng)開(kāi)發(fā)中,多任務(wù)并發(fā)是非常常見(jiàn)的,對(duì)于處理復(fù)雜的應(yīng)用場(chǎng)景、提升系統(tǒng)的并發(fā)能力、提高系統(tǒng)的實(shí)時(shí)性等方面都有很大好處。在單片機(jī)中實(shí)現(xiàn)多任務(wù)并發(fā)是非常重要的,本文將為大家介紹如何在單片機(jī)中
    發(fā)表于 01-06 06:46

    iSUN3D即將推出單組分彈性樹(shù)脂3D打印解決方案!

    iSUN3D將在Formnext 2025發(fā)布單組分彈性樹(shù)脂3D打印方案,覆蓋設(shè)計(jì)到交付全流程,解決柔彈性制造成本與效率痛點(diǎn),現(xiàn)場(chǎng)可體驗(yàn)高速打印與限量禮品。
    的頭像 發(fā)表于 11-17 11:45 ?653次閱讀
    iSUN<b class='flag-5'>3D</b>即將推出單組分彈性樹(shù)脂<b class='flag-5'>3D</b>打印解決方案!

    【CIE全國(guó)RISC-V創(chuàng)新應(yīng)用大賽】+基于MUSE Pi Pro的3d激光里程計(jì)實(shí)現(xiàn)

    基于MUSE Pi Pro的3D激光里程計(jì)實(shí)現(xiàn)技術(shù)文檔 內(nèi)容摘要 本文檔詳細(xì)介紹了基于MUSE Pi Pro開(kāi)發(fā)板和速騰聚創(chuàng)Airy 96線激光雷達(dá)實(shí)現(xiàn)3D激光里程計(jì)系統(tǒng)的完整技術(shù)方案
    發(fā)表于 10-24 17:02

    玩轉(zhuǎn) KiCad 3D模型的使用

    時(shí)間都在與 2D 的焊盤(pán)、走線和絲印打交道。但一個(gè)完整的產(chǎn)品,終究是要走向物理世界的。元器件的高度、接插件的朝向、與外殼的配合,這些都是 2D 視圖難以表達(dá)的。 幸運(yùn)的是,KiCad 提供了強(qiáng)大的 3D 可視化功能。它不僅能讓你
    的頭像 發(fā)表于 09-16 19:21 ?1.2w次閱讀
    玩轉(zhuǎn) KiCad <b class='flag-5'>3D</b>模型的使用

    光子精密雙目3D線激光輪廓測(cè)量?jī)x,擺脫視覺(jué)盲區(qū),1臺(tái)更比2臺(tái)強(qiáng)!

    光子精密雙目3D線激光輪廓測(cè)量?jī)x(GL-8160D),在GL-8000系列的基礎(chǔ)創(chuàng)新升級(jí)。GL-8160D采用全新雙目單線設(shè)計(jì),突破傳統(tǒng)3D
    的頭像 發(fā)表于 07-16 17:21 ?1370次閱讀
    光子精密雙目<b class='flag-5'>3D</b>線激光輪廓測(cè)量?jī)x,擺脫視覺(jué)盲區(qū),1臺(tái)更比2臺(tái)強(qiáng)!

    TechWiz LCD 3D應(yīng)用:FFS仿真

    建模任務(wù) 堆棧結(jié)構(gòu) 建模過(guò)程 2.1使用TechWiz Layout繪制各層掩模版平面圖 2.2創(chuàng)建堆棧結(jié)構(gòu),并生成3D結(jié)構(gòu) 2.3 使用TechWiz LCD 3D進(jìn)行各項(xiàng)參數(shù)計(jì)算 3
    的頭像 發(fā)表于 07-14 14:08 ?674次閱讀
    TechWiz LCD <b class='flag-5'>3D</b>應(yīng)用:FFS仿真

    TechWiz LCD 3D應(yīng)用:局部液晶配向

    ,本案例使用TechWiz LCD 3D進(jìn)行局部摩擦的設(shè)置。 1. 建模任務(wù) 1.1進(jìn)行局部摩擦配置 2. 建模過(guò)程 以下是建模過(guò)程中部分重要步驟的說(shuō)明 2.1在TechWiz Layout中創(chuàng)建結(jié)構(gòu)
    發(fā)表于 06-16 08:46

    TechWiz LCD 3D應(yīng)用:微液晶分子摩擦排布

    ) 結(jié)構(gòu)創(chuàng)建完成后在TechWiz LCD 3D中加載并進(jìn)行相關(guān)參數(shù)設(shè)置 2.2在TechWiz LCD 3D軟件中設(shè)置微擾方式為用戶自定義,并設(shè)置微擾角度 2.3其它設(shè)置 此例僅對(duì)比使用微擾方式
    發(fā)表于 06-10 08:44

    快速入門(mén)——LuatOS:sys庫(kù)多任務(wù)管理實(shí)戰(zhàn)攻略!

    的開(kāi)發(fā)者,這里將用最簡(jiǎn)明的步驟,助你輕松實(shí)現(xiàn)多任務(wù)應(yīng)用開(kāi)發(fā)! sys庫(kù)是LuatOS的核心系統(tǒng)調(diào)度庫(kù),它基于Lua協(xié)程機(jī)制實(shí)現(xiàn)了實(shí)時(shí)多任務(wù)調(diào)度、定時(shí)器管理以及消息通信等功能。 在詳細(xì)介
    的頭像 發(fā)表于 05-29 14:36 ?820次閱讀
    快速入門(mén)——LuatOS:sys庫(kù)<b class='flag-5'>多任務(wù)</b>管理實(shí)戰(zhàn)攻略!

    3D AD庫(kù)文件

    3D庫(kù)文件
    發(fā)表于 05-28 13:57 ?6次下載

    TechWiz LCD 3D應(yīng)用:撓曲電效用仿真

    完成后在TechWiz LCD 3D中加載并進(jìn)行相關(guān)參數(shù)設(shè)置 2.2在TechWiz LCD 3D軟件中開(kāi)啟應(yīng)用撓曲電效應(yīng)的功能 2.3其它設(shè)置 液晶設(shè)置 電壓條件設(shè)置 光學(xué)分析部分,添加偏振片 結(jié)果查看 3.1 V-T曲線 3.2 結(jié)果對(duì)比
    發(fā)表于 05-14 08:55

    告別漫長(zhǎng)等待! 3D測(cè)量竟然可以如此的絲滑

    據(jù)進(jìn)行實(shí)時(shí)處理,快速得到全視角的彩色高精度2D圖像和3D點(diǎn)。產(chǎn)品優(yōu)勢(shì)01高精度的在線3D檢測(cè)采用業(yè)界頂級(jí)的CMOS感光元件和超低畸變遠(yuǎn)心光
    的頭像 發(fā)表于 05-12 18:01 ?673次閱讀
    告別漫長(zhǎng)等待! <b class='flag-5'>3D</b>測(cè)量竟然可以如此的絲滑

    3D閃存的制造工藝與挑戰(zhàn)

    3D閃存有著更大容量、更低成本和更高性能的優(yōu)勢(shì),本文介紹了3D閃存的制造工藝與挑戰(zhàn)。
    的頭像 發(fā)表于 04-08 14:38 ?2426次閱讀
    <b class='flag-5'>3D</b>閃存的制造工藝與挑戰(zhàn)

    TechWiz LCD 3D應(yīng)用:微液晶分子摩擦排布

    ) 結(jié)構(gòu)創(chuàng)建完成后在TechWiz LCD 3D中加載并進(jìn)行相關(guān)參數(shù)設(shè)置 2.2在TechWiz LCD 3D軟件中設(shè)置微擾方式為用戶自定義,并設(shè)置微擾角度 2.3其它設(shè)置 此例僅對(duì)比使用微擾方式
    發(fā)表于 04-01 08:59

    一種以圖像為中心的3D感知模型BIP3D

    在具身智能系統(tǒng)中,3D感知算法是一個(gè)關(guān)鍵組件,它在端側(cè)幫助可以幫助智能體理解環(huán)境信息,在云端可以用來(lái)輔助生成3D場(chǎng)景和3D標(biāo)簽,具備重要的研究?jī)r(jià)值?,F(xiàn)有主流算法主要依賴于點(diǎn)
    的頭像 發(fā)表于 03-17 13:44 ?1234次閱讀
    一種以圖像為中心的<b class='flag-5'>3D</b>感知模型BIP<b class='flag-5'>3D</b>