91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

深度學(xué)習(xí)不是萬靈藥 神經(jīng)網(wǎng)絡(luò)3D建模其實(shí)只是圖像識(shí)別

DPVg_AI_era ? 來源:yxw ? 2019-06-17 11:21 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

隨著深度學(xué)習(xí)的大熱,許多研究都致力于如何從單張圖片生成3D模型。但近期一項(xiàng)研究表明,幾乎所有基于深度神經(jīng)網(wǎng)絡(luò)的3D中重建工作,實(shí)際上并不是重建,而是圖像分類。深度學(xué)習(xí)并不是萬能的!

深度學(xué)習(xí)并不是萬靈藥。

近幾年,隨著深度學(xué)習(xí)的大熱,許多研究攻克了如何從單張圖片生成3D模型。從某些方面似乎再次驗(yàn)證了深度學(xué)習(xí)的神奇——doing almost the impossible。

但是,最近一篇文章卻對此提出了質(zhì)疑:幾乎所有這些基于深度神經(jīng)網(wǎng)絡(luò)的3D重建的工作,實(shí)際上并不是進(jìn)行重建,而是進(jìn)行圖像分類。

arXiv地址:

https://arxiv.org/pdf/1905.03678.pdf

在這項(xiàng)工作中,研究人員建立了兩種不同的方法分別執(zhí)行圖像分類和檢索。這些簡單的基線方法在定性和定量上都比最先進(jìn)的方法產(chǎn)生的結(jié)果要更好。

正如伯克利馬毅教授評(píng)價(jià):

幾乎所有這些基于深度神經(jīng)網(wǎng)絡(luò)的3D重建的工作(層出不窮令人眼花繚亂的State of the Art top conferences 論文),其實(shí)還比不上稍微認(rèn)真一點(diǎn)的nearest neighbor baselines。沒有任何工具或算法是萬靈藥。

至少在三維重建問題上,沒有把幾何關(guān)系條件嚴(yán)格用到位的算法,都是不科學(xué)的——根本談不上可靠和準(zhǔn)確。

并非3D重建,而只是圖像分類?

基于對象(object-based)的單視圖3D重建任務(wù)是指,在給定單個(gè)圖像的情況下生成對象的3D模型。

如上圖所示,推斷一輛摩托車的3D結(jié)構(gòu)需要一個(gè)復(fù)雜的過程,它結(jié)合了低層次的圖像線索、有關(guān)部件結(jié)構(gòu)排列的知識(shí)和高層次的語義信息。

研究人員將這種情況稱為重建和識(shí)別:

重構(gòu)意味著使用紋理、陰影和透視效果等線索對輸入圖像的3D結(jié)構(gòu)進(jìn)行推理。

識(shí)別相當(dāng)于對輸入圖像進(jìn)行分類,并從數(shù)據(jù)庫中檢索最合適的3D模型。

雖然在其它文獻(xiàn)中已經(jīng)提出了各種體系結(jié)構(gòu)和3D表示,但是用于單視圖3D理解的現(xiàn)有方法都使用編碼器——解碼器結(jié)構(gòu),其中編碼器將輸入圖像映射到潛在表示,而解碼器執(zhí)行關(guān)于3D的非平凡(nontrivial)推理,并輸出空間的結(jié)構(gòu)。

為了解決這一任務(wù),整個(gè)網(wǎng)絡(luò)既要包含高級(jí)信息,也要包含低級(jí)信息。

而在這項(xiàng)工作中,研究人員對目前最先進(jìn)的編解碼器方法的結(jié)果進(jìn)行了分析,發(fā)現(xiàn)它們主要依靠識(shí)別來解決單視圖3D重建任務(wù),同時(shí)僅顯示有限的重建能力。

為了支持這一觀點(diǎn),研究人員設(shè)計(jì)了兩個(gè)純識(shí)別基線:一個(gè)結(jié)合了3D形狀聚類和圖像分類,另一個(gè)執(zhí)行基于圖像的3D形狀檢索。

在此基礎(chǔ)上,研究人員還證明了即使不需要明確地推斷出物體的3D結(jié)構(gòu),現(xiàn)代卷積網(wǎng)絡(luò)在單視圖3D重建中的性能是可以超越的。

在許多情況下,識(shí)別基線的預(yù)測不僅在數(shù)量上更好,而且在視覺上看起來更有吸引力。

研究人員認(rèn)為,卷積網(wǎng)絡(luò)在單視圖3D重建任務(wù)中是主流實(shí)驗(yàn)程序的某些方面的結(jié)果,包括數(shù)據(jù)集的組成和評(píng)估協(xié)議。它們允許網(wǎng)絡(luò)找到一個(gè)快捷的解決方案,這恰好是圖像識(shí)別。

純粹的識(shí)別方法,性能優(yōu)于先進(jìn)的神經(jīng)網(wǎng)絡(luò)

實(shí)驗(yàn)基于現(xiàn)代卷積網(wǎng)絡(luò),它可以從一張圖像預(yù)測出高分辨率的3D模型。

方法的分類是根據(jù)它們的輸出表示對它們進(jìn)行分類:體素網(wǎng)格(voxel grids)、網(wǎng)格(meshes)、點(diǎn)云和深度圖。為此,研究人員選擇了最先進(jìn)的方法來覆蓋主要的輸出表示,或者在評(píng)估中已經(jīng)清楚地顯示出優(yōu)于其他相關(guān)表示。

研究人員使用八叉樹生成網(wǎng)絡(luò)(Octree Generating Networks,OGN)作為直接在體素網(wǎng)格上預(yù)測輸出的代表性方法。

與早期使用這種輸出表示的方法相比,OGN通過使用八叉樹有效地表示所占用的空間,可以預(yù)測更高分辨率的形狀。

還評(píng)估了AtlasNet作為基于表面的方法的代表性方法。AtlasNet預(yù)測了一組參數(shù)曲面,并在操作這種輸出表示的方法中構(gòu)成了最先進(jìn)的方法。它被證明優(yōu)于直接生成點(diǎn)云作為輸出的唯一方法,以及另一種基于八叉樹的方法。

最后,研究人員評(píng)估了該領(lǐng)域目前最先進(jìn)的Matryoshka Networks。該網(wǎng)絡(luò)使用由多個(gè)嵌套深度圖組成的形狀表示,,這些深度圖以體積方式融合到單個(gè)輸出對象中。

對于來自AtlasNet的基于IoU的表面預(yù)測評(píng)估,研究人員將它們投影到深度圖,并進(jìn)一步融合到體積表示。 對于基于表面的評(píng)估指標(biāo),使用移動(dòng)立方體算法從體積表示中提取網(wǎng)格。

研究人員實(shí)現(xiàn)了兩個(gè)簡單的基線,僅從識(shí)別的角度來處理問題。

第一種方法是結(jié)合圖像分類器對訓(xùn)練形狀進(jìn)行聚類;第二個(gè)是執(zhí)行數(shù)據(jù)庫檢索。

在聚類方面的基線中,使用K-means算法將訓(xùn)練形狀聚類為K個(gè)子類別。

在檢索基線方面,嵌入空間由訓(xùn)練集中所有3D形狀的兩兩相似矩陣構(gòu)造,通過多維尺度將矩陣的每一行壓縮為一個(gè)低維描述符。

研究人員根據(jù)平均IoU分?jǐn)?shù)對所有方法進(jìn)行標(biāo)準(zhǔn)比較。

研究人員發(fā)現(xiàn),雖然最先進(jìn)的方法有不同體系結(jié)構(gòu)的支持,但在執(zhí)行的時(shí)候卻非常相似。

有趣的是,檢索基線是一種純粹的識(shí)別方法,在均值和中位數(shù)IoU方面都優(yōu)于所有其他方法。簡單的聚類基線具有競爭力,性能優(yōu)于AtlasNet和OGN。

但研究人員進(jìn)一步觀察到,一個(gè)完美的檢索方法(Oracle NN)的性能明顯優(yōu)于所有其他方法。值得注意的是,所有方法的結(jié)果差異都非常大(在35%到50%之間)。

這意味著僅依賴于平均IoU的定量比較不能提供這種性能水平的全貌。 為了更清楚地了解這些方法的行為,研究人員進(jìn)行了更詳細(xì)的分析。

每類mIoU比較。

總的來說,這些方法在不同的類之間表現(xiàn)出一致的相對性能。檢索基線為大多數(shù)類生成最佳重構(gòu)。所有類和方法的方差都很大。

mIoU與每個(gè)類的訓(xùn)練樣本數(shù)量。

研究人員發(fā)現(xiàn)一個(gè)類的樣本數(shù)量和這個(gè)類的mIoU分?jǐn)?shù)之間沒有相關(guān)性。所有方法的相關(guān)系數(shù)c均接近于零。

定性的結(jié)果

聚類基線產(chǎn)生的形狀質(zhì)量與最先進(jìn)的方法相當(dāng)。 檢索基線通過設(shè)計(jì)返回高保真形狀,但細(xì)節(jié)可能不正確。 每個(gè)樣本右下角的數(shù)字表示IoU。

左:為所選類分配IoU。 基于解碼器的方法和顯式識(shí)別基線的類內(nèi)分布是類似的。 Oracle NN的發(fā)行版在大多數(shù)類中都有所不同。 右圖:成對Kolmogorov-Smirnov檢驗(yàn)未能拒絕兩個(gè)分布的無效假設(shè)的類數(shù)的熱圖。

研究中的一些問題

參照系的選擇

我們嘗試使用視角預(yù)測網(wǎng)絡(luò)對聚類基線方法進(jìn)行擴(kuò)展,該方法將重點(diǎn)回歸攝像頭的方位角和仰角等規(guī)范框架,結(jié)果失敗了,因?yàn)橐?guī)范框架對每個(gè)對象類都有不同的含義,即視角網(wǎng)絡(luò)需要使用類信息來解決任務(wù)。我們對檢索基線方法進(jìn)行了重新訓(xùn)練,將每個(gè)訓(xùn)練視圖作為單獨(dú)樣本來處理,從而為每個(gè)單獨(dú)的對象提供空間。

量度標(biāo)準(zhǔn)

平均IoU通常在基準(zhǔn)測試中被用作衡量單視圖圖像重建方法的主要量化指標(biāo)。如果將其作為最優(yōu)解的唯一衡量指標(biāo),就可能會(huì)出現(xiàn)問題,因?yàn)樗趯ο笮螤畹馁|(zhì)量值足夠高時(shí)才能有效預(yù)測。如果該值處于中低水平,表明兩個(gè)對象的形狀存在顯著差異。

如上圖所示,將一個(gè)汽車模型與數(shù)據(jù)集中的不同形狀的對象進(jìn)行了比較,只有 IoU分?jǐn)?shù)比較高(最右兩張圖)時(shí)才有意義,即使IoU=0.59,兩個(gè)目標(biāo)可能都是完全不同的物體,比較相似度失去了意義。

倒角距離(Chamfer distance)

如上圖所示,兩者目標(biāo)椅子與下方的椅子的下半部分完美匹配,但上半部分完全不同。但是根據(jù)得分,第二個(gè)目標(biāo)要好于第一個(gè)。由此來看,倒角距離這個(gè)量度會(huì)被空間幾何布局顯著干擾。為了可靠地反映真正的模型重建性能,好的量度應(yīng)該具備對幾何結(jié)構(gòu)變化的高魯棒性。

F-score

我們繪制了以觀察者為中心的重建方式的F分?jǐn)?shù)的不同距離閾值d(左)。在 d =重建體積邊長的2%的條件下,F(xiàn)分?jǐn)?shù)絕對值與當(dāng)前范圍的 mIoU分?jǐn)?shù)相同,這并不能有效反映模型的預(yù)測質(zhì)量。

因此,我們建議將距離閾值設(shè)為重建模型體積邊長的1%以下來考察F值。如上圖(右)中所示,在閾值d = 1%時(shí),F(xiàn)分?jǐn)?shù)為0.5以上。只有一小部分模型的形狀被精確構(gòu)建出來,預(yù)設(shè)任務(wù)仍然遠(yuǎn)未解決。我們的檢索基線方法不再具有明顯的優(yōu)勢,進(jìn)一步表明使用純粹的識(shí)別方法很難解決這個(gè)問題。

現(xiàn)有的基于CNN的方法在精度上表現(xiàn)良好,但丟失了目標(biāo)的部分結(jié)構(gòu)

未來展望

在這項(xiàng)研究中,研究人員通過重建和識(shí)別來推斷單視圖3D重建方法的范圍。

工作展示了簡單的檢索基線優(yōu)于最新、最先進(jìn)的方法。分析表明,目前最先進(jìn)的單視圖3D重建方法主要用于識(shí)別,而不是重建。

研究人員確定了引起這種問題的一些因素,并提出了一些建議,包括使用以視圖為中心的坐標(biāo)系和魯棒且信息量大的評(píng)估度量(F-score)。

另一個(gè)關(guān)鍵問題是數(shù)據(jù)集組合,雖然問題已經(jīng)確定,但沒有處理。研究人員正努力在以后的工作中糾正這一點(diǎn)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 圖像識(shí)別
    +關(guān)注

    關(guān)注

    9

    文章

    533

    瀏覽量

    40059
  • 3D建模
    +關(guān)注

    關(guān)注

    0

    文章

    36

    瀏覽量

    10155
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5599

    瀏覽量

    124398

原文標(biāo)題:深度學(xué)習(xí)不是萬靈藥!神經(jīng)網(wǎng)絡(luò)3D建模其實(shí)只是圖像識(shí)別?

文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    神經(jīng)網(wǎng)絡(luò)的初步認(rèn)識(shí)

    日常生活中的智能應(yīng)用都離不開深度學(xué)習(xí),而深度學(xué)習(xí)則依賴于神經(jīng)網(wǎng)絡(luò)的實(shí)現(xiàn)。什么是神經(jīng)網(wǎng)絡(luò)?
    的頭像 發(fā)表于 12-17 15:05 ?330次閱讀
    <b class='flag-5'>神經(jīng)網(wǎng)絡(luò)</b>的初步認(rèn)識(shí)

    如何深度學(xué)習(xí)機(jī)器視覺的應(yīng)用場景

    檢測應(yīng)用 微細(xì)缺陷識(shí)別:檢測肉眼難以發(fā)現(xiàn)的微小缺陷和異常 紋理分析:對材料表面紋理進(jìn)行智能分析和缺陷識(shí)別 3D表面重建:通過深度學(xué)習(xí)進(jìn)行高精
    的頭像 發(fā)表于 11-27 10:19 ?221次閱讀

    技術(shù)資訊 I 多板系統(tǒng) 3D 建模,提升設(shè)計(jì)精度和性能

    本文要點(diǎn)了解3D建模流程。洞悉多板系統(tǒng)3D建模如何提高設(shè)計(jì)精度、性能和成本效益。掌握3D建模在制
    的頭像 發(fā)表于 11-21 17:45 ?2518次閱讀
    技術(shù)資訊 I 多板系統(tǒng) <b class='flag-5'>3D</b> <b class='flag-5'>建模</b>,提升設(shè)計(jì)精度和性能

    自動(dòng)駕駛中常提的卷積神經(jīng)網(wǎng)絡(luò)是個(gè)啥?

    在自動(dòng)駕駛領(lǐng)域,經(jīng)常會(huì)聽到卷積神經(jīng)網(wǎng)絡(luò)技術(shù)。卷積神經(jīng)網(wǎng)絡(luò),簡稱為CNN,是一種專門用來處理網(wǎng)格狀數(shù)據(jù)(比如圖像)的深度學(xué)習(xí)模型。CNN在
    的頭像 發(fā)表于 11-19 18:15 ?2077次閱讀
    自動(dòng)駕駛中常提的卷積<b class='flag-5'>神經(jīng)網(wǎng)絡(luò)</b>是個(gè)啥?

    NMSIS神經(jīng)網(wǎng)絡(luò)庫使用介紹

    (q7_t) 和 16 位整數(shù) (q15_t)。 卷積神經(jīng)網(wǎng)絡(luò)示例: 本示例中使用的 CNN 基于來自 Caffe 的 CIFAR-10 示例。神經(jīng)網(wǎng)絡(luò)3 個(gè)卷積層組成,中間散布著 ReLU
    發(fā)表于 10-29 06:08

    構(gòu)建CNN網(wǎng)絡(luò)模型并優(yōu)化的一般化建議

    :Dropout層隨機(jī)跳過神經(jīng)網(wǎng)絡(luò)模型中某些神經(jīng)元之間的連接,通過隨機(jī)制造缺陷進(jìn)行訓(xùn)練提升整個(gè)神經(jīng)網(wǎng)絡(luò)的魯棒性。 6)指定合理的學(xué)習(xí)率策略:一旦
    發(fā)表于 10-28 08:02

    在Ubuntu20.04系統(tǒng)中訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型的一些經(jīng)驗(yàn)

    模型。 我們使用MNIST數(shù)據(jù)集,訓(xùn)練一個(gè)卷積神經(jīng)網(wǎng)絡(luò)(CNN)模型,用于手寫數(shù)字識(shí)別。一旦模型被訓(xùn)練并保存,就可以用于對新圖像進(jìn)行推理和預(yù)測。要使用生成的模型進(jìn)行推理,可以按照以下步驟進(jìn)行操作: 1.
    發(fā)表于 10-22 07:03

    CICC2033神經(jīng)網(wǎng)絡(luò)部署相關(guān)操作

    在完成神經(jīng)網(wǎng)絡(luò)量化后,需要將神經(jīng)網(wǎng)絡(luò)部署到硬件加速器上。首先需要將所有權(quán)重?cái)?shù)據(jù)以及輸入數(shù)據(jù)導(dǎo)入到存儲(chǔ)器內(nèi)。 在仿真環(huán)境下,可將其存于一個(gè)文件,并在 Verilog 代碼中通過 readmemh 函數(shù)
    發(fā)表于 10-20 08:00

    液態(tài)神經(jīng)網(wǎng)絡(luò)(LNN):時(shí)間連續(xù)性與動(dòng)態(tài)適應(yīng)性的神經(jīng)網(wǎng)絡(luò)

    1.算法簡介液態(tài)神經(jīng)網(wǎng)絡(luò)(LiquidNeuralNetworks,LNN)是一種新型的神經(jīng)網(wǎng)絡(luò)架構(gòu),其設(shè)計(jì)理念借鑒自生物神經(jīng)系統(tǒng),特別是秀麗隱桿線蟲的神經(jīng)結(jié)構(gòu),盡管這種微生物的
    的頭像 發(fā)表于 09-28 10:03 ?1224次閱讀
    液態(tài)<b class='flag-5'>神經(jīng)網(wǎng)絡(luò)</b>(LNN):時(shí)間連續(xù)性與動(dòng)態(tài)適應(yīng)性的<b class='flag-5'>神經(jīng)網(wǎng)絡(luò)</b>

    如何在機(jī)器視覺中部署深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)

    圖 1:基于深度學(xué)習(xí)的目標(biāo)檢測可定位已訓(xùn)練的目標(biāo)類別,并通過矩形框(邊界框)對其進(jìn)行標(biāo)識(shí)。 在討論人工智能(AI)或深度學(xué)習(xí)時(shí),經(jīng)常會(huì)出現(xiàn)“神經(jīng)網(wǎng)絡(luò)
    的頭像 發(fā)表于 09-10 17:38 ?901次閱讀
    如何在機(jī)器視覺中部署<b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b><b class='flag-5'>神經(jīng)網(wǎng)絡(luò)</b>

    iTOF技術(shù),多樣化的3D視覺應(yīng)用

    動(dòng)態(tài)模糊,確保高耐光性,同時(shí)輸出2D(紅外)和3D深度)數(shù)據(jù)。 ◆ Testing Principles ※ 測量脈沖光的飛行時(shí)間,以檢測 TOF 相機(jī)與被測物體之間的距離。 ◆ ToF 產(chǎn)品
    發(fā)表于 09-05 07:24

    TechWiz LCD 3D應(yīng)用:FFS仿真

    建模任務(wù) 堆棧結(jié)構(gòu) 建模過程 2.1使用TechWiz Layout繪制各層掩模版平面圖 2.2創(chuàng)建堆棧結(jié)構(gòu),并生成3D結(jié)構(gòu) 2.3 使用TechWiz LCD 3D進(jìn)行各項(xiàng)參數(shù)計(jì)算
    的頭像 發(fā)表于 07-14 14:08 ?681次閱讀
    TechWiz LCD <b class='flag-5'>3D</b>應(yīng)用:FFS仿真

    基于FPGA的SSD目標(biāo)檢測算法設(shè)計(jì)

    隨著人工智能的發(fā)展,神經(jīng)網(wǎng)絡(luò)正被逐步應(yīng)用于智能安防、自動(dòng)駕駛、醫(yī)療等各行各業(yè)。目標(biāo)識(shí)別作為人工智能的一項(xiàng)重要應(yīng)用也擁有著巨大的前景,隨著深度學(xué)習(xí)的普及和框架的成熟,卷積
    的頭像 發(fā)表于 07-10 11:12 ?2561次閱讀
    基于FPGA的SSD目標(biāo)檢測算法設(shè)計(jì)

    【嘉楠堪智K230開發(fā)板試用體驗(yàn)】01 Studio K230開發(fā)板Test2——手掌,手勢檢測,字符檢測

    CanMV K230 的核心計(jì)算單元,專門用于處理需要高計(jì)算量的復(fù)雜圖像識(shí)別任務(wù)。其作用類似于電腦中的 GPU,專注于提供強(qiáng)大的視覺處理算力。 KPU 的核心優(yōu)勢在于: 神經(jīng)網(wǎng)絡(luò)處理能力: 它采用神經(jīng)網(wǎng)絡(luò)
    發(fā)表于 07-10 09:45

    神經(jīng)網(wǎng)絡(luò)專家系統(tǒng)在電機(jī)故障診斷中的應(yīng)用

    摘要:針對傳統(tǒng)專家系統(tǒng)不能進(jìn)行自學(xué)習(xí)、自適應(yīng)的問題,本文提出了基于種經(jīng)網(wǎng)絡(luò)專家系統(tǒng)的并步電機(jī)故障診斷方法。本文將小波神經(jīng)網(wǎng)絡(luò)和專家系統(tǒng)相結(jié)合,充分發(fā)揮了二者故障診斷的優(yōu)點(diǎn),很大程度上降低了對電機(jī)
    發(fā)表于 06-16 22:09