91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

大疆、港科大聯(lián)手!雙目3D目標(biāo)檢測實(shí)驗(yàn)效果大放送

電子工程師 ? 來源:lp ? 2019-03-12 09:43 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

CVPR 2019的文章出來了,今天聊聊雙目的 3D object detection。這是一篇來自 DJI (大疆)與港科大合作的文章《Stereo R-CNN based 3D Object Detection for Autonomous Driving》,作者分別是 Peiliang Li,陳曉智(DJI,MV3D的作者)和港科大的 Shaojie Shen 老師。

論文鏈接,文中稱代碼將開源

https://arxiv.org/abs/1902.09738

1. Introduction

2018 年在 3D 檢測方面的文章層出不窮,也是各個(gè)公司無人駕駛或者機(jī)器人學(xué)部門關(guān)注的重點(diǎn),包含了點(diǎn)云,點(diǎn)云圖像融合,以及單目 3D 檢測,但是在雙目視覺方面的貢獻(xiàn)還是比較少,自從 3DOP 之后。

總體來說,圖像的檢測距離、圖像的 density 以及 context 信息,在 3D檢測中是不可或缺的一部分,因此作者在這篇文章中挖掘了雙目視覺做 3D檢測的的潛力。

2.Network Structure

整個(gè)網(wǎng)絡(luò)結(jié)構(gòu)分為以下的幾個(gè)部分。

1). RPN部分,作者將左右目的圖像通過stereoRPN產(chǎn)生相應(yīng)的proposal。具體來說stereo RPN是在FPN的基礎(chǔ)上,將每個(gè)FPN的scale上的feature map的進(jìn)行concat的結(jié)構(gòu)。

2). Stereo Regression,在RPN之后,通過RoiAlign的操作,得到each FPN scale下的left and right Roi features,然后concat相應(yīng)的特征,經(jīng)過fc層得到object class, stereo bounding boxes dimension還有viewpoint angle(下圖所示) 的值。這里解釋一下viewpoint,根據(jù)Figure3.,假定物

3). keypoint的檢測。這里采用的是類似于mask rcnn的結(jié)構(gòu)進(jìn)行關(guān)鍵點(diǎn)的預(yù)測。文章定義了4個(gè)3D semantic keypoint,即車輛底部的3D corner point,同時(shí)將這4個(gè)點(diǎn)投影到圖像,得到4個(gè)perspective keypoint,這4個(gè)點(diǎn)在3D bbox regression起到一定的作用,我們在下一部分再介紹。

在keypoint檢測任務(wù)中,作者利用RoiAlign得到的14*14feature map,經(jīng)過conv,deconv最后得到6 * 28 * 28的feature map,注意到只有keypoint的u坐標(biāo)會(huì)提供2D Box以外的信息,因此,處于減少計(jì)算量的目的,作者aggregate每一列的feature,得到6 * 28的output,其中,前4個(gè)channel代表4個(gè)keypoint被投影到相應(yīng)的u坐標(biāo)的概率,后面兩個(gè)channel代表是left or right boundary上的keypoint的概率。

3. 3D Box Estimation

通過網(wǎng)絡(luò)回歸得到的 2D box 的 dimension,viewpoint,還有 keypoint,我們可以通過一定的方式得到3D box的位置。定義 3D box 的狀態(tài)x = [x, y, z, θ]。

Figure 5,給出了一些稀疏的約束。包含了特征點(diǎn)的映射過程。這里也體現(xiàn)了keypoint的用處。

上述公式即為約束方程,因此可以通過高斯牛頓的方法直接求解。具體可以參考論文的引文17。這里我們簡單證明一下第一個(gè)公式。注意,這里的假設(shè)都是u,v坐標(biāo)都已經(jīng)經(jīng)過相機(jī)內(nèi)參的歸一化了。

4. Dense 3D Box Alignment

這里就回到shenshaojie老師比較熟悉的BA的過程了,由于part 3僅僅只是一個(gè)object level的深度,這里文章利用最小化左右視圖的RGB的值,得到一個(gè)更加refine的過程。定義如下的誤差函數(shù)

求解可以利用G20或者ceres也可以完成。整個(gè)alignment過程其實(shí)相對于深度的直接預(yù)測是更加robust的,因?yàn)檫@種預(yù)測方法,避免了全局的depth estimation中的一些invalid的pixel引起的ill problem的問題。

5. experiment

作者在實(shí)驗(yàn)這塊達(dá)到了雙目視覺的state-of-the-art,同時(shí)對于各個(gè)module也做了很充足的實(shí)驗(yàn)(這塊請查看原論文)。

下面是圖a、b、c為處理結(jié)果示例,每幅圖像內(nèi)部上中下三部分,分別為左眼圖像檢測結(jié)果、右眼圖像檢測結(jié)果、鳥瞰視圖檢測結(jié)果。

圖a

圖b

圖c

6. Insight

最后談?wù)勎恼陆o我的一些 insights,首先,整個(gè)文章將傳統(tǒng)的 detection 的任務(wù),結(jié)合了 geometry constraint 優(yōu)化的方式,做到了3D位置的估計(jì),想法其實(shí)在不少文章sfm-learner之類的文章已經(jīng)有體現(xiàn)過了,不過用在3Ddetection上面還是比較新穎,避免了做雙目匹配估計(jì)深度的過程。也屬于slam跟深度學(xué)習(xí)結(jié)合的一篇文章,感興趣的朋友可以繼續(xù)看看(下面鏈接)相關(guān)文章

arxiv.org/abs/1802.0552

談幾點(diǎn)我個(gè)人意義上的不足吧,首先耗時(shí)過程 0.28s 的 inference time,不過可能作者的重點(diǎn)也不在這個(gè)方面,特征的利用上可以更加有效率,在實(shí)現(xiàn)上。其次,能不能采用deep3dbox的方式預(yù)測dimension,然后添加入優(yōu)化項(xiàng)呢...總體來說,是一篇不錯(cuò)的值得一讀的文章!

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 機(jī)器人
    +關(guān)注

    關(guān)注

    213

    文章

    31075

    瀏覽量

    222201
  • 3D
    3D
    +關(guān)注

    關(guān)注

    9

    文章

    3011

    瀏覽量

    115024
  • 圖像檢測
    +關(guān)注

    關(guān)注

    0

    文章

    35

    瀏覽量

    12188

原文標(biāo)題:大疆、港科大聯(lián)手!雙目3D目標(biāo)檢測實(shí)驗(yàn)效果大放送 | CVPR 2019

文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    人形機(jī)器人 3D 視覺路線之爭:激光雷達(dá)、雙目3D - ToF 誰更勝一籌?

    電子發(fā)燒友網(wǎng)報(bào)道(文 / 吳子鵬)在人形機(jī)器人的設(shè)計(jì)方案中,3D 視覺技術(shù)是實(shí)現(xiàn)環(huán)境感知與智能化決策的核心支撐之一。它能夠助力人形機(jī)器人完成環(huán)境感知與建模、動(dòng)態(tài)目標(biāo)檢測與跟蹤、物體操作與精細(xì)控制等
    的頭像 發(fā)表于 04-15 00:14 ?4084次閱讀

    奧比中光Gemini 330系列雙目3D相機(jī)完成NVIDIA Jetson Thor平臺(tái)全面適配

    在CES 2026展會(huì)期間,奧比中光發(fā)布專為機(jī)械臂腕部設(shè)計(jì)超小型雙目3D相機(jī)Gemini 305 立即購買,并正式宣布其面向機(jī)器人的標(biāo)志性產(chǎn)品Gemini 330系列相機(jī)已完成與先進(jìn)算力平臺(tái)
    的頭像 發(fā)表于 01-12 10:22 ?301次閱讀

    奧比中光正式推出超小型雙目3D相機(jī)Gemini 305

    1月6日,CES 2026首日,奧比中光正式推出超小型雙目3D相機(jī)Gemini 305。該產(chǎn)品專為機(jī)械臂腕部設(shè)計(jì),最小成像距離僅4厘米,視場角達(dá)88°×65°,且支持靈活切換成像模式。Gemini 305為協(xié)作機(jī)械臂、人形機(jī)器人及工業(yè)柔性抓取提供了精細(xì)視覺解決方案。
    的頭像 發(fā)表于 01-08 17:14 ?561次閱讀

    Vitrox的v510i系列的3D AOI光學(xué)檢測設(shè)備

    V510i部署在SMT生產(chǎn)線的 貼片機(jī)之后、回流焊爐之前或之后 ,主要用于檢測貼裝好的電子元件是否存在缺陷。其核心任務(wù)是: 3D與2D復(fù)合檢測 :同時(shí)利用
    的頭像 發(fā)表于 12-04 09:27 ?655次閱讀

    ,帶給3D打印行業(yè)一場“成人禮”

    布局3D打印是行業(yè)周期的回應(yīng),巨頭未入局凸顯行業(yè)需成熟,消費(fèi)級市場快速增長。
    的頭像 發(fā)表于 11-21 10:11 ?1645次閱讀

    友思特應(yīng)用 | 基于高精度雙目散斑 3D 相機(jī)的放射治療視覺定位應(yīng)用

    面臨挑戰(zhàn)。本文將深入探討基于高精度雙目散斑3D相機(jī)的視覺定位系統(tǒng)如何革新放療定位流程,提升治療的安全性與有效性。
    的頭像 發(fā)表于 10-30 11:05 ?405次閱讀
    友思特應(yīng)用 | 基于高精度<b class='flag-5'>雙目</b>散斑 <b class='flag-5'>3D</b> 相機(jī)的放射治療視覺定位應(yīng)用

    iTOF技術(shù),多樣化的3D視覺應(yīng)用

    動(dòng)態(tài)模糊,確保高耐光性,同時(shí)輸出2D(紅外)和3D(深度)數(shù)據(jù)。 ◆ Testing Principles ※ 測量脈沖光的飛行時(shí)間,以檢測 TOF 相機(jī)與被測物體之間的距離。 ◆ ToF 產(chǎn)品
    發(fā)表于 09-05 07:24

    奧比中光發(fā)布最新一代3D激光雷達(dá)及雙目深度相機(jī)

    近日,世界機(jī)器人大會(huì)現(xiàn)場,奧比中光發(fā)布最新一代3D激光雷達(dá)及雙目深度相機(jī),以“場景拓展”與“極限感知”為核心優(yōu)勢,進(jìn)階全領(lǐng)域能力矩陣,刷新機(jī)器人性能上限,為各類機(jī)器人帶來更靈活可靠的視覺解決方案。
    的頭像 發(fā)表于 08-15 15:05 ?1421次閱讀

    3D激光輪廓儀可實(shí)現(xiàn)在線3D測量和檢測

    Z-Trak? Express 1K5 系列專為實(shí)現(xiàn)經(jīng)濟(jì)高效的在線3D測量和檢測而設(shè)計(jì),具有高速檢測能力和實(shí)時(shí)處理性能。
    的頭像 發(fā)表于 08-08 17:17 ?968次閱讀
    <b class='flag-5'>3D</b>激光輪廓儀可實(shí)現(xiàn)在線<b class='flag-5'>3D</b>測量和<b class='flag-5'>檢測</b>

    3D打印能用哪些材質(zhì)?

    3D打印的材質(zhì)有哪些?不同材料決定了打印效果、強(qiáng)度、用途乃至安全性,本文將介紹目前主流的3D打印材質(zhì),幫助你找到最適合自己需求的材料。
    的頭像 發(fā)表于 07-28 10:58 ?3775次閱讀
    <b class='flag-5'>3D</b>打印能用哪些材質(zhì)?

    光子精密雙目3D線激光輪廓測量儀,擺脫視覺盲區(qū),1臺(tái)更比2臺(tái)強(qiáng)!

    光子精密雙目3D線激光輪廓測量儀(GL-8160D),在GL-8000系列的基礎(chǔ)上創(chuàng)新升級。GL-8160D采用全新雙目單線設(shè)計(jì),突破傳統(tǒng)
    的頭像 發(fā)表于 07-16 17:21 ?1370次閱讀
    光子精密<b class='flag-5'>雙目</b><b class='flag-5'>3D</b>線激光輪廓測量儀,擺脫視覺盲區(qū),1臺(tái)更比2臺(tái)強(qiáng)!

    海伯森3D閃測傳感器,工業(yè)檢測領(lǐng)域的高精度利器

    隨著信息技術(shù)的飛速進(jìn)步,第四次視覺革命深度融合“人”“機(jī)”“物”,基于光學(xué)原理的3D視覺檢測技術(shù)迎來爆發(fā)式發(fā)展,成為工業(yè)生產(chǎn)中更高效的檢測利器。3D視覺技術(shù)通過非接觸性、高速性、數(shù)據(jù)完
    的頭像 發(fā)表于 06-20 17:46 ?1466次閱讀
    海伯森<b class='flag-5'>3D</b>閃測傳感器,工業(yè)<b class='flag-5'>檢測</b>領(lǐng)域的高精度利器

    3D AD庫文件

    3D庫文件
    發(fā)表于 05-28 13:57 ?6次下載

    奧比中光發(fā)布新一代雙目3D相機(jī)Gemini 435Le

    近日,奧比中光在美國底特律舉辦的Automate 2025展會(huì)上發(fā)布Gemini 435Le,獲得眾多機(jī)器人專業(yè)人士的關(guān)注。作為最新一代工業(yè)級雙目視覺解決方案,Gemini 435Le雙目3D相機(jī)在前作基礎(chǔ)上針對智能機(jī)器人的工業(yè)
    的頭像 發(fā)表于 05-14 17:15 ?1098次閱讀

    HT 可視化監(jiān)控頁面的 2D3D 連線效果

    HT 是一個(gè)靈活多變的前端組件庫,具備豐富的功能和效果,滿足多種開發(fā)需求。讓我們將其效果化整為零,逐一拆解具體案例,幫助你更好地理解其實(shí)現(xiàn)方案。 此篇文章中,讓我們一起深入探討 2D3D
    的頭像 發(fā)表于 04-09 11:28 ?1505次閱讀
    HT 可視化監(jiān)控頁面的 2<b class='flag-5'>D</b> 與 <b class='flag-5'>3D</b> 連線<b class='flag-5'>效果</b>