91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

谷歌Objectron數(shù)據(jù)集:3D目標檢測數(shù)據(jù)集及檢測方案

新機器視覺 ? 來源:新機器視覺 ? 作者:新智元 ? 2020-11-27 09:49 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

谷歌人工智能實驗室近日發(fā)布 Objectron 數(shù)據(jù)集,這是一個以3D目標為中心的視頻剪輯的集合,這些視頻剪輯從不同角度捕獲了較大的一組公共對象。數(shù)據(jù)集包括 15K 帶注釋的視頻剪輯,并補充了從地理多樣的樣本中收集的超過 4M 帶注釋的圖像(覆蓋五大洲的 10 個國家)。

機器學習(ML)的最新技術已經(jīng)在許多計算機視覺任務上取得了SOTA的結果,但僅僅是通過在2D照片上訓練模型而已。 在這些成功的基礎上,提高模型對 3D 物體的理解力有很大的潛力來支持更廣泛的應用場景,如增強現(xiàn)實、機器人、自動化和圖像檢索。 今年早些時候,谷歌發(fā)布了 MediaPipe Objectron,一套為移動設備設計的實時 3D 目標檢測模型,這個模型是基于一個已標注的、真實世界的 3D 數(shù)據(jù)集,可以預測物體的 3D 邊界。

然而,理解3D 中的對象仍然是一項具有挑戰(zhàn)性的任務,因為與2D 任務(例如,ImageNet、 COCO 和 Open Images)相比,缺乏大型的真實世界數(shù)據(jù)集。 為了使研究團體能夠繼續(xù)推進3D 對象理解,迫切需要發(fā)布以對象為中心的視頻數(shù)據(jù)集,這些數(shù)據(jù)集能夠捕獲更多的對象的3D 結構,同時匹配用于許多視覺任務(例如,視頻或攝像機流)的數(shù)據(jù)格式,以幫助機器學習模型的訓練和基準測試。 近期谷歌發(fā)布了 Objectron 數(shù)據(jù)集,這是一個以對象為中心的短視頻剪輯數(shù)據(jù)集,從不同的角度捕捉了一組更大的普通對象。

每個視頻剪輯都伴隨著 AR 會話元數(shù)據(jù),其中包括攝像機姿態(tài)和稀疏點云。數(shù)據(jù)還包含為每個對象手動注釋的3D 邊界,這些 bounding box 描述了對象的位置、方向和尺寸。 每個視頻剪輯都隨附有 AR 的元數(shù)據(jù),其中包括相機姿勢和稀疏點云。數(shù)據(jù)還包含每個對象的手動注釋的 3D 邊界框,用于描述對象的位置,方向和尺寸。 該數(shù)據(jù)集包括15K 注釋視頻剪輯與超過4M 注釋圖像收集的地理多樣性樣本(涵蓋10個國家橫跨五大洲)。

3D 目標檢測解決方案

除了這個數(shù)據(jù)集,谷歌還分享了一個 3D 目標檢測解決方案,可以用于4類物體:鞋子、椅子、杯子和相機。 這些模型是在 MediaPipe 中發(fā)布的,MediaPipe 是谷歌的開源框架,用于跨平臺可定制的流媒體機器學習解決方案,它同時也支持機器學習解決方案,比如設備上的實時手勢、虹膜和身體姿態(tài)跟蹤。

與之前發(fā)布的 single-stage Objectron 模型相比,這些最新版本采用了兩級架構。 第一級使用 TensorFlow 目標檢測模型來尋找物體的 2D 裁剪,第二級使用圖像裁剪來估計三維bounding box,同時計算下一幀對象的二維裁剪,使得目標檢測器不需要運行每一幀。第二階段的三維 bounding box 預測器是以83 FPS在 Adreno 650 GPU 上運行。

3D 目標檢測的評估指標

有了真實的注釋,我們就可以使用 3D IoU(intersection over union)相似性統(tǒng)計來評估 3D 目標檢測模型的性能,這是計算機視覺任務常用的指標,衡量bounding box與ground truth的接近程度。 谷歌提出了一種計算一般的面向三維空間的精確 3D IoU 的算法。 首先使用 Sutherland-Hodgman Polygon clipping 算法計算兩個盒子面之間的交點,這類似于計算機圖形學的剔除技術(frustum culling),利用所有截斷多邊形的凸包計算相交的體積。最后,通過交集的體積和兩個盒子的并集的體積計算 IoU。 谷歌表示將隨數(shù)據(jù)集一起發(fā)布評估的源代碼。

數(shù)據(jù)格式

Objectron 數(shù)據(jù)集的技術細節(jié),包括使用和教程,均可在數(shù)據(jù)集網(wǎng)站上獲得。這些數(shù)據(jù)集中的物體包括自行車、書籍、瓶子、相機、麥片盒、椅子、杯子、筆記本電腦和鞋子等,和數(shù)據(jù)集一起發(fā)布的具有以下內容: 1.視頻序列 2.帶注釋的標簽(目標的3D 邊界框) 3.AR 元數(shù)據(jù) (如照相機姿態(tài)、點云和平面表面) 4.處理過的數(shù)據(jù)集: 混合版本的帶注釋的幀、tf.example 格式的圖像和 SequenceExample 格式的視頻 5.支持基于上面描述的度量評估的腳本 6.支持腳本將數(shù)據(jù)加載到 Tensorflow、Pytorch、Jax并且可視化數(shù)據(jù)集 除了數(shù)據(jù)集,谷歌還開放了數(shù)據(jù)管道來解析 Tensorflow、 PyTorch 和 Jax 框架中的數(shù)據(jù)集。

還提供了 colab notebook 的實例 。 通過發(fā)布這個 Objectron 數(shù)據(jù)集,谷歌希望能夠使研究團體推進三維物體幾何理解的極限。同時也希望促進新的研究和應用,如視圖合成,改進的 3D 表示和非監(jiān)督式學習等。 參考鏈接: https://ai.googleblog.com/2020/11/announcing-objectron-dataset.html?utm_source=feedburner&utm_medium=feed&utm_campaign=Feed%3A+blogspot%2FgJZg+%28Google+AI+Blog%29

責任編輯:xj

原文標題:重磅!谷歌發(fā)布3D目標檢測數(shù)據(jù)集及檢測方案

文章出處:【微信公眾號:新機器視覺】歡迎添加關注!文章轉載請注明出處。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 3D
    3D
    +關注

    關注

    9

    文章

    3011

    瀏覽量

    115059
  • 谷歌
    +關注

    關注

    27

    文章

    6254

    瀏覽量

    111406
  • 人工智能
    +關注

    關注

    1817

    文章

    50098

    瀏覽量

    265395

原文標題:重磅!谷歌發(fā)布3D目標檢測數(shù)據(jù)集及檢測方案

文章出處:【微信號:vision263com,微信公眾號:新機器視覺】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    YOLO5目標檢測方案-基于米爾RK3576開發(fā)板

    畫面中實時繪制檢測框。 PART 02數(shù)據(jù)處理流程與優(yōu)化實踐 攝像頭數(shù)據(jù)需要經(jīng)歷哪些過程才能到顯示端輸出,參考下圖 2.1 CPU處理方案及其瓶頸 如果把攝像頭
    發(fā)表于 01-22 19:21

    Vitrox的v510i系列的3D AOI光學檢測設備

    V510i部署在SMT生產(chǎn)線的 貼片機之后、回流焊爐之前或之后 ,主要用于檢測貼裝好的電子元件是否存在缺陷。其核心任務是: 3D與2D復合檢測 :同時利用
    的頭像 發(fā)表于 12-04 09:27 ?664次閱讀

    Vitrox 3D在線X-RAY檢測技術

    中國的核心代理商,致力于將前沿的自動光學檢測技術帶給國內電子制造業(yè)。今天,我們將深入剖析Vitrox核心技術之一——3D在線X-RAY自動檢測系統(tǒng)?的工作原理 一、技術背景:為何需要3D
    的頭像 發(fā)表于 12-03 10:05 ?647次閱讀

    SimData:基于aiSim的高保真虛擬數(shù)據(jù)生成方案

    01前言在自動駕駛感知系統(tǒng)的研發(fā)過程中,模型的性能高度依賴于大規(guī)模、高質量的感知數(shù)據(jù)。目前業(yè)界常用的數(shù)據(jù)包括KITTI、nuScenes、WaymoOpenDataset等,它們?yōu)?/div>
    的頭像 發(fā)表于 11-07 17:35 ?5367次閱讀
    SimData:基于aiSim的高保真虛擬<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>集</b>生成<b class='flag-5'>方案</b>

    iTOF技術,多樣化的3D視覺應用

    動態(tài)模糊,確保高耐光性,同時輸出2D(紅外)和3D(深度)數(shù)據(jù)。 ◆ Testing Principles ※ 測量脈沖光的飛行時間,以檢測 TOF 相機與被測物體之間的距離。
    發(fā)表于 09-05 07:24

    AIcube1.4目標檢測模型導入yolotxt格式數(shù)據(jù)后一直顯示數(shù)據(jù)正在解析,為什么?

    AIcube1.4目標檢測模型導入yolotxt格式數(shù)據(jù)后一直顯示數(shù)據(jù)正在解析 數(shù)據(jù)有問題,把
    發(fā)表于 08-13 07:16

    AI Cube如何導入數(shù)據(jù)?

    我從在線平臺標注完并且下載了數(shù)據(jù),也按照ai cube的要求修改了文件夾名稱,但是導入提示 不知道是什么原因,我該怎么辦? 以下是我修改后的文件夾目錄
    發(fā)表于 08-11 08:12

    請問AICube所需的目標檢測數(shù)據(jù)標注可以使用什么工具?

    請問AICube所需的目標檢測數(shù)據(jù)標注可以使用什么工具? 我使用labelimg進行標注,標注后的數(shù)據(jù)
    發(fā)表于 08-11 08:07

    3D激光輪廓儀可實現(xiàn)在線3D測量和檢測

    Z-Trak? Express 1K5 系列專為實現(xiàn)經(jīng)濟高效的在線3D測量和檢測而設計,具有高速檢測能力和實時處理性能。
    的頭像 發(fā)表于 08-08 17:17 ?971次閱讀
    <b class='flag-5'>3D</b>激光輪廓儀可實現(xiàn)在線<b class='flag-5'>3D</b>測量和<b class='flag-5'>檢測</b>

    云訓練平臺數(shù)據(jù)過大無法下載數(shù)據(jù)至本地怎么解決?

    起因是現(xiàn)在平臺限制了圖片數(shù)量,想要本地訓練下載數(shù)據(jù)時發(fā)現(xiàn)只會跳出網(wǎng)絡異常的錯誤,請問這有什么解決辦法?
    發(fā)表于 07-22 06:03

    使用AICube導入數(shù)據(jù)點創(chuàng)建后提示數(shù)據(jù)不合法怎么處理?

    重現(xiàn)步驟 data目錄下 labels.txt只有英文 **錯誤日志** 但是使用示例的數(shù)據(jù)可以完成訓練并部署
    發(fā)表于 06-24 06:07

    海伯森3D閃測傳感器,工業(yè)檢測領域的高精度利器

    隨著信息技術的飛速進步,第四次視覺革命深度融合“人”“機”“物”,基于光學原理的3D視覺檢測技術迎來爆發(fā)式發(fā)展,成為工業(yè)生產(chǎn)中更高效的檢測利器。3D視覺技術通過非接觸性、高速性、
    的頭像 發(fā)表于 06-20 17:46 ?1470次閱讀
    海伯森<b class='flag-5'>3D</b>閃測傳感器,工業(yè)<b class='flag-5'>檢測</b>領域的高精度利器

    數(shù)據(jù)下載失敗的原因?

    數(shù)據(jù)下載失敗什么原因太大了嗎,小的可以下載,想把大的下載去本地訓練報錯網(wǎng)絡錯誤 大的數(shù)據(jù)多大?數(shù)據(jù)量有多少?
    發(fā)表于 06-18 07:04

    請問NanoEdge AI數(shù)據(jù)該如何構建?

    我想用NanoEdge來識別異常的聲音,但我目前沒有辦法生成模型,我感覺可能是數(shù)據(jù)的問題,請問我該怎么構建數(shù)據(jù)?或者生成模型失敗還會有哪些原因?
    發(fā)表于 03-10 08:20