91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

使用NVIDIA CUDA-Pointpillars檢測(cè)點(diǎn)云中的對(duì)象

星星科技指導(dǎo)員 ? 來(lái)源:NVIDIA ? 作者:NVIDIA ? 2022-04-13 16:42 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

點(diǎn)云是坐標(biāo)系中的點(diǎn)數(shù)據(jù)集。點(diǎn)包含豐富的信息,包括三維坐標(biāo)(X、Y、Z)、顏色、分類(lèi)值、強(qiáng)度值和時(shí)間等。點(diǎn)云主要來(lái)自于各種NVIDIA Jetson用例中常用的激光雷達(dá),如自主機(jī)器、感知模塊和3D建模。

其中一個(gè)關(guān)鍵應(yīng)用是利用遠(yuǎn)程和高精度的數(shù)據(jù)集來(lái)實(shí)現(xiàn)3D對(duì)象的感知、映射和定位算法。

PointPillars是最常用于點(diǎn)云推理的模型之一。本文將探討為Jetson開(kāi)發(fā)者提供的NVIDIA CUDA加速PointPillars模型。馬上下載CUDA-PointPillars模型。

什么是CUDA-Pointpillars

本文所介紹的CUDA-Pointpillars可以檢測(cè)點(diǎn)云中的對(duì)象。其流程如下:

基本預(yù)處理:生成柱體。

預(yù)處理:生成BEV特征圖(10個(gè)通道)。

用于TensorRT的ONNX模型:通過(guò)TensorRT實(shí)現(xiàn)的ONNX模式。

后處理:通過(guò)解析TensorRT引擎輸出生成邊界框。

圖 1 。 CUDA 點(diǎn)柱管道。

基本預(yù)處理

基本預(yù)處理步驟將點(diǎn)云轉(zhuǎn)換為基本特征圖?;咎卣鲌D包含以下組成部分:

基本特征圖。

柱體坐標(biāo):每根柱體的坐標(biāo)。

參數(shù):柱體數(shù)量。

poYBAGJWjTyABlEDAACUw3Ico5I757.png

圖 2 。將點(diǎn)云轉(zhuǎn)換為基礎(chǔ)要素地圖

預(yù)處理

預(yù)處理步驟將基本特征圖(4個(gè)通道)轉(zhuǎn)換為 BEV 特征圖(10個(gè)通道)。

圖 3 。將基本要素地圖轉(zhuǎn)換為 BEV 要素地圖

用于TensorRT的ONNX模型

出于以下原因修改OpenPCDet的原生點(diǎn)柱:

小型操作過(guò)多,并且內(nèi)存帶寬低。

NonZero等一些TensorRT不支持的操作。

ScatterND等一些性能較低的操作。

使用“dict”作為輸入和輸出,因此無(wú)法導(dǎo)出ONNX文件。

為了從原生OpenPCDet導(dǎo)出ONNX,我們修改了該模型(圖4)。

圖 4 。 CUDA Pointpillars 中 ONNX 模型概述。

您可把整個(gè)ONNX文件分為以下幾個(gè)部分:

輸入:BEV特征圖、柱體坐標(biāo)、參數(shù),均在預(yù)處理中生成。

輸出:類(lèi)、框、Dir_class,在后處理步驟中解析后生成一個(gè)邊界框。

ScatterBEV:將點(diǎn)柱(一維)轉(zhuǎn)換為二維圖像,可作為T(mén)ensorRT的插件。

其他:TensorRT支持的其他部分。

圖 5 。將點(diǎn)支柱數(shù)據(jù)散射到二維主干的二維圖像中。

后處理

在后處理步驟中解析TensorRT引擎的輸出(class、box和dir_class)和輸出邊界框。圖6所示的是示例參數(shù)。

poYBAGJWjW6AY7PjAAE6J47WgR0196.png

圖 6 。邊界框的參數(shù)。

使用 CUDA PointPillars

若要使用CUDA-PointPillars,需要提供點(diǎn)云的ONNX模式文件和數(shù)據(jù)緩存:

 std::vector nms_pred; PointPillar pointpillar(ONNXModel_File, cuda_stream); pointpillar.doinfer(points_data, points_count, nms_pred);

將OpenPCDet訓(xùn)練的原生模型轉(zhuǎn)換為CUDA-Pointpillars的ONNX文件

我們?cè)陧?xiàng)目中提供了一個(gè)Python腳本,可以將OpenPCDet訓(xùn)練的原生模型轉(zhuǎn)換成CUDA-Pointpillars的ONNX文件??稍贑UDA-Pointpillars的/tool 目錄下找到exporter.py 腳本。

可在當(dāng)前目錄下運(yùn)行以下命令獲得pointpillar.onnx文件:

$ python exporter.py --ckpt ./*.pth

性能

下表顯示了測(cè)試環(huán)境和性能。在測(cè)試之前提升CPUGPU的性能。


表 1 測(cè)試平臺(tái)與性能

開(kāi)始使用 CUDA PointPillars

本文介紹了什么是CUDA-PointPillars以及如何使用它來(lái)檢測(cè)點(diǎn)云中的對(duì)象。

由于原生OpenPCDet無(wú)法導(dǎo)出ONNX,而且對(duì)于TensorRT來(lái)說(shuō),性能較低的小型操作數(shù)量過(guò)多,因此我們開(kāi)發(fā)了CUDA-PointPillars。該應(yīng)用可以將OpenPCDet訓(xùn)練的原生模型導(dǎo)出為特殊的ONNX模型,并通過(guò)TensorRT推斷ONNX模型。

關(guān)于作者

Lei Fan 是 NVIDIA 的高級(jí) CUDA 軟件工程師。他目前正與 TSE 中國(guó)團(tuán)隊(duì)合作,開(kāi)發(fā)由 CUDA 優(yōu)化軟件性能的解決方案。

Lily Li 正在為 NVIDIA 的機(jī)器人團(tuán)隊(duì)處理開(kāi)發(fā)人員關(guān)系。她目前正在 Jetson 生態(tài)系統(tǒng)中開(kāi)發(fā)機(jī)器人技術(shù)解決方案,以幫助創(chuàng)建最佳實(shí)踐。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5653

    瀏覽量

    109926
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1238

    瀏覽量

    26226
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    NVIDIA推出cuEST量子化學(xué)加速庫(kù)

    本周,NVIDIA 發(fā)布了 NVIDIA cuEST。這是一款全新的 NVIDIA CUDA-X 庫(kù),可將電子結(jié)構(gòu)計(jì)算遷移到 GPU 上執(zhí)行。應(yīng)用材料公司、三星、新思科技和 TSMC
    的頭像 發(fā)表于 03-23 15:11 ?181次閱讀

    NVIDIA cuDF和cuVS獲全球領(lǐng)先數(shù)據(jù)平臺(tái)采用

    企業(yè)每年產(chǎn)生數(shù)百 ZB (Zettabyte) 的數(shù)據(jù),并在爭(zhēng)相將這些信息轉(zhuǎn)化為洞察。NVIDIA cuDF 和 cuVS 作為基于 NVIDIA CUDA-X 構(gòu)建的加速數(shù)據(jù)庫(kù),正在被各行業(yè)的數(shù)據(jù)平臺(tái)所應(yīng)用,帶來(lái)至高 5 倍性
    的頭像 發(fā)表于 03-19 15:46 ?158次閱讀

    NVIDIA攜手全球工業(yè)軟件巨頭構(gòu)建AI智能體加速設(shè)計(jì)與工程開(kāi)發(fā)流程

    GTC — NVIDIA 今日宣布,正與包括 Cadence、達(dá)索系統(tǒng)、PTC、西門(mén)子和新思科技等在內(nèi)的全球領(lǐng)先工業(yè)軟件廠商合作,將 NVIDIA CUDA-X?、NVIDIA Omn
    的頭像 發(fā)表于 03-19 15:39 ?184次閱讀

    借助NVIDIA CUDA Tile IR后端推進(jìn)OpenAI Triton的GPU編程

    NVIDIA CUDA Tile 是基于 GPU 的編程模型,其設(shè)計(jì)目標(biāo)是為 NVIDIA Tensor Cores 提供可移植性,從而釋放 GPU 的極限性能。CUDA Tile 的
    的頭像 發(fā)表于 02-10 10:31 ?341次閱讀

    如何在NVIDIA CUDA Tile中編寫(xiě)高性能矩陣乘法

    本博文是系列課程的一部分,旨在幫助開(kāi)發(fā)者學(xué)習(xí) NVIDIA CUDA Tile 編程,掌握構(gòu)建高性能 GPU 內(nèi)核的方法,并以矩陣乘法作為核心示例。
    的頭像 發(fā)表于 01-22 16:43 ?4981次閱讀
    如何在<b class='flag-5'>NVIDIA</b> <b class='flag-5'>CUDA</b> Tile中編寫(xiě)高性能矩陣乘法

    超擎數(shù)智為您深度解析NVIDIA Quantum-X800 InfiniBand平臺(tái)

    NVIDIA
    專(zhuān)精特新
    發(fā)布于 :2026年01月08日 19:47:03

    NVIDIA RTX PRO 5000 Blackwell GPU的深度評(píng)測(cè)

    NVIDIA RTX PRO 5000 Blackwell 是 NVIDIA RTX 5000 Ada Generation 的升級(jí)迭代產(chǎn)品,其各項(xiàng)核心指標(biāo)均針對(duì) GPU 加速工作流的高性能
    的頭像 發(fā)表于 01-06 09:51 ?2895次閱讀
    <b class='flag-5'>NVIDIA</b> RTX PRO 5000 Blackwell GPU的深度評(píng)測(cè)

    如何解決激光雷達(dá)點(diǎn)云中“鬼影”和“膨脹”問(wèn)題?

    [首發(fā)于智駕最前沿微信公眾號(hào)]之前在聊激光雷達(dá)點(diǎn)云“鬼影”和“膨脹”的文章中( 相關(guān)閱讀: 激光雷達(dá)點(diǎn)云中“鬼影”和“膨脹”是什么原因?qū)е碌??),很多小伙伴都提到一個(gè)問(wèn)題,那就是激光雷達(dá)點(diǎn)
    的頭像 發(fā)表于 01-02 09:30 ?463次閱讀
    如何解決激光雷達(dá)<b class='flag-5'>點(diǎn)</b><b class='flag-5'>云中</b>“鬼影”和“膨脹”問(wèn)題?

    NVIDIA CUDA Tile的創(chuàng)新之處、工作原理以及使用方法

    NVIDIA CUDA 13.1 推出 NVIDIA CUDA Tile,這是自 2006 年 NVIDIA
    的頭像 發(fā)表于 12-24 10:17 ?527次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>CUDA</b> Tile的創(chuàng)新之處、工作原理以及使用方法

    在Python中借助NVIDIA CUDA Tile簡(jiǎn)化GPU編程

    NVIDIA CUDA 13.1 版本新增了基于 Tile 的GPU 編程模式。它是自 CUDA 發(fā)明以來(lái) GPU 編程最核心的更新之一。借助 GPU tile kernels,可以用比 SIMT
    的頭像 發(fā)表于 12-13 10:12 ?1263次閱讀
    在Python中借助<b class='flag-5'>NVIDIA</b> <b class='flag-5'>CUDA</b> Tile簡(jiǎn)化GPU編程

    NVIDIA CUDA 13.1版本的新增功能與改進(jìn)

    NVIDIA CUDA 13.1 是自 CUDA 二十年前發(fā)明以來(lái),規(guī)模最大、內(nèi)容最全面的一次更新。
    的頭像 發(fā)表于 12-13 10:08 ?2277次閱讀

    NVIDIA在Hot Chips 2025大會(huì)展示創(chuàng)新技術(shù)

    本周在加利福尼亞州帕洛阿爾托(Palo Alto)舉行的 Hot Chips 大會(huì)上,NVIDIA 專(zhuān)家詳細(xì)介紹了 NVIDIA NVLink 和Spectrum-X 以太網(wǎng)技術(shù)、Blackwell 以及 CUDA 如何為全球數(shù)
    的頭像 發(fā)表于 08-27 12:52 ?1971次閱讀

    NVIDIA攜手Ansys和DCAI推進(jìn)流體動(dòng)力學(xué)量子算法發(fā)展

    為抓住這一機(jī)遇,Ansys 宣布,將利用在 Gefion 超級(jí)計(jì)算機(jī)上運(yùn)行的 NVIDIA CUDA-Q 量子計(jì)算平臺(tái),推進(jìn)流體動(dòng)力學(xué)應(yīng)用的量子算法發(fā)展。
    的頭像 發(fā)表于 06-12 15:28 ?1040次閱讀

    借助NVIDIA技術(shù)加速半導(dǎo)體芯片制造

    NVIDIA Blackwell GPU、NVIDIA Grace CPU、高速 NVIDIA NVLink 網(wǎng)絡(luò)架構(gòu)和交換機(jī),以及諸如 NVIDIA cuDSS 和
    的頭像 發(fā)表于 05-27 13:59 ?1157次閱讀

    使用NVIDIA CUDA-X庫(kù)加速科學(xué)和工程發(fā)展

    NVIDIA GTC 全球 AI 大會(huì)上宣布,開(kāi)發(fā)者現(xiàn)在可以通過(guò) CUDA-X 與新一代超級(jí)芯片架構(gòu)的協(xié)同,實(shí)現(xiàn) CPU 和 GPU 資源間深度自動(dòng)化整合與調(diào)度,相較于傳統(tǒng)加速計(jì)算架構(gòu),該技術(shù)可使計(jì)算工程工具運(yùn)行速度提升至原來(lái)的 11 倍,計(jì)算規(guī)模增加至 5 倍。
    的頭像 發(fā)表于 03-25 15:11 ?1597次閱讀