91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA Jetson AGX Xavier應(yīng)用在AI和

星星科技指導(dǎo)員 ? 來源:NVIDIA ? 作者:Dustin ? 2022-04-18 10:26 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

面向 AI 開發(fā)人員的全球終極嵌入式解決方案JetsonAGXXavier現(xiàn)已作為 NVIDIA 的獨(dú)立生產(chǎn)模塊發(fā)貨。英偉達(dá) AGX 系統(tǒng)的成員對于自主機(jī)器,Jetson AGX Xavier 非常適合將先進(jìn)的 AI 和計(jì)算機(jī)視覺部署到邊緣,使現(xiàn)場機(jī)器人平臺具有工作站級性能,并能夠在不依賴人工干預(yù)和云連接的情況下完全自主運(yùn)行。由 Jetson AGX Xavier 提供支持的智能機(jī)器可以自由地在其環(huán)境中進(jìn)行交互和安全導(dǎo)航,不受復(fù)雜地形和動態(tài)障礙物的阻礙,完全自主地完成現(xiàn)實(shí)世界的任務(wù)。這包括需要高級實(shí)時感知和推理才能執(zhí)行的包裹遞送和工業(yè)檢查。作為世界上第一臺專為機(jī)器人和邊緣計(jì)算設(shè)計(jì)的計(jì)算機(jī),Jetson AGX Xavier 的高性能可以處理視覺里程計(jì)、傳感器融合、定位和映射,障礙物檢測和對下一代機(jī)器人至關(guān)重要的路徑規(guī)劃算法。圖 1 顯示了現(xiàn)在全球可用的生產(chǎn)計(jì)算模塊。開發(fā)人員現(xiàn)在可以開始批量部署新的自主機(jī)器。

最新一代 NVIDIA 業(yè)界領(lǐng)先的Jetson AGX系列嵌入式 Linux 高性能計(jì)算機(jī),Jetson AGX Xavier 提供 GPU 工作站級性能,具有無與倫比的 32 TeraOPS (TOPS) 峰值計(jì)算和 750Gbps 的高速 I/O,體積小巧100x87mm 外形尺寸。用戶可以根據(jù)應(yīng)用需要配置 10W、15W 和 30W 的工作模式。Jetson AGX Xavier 為可部署到邊緣的計(jì)算密度、能源效率和 AI 推理功能樹立了新的標(biāo)桿,使具有端到端自主能力的下一級智能機(jī)器成為可能。

Jetson 使用深度學(xué)習(xí)和計(jì)算機(jī)視覺為世界上許多最先進(jìn)的機(jī)器人和自主機(jī)器背后的 AI 提供動力,同時專注于性能、效率和可編程性。Jetson AGX Xavier,如圖 2 所示,由超過 90 億個晶體管組成,基于有史以來最復(fù)雜的片上系統(tǒng) (SoC)。該平臺包含一個集成的 512 核 NVIDIA Volta GPU,包括 64 個張量核心、8 核 NVIDIA Carmel ARMv8.2 64 位 CPU、16GB 256 位 LPDDR4x、雙 NVIDIA深度學(xué)習(xí)加速器(DLA) 引擎、NVIDIA Vision Accelerator 引擎、高清視頻編解碼器、128Gbps 的專用攝像頭攝取和 16 通道 PCIe Gen 4 擴(kuò)展。256 位接口上的內(nèi)存帶寬為 137GB/s,而 DLA 引擎卸載了深度神經(jīng)網(wǎng)絡(luò) (DNN) 的推理。NVIDIA 用于 Jetson AGX Xavier 的 JetPack SDK 4.1.1 包括 CUDA 10.0、cuDNN 7.3 和 TensorRT 5.0,提供完整的 AI 軟件堆棧。

poYBAGJczEyAIdLjAAOMQVqB1b0776.png

圖 2. Jetson AGX Xavier 提供一組豐富的高速 I/O

這使開發(fā)人員能夠在機(jī)器人、智能視頻分析、醫(yī)療儀器、嵌入式物聯(lián)網(wǎng)邊緣設(shè)備等應(yīng)用中部署加速 AI。與其前身 Jetson TX1 和 TX2 一樣,Jetson AGX Xavier 使用系統(tǒng)級模塊 (SoM) 范例。所有處理都包含在計(jì)算模塊上,高速 I/O 位于通過高密度板對板連接器提供的分線載體或外殼上。以這種方式在模塊上封裝功能使開發(fā)人員可以輕松地將 Jetson Xavier 集成到他們自己的設(shè)計(jì)中。NVIDIA 發(fā)布了全面的文檔和參考設(shè)計(jì)文件,可供嵌入式設(shè)計(jì)人員下載,以使用 Jetson AGX Xavier 創(chuàng)建自己的設(shè)備和平臺。請務(wù)必咨詢JetsonAGXXavier 模塊數(shù)據(jù)表和JetsonAGXXavier OEM 產(chǎn)品設(shè)計(jì)指南,了解表 1 中列出的全部產(chǎn)品功能,以及機(jī)電規(guī)格、模塊引腳排列、電源排序和信號路由指南。

poYBAGJczNOAZfpmAAC3OMUs6vY543.png

Jetson AGX Xavier 包括超過 750Gbps 的高速 I/O,為流式傳感器和高速外圍設(shè)備提供了非凡的帶寬。它是首批支持 PCIe Gen 4 的嵌入式設(shè)備之一,在五個 PCIe Gen 4 控制器上提供 16 個通道,其中三個可以在根端口或端點(diǎn)模式下運(yùn)行。16 個 MIPI CSI-2 通道可連接到四個 4 通道攝像頭、六個 2 通道攝像頭、六個 1 通道攝像頭或這些配置的組合,最多六個攝像頭,36 個虛擬通道允許同時連接更多攝像頭使用流聚合。其他高速 I/O 包括三個 USB 3.1 端口、SLVS-EC、UFS 和用于千兆以太網(wǎng)的 RGMII。開發(fā)者現(xiàn)在可以訪問 NVIDIA 的JetPack 4.1.1 開發(fā)者預(yù)覽版Jetson AGX Xavier 的軟件,列于表 2。開發(fā)者預(yù)覽版包括 Linux For Tegra (L4T) R31.1 板級支持包 (BSP),支持 Linux 內(nèi)核 4.9 和目標(biāo)上的 Ubuntu 18.04。在主機(jī) PC 端,JetPack 4.1.1 支持 Ubuntu 16.04 和 Ubuntu 18.04。

poYBAGJczNyAE7GMAAAq_GUV5u0939.png

JetPack 4.1.1 開發(fā)人員預(yù)覽版允許開發(fā)人員立即開始使用 Jetson AGX Xavier 對產(chǎn)品和應(yīng)用程序進(jìn)行原型設(shè)計(jì),為生產(chǎn)部署做準(zhǔn)備。NVIDIA 將繼續(xù)通過額外的功能增強(qiáng)和性能優(yōu)化來改進(jìn) JetPack。請閱讀發(fā)行說明以了解此版本的亮點(diǎn)和軟件狀態(tài)。

伏特顯卡

Jetson AGX Xavier 集成 Volta GPU,如圖 3 所示,提供 512 個 CUDA 內(nèi)核和 64 個 Tensor 內(nèi)核,可實(shí)現(xiàn)高達(dá) 11 TFLOPS FP16 或 22 TOPS 的 INT8 計(jì)算,最大時鐘頻率為 1.37GHz。它支持計(jì)算能力為 sm_72 的 CUDA 10。GPU 包括 8 個 Volta 流式多處理器 (SM),每個 Volta SM 有 64 個 CUDA 核心和 8 個張量核心。每個 Volta SM 都包含一個 128KB L1 緩存,比前幾代產(chǎn)品大 8 倍。SM 共享一個 512KB L2 緩存,提供比前幾代快 4 倍的訪問速度。

Volta_GPU-625x414.png

圖 3. Jetson AGX Xavier Volta GPU 框圖

每個 SM 由 4 個獨(dú)立的處理塊組成,稱為 SMP(流式多處理器分區(qū)),每個處理塊都包括自己的 L0 指令緩存、warp 調(diào)度程序、調(diào)度單元和寄存器文件,以及 CUDA 核心和張量核心。每個 SM 的 SMP 數(shù)量是 Pascal 的兩倍,Volta SM 具有改進(jìn)的并發(fā)性,并支持更多的線程、warp 和運(yùn)行中的線程塊。

張量核心

NVIDIA 張量核心是可編程的融合矩陣乘法和累加單元,可與 CUDA 核心同時執(zhí)行。張量核心實(shí)現(xiàn)了新的浮點(diǎn) HMMA(半精度矩陣乘法和累加)和 IMMA(整數(shù)矩陣乘法和累加)指令,用于加速密集線性代數(shù)計(jì)算、信號處理和深度學(xué)習(xí)推理。

Tensor-Core-Matrix-1-1024x276.png

圖 4. Tensor Core HMMA/IMMA 4x4x4 矩陣乘法和累加

矩陣乘法輸入A和B是 HMMA 指令的 FP16 矩陣,而累加矩陣C和D可以是 FP16 或 FP32 矩陣。對于 IMMA,矩陣乘法輸入A是有符號或無符號 INT8 或 INT16 矩陣,B是有符號或無符號 INT8 矩陣,C和D累加器矩陣都是有符號 INT32。因此,精度和計(jì)算范圍足以避免內(nèi)部累加期間的上溢和下溢情況。

包括 cuBLAS、cuDNN 和 TensorRT 在內(nèi)的 NVIDIA 庫已更新為在內(nèi)部使用 HMMA 和 IMMA,使程序員能夠輕松利用 Tensor Core 固有的性能提升。用戶還可以通過 CUDA 10 中包含的 wmma 命名空間和 mma.h 標(biāo)頭中公開的新 API 直接在 warp 級別訪問 Tensor Core 操作。warp 級接口映射 16×16、32×8 和 8×32 大小每個扭曲的所有 32 個線程的矩陣。

深度學(xué)習(xí)加速器

Jetson AGX Xavier 具有兩個 NVIDIA深度學(xué)習(xí)加速器(DLA) 引擎,如圖 5 所示,可卸載固定功能卷積神經(jīng)網(wǎng)絡(luò) (CNN) 的推理。這些引擎提高了能源效率并釋放了 GPU 來運(yùn)行用戶實(shí)現(xiàn)的更復(fù)雜的網(wǎng)絡(luò)和動態(tài)任務(wù)。NVIDIA DLA 硬件架構(gòu)是開源的,可從NVDLA.org 獲得。每個 DLA 具有高達(dá) 5 TOPS INT8 或 2.5 TFLOPS FP16 的性能,功耗僅為 0.5-1.5W。DLA 支持加速 CNN 層,例如卷積、反卷積、激活函數(shù)、最小/最大/均值池、局部響應(yīng)歸一化和全連接層。

poYBAGJczGOAJ_7UAACk6ipVyT4846.png

圖 5. 深度學(xué)習(xí)加速器 (DLA) 架構(gòu)框圖

DLA 硬件由以下組件組成:

Convolution Core – 優(yōu)化的高性能卷積引擎。

單數(shù)據(jù)處理器——用于激活功能的單點(diǎn)查找引擎。

平面數(shù)據(jù)處理器——用于池化的平面平均引擎。

通道數(shù)據(jù)處理器——用于高級標(biāo)準(zhǔn)化功能的多通道平均引擎。

專用內(nèi)存和數(shù)據(jù)重塑引擎——用于張量重塑和復(fù)制操作的內(nèi)存到內(nèi)存轉(zhuǎn)換加速。

開發(fā)人員使用 TensorRT 5.0 對 DLA 引擎進(jìn)行編程,以在網(wǎng)絡(luò)上執(zhí)行推理,包括對 AlexNet、GoogleNet 和 ResNet-50 的支持。對于使用 DLA 不支持的層配置的網(wǎng)絡(luò),TensorRT 為無法在 DLA 上運(yùn)行的層提供 GPU 回退。JetPack 4.0 開發(fā)者預(yù)覽版最初將 DLA 精度限制為 FP16 模式,未來 JetPack 版本中將提供 INT8 精度和更高的 DLA 性能。

TensorRT 5.0 將以下 API 添加到其 IBuilder 接口以啟用 DLA:

setDeviceType()以及setDefaultDeviceType()默認(rèn)選擇 GPU、DLA_0 或 DLA_1 來執(zhí)行特定層或網(wǎng)絡(luò)中的所有層。

canRunOnDLA()檢查層是否可以按照配置在 DLA 上運(yùn)行。

getMaxDLABatchSize()用于檢索 DLA 可以支持的最大批量大小。

allowGPUFallback()使 GPU 能夠執(zhí)行 DLA 不支持的層。

請參閱TensorRT 5.0 開發(fā)人員指南的第 6 章,了解支持的層配置的完整列表以及在 TensorRT 中使用 DLA 的代碼示例。

深度學(xué)習(xí)推理基準(zhǔn)

我們已經(jīng)發(fā)布了 Jetson AGX Xavier 在常見 DNN(例如 ResNet、GoogleNet 和 VGG 的變體)上的深度學(xué)習(xí)推理基準(zhǔn)測試結(jié)果。我們在 Jetson AGX Xavier 的 GPU 和 DLA 引擎上使用帶有 TensorRT 5.0 的 JetPack 4.1.1 開發(fā)者預(yù)覽版為 Jetson AGX Xavier 運(yùn)行這些基準(zhǔn)測試。GPU 和兩個 DLA 分別以 INT8 和 FP16 精度同時運(yùn)行相同的網(wǎng)絡(luò)架構(gòu),并報告每種配置的總體性能。GPU 和 DLA 可以在實(shí)際用例中同時運(yùn)行不同的網(wǎng)絡(luò)或網(wǎng)絡(luò)模型,并行或在處理管道中提供獨(dú)特的功能。在 TensorRT 中使用 INT8 與完整的 FP32 精度會導(dǎo)致精度損失 1% 或更少。

首先,讓我們考慮 ResNet-18 FCN (Fully Convolutional Network) 的結(jié)果,這是一個用于語義分割的 2048×1024 分辨率的全高清模型。分割為自由空間檢測和占用映射等任務(wù)提供每像素分類,并代表由自主機(jī)器計(jì)算的用于感知、路徑規(guī)劃和導(dǎo)航的深度學(xué)習(xí)工作負(fù)載。圖 6 顯示了在 Jetson AGX Xavier 與 Jetson TX2 上運(yùn)行 ResNet-18 FCN 的測量吞吐量。

pYYBAGJczGWAXst7AABt6EedXBs772.png

圖 6. Jetson AGX Xavier 和 Jetson TX2 的 ResNet-18 FCN 推理吞吐量

與 Jetson TX2 相比,Jetson AGX Xavier 目前在 ResNet-18 FCN 推理中的性能高達(dá) 13 倍。NVIDIA 將繼續(xù)在 JetPack 中發(fā)布軟件優(yōu)化和功能增強(qiáng),隨著時間的推移將進(jìn)一步提高性能和功率特性。請注意,基準(zhǔn)結(jié)果的完整列表報告了 Jetson AGX Xavier 的 ResNet-18 FCN 的性能,批次大小為 32,但是在圖 7 中,我們僅繪制了 16 的批次大小,因?yàn)?Jetson TX2 能夠運(yùn)行 ResNet -18 FCN,最大批量為 16。

pYYBAGJczG6AIiAeAAB31N90LDU064.png

圖 7. ResNet-18 FCN 推理 Jetson AGX Xavier 和 Jetson TX2 的能效

在考慮使用每秒每瓦特處理圖像的能效時,Jetson AGX Xavier 目前在 ResNet-18 FCN 上的能效比 Jetson TX2 高 6 倍。我們通過使用板載 INA 電壓和電流監(jiān)視器測量總模塊功耗來計(jì)算效率,包括 CPU、GPU、DLA、內(nèi)存、其他 SoC 電源、I/O 和所有軌上的穩(wěn)壓器效率損失。兩臺 Jetson 均在 15W 功率模式下運(yùn)行。Jetson AGX Xavier 和 JetPack 附帶 10W、15W 和 30W 的可配置預(yù)設(shè)功率配置文件,可在運(yùn)行時使用 nvpmodel 電源管理工具進(jìn)行切換。用戶還可以使用不同的時鐘和 DVFS(動態(tài)電壓和頻率縮放)調(diào)節(jié)器設(shè)置來定義自己的自定義配置文件,這些配置文件已經(jīng)過定制,以實(shí)現(xiàn)單個應(yīng)用程序的最佳性能。

接下來,讓我們比較 Jetson AGX Xavier 基準(zhǔn)在圖像識別網(wǎng)絡(luò) ResNet-50 和 VGG19 上的批量大小 1 到 128 與 Jetson TX2。這些模型對分辨率為 224×224 的圖像塊進(jìn)行分類,并經(jīng)常用作各種對象檢測網(wǎng)絡(luò)中的編碼器主干。在較低分辨率下使用 8 或更高的批大小可用于近似在更高分辨率下批大小為 1 的性能和延遲。機(jī)器人平臺和自主機(jī)器通常包含多個相機(jī)和傳感器,這些相機(jī)和傳感器可以進(jìn)行批處理以提高性能,此外還可以執(zhí)行感興趣區(qū)域 (ROI) 的檢測,然后分批對 ROI 進(jìn)行進(jìn)一步分類。圖 8 還包括對 Jetson AGX Xavier 未來性能的估計(jì),

poYBAGJczHCAWVpoAACLxCLzCMY324.png

圖 8. INT8 支持 DLA 和其他 GPU 優(yōu)化后的估計(jì)性能

Jetson AGX Xavier 目前在 VGG19 上的吞吐量是 Jetson TX2 的 18 倍,在 ResNet-50 上的吞吐量是在 JetPack 4.1.1 上測量的 14 倍,如圖 9 所示。ResNet-50 的延遲低至 1.5 毫秒或更高650FPS,批量大小為 1。隨著未來的軟件改進(jìn),Jetson AGX Xavier 估計(jì)比 Jetson TX2 快 24 倍。請注意,對于舊版比較,我們還在完整的性能列表中提供了 GoogleNet 和 AlexNet 的數(shù)據(jù)。

pYYBAGJczHOAZ5s4AACDi5Pgu8A488.png

圖 9. Jetson Xavier 和 Jetson TX2 的 ResNet-50 和 VGG19 能效

Jetson AGX Xavier 目前在 VGG19 推理方面的效率是 Jetson TX2 的 7 倍以上,在 ResNet-50 方面的效率提高了 5 倍,在考慮未來的軟件優(yōu)化和增強(qiáng)時效率提高了 10 倍。有關(guān)推理基準(zhǔn)的更多數(shù)據(jù)和詳細(xì)信息,請參閱完整的性能結(jié)果。我們還將在下一節(jié)中對 CPU 性能進(jìn)行基準(zhǔn)測試。

卡梅爾 CPU 復(fù)合體

Jetson AGX Xavier 的 CPU 復(fù)合體如圖 10 所示,由四個基于 ARMv8.2 的異構(gòu)雙核 NVIDIA Carmel CPU 集群組成,最大時鐘頻率為 2.26GHz。每個內(nèi)核包括 128KB 指令和 64KB 數(shù)據(jù) L1 緩存以及兩個內(nèi)核之間共享的 2MB L2 緩存。CPU 集群共享一個 4MB L3 緩存。

pYYBAGJczHaABCAzAACYuXpdFeM880.png

圖 10. 帶有 NVIDIA Carmel 集群的 Jetson Xavier CPU 復(fù)合體的框圖

Carmel CPU 內(nèi)核具有 NVIDIA 的動態(tài)代碼優(yōu)化、10 路超標(biāo)量架構(gòu)以及 ARMv8.2 的完整實(shí)現(xiàn),包括完整的高級 SIMD、VFP(矢量浮點(diǎn))和 ARMv8.2-FP16。

SPECint_rate 基準(zhǔn)測量多核系統(tǒng)的 CPU 吞吐量??傮w性能得分平均了幾個密集的子測試,包括壓縮、向量和圖形操作、代碼編譯以及為國際象棋和圍棋等游戲執(zhí)行 AI。圖 11 顯示了幾代 CPU 性能提升超過 2.5 倍的基準(zhǔn)測試結(jié)果。

poYBAGJczHeAfdRfAAAcmuA86xw627.png

圖 11. SPECInt2K_rate 8x* 基準(zhǔn)測試中 Jetson AGX Xavier 與 Jetson TX2 的 CPU 性能 *Jetson AGX Xavier / Jetson TX2 SPECint 基準(zhǔn)測試尚未正式提交給 SPEC,在發(fā)布時被視為估計(jì)值。

同時運(yùn)行了 8 個 SPECint_rate 測試副本,保持 CPU 滿載。Jetson AGX Xavier 自然擁有八個 CPU 核心;Jetson TX2 的架構(gòu)使用四個 Arm Cortex-A57 內(nèi)核和兩個 NVIDIA Denver D15 內(nèi)核。每個 Denver 核心運(yùn)行兩個副本會產(chǎn)生更高的性能。

視覺加速器

Jetson AGX Xavier 具有兩個視覺加速器引擎,如圖 12 所示。每個引擎都包括一個雙 7 路 VLIW(超長指令字)矢量處理器,用于卸載計(jì)算機(jī)視覺算法,例如特征檢測和匹配、光流、立體視差塊匹配、以及低延遲和低功耗的點(diǎn)云處理。卷積、形態(tài)算子、直方圖、色彩空間轉(zhuǎn)換和扭曲等成像過濾器也是加速的理想選擇。

poYBAGJczHqABy36AACIu3wCwP0299.png

圖 12. Jetson AGX Xavier VLIW 視覺加速器架構(gòu)框圖

每個視覺加速器包括一個用于命令和控制的 Cortex-R5 內(nèi)核、兩個矢量處理單元(每個都有 192KB 的片上矢量存儲器)和兩個用于數(shù)據(jù)移動的 DMA 單元。7 路向量處理單元包含用于每條指令的兩個向量、兩個標(biāo)量和三個內(nèi)存操作的插槽。Early Access 軟件版本不支持 Vision Accelerator,但將在 JetPack 的未來版本中啟用。

NVIDIA Jetson AGX Xavier 開發(fā)者套件

JetsonAGXXavier 開發(fā)套件包含開發(fā)人員快速啟動和運(yùn)行所需的一切該套件包括JetsonAGX Xavier 計(jì)算模塊、參考開源載板、電源和 JetPack SDK,使用戶能夠快速開始開發(fā)應(yīng)用程序。Jetson AGX Xavier 開發(fā)者套件只需 1,299 美元即可購買。

Jetson AGX Xavier 開發(fā)工具包的尺寸為 105mm2,明顯小于 Jetson TX1 和 TX2 開發(fā)工具包,同時改進(jìn)了可用的 I/O。I/O 功能包括兩個 USB3.1 端口(支持 DisplayPort 和 Power Delivery)、一個混合 eSATAp + USB3.0 端口、一個 PCIe x16 插槽(x8 電氣)、M.2 Key-M NVMe 和 M.2 Key 站點(diǎn)-E WLAN 夾層、千兆以太網(wǎng)、HDMI 2.0 和 8 攝像頭 MIPI CSI 連接器。有關(guān)通過開發(fā)工具包參考載板提供的 I/O 的完整列表,請參見下面的表 3。

pYYBAGJczO-ARFk8AABF1qXkA6Y809.png

我們?yōu)?Jetson AGX Xavier 整理了一個開源的為期兩天的深度學(xué)習(xí)演示教程,該教程指導(dǎo)開發(fā)人員通過訓(xùn)練和部署 DNN 推理來執(zhí)行圖像識別、對象檢測和分割,使您能夠快速開始創(chuàng)建自己的 AI應(yīng)用程序。兩天演示使用云端的 NVIDIA DIGITS 交互式訓(xùn)練系統(tǒng)或 GPU 加速的 PC,并使用 TensorRT 對 Jetson 上的圖像或?qū)崟r攝像頭饋送執(zhí)行加速推理。GitHub 上的為期兩天的演示代碼存儲庫已更新,包括對 Xavier DLA 和 GPU INT8 精度的支持。

智能視頻分析 (IVA)

人工智能和深度學(xué)習(xí)能夠有效利用大量數(shù)據(jù),讓城市更安全、更方便,包括交通管理、智能停車和零售店的簡化結(jié)賬體驗(yàn)等應(yīng)用。NVIDIA Jetson 和 NVIDIADeepStream SDK使分布式智能攝像頭能夠在邊緣實(shí)時執(zhí)行智能視頻分析,從而減少傳輸基礎(chǔ)設(shè)施上的大量帶寬負(fù)載,并提高安全性和匿名性。

在 Jetson AGX Xavier 上運(yùn)行的 IVA 演示視頻捕獲,具有 30 個并發(fā)高清流

Jetson TX2 可以同時處理兩個高清流以及對象檢測和跟蹤。如上面的視頻所示,Jetson AGX Xavier 能夠以 1080p30 同時處理 30 個獨(dú)立的高清視頻流——提高了 15 倍。Jetson AGX Xavier 提供超過 1850MP/s 的總吞吐量,使其能夠解碼、預(yù)處理、使用基于 ResNet 的檢測執(zhí)行推理,并在超過 1 毫秒的時間內(nèi)可視化每一幀。Jetson AGX Xavier 的功能大大提高了邊緣視頻分析的性能和可擴(kuò)展性。

自治的新時代

Jetson AGX Xavier 提供前所未有的機(jī)載機(jī)器人和智能機(jī)器性能水平。這些系統(tǒng)需要對人工智能驅(qū)動的感知、導(dǎo)航和操作具有苛刻的計(jì)算能力,以提供強(qiáng)大的自主操作。應(yīng)用包括制造、工業(yè)檢測、精準(zhǔn)農(nóng)業(yè)和家庭服務(wù)。向最終消費(fèi)者遞送包裹并支持倉庫、商店和工廠物流的自主遞送機(jī)器人代表了一類應(yīng)用。

全自動交付和物流的典型處理流程需要多個階段的視覺和感知任務(wù),如圖 14 所示。移動交付機(jī)器人通常具有多個外圍高清攝像頭,除了激光雷達(dá)和其他測距傳感器之外,還提供 360° 態(tài)勢感知。與慣性傳感器一起融合在軟件中。經(jīng)常使用前向立體驅(qū)動攝像頭,需要預(yù)處理和立體深度映射。NVIDIA 創(chuàng)建了Stereo DNN模型,其準(zhǔn)確性高于傳統(tǒng)的塊匹配方法來支持這一點(diǎn)。

delivery_pipeline-625x283.png

圖 14. 自主配送和物流機(jī)器人的 AI 處理流程示例

SSD 或 Faster-RCNN 等對象檢測模型和基于特征的跟蹤通常會告知行人、車輛和地標(biāo)的避障。對于倉庫和店面機(jī)器人,這些對象檢測模型可以定位感興趣的物品,例如產(chǎn)品、貨架和條形碼。面部識別、姿勢估計(jì)和自動語音識別 (ASR) 促進(jìn)了人機(jī)交互 (HMI),使機(jī)器人能夠與人類進(jìn)行有效協(xié)調(diào)和交流。

高幀率同步定位和映射 (SLAM) 對于保持機(jī)器人在 3D 中準(zhǔn)確定位至關(guān)重要。GPS 本身缺乏亞米級定位的精度,并且在室內(nèi)無法使用。SLAM 將最新的傳感器數(shù)據(jù)與系統(tǒng)在其點(diǎn)云中積累的先前數(shù)據(jù)進(jìn)行配準(zhǔn)和對齊。經(jīng)常有噪聲的傳感器數(shù)據(jù)需要大量過濾才能正確定位,尤其是來自移動平臺的數(shù)據(jù)。

路徑規(guī)劃階段通常使用 ResNet-18 FCN、SegNet 或 DeepLab 等語義分割網(wǎng)絡(luò)來執(zhí)行自由空間檢測,告訴機(jī)器人在哪里行駛而不被遮擋。現(xiàn)實(shí)世界中經(jīng)常存在太多需要單獨(dú)檢測和跟蹤的通用障礙物類型,因此基于分割的方法用其分類標(biāo)記每個像素或體素。與管道的前幾個階段一起,這會通知規(guī)劃者和控制回路它可以采取的安全路線。

Jetson AGX Xavier 的性能和效率使得這些機(jī)器人能夠?qū)崟r處理所有需要的組件,以實(shí)現(xiàn)完全自主的安全運(yùn)行,包括用于實(shí)時感知、導(dǎo)航和操作的高性能視覺算法。隨著獨(dú)立的 Jetson AGX Xavier 模塊現(xiàn)已投入生產(chǎn),開發(fā)人員可以將這些 AI 解決方案部署到下一代自主機(jī)器。

立即開始構(gòu)建下一波自主機(jī)器

Jetson AGX Xavier 為機(jī)器人和邊緣設(shè)備帶來了改變游戲規(guī)則的計(jì)算水平,為針對尺寸、重量和功率進(jìn)行了優(yōu)化的嵌入式平臺帶來了高端工作站性能。

關(guān)于作者

Dustin 是 NVIDIA Jetson 團(tuán)隊(duì)的一名開發(fā)人員推廣員。Dustin 擁有機(jī)器人技術(shù)和嵌入式系統(tǒng)方面的背景,喜歡在社區(qū)中提供幫助并與 Jetson 合作開展項(xiàng)目。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 機(jī)器人
    +關(guān)注

    關(guān)注

    213

    文章

    31066

    瀏覽量

    222133
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5592

    瀏覽量

    109702
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    如何在NVIDIA Jetson AGX Thor上部署1200億參數(shù)大模型

    上一期介紹了如何在 NVIDIA Jetson AGX Thor 上使用 Docker 部署 vLLM 推理服務(wù),以及使用 Chatbox 作為前端調(diào)用 vLLM 運(yùn)行的模型(上期文章鏈接)。本期
    的頭像 發(fā)表于 12-26 17:06 ?4765次閱讀
    如何在<b class='flag-5'>NVIDIA</b> <b class='flag-5'>Jetson</b> <b class='flag-5'>AGX</b> Thor上部署1200億參數(shù)大模型

    如何在NVIDIA Jetson平臺上運(yùn)行最新的開源AI模型

    在小型、低功耗的邊緣設(shè)備上運(yùn)行先進(jìn)的 AI 和計(jì)算機(jī)視覺工作流正變得越來越具有挑戰(zhàn)性。機(jī)器人、智能攝像頭和自主設(shè)備需要實(shí)時智能來感知、理解并做出反應(yīng),而無需依賴云端。NVIDIA Jetson 平臺通過緊湊的 GPU 加速模塊和
    的頭像 發(fā)表于 12-24 10:38 ?1560次閱讀
    如何在<b class='flag-5'>NVIDIA</b> <b class='flag-5'>Jetson</b>平臺上運(yùn)行最新的開源<b class='flag-5'>AI</b>模型

    NVIDIA Jetson系列開發(fā)者套件助力打造面向未來的智能機(jī)器人

    NVIDIA Jetson AGX Thor、AGX Orin 以及 Jetson Orin Nano Super 開發(fā)者套件,助力打造面向
    的頭像 發(fā)表于 12-13 10:20 ?3047次閱讀

    如何在NVIDIA Jetson AGX Thor上通過Docker高效部署vLLM推理服務(wù)

    繼系統(tǒng)安裝與環(huán)境配置后,本期我們將繼續(xù)帶大家深入 NVIDIA Jetson AGX Thor 的開發(fā)教程之旅,了解如何在 Jetson AGX
    的頭像 發(fā)表于 11-13 14:08 ?4107次閱讀
    如何在<b class='flag-5'>NVIDIA</b> <b class='flag-5'>Jetson</b> <b class='flag-5'>AGX</b> Thor上通過Docker高效部署vLLM推理服務(wù)

    NVIDIA Jetson AGX Thor Developer Kit開發(fā)環(huán)境配置指南

    NVIDIA Jetson AGX Thor 專為物理 AI 打造,與上一代產(chǎn)品 NVIDIA Jets
    的頭像 發(fā)表于 11-08 09:55 ?7243次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>Jetson</b> <b class='flag-5'>AGX</b> Thor Developer Kit開發(fā)環(huán)境配置指南

    通過NVIDIA Jetson AGX Thor實(shí)現(xiàn)7倍生成式AI性能

    Jetson Thor 平臺還支持多種主流量化格式,包括 NVIDIA Blackwell GPU 架構(gòu)的新 NVFP4 格式,有助于進(jìn)一步優(yōu)化推理性能。該平臺同時支持推測解碼等新技術(shù),為在邊緣端加速生成式 AI 工作負(fù)載提供了
    的頭像 發(fā)表于 10-29 16:53 ?1414次閱讀

    BPI-AIM7 RK3588 AINvidia Jetson Nano 生態(tài)系統(tǒng)兼容的低功耗 AI 模塊

    。它是開源硬件,我們已在線發(fā)布設(shè)計(jì)文檔,包括原理圖和接口定義。其異構(gòu)計(jì)算架構(gòu)兼容 NVIDIA Jetson Nano 接口標(biāo)準(zhǔn),非常適合邊緣計(jì)算、AI 推理、VR/AR、智能 NVR 系統(tǒng)以及通用
    發(fā)表于 10-11 09:08

    NVIDIA Jetson AGX Thor開發(fā)者套件重磅發(fā)布

    開發(fā)者與未來創(chuàng)造者們,準(zhǔn)備好迎接邊緣AI的史詩級革新了嗎?NVIDIA以顛覆性技術(shù)再次突破極限,正式推出Jetson AGX Thor開發(fā)者套件!作為繼傳奇產(chǎn)品
    的頭像 發(fā)表于 08-28 14:31 ?1550次閱讀

    NVIDIA三臺計(jì)算機(jī)解決方案如何協(xié)同助力機(jī)器人技術(shù)

    NVIDIA DGX、基于 NVIDIA RTX PRO 服務(wù)器的 Omniverse 和 Cosmos,以及 Jetson AGX Thor,正全面加速從人形機(jī)器人到機(jī)器人工廠等基于
    的頭像 發(fā)表于 08-27 11:48 ?2398次閱讀

    基于 NVIDIA Blackwell 的 Jetson Thor 現(xiàn)已發(fā)售,加速通用機(jī)器人時代的到來

    ·專為物理 AI 和機(jī)器人打造的機(jī)器人計(jì)算機(jī) NVIDIA Jetson AGX Thor 開發(fā)者套件和量產(chǎn)級模組,現(xiàn)已發(fā)售。 ·超過 200 萬開發(fā)者正在使用
    發(fā)表于 08-26 09:28 ?1299次閱讀
    基于 <b class='flag-5'>NVIDIA</b> Blackwell 的 <b class='flag-5'>Jetson</b> Thor 現(xiàn)已發(fā)售,加速通用機(jī)器人時代的到來

    NVIDIA Jetson AGX Thor開發(fā)者套件概述

    TFLOPS 的 AI 計(jì)算性能,從而輕松運(yùn)行最新的生成式 AI模型,且功耗不超過 130 W。與 NVIDIA Jetson AGX O
    的頭像 發(fā)表于 08-11 15:03 ?1891次閱讀

    NVIDIA Jetson + Isaac SDK 人形機(jī)器人方案全面解析

    NVIDIA Jetson + Isaac SDK 人形機(jī)器人方案全面解析 一、方案概述 Jetson 硬件平臺 :提供 AI + GPU 運(yùn)算能力,配合多傳感器、視覺、傳動控制體系
    的頭像 發(fā)表于 07-30 16:12 ?2174次閱讀

    Jetson平臺核心組件BOM清單概覽

    、Jetson Xavier NX、Jetson AGX Orin)的核心BOM清單進(jìn)行梳理。需要注意的是,NVIDIA官方并
    的頭像 發(fā)表于 07-30 16:11 ?3121次閱讀

    邊緣AI MPU深度盤點(diǎn):品牌、型號與技術(shù)特性全解析

    三個維度,結(jié)合典型應(yīng)用場景,對主流邊緣AI MPU進(jìn)行全面盤點(diǎn)。 一、國際品牌:技術(shù)領(lǐng)先,場景覆蓋全面 NVIDIA(英偉達(dá)) 代表型號 :Jetson系列(Orin Nano/NX/AGX
    的頭像 發(fā)表于 04-30 17:27 ?4092次閱讀

    市場上主流的端側(cè)AI MPU 大全

    ? ? NVIDIA ? ? Jetson系列 ?:面向邊緣AI的高性能MPU Jetson Orin Nano/NX/AGX(基于Amp
    的頭像 發(fā)表于 04-02 17:44 ?4285次閱讀