91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

用于工業(yè)AI的Jetson AGX Xavier模塊

星星科技指導(dǎo)員 ? 來源:嵌入式計算設(shè)計 ? 作者:Simon Holt ? 2022-06-08 14:22 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

工業(yè)物聯(lián)網(wǎng)架構(gòu)師花了數(shù)年時間才得出結(jié)論,邊緣需要數(shù)據(jù)中心級的性能,以實現(xiàn)高效分析、提高安全性和降低網(wǎng)絡(luò)成本。在人工智能機器學(xué)習(xí)領(lǐng)域,傳感器設(shè)備內(nèi)部或附近對高端處理能力的需求從一開始就很明顯。

考慮到即使是簡單的自主機器(我知道這是矛盾的說法)也需要大量的計算能力來運行神經(jīng)網(wǎng)絡(luò)來執(zhí)行障礙物檢測、識別和避免等功能。例如,京東和菜鳥等公司生產(chǎn)的自動送貨車需要大約每秒 30 兆次運算 (TOPS) 的處理性能,而雅馬哈正在開發(fā)的自動駕駛檢查無人機需要大約 20 兆次運算 (TOPS) 的處理性能。

當(dāng)然,這對嵌入式和工業(yè)工程師提出了一個經(jīng)典的設(shè)計挑戰(zhàn):平衡每瓦性能。性能太低,應(yīng)用程序失敗。功耗太大,自主機器必須連接到持續(xù)的電源。

隨著NVIDIA 的 Jetson AGX Xavier 模塊的發(fā)布,這種情況正在改變。

服務(wù)器級性能,嵌入式功耗

Jetson AGX Xavier 核心的 Xavier SoC 包含大量異構(gòu)處理性能,適用于人工智能驅(qū)動的機器人應(yīng)用程序,包括:

512 核 Volta GPU,帶有 64 個 TensorCore

八核、64 位基于 Arm 的 Carmel CPU

雙 NVDLA(NVIDIA 深度學(xué)習(xí)加速器)引擎

雙 7 路 VLIW 視覺加速器引擎

這代表 Jetson AGX 模塊的性能高達 32 TOPS,尺寸為 87 mm x 100 mm。如上圖所示,該芯片還包括一個 256 位 LPDDR4X 接口,能夠以 137 GBps 的速度將數(shù)據(jù)傳輸?shù)侥K上的 16 GB DRAM,用于與 AI 工作負載相關(guān)的頻繁讀寫。

基本上,Jetson AGX Xavier 以嵌入式模塊形式提供服務(wù)器級性能。然而,同樣重要的是,該模塊的功耗僅為 10W,或與臺式風(fēng)扇差不多。用戶可將操作模式配置為 10W、15W 或 30W,NVIDIA 報告稱每瓦性能 (PPW) 的最佳點在 15W 左右。即使在那個水平(大約相當(dāng)于藍光播放器的功耗),Jetson AGX Xavier 在推理性能和能源效率方面也大大超過了其前身 Jetson TX2 和 Intel Core i7 + GTX 1070 顯卡。

pYYBAGKgQDeAcKYxAADtibAg8G4288.png

Jetson AGX Xavier:引擎蓋下

Jetson AGX Xavier 的多項功能可實現(xiàn)這種類型的每瓦性能,從基礎(chǔ)芯片架構(gòu)開始。雖然 SoC 上的每個內(nèi)核都有自己的內(nèi)存,但內(nèi)存是離散 SoC 模塊之間的零內(nèi)存復(fù)制。雖然 AGX Xavier 模塊確實通過外部 16 GB LPDDR4X DRAM 提供共享內(nèi)存,但片上數(shù)據(jù)只是通過管道傳遞到必要的處理核心。

架構(gòu)的異構(gòu)性也提高了效率,因為工作負載可以在最適合任務(wù)的架構(gòu)上執(zhí)行。這方面的一個例子是片上加速引擎,它可以卸載 Volta GPU,以便它可以專注于更復(fù)雜或用戶定義的任務(wù)。例如,在以 8 位分辨率推斷固定功能卷積神經(jīng)網(wǎng)絡(luò) (CNN) 時,NVDLA 引擎可提供高達 5 TOPS 的性能,以 16 位分辨率推斷 2.5 TFLOPS 時,功耗在 0.5W 和 1.5W 之間。

poYBAGKgQECARpmYAAFR4BDwBMw371.png

同時,Carmel CPU 內(nèi)核可以保留用于通用計算任務(wù)。

JetPack 簡化了深度學(xué)習(xí)編程的復(fù)雜性

Jetson AGX 系列運行 Linux,這在工業(yè)嵌入式系統(tǒng)中變得越來越普遍。許多希望利用 Jetson AGX Xavier 性能的工業(yè)和嵌入式開發(fā)人員可能不太熟悉的是對 GPU 和/或深度學(xué)習(xí)加速器進行編程。幸運的是,NVIDIA JetPack 4.1.1 軟件開發(fā)套件 (SDK)在CUDA Toolkit中提供了一攬子 API、嵌入式庫以及與常用語言的集成,因此您無需了解如何編程 GPU對 GPU 進行編程。

最新JetPack版本中的一些軟件工具包括:

Linux For Tegra R31.0.1 (K4.9)

CUDA 工具包 10.0

cuDNN 7.3

張量RT 5.0 GA

OpenCV 3.3.1

OpenGL 4.6 / GLES 3.2

伏爾甘 1.1

多媒體 API R31.1

阿格斯 0.97 相機 API

TensorRT 5.0 包中提供的 API 也簡化了對 DLA 進行編程以執(zhí)行神經(jīng)網(wǎng)絡(luò)工作負載。例如,_setDeviceType() 和 setDefaultDeviceType() 命令可用于在 GPU 或任一 DLA 上執(zhí)行特定的神經(jīng)網(wǎng)絡(luò)層或?qū)?,而?_allowGPUFallback() 這樣的命令可讓工作負載在 DLA 不支持的情況下恢復(fù)到 GPU 。

此外,DeepStream 3.0 SDK 支持 Jetson AGX Xavier,該 SDK 利用 TensorRT、CUDA、多媒體和成像 API 來加速視頻分析應(yīng)用程序的開發(fā)。

當(dāng)然,低級 CUDA 編程是另一種選擇。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4838

    瀏覽量

    107800
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5594

    瀏覽量

    109756
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5194

    瀏覽量

    135474
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    如何在NVIDIA Jetson AGX Thor上部署1200億參數(shù)大模型

    上一期介紹了如何在 NVIDIA Jetson AGX Thor 上使用 Docker 部署 vLLM 推理服務(wù),以及使用 Chatbox 作為前端調(diào)用 vLLM 運行的模型(上期文章鏈接)。本期
    的頭像 發(fā)表于 12-26 17:06 ?4836次閱讀
    如何在NVIDIA <b class='flag-5'>Jetson</b> <b class='flag-5'>AGX</b> Thor上部署1200億參數(shù)大模型

    NVIDIA Jetson系列開發(fā)者套件助力打造面向未來的智能機器人

    NVIDIA Jetson AGX Thor、AGX Orin 以及 Jetson Orin Nano Super 開發(fā)者套件,助力打造面向未來的智能機器人。
    的頭像 發(fā)表于 12-13 10:20 ?3066次閱讀

    如何在NVIDIA Jetson AGX Thor上通過Docker高效部署vLLM推理服務(wù)

    繼系統(tǒng)安裝與環(huán)境配置后,本期我們將繼續(xù)帶大家深入 NVIDIA Jetson AGX Thor 的開發(fā)教程之旅,了解如何在 Jetson AGX Thor 上,通過 Docker 高效
    的頭像 發(fā)表于 11-13 14:08 ?4118次閱讀
    如何在NVIDIA <b class='flag-5'>Jetson</b> <b class='flag-5'>AGX</b> Thor上通過Docker高效部署vLLM推理服務(wù)

    NVIDIA Jetson AGX Thor Developer Kit開發(fā)環(huán)境配置指南

    NVIDIA Jetson AGX Thor 專為物理 AI 打造,與上一代產(chǎn)品 NVIDIA Jetson AGX Orin 相比,生成式
    的頭像 發(fā)表于 11-08 09:55 ?7263次閱讀
    NVIDIA <b class='flag-5'>Jetson</b> <b class='flag-5'>AGX</b> Thor Developer Kit開發(fā)環(huán)境配置指南

    通過NVIDIA Jetson AGX Thor實現(xiàn)7倍生成式AI性能

    Jetson Thor 平臺還支持多種主流量化格式,包括 NVIDIA Blackwell GPU 架構(gòu)的新 NVFP4 格式,有助于進一步優(yōu)化推理性能。該平臺同時支持推測解碼等新技術(shù),為在邊緣端加速生成式 AI 工作負載提供了新的途徑。
    的頭像 發(fā)表于 10-29 16:53 ?1434次閱讀

    BPI-AIM7 RK3588 AI與 Nvidia Jetson Nano 生態(tài)系統(tǒng)兼容的低功耗 AI 模塊

    套件 (100x80 毫米) 占用空間相同,與現(xiàn)有外殼兼容 Jetson Nano 兼容性 為 Jetson Nano 提供 5 V 和 12 V 電源輸入 比較 8 GB ArmSoM RK3588 AI
    發(fā)表于 10-11 09:08

    NVIDIA Jetson AGX Thor開發(fā)者套件重磅發(fā)布

    開發(fā)者與未來創(chuàng)造者們,準備好迎接邊緣AI的史詩級革新了嗎?NVIDIA以顛覆性技術(shù)再次突破極限,正式推出Jetson AGX Thor開發(fā)者套件!作為繼傳奇產(chǎn)品Jetson
    的頭像 發(fā)表于 08-28 14:31 ?1558次閱讀

    基于 NVIDIA Blackwell 的 Jetson Thor 現(xiàn)已發(fā)售,加速通用機器人時代的到來

    ·專為物理 AI 和機器人打造的機器人計算機 NVIDIA Jetson AGX Thor 開發(fā)者套件和量產(chǎn)級模組,現(xiàn)已發(fā)售。 ·超過 200 萬開發(fā)者正在使用 NVIDIA 的機器人技術(shù)棧,聯(lián)影
    發(fā)表于 08-26 09:28 ?1299次閱讀
    基于 NVIDIA Blackwell 的 <b class='flag-5'>Jetson</b> Thor 現(xiàn)已發(fā)售,加速通用機器人時代的到來

    NVIDIA Jetson AGX Thor開發(fā)者套件概述

    TFLOPS 的 AI 計算性能,從而輕松運行最新的生成式 AI模型,且功耗不超過 130 W。與 NVIDIA Jetson AGX Orin 相比,其
    的頭像 發(fā)表于 08-11 15:03 ?1906次閱讀

    NVIDIA Jetson + Isaac SDK 人形機器人方案全面解析

    Volta 6-core Carmel 21 10~15W 中性能服務(wù)型機器人 Jetson AGX Xavier 512-core
    的頭像 發(fā)表于 07-30 16:12 ?2188次閱讀

    Jetson平臺核心組件BOM清單概覽

    、Jetson Xavier NX、Jetson AGX Orin)的核心BOM清單進行梳理。需要注意的是,NVIDIA官方并
    的頭像 發(fā)表于 07-30 16:11 ?3142次閱讀

    NVIDIA Jetson + Isaac SDK 在人形機器人領(lǐng)域的方案詳解

    組件 描述 硬件平臺(Jetson系列) 面向邊緣AI和機器人開發(fā)的SoC模塊,搭載GPU + ARM CPU,支持多種傳感器和AI模型部署 軟件平臺(Isaac SDK / Isa
    的頭像 發(fā)表于 07-30 16:05 ?3624次閱讀

    Made with KiCad(126):Antmicro OV5640 雙攝像頭子板

    Jetson Nano、Jetson TX2 NX、Jetson Xavier NX 系統(tǒng)模塊Je
    發(fā)表于 05-12 18:13

    邊緣AI MPU深度盤點:品牌、型號與技術(shù)特性全解析

    三個維度,結(jié)合典型應(yīng)用場景,對主流邊緣AI MPU進行全面盤點。 一、國際品牌:技術(shù)領(lǐng)先,場景覆蓋全面 NVIDIA(英偉達) 代表型號 :Jetson系列(Orin Nano/NX/AGX
    的頭像 發(fā)表于 04-30 17:27 ?4137次閱讀

    市場上主流的端側(cè)AI MPU 大全

    ? ? NVIDIA ? ? Jetson系列 ?:面向邊緣AI的高性能MPU Jetson Orin Nano/NX/AGX(基于Ampere架構(gòu),4-64 TOPS算力)
    的頭像 發(fā)表于 04-02 17:44 ?4341次閱讀