91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

如何在NVIDIA Jetson平臺上運行最新的開源AI模型

NVIDIA英偉達企業(yè)解決方案 ? 來源:NVIDIA英偉達企業(yè)解決方案 ? 2025-12-24 10:38 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在小型、低功耗的邊緣設備上運行先進的 AI計算機視覺工作流正變得越來越具有挑戰(zhàn)性。機器人、智能攝像頭和自主設備需要實時智能來感知、理解并做出反應,而無需依賴云端。NVIDIA Jetson 平臺通過緊湊的 GPU 加速模塊和專為邊緣 AI 與機器人開發(fā)設計的開發(fā)套件,滿足了這一需求。

本文將介紹如何在 NVIDIA Jetson 平臺上運行最新的開源 AI 模型,實現(xiàn)完全獨立運行并可隨時部署。掌握這些基礎知識后,你就可以快速從簡單的演示過渡到構(gòu)建各種應用,比如打造私人代碼助手,或者構(gòu)建完全自主的智能機器人。

教程一:打造你的個人AI助手——本地運行大語言模型與視覺模型

上手邊緣 AI 的一個絕佳方式,就是在本地設備上運行大語言模型(LLM)或視覺語言模型(VLM)。在自己的設備上直接運行這些模型,能帶來兩個關(guān)鍵優(yōu)勢:完全的隱私性與零網(wǎng)絡延遲。

當使用外部 API 時,數(shù)據(jù)往往需要上傳到云端,這就意味著失去了對信息的控制權(quán)。而在 Jetson 上,無論是個人筆記、私有代碼,還是攝像頭數(shù)據(jù),所有輸入都始終保留在本地,確保對信息的完全掌控。同時,由于無需依賴網(wǎng)絡傳輸,每一次交互都能瞬間響應。

開源社區(qū)讓這一切變得觸手可及。而能構(gòu)建出多強大的 AI 助手,很大程度上取決于選擇的 Jetson 配置:

NVIDIA Jetson Orin Nano Super 開發(fā)者套件(8GB):適合打造輕量級專屬 AI 助手。你可以輕松部署像 Llama 3.2 3B 或 Phi-3 這類高速“小語言模型”。這些模型不僅推理速度快且都能在 8GB 內(nèi)存限制下流暢運行,同時 Hugging Face 社區(qū)會持續(xù)推出針對如編程輔助、創(chuàng)意寫作等特定場景的新微調(diào)版本。

NVIDIA Jetson AGX Orin(64GB):憑借更大的內(nèi)存和更強的 AI 算力,它能勝任更大且更復雜的任務,例如用于深度推理的 gpt-oss-20b 或量化版的 Llama 3.1 70B。

NVIDIA Jetson AGX Thor(128GB):擁有高達 128GB 的內(nèi)存,提供一流的性能。讓你能夠在邊緣端運行參數(shù)規(guī)模超過 100B 的超大模型,真正把數(shù)據(jù)中心級別的智能帶到邊緣端。

如果你手頭正好有一臺 AGX Orin,現(xiàn)在就可以動手試試:用 vLLM 作為推理引擎,搭配界面友好、美觀易用的 Open WebUI,很快就能啟動一個 gpt-oss-20b 實例。

docker run --rm -it \
  --network host \
  --shm-size=16g \
  --ulimit memlock=-1 \
  --ulimit stack=67108864 \
  --runtime=nvidia \
  --name=vllm \
  -v $HOME/data/models/huggingface:/root/.cache/huggingface \
  -v $HOME/data/vllm_cache:/root/.cache/vllm \
  ghcr.io/nvidia-ai-iot/vllm:latest-jetson-orin
 
vllm serve openai/gpt-oss-20b

在另一個終端中運行 Open WebUI:

docker run -d \
  --network=host \
  -v ${HOME}/open-webui:/app/backend/data \
  -e OPENAI_API_BASE_URL=http://0.0.0.0:8000/v1 \
  --name open-webui \
  ghcr.io/open-webui/open-webui:main

然后查閱:http://localhost:8080

在此基礎上,你可以與大語言模型進行自然交互,并進一步為它集成各種工具,使其具備智能體能力,比如搜索、數(shù)據(jù)分析及語音輸出(TTS)。

image.jpeg

圖 1. 基于 Jetson AGX Orin,通過 Open WebUI 界面使用 vLLM 進行 GPT-OSS 20B 模型推理的演示,生成速度達每秒 40 個 token

然而,僅靠文本還不足以構(gòu)建能真正與物理世界交互的智能體,它需要具有多模態(tài)感知能力。在這方面,既能識別畫面中的物體,又能對整個場景進行推理的視覺語言模型正成為主流選擇,比如 VILA 和 Qwen2.5-VL。面對一段實時視頻流,這類模型可以回答如“這次 3D 打印是不是失敗了?”或“外面現(xiàn)在的交通狀況怎么樣?”等問題。

Jetson Orin Nano Super 開發(fā)者套件可以運行像 VILA-2.7B 這類高效的視覺語言模型,來完成基礎檢測和簡單的視覺查詢?nèi)蝿?。Jetson AGX Orin 憑借更大的內(nèi)存和更強的算力,能從容應對更復雜、更密集的工作負載,如處理更高分辨率的畫面、同時接入多路攝像頭或者并行運行多個智能體。

要親身體驗這一能力,可直接從Jetson AI Lab啟動Live VLM WebUI。它能通過 WebRTC 將電腦的實時攝像頭畫面?zhèn)鬏斀o AI 模型,讓模型即時分析并描述,相當于搭建了一個沙盒。

Live VLM WebUI 兼容 Ollama、vLLM,以及幾乎所有支持 OpenAI 服務器協(xié)議的推理引擎。

若想通過 Ollama 啟動 VLM WebUI,可按以下步驟操作:

# Install ollama (skip if already installed)
curl -fsSL https://ollama.com/install.sh | sh
 
# Pull a small VLM-compatible model
ollama pull gemma3:4b 
 
# Clone and start Live VLM WebUI
git clone https://github.com/nvidia-ai-iot/live-vlm-webui.git
cd live-vlm-webui
./scripts/start_container.sh

體驗該功能請查閱:https://localhost:8090

從此開始,構(gòu)建智能安防系統(tǒng)、野生動物觀察助手或視覺輔助應用。

image-1.jpeg

圖 2. 在 NVIDIA Jetson 上通過 Live VLM WebUI 實現(xiàn)交互式視覺語言模型推理

可以運行哪些視覺語言模型?

Jetson Orin Nano 8GB:適合運行參數(shù)量最高約 4B 的視覺語言模型,例如 Qwen2.5-VL-3B、VILA 1.5–3B 或 Gemma-3/4B。

Jetson AGX Orin 64GB:適合運行參數(shù)量級約為 4B 至20B 的中型視覺語言模型,例如 LLaVA-13B、Qwen2.5-VL-7B、Phi-3.5-Vision。

Jetson AGX Thor 128GB:專為超大規(guī)模模型設計,可支持約 20B 至 120B 參數(shù)的單個模型或多個模型并行運行,例如 Llama 3.2 Vision 70B 或120B量級的模型。

想探索更深層的應用?視頻搜索和總結(jié)(VSS)能力可助力構(gòu)建智能化視覺檔案系統(tǒng)。這意味著可以直接根據(jù)視頻中的內(nèi)容進行檢索而不只局限于搜索文件名,還能為長時間錄像自動生成內(nèi)容摘要。對希望高效管理并深度挖掘視覺數(shù)據(jù)價值的開發(fā)者而言,這正是視覺語言模型理念的完美延伸。

教程二:基于基礎模型的機器人技術(shù)

機器人領域正經(jīng)歷一場根本性的架構(gòu)變革。數(shù)十年來,機器人控制主要依賴于僵化的硬編碼邏輯與割裂的感知流程:先檢測物體、再規(guī)劃路徑、最后執(zhí)行動作。每一種可能的邊緣情況都需要人工反復調(diào)試和顯式編程,使大規(guī)模自動化難以實現(xiàn)。

如今,機器人領域正朝著端到端模仿學習的方向演進:不再需要編寫顯式規(guī)則,而是借助如NVIDIA Isaac GR00T N1這樣的基礎模型,直接從演示中學習控制策略。這類視覺語言動作模型從根本上改變了機器人控制的輸入輸出關(guān)系。在此架構(gòu)下,模型接收來自機器人攝像頭的實時視覺數(shù)據(jù)流,結(jié)合自然語言指令(例如:“打開抽屜”),處理這些多模態(tài)上下文信息,直接預測下一刻所需的關(guān)節(jié)位置或電機轉(zhuǎn)速。

然而,訓練這些模型面臨著一個重大挑戰(zhàn):數(shù)據(jù)瓶頸。與語言模型可利用海量互聯(lián)網(wǎng)文本進行訓練不同,機器人需要的是物理交互數(shù)據(jù),這類數(shù)據(jù)的采集成本高昂且獲取速度慢。解決這一難題的關(guān)鍵在于仿真。借助NVIDIA Isaac Sim,不僅可以在物理精確的虛擬環(huán)境中生成合成訓練數(shù)據(jù)并驗證控制策略,還可以進行硬件在環(huán)測試:讓 Jetson 連接到由NVIDIA RTX GPU 驅(qū)動的仿真器,并運行控制策略。這樣一來,在投資實體硬件或進行實地部署之前,你就能驗證從感知到執(zhí)行的完整端到端系統(tǒng)。

在仿真中完成驗證后,整個工作流可以無縫遷移到真實世界。您可以將優(yōu)化后的策略直接部署到邊緣設備,并借助 TensorRT 等優(yōu)化技術(shù),讓原本復雜的 Transformer 也能以實時控制循環(huán)所需的低延遲(低于 30 毫秒)運行。無論是構(gòu)建簡單的機械臂,還是探索更復雜的人形機器人,這種“在仿真中學習動作,再部署到物理邊緣”的方法,如今已成為現(xiàn)代機器人開發(fā)的標準流程。

現(xiàn)在即可嘗試這些開發(fā)流程。GitHub 上的 Isaac Lab 評估任務庫內(nèi)置了螺母分揀、排氣管分類等工業(yè)級操作基準測試場景。開發(fā)者可先在仿真環(huán)境中驗證控制策略,再部署到實體硬件。通過驗證后,GR00T Jetson 部署指南將引導開發(fā)者將策略轉(zhuǎn)換為 TensorRT 優(yōu)化格式,確保其在 Jetson 平臺的高效運行。針對需在自定義任務中后訓練或微調(diào) GR00T 模型的開發(fā)者,LeRobot 集成方案整合了社區(qū)數(shù)據(jù)集與模仿學習工具,打通從數(shù)據(jù)采集到實際部署的全鏈路。

加入機器人開發(fā)者社區(qū):機器人開發(fā)者社區(qū)正蓬勃發(fā)展,成為技術(shù)探索的熱土。從開源機器人設計到共享學習資源,這條創(chuàng)新之路始終充滿同行者。各類技術(shù)論壇、GitHub 開源項目以及社區(qū)成果展示,將持續(xù)為你提供靈感與實踐指導。歡迎加入 LeRobot Discord 社區(qū),與全球機器人開發(fā)者溝通交流,共同塑造機器人的未來。

構(gòu)建實體機器人需投入大量精力在機械設計、組裝還有與現(xiàn)有平臺集成。但真正驅(qū)動機器人的“智能層”又該如何實現(xiàn)?這正是 Jetson 的價值所在:實時、強大且可立即部署。

哪款Jetson最適合你?

Jetson Orin Nano Super(8GB)適合剛接觸本地 AI,想運行較小的 LLM 或 VLM 模型或進行早期機器人及邊緣原型開發(fā)的開發(fā)者。相比于考慮最大模型容量,它體積小巧、價格親民、上手簡單,更適合機器人項目和嵌入式應用的開發(fā)愛好者。

Jetson AGX Orin(64GB)適合希望打造功能扎實的本地 AI 助手、嘗試智能體式工作流或構(gòu)建能實際部署的個人應用的愛好者或獨立開發(fā)者。64GB 內(nèi)存讓你無需為內(nèi)存不足而煩惱,可直接在一臺設備上輕松組合視覺、語言和語音模型(ASR 和 TTS)。

Jetson AGX Thor(128GB)適合對需要處理超大規(guī)模模型、同時運行多個模型或者在邊緣側(cè)對實時性有嚴苛要求的開發(fā)者。

操作指南

準備好開始探索了嗎?按以下步驟快速入門:

選擇適合你的Jetson:根據(jù)你的目標和預算,挑選適合你需求的開發(fā)者套件。

刷寫系統(tǒng)與配置:快速入門指南將讓設置過程變得簡單直接,你可以在一個小時內(nèi)完成準備工作并開始運行。

Jetson Orin Nano 開發(fā)者套件——快速入門指南

Jetson AGX Orin 開發(fā)者套件——快速入門指南

Jetson AGX Thor 開發(fā)者套件——快速入門指南

探索生態(tài)資源:

Jetson AI Lab:訪問包含全面教程與預建容器指引的資源庫(Open WebUI、Live VLM WebUI等),測試你的模型。

社區(qū)論壇:與其他開發(fā)者交流、分享項目并獲取幫助

動手構(gòu)建:選擇一個項目,深入學習 GitHub 上的教程項目,看看能做到什么,并繼續(xù)深入探索。

NVIDIA Jetson 系列產(chǎn)品為開發(fā)者提供了設計、構(gòu)建和部署下一代智能機器所需的全套工具。

關(guān)于作者

Chitoku Yato 是節(jié)能、緊湊和可擴展的 NVIDIA Jetson Edge AI 平臺的技術(shù)產(chǎn)品營銷經(jīng)理,負責確保平臺上的最佳開發(fā)人員體驗。他還與充滿活力的 NVIDIA 開發(fā)人員社區(qū)密切合作,幫助宣傳在 Jetson 上使用預訓練的 AI 模型、開發(fā)人員 SDK 和對云原生技術(shù)的支持,以幫助客戶構(gòu)建、部署和管理基于 AI 的自主機器。這包括關(guān)于 NVIDIA JetBot 和 JetRacers 的教程以及關(guān)于 NVIDIA 深度學習學院的教育內(nèi)容,以教授和學習 AI 和機器人技術(shù)。他在東京的索尼公司開始了他的職業(yè)生涯,在那里他從事 GPS 汽車導航系統(tǒng)開發(fā)、Android 平板電腦軟件開發(fā)和 PlayStation 外圍設備的產(chǎn)品規(guī)劃。 Chitoku 擁有加州大學圣巴巴拉分校的計算機工程學士學位。

Khalil BenKhared 是 NVIDIA Jetson 團隊的技術(shù)營銷工程師。Khalil 擁有創(chuàng)建和擴展 AI 和機器人開發(fā)解決方案的背景,他喜歡從根本上簡化邊緣 AI,讓開發(fā)者和工程師更容易使用。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 機器人
    +關(guān)注

    關(guān)注

    213

    文章

    31065

    瀏覽量

    222131
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5588

    瀏覽量

    109702
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    39685

    瀏覽量

    301292

原文標題:基于 NVIDIA Jetson 的邊緣 AI 入門指南:面向機器人的大語言模型、視覺語言模型和基礎模型

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    英飛凌為NVIDIA Jetson邊緣AI平臺提供AIROC? Wi-Fi/藍牙?解決方案

    公司(FSE代碼:IFX / OTCQX代碼:IFNNY)近日宣布,為NVIDIA Jetson邊緣AI平臺提供AIROC? Wi-Fi和藍牙?連接解決方案。 ? ?
    的頭像 發(fā)表于 06-10 16:08 ?3629次閱讀
    英飛凌為<b class='flag-5'>NVIDIA</b> <b class='flag-5'>Jetson</b>邊緣<b class='flag-5'>AI</b><b class='flag-5'>平臺</b>提供AIROC? Wi-Fi/藍牙?解決方案

    何在NVIDIA Jetson AGX Thor上部署1200億參數(shù)大模型

    上一期介紹了如何在 NVIDIA Jetson AGX Thor 上使用 Docker 部署 vLLM 推理服務,以及使用 Chatbox 作為前端調(diào)用 vLLM 運行
    的頭像 發(fā)表于 12-26 17:06 ?4754次閱讀
    如<b class='flag-5'>何在</b><b class='flag-5'>NVIDIA</b> <b class='flag-5'>Jetson</b> AGX Thor上部署1200億參數(shù)大<b class='flag-5'>模型</b>

    BPI-AIM7 RK3588 AINvidia Jetson Nano 生態(tài)系統(tǒng)兼容的低功耗 AI 模塊

    。它是開源硬件,我們已在線發(fā)布設計文檔,包括原理圖和接口定義。其異構(gòu)計算架構(gòu)兼容 NVIDIA Jetson Nano 接口標準,非常適合邊緣計算、AI 推理、VR/AR、智能 NVR
    發(fā)表于 10-11 09:08

    基于JetsoN Nano開發(fā)套件的開源智能車項目

    JetBot 項目是NVIDIA(英偉達)基于JetsoN Nano開發(fā)套件而設計的一款開源智能車項目, 為初步上手Jetson Nano,并渴望做出自己的第一個
    發(fā)表于 11-04 07:40

    NVIDIA Jetson的相關(guān)資料分享

    Jetson概述爆炸式增長的AI模型的復雜性專為自主機器開發(fā)人員設計的AI計算板加快AI處理的SDK“JetPack”概述
    發(fā)表于 11-09 08:26

    NVIDIA Jetson介紹

    首發(fā)極術(shù)社區(qū)如對Arm相關(guān)技術(shù)感興趣,歡迎私信 aijishu20加入技術(shù)微信群。分享內(nèi)容NVIDIA Jetson是嵌入式計算平臺,具有低功耗、高性能和小體積等特點,可加速各行業(yè)的AI
    發(fā)表于 12-14 08:05

    如何利用運行NVIDIA的EGX平臺上NVIDIA Metropolis應用

    優(yōu)化對于無人零售、簡化庫存管理、智慧城市的交通工程、工廠車間的光學檢測、醫(yī)療設施的患者護理等至關(guān)重要。 在本系列文章中,我們將探索現(xiàn)實案例中如何利用運行NVIDIA的EGX平臺上NVIDI
    的頭像 發(fā)表于 08-13 10:45 ?2289次閱讀

    何在NVIDIA Jetson平臺創(chuàng)建多攝像頭管道

      在本文中,我將展示如何在 NVIDIA Jetson 平臺上高效地實現(xiàn)這些常見任務。具體來說,我介紹了 jetmulticam ,一個易于使用的 Python 軟件包,用于創(chuàng)建多攝
    的頭像 發(fā)表于 04-28 09:15 ?3627次閱讀

    NVIDIA Jetson賦能智騁致想智惠農(nóng)業(yè)平臺

    NVIDIA Jetson 賦能智騁致想智惠農(nóng)業(yè)平臺,助力 AI 在農(nóng)業(yè)領域的不斷發(fā)展。
    的頭像 發(fā)表于 06-27 14:27 ?1785次閱讀

    使用NVIDIA Jetson邊緣AI平臺實時分析患者數(shù)據(jù)

    臺北榮民總醫(yī)院正在使用 NVIDIA Jetson 邊緣 AI 平臺分析透析過程中的數(shù)據(jù)流。
    的頭像 發(fā)表于 07-19 10:59 ?2617次閱讀

    NVIDIA 擴展機器人平臺,迎接生成式 AI 的崛起

    基于 NVIDIA Jetson 平臺進行開發(fā)的 1 萬多家公司現(xiàn)在可以利用全新的生成式 AI、API 和微服務來加快推進行業(yè)數(shù)字化 ? ? 強大的生成式
    發(fā)表于 10-19 17:16 ?919次閱讀
    <b class='flag-5'>NVIDIA</b> 擴展機器人<b class='flag-5'>平臺</b>,迎接生成式 <b class='flag-5'>AI</b> 的崛起

    NVIDIA 擴展機器人平臺,迎接生成式 AI 的崛起

    基于 NVIDIA Jetson 平臺進行開發(fā)的 1 萬多家公司現(xiàn)在可以利用全新的生成式 AI、API 和微服務來加快推進行業(yè)數(shù)字化 強大的生成式
    的頭像 發(fā)表于 10-20 02:05 ?1148次閱讀
    <b class='flag-5'>NVIDIA</b> 擴展機器人<b class='flag-5'>平臺</b>,迎接生成式 <b class='flag-5'>AI</b> 的崛起

    利用 NVIDIA Jetson 實現(xiàn)生成式 AI

    的無限可能性。不同于其他嵌入式平臺,Jetson 能夠在本地運行大語言模型(LLM)、視覺 Transformer 和 stable diffusion,包括在
    的頭像 發(fā)表于 11-07 21:25 ?2346次閱讀
    利用 <b class='flag-5'>NVIDIA</b> <b class='flag-5'>Jetson</b> 實現(xiàn)生成式 <b class='flag-5'>AI</b>

    NVIDIA再出手!加速開發(fā)邊緣AI應用,迎接生成式AI新紀元

    NVIDIA 近日宣布,對適用于邊緣 AI 和機器人的 NVIDIA Jetson 平臺上的兩個框架進行大規(guī)模擴展。
    的頭像 發(fā)表于 11-23 17:31 ?1745次閱讀
    <b class='flag-5'>NVIDIA</b>再出手!加速開發(fā)邊緣<b class='flag-5'>AI</b>應用,迎接生成式<b class='flag-5'>AI</b>新紀元

    NVIDIA Jetson 的嵌入式系統(tǒng)AI應用

    在這個平臺上可以使用多個不同的芯片 ,案例的主角是AIMobile AIM Edge Ncox,一款基于NVIDIA Jetson Orin NX的小型被動冷卻嵌入式系統(tǒng)。該系統(tǒng)具有6-8個Arm內(nèi)核和
    發(fā)表于 12-11 17:37 ?1290次閱讀