91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA NGC目錄中的GPU優(yōu)化容器

NVIDIA英偉達企業(yè)解決方案 ? 來源:NVIDIA英偉達企業(yè)解決方案 ? 作者:NVIDIA英偉達企業(yè)解 ? 2022-07-01 11:21 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

借助 NVIDIA NGC 目錄中的 GPU 優(yōu)化容器,更快地開發(fā)和部署應(yīng)用。

什么是容器?

容器是一種便攜式軟件單元,可將應(yīng)用及其所有依賴項合并為一個軟件包,該軟件包不受底層主機操作系統(tǒng)限制。這樣無需再構(gòu)建復(fù)雜的環(huán)境,并簡化了應(yīng)用開發(fā)到部署的過程。

NVIDIA NGC 目錄包含一系列用于深度學(xué)習(xí)、機器學(xué)習(xí)、可視化和高性能計算(HPC)應(yīng)用的 GPU 優(yōu)化容器,這些容器均已經(jīng)過了性能、安全性和可擴展性測試。

NGC 目錄中的容器的優(yōu)勢

輕松部署

內(nèi)置庫和依賴項可讓您輕松部署和運行應(yīng)用。

加快訓(xùn)練速度

TensorFlow 和 PyTorch 等 NVIDIA AI 容器每月會提供針對性能優(yōu)化的更新版本,以便加快 AI 訓(xùn)練和推理速度。

運行位置不受限制

在 bare metal、虛擬機(VM)和 Kubernetes 上,將容器部署在任意位置(云端、內(nèi)部私有云和邊緣)的多 GPU/多節(jié)點系統(tǒng)上。

放心部署

容器經(jīng)過常見漏洞和暴露(CVE)掃描(附有安全報告),并通過 NVIDIA AI Enterprise 得到了可選的企業(yè)支持。

性能優(yōu)化

NVIDIA 構(gòu)建的 Docker 容器每月都會更新,第三方軟件也會定期更新,以提供所需的功能,便于您從現(xiàn)有基礎(chǔ)架構(gòu)中獲得出色性能,并縮短找出解決方案的時間。

借助 BERT-Large 進行自然語言處理

BERT-Large 利用 VoltaV100 和 Ampere A100 GPU 上的混合精度運算和 Tensor Core,在保持目標準確性的同時縮短訓(xùn)練時間。

在單節(jié)點的 8x V100 (16GB) 和 A100 (40GB) 上使用 TensorFlow 時,BERT-Large 和訓(xùn)練的性能表現(xiàn)?;旌暇?。BERT 的批量大?。? (V100)、24(A100)

用于圖像處理的 ResNet50 v1.5

此模型使用 Volta、Turing 和 NVIDIA Ampere GPU 體系架構(gòu)上的 Tensor Core 進行混合精度訓(xùn)練,以加快訓(xùn)練速度。

在單節(jié)點 8x V100 (16GB) 和 A100 (40GB) 上使用 TensorFlow 時,ResNet 50 的性能表現(xiàn)。混合精度。ResNet50 批量大?。?6

用于深度學(xué)習(xí)的 Matlab

持續(xù)開發(fā) Matlab 深度學(xué)習(xí)容器可提高訓(xùn)練和推理性能。

Windows 10Intel Xeon E5-2623 @2.4GHz,NVIDIA Titan V 12GB GPU

用于各種工作負載的容器

AI 容器

TensorFlow

TensorFlow 是一個用于高性能數(shù)值計算的開源軟件庫。

PyTorch

PyTorch 是具有 Python 前端的 GPU 加速型張量計算框架。

NVIDIA Triton 推理服務(wù)器

NVIDIA Triton 推理服務(wù)器是一種開源推理解決方案,可更大限度地提高 GPU 的利用率和性能。

NVIDIA TensorRT

NVIDIA TensorRT 是一個C++ 庫,可加快 NVIDIA GPU 上的高性能推理。

應(yīng)用框架

NVIDIA Clara

用于醫(yī)療成像的 NVIDIA Clara Train 是一個應(yīng)用框架,包含超過 20 個先進的預(yù)訓(xùn)練模型、遷移學(xué)習(xí)和聯(lián)合學(xué)習(xí)工具、AutoML,以及 AI 輔助的標記數(shù)據(jù)。

DeepStream

DeepStream 是一款流分析工具包,可用于基于 AI 的視頻、音頻和圖像理解和多傳感器處理。

NVIDIA Riva

NVIDIA Riva 是一個應(yīng)用框架,適用于在 GPU 上提供實時性能的多模態(tài)對話式 AI 服務(wù)。

Merlin Training

Merlin HugeCTR 是 NVIDIA Merlin 的組件,是一款專為推薦系統(tǒng)設(shè)計的深度神經(jīng)網(wǎng)絡(luò)訓(xùn)練框架。

HPC 容器

NAMD

NAMD 是一段并行分子動力學(xué)代碼,旨在實現(xiàn)生物大分子系統(tǒng)的高性能模擬

GROMACS

GROMACS 是一款熱門的分子動力學(xué)應(yīng)用,用于模擬蛋白質(zhì)和脂質(zhì)。

Relion

Relion 采用經(jīng)驗貝葉斯方法分析低溫電子顯微鏡(cryo EM)。

NVIDIA HPC SDK

NVIDIA HPC SDK 是編譯器、庫和工具的綜合套件,用于構(gòu)建、部署和管理 HPC 應(yīng)用。

點擊閱讀原文,了解更多 AI 和 HPC 容器相關(guān)內(nèi)容

NVIDIA 深度學(xué)習(xí)培訓(xùn)中心

我們的 NVIDIA 深度學(xué)習(xí)培訓(xùn)中心還推出了 AI 和 HPC 容器及 NGC 相關(guān)課程,您可以復(fù)制鏈接查看課程詳情。

使用容器實現(xiàn)高性能計算

學(xué)習(xí)使用容器化環(huán)境開發(fā)高性能計算(HPC)應(yīng)用程序,降低編碼的復(fù)雜性和可移植性,從而提高開發(fā)效率。

原文標題:DevZone | AI和HPC容器

文章出處:【微信公眾號:NVIDIA英偉達企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5592

    瀏覽量

    109702
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5194

    瀏覽量

    135407
  • 容器
    +關(guān)注

    關(guān)注

    0

    文章

    531

    瀏覽量

    22961

原文標題:DevZone | AI和HPC容器

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    借助NVIDIA CUDA Tile IR后端推進OpenAI Triton的GPU編程

    NVIDIA CUDA Tile 是基于 GPU 的編程模型,其設(shè)計目標是為 NVIDIA Tensor Cores 提供可移植性,從而釋放 GPU 的極限性能。CUDA Tile 的
    的頭像 發(fā)表于 02-10 10:31 ?234次閱讀

    NVIDIA RTX PRO 5000 Blackwell GPU的深度評測

    NVIDIA RTX PRO 5000 Blackwell 是 NVIDIA RTX 5000 Ada Generation 的升級迭代產(chǎn)品,其各項核心指標均針對 GPU 加速工作流的高性能
    的頭像 發(fā)表于 01-06 09:51 ?2200次閱讀
    <b class='flag-5'>NVIDIA</b> RTX PRO 5000 Blackwell <b class='flag-5'>GPU</b>的深度評測

    NVIDIA RTX PRO 4000 Blackwell GPU性能測試

    Generation 的全面超越。那么,這款劃時代的專業(yè) GPU 在真實應(yīng)用場景的表現(xiàn)究竟如何?今天,我們將通過深度實測,為您揭曉 NVIDIA RTX PRO 4000 Blackwell 相較于前代產(chǎn)品的性能躍遷。
    的頭像 發(fā)表于 12-29 15:30 ?1324次閱讀
    <b class='flag-5'>NVIDIA</b> RTX PRO 4000 Blackwell <b class='flag-5'>GPU</b>性能測試

    NVIDIA RTX PRO 5000 72GB Blackwell GPU現(xiàn)已全面上市

    NVIDIA RTX PRO 5000 72GB Blackwell GPU 現(xiàn)已全面上市,將基于 NVIDIA Blackwell 架構(gòu)的強大代理式與生成式 AI 能力帶到更多桌面和專業(yè)用戶手中。
    的頭像 發(fā)表于 12-24 10:32 ?818次閱讀
    <b class='flag-5'>NVIDIA</b> RTX PRO 5000 72GB Blackwell <b class='flag-5'>GPU</b>現(xiàn)已全面上市

    NVIDIA Omniverse基于Container的部署推流方案

    為了讓客戶能夠高效安裝和部署 NVIDIA Omniverse 及 NVIDIA Isaac 平臺,NVIDIA 現(xiàn)已推出簡單便捷的容器化部署方案,以支持在數(shù)據(jù)中心的服務(wù)器
    的頭像 發(fā)表于 12-17 10:17 ?648次閱讀
    <b class='flag-5'>NVIDIA</b> Omniverse基于Container的部署推流方案

    在Python借助NVIDIA CUDA Tile簡化GPU編程

    NVIDIA CUDA 13.1 版本新增了基于 Tile 的GPU 編程模式。它是自 CUDA 發(fā)明以來 GPU 編程最核心的更新之一。借助 GPU tile kernels,可以用
    的頭像 發(fā)表于 12-13 10:12 ?1189次閱讀
    在Python<b class='flag-5'>中</b>借助<b class='flag-5'>NVIDIA</b> CUDA Tile簡化<b class='flag-5'>GPU</b>編程

    NVIDIA RTX PRO 2000 Blackwell GPU性能測試

    Blackwell 架構(gòu) GPU 端專業(yè)圖形卡,高度僅為全高 GPU 的二分之一。如果您需要的是一塊半高顯卡,能適配小機箱,功耗不高,還要具備 AI 及光線追蹤性能的話,那么
    的頭像 發(fā)表于 11-28 09:39 ?6256次閱讀
    <b class='flag-5'>NVIDIA</b> RTX PRO 2000 Blackwell <b class='flag-5'>GPU</b>性能測試

    NVIDIA Isaac Lab多GPU多節(jié)點訓(xùn)練指南

    NVIDIA Isaac Lab 是一個適用于機器人學(xué)習(xí)的開源統(tǒng)一框架,基于 NVIDIA Isaac Sim 開發(fā),其模塊化高保真仿真適用于各種訓(xùn)練環(huán)境,可提供各種物理 AI 功能和由 GPU 驅(qū)動的物理仿真,縮小仿真與現(xiàn)實世
    的頭像 發(fā)表于 09-23 17:15 ?2395次閱讀
    <b class='flag-5'>NVIDIA</b> Isaac Lab多<b class='flag-5'>GPU</b>多節(jié)點訓(xùn)練指南

    DeepSeek R1 MTP在TensorRT-LLM的實現(xiàn)與優(yōu)化

    TensorRT-LLM 在 NVIDIA Blackwell GPU 上創(chuàng)下了 DeepSeek-R1 推理性能的世界紀錄,Multi-Token Prediction (MTP) 實現(xiàn)了大幅提速
    的頭像 發(fā)表于 08-30 15:47 ?4442次閱讀
    DeepSeek R1 MTP在TensorRT-LLM<b class='flag-5'>中</b>的實現(xiàn)與<b class='flag-5'>優(yōu)化</b>

    NVIDIA RTX PRO 4500 Blackwell GPU測試分析

    今天我們帶來全新 NVIDIA Blackwell 架構(gòu) GPU —— NVIDIA RTX PRO 4500 Blackwell 的測試,對比上一代產(chǎn)品 NVIDIA RTX 450
    的頭像 發(fā)表于 08-28 11:02 ?3975次閱讀
    <b class='flag-5'>NVIDIA</b> RTX PRO 4500 Blackwell <b class='flag-5'>GPU</b>測試分析

    NVIDIA桌面GPU系列擴展新產(chǎn)品

    NVIDIA 桌面 GPU 系列擴展,推出 NVIDIA RTX PRO 4000 SFF Edition GPU 和 RTX PRO 2000 Blackwell
    的頭像 發(fā)表于 08-18 11:50 ?1403次閱讀

    如何在Ray分布式計算框架下集成NVIDIA Nsight Systems進行GPU性能分析

    在大語言模型的強化學(xué)習(xí)訓(xùn)練過程,GPU 性能優(yōu)化至關(guān)重要。隨著模型規(guī)模不斷擴大,如何高效地分析和優(yōu)化 GPU 性能成為開發(fā)者面臨的主要挑戰(zhàn)
    的頭像 發(fā)表于 07-23 10:34 ?2397次閱讀
    如何在Ray分布式計算框架下集成<b class='flag-5'>NVIDIA</b> Nsight Systems進行<b class='flag-5'>GPU</b>性能分析

    NVIDIA Blackwell GPU優(yōu)化DeepSeek-R1性能 打破DeepSeek-R1在最小延遲場景的性能紀錄

    本文將探討 NVIDIA TensorRT-LLM 如何基于 8 個 NVIDIA Blackwell GPU 的配置,打破 DeepSeek-R1 在最小延遲場景的性能紀錄:在 G
    的頭像 發(fā)表于 07-02 19:31 ?3288次閱讀
    <b class='flag-5'>NVIDIA</b> Blackwell <b class='flag-5'>GPU</b><b class='flag-5'>優(yōu)化</b>DeepSeek-R1性能 打破DeepSeek-R1在最小延遲場景<b class='flag-5'>中</b>的性能紀錄

    NVIDIA虛擬GPU 18.0版本的亮點

    NVIDIA 虛擬 GPU(vGPU)技術(shù)可在虛擬桌面基礎(chǔ)設(shè)施(VDI)解鎖 AI 功能,使其比以往更加強大、用途更加廣泛。vGPU 通過為各種虛擬化環(huán)境的 AI 驅(qū)動工作負載提供
    的頭像 發(fā)表于 04-07 11:28 ?1428次閱讀

    使用NVIDIA RTX PRO Blackwell系列GPU加速AI開發(fā)

    NVIDIA GTC 推出新一代專業(yè)級 GPU 和 AI 賦能的開發(fā)者工具—同時,ChatRTX 更新現(xiàn)已支持 NVIDIA NIM,RTX Remix 正式結(jié)束測試階段,本月的 NVIDIA
    的頭像 發(fā)表于 03-28 09:59 ?1294次閱讀