91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

NVIDIA GPU Operator的新功能介紹

星星科技指導員 ? 來源:NVIDIA ? 作者:NVIDIA ? 2022-04-11 16:44 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在 Kubernetes 中使用 GPU 可靠地配置服務器可能很快變得復雜,因為必須安裝和管理多個組件才能使用 GPU。 GPU 運營商基于運營商框架,簡化了 GPU 服務器的初始部署和管理。 NVIDIA , Red Hat 和社區(qū)中的其他人合作創(chuàng)建了 GPU 運營商。

要在 Kubernetes 群集中配置 GPU 工作節(jié)點,需要以下 NVIDIA 軟件組件:

NVIDIA driver

NVIDIA 容器工具包

Kubernetes 設備插件

Monitoring

這些組件應該在 GPU 資源可用于集群之前進行配置,并在集群操作期間進行管理。

GPU 操作員通過將所有組件封裝起來,簡化了組件的初始部署和管理。它使用標準的 kubernetes api 來自動化和管理這些組件,包括版本控制和升級。 GPU 操作符是完全開源的。它在 NGC 上提供,并且是 NVIDIA EGX Stack和 Red Hat OpenShift 的一部分。

最新的 GPU 操作員版本 1 . 6 和 1 . 7 包括幾個新功能:

支持使用 NVIDIA 安培體系結構產品自動配置 MIG 幾何圖形

支持預安裝的 NVIDIA 驅動程序和 NVIDIA 容器工具包

更新了對 Red Hat OpenShift 4 . 7 的支持

更新了 GPU 驅動程序版本,包括對 NVIDIA A40 、 A30 和 A10 的支持

使用 Containerd 支持 RuntimeClass

多實例 GPU 支持

多實例 GPU ( MIG )擴展了每個 NVIDIA A100 TensorCoreGPU 的性能和價值。 MIG 可以將 A100 或 A30 GPU 劃分為多達七個實例( A100 )或四個實例( A30 ),每個實例都用自己的高帶寬內存、緩存和計算核心完全隔離。

如果沒有 MIG ,在同一 GPU 上運行的不同作業(yè)(如不同的 AI 推斷請求)將爭奪相同的資源(如內存帶寬)。使用 MIG ,作業(yè)在不同的實例上同時運行,每個實例都有專用的計算、內存和內存帶寬資源。這將產生可預測的性能、服務質量和最大 GPU 利用率。因為同時作業(yè)可以操作, MIG 是邊緣計算用例的理想選擇。

GPU Operator 1 . 7 添加了一個名為 NVIDIA MIG Kubernetes Manager, 的新組件,它作為守護程序運行,管理每個節(jié)點上的 MIG 模式和 MIG 配置更改。您可以在節(jié)點上應用 MIG 配置,方法是添加一個指示要應用的預定義配置名稱的標簽。應用 MIG 配置后, GPU 運算符自動驗證是否按預期應用了 MIG 更改。

預裝驅動程序和容器工具包

GPU Operator 1 . 7 現(xiàn)在支持有選擇地安裝 NVIDIA 驅動程序和容器工具包(容器配置)組件。這個新特性為預安裝驅動程序或 nvidia-docker2 包的環(huán)境提供了極大的靈活性。這些環(huán)境現(xiàn)在可以使用 GPU 操作符簡化對其他軟件組件的管理,如設備插件、 GPU 功能發(fā)現(xiàn)插件、用于監(jiān)視的 DCGM 導出器或用于 Kubernetes 的 MIG 管理器。

只預裝驅動程序的 Install 命令:

 helm install --wait --generate-name \
  nvidia/gpu-operator \
  --set driver.enabled=false 

預裝驅動程序和nvidia-docker2的 Install 命令:

 helm install --wait --generate-name \
  nvidia/gpu-operator \
  --set driver.enabled=false
  --set toolkit.enabled=false 

增加了對 Red Hat OpenShift 的支持

我們繼續(xù)支持 Red Hat OpenShift ,

GPU Operator 1 . 6 和 1 . 7 支持最新的 Red Hat OpenShift 4 . 7 版本。

GPU 運算符 1 . 5 支持 Red Hat OpenShift 4 . 6 。

GPU 操作符 1 . 4 和 1 . 3 分別支持 Red Hat OpenShift 4 . 5 和 4 . 4 。

GPU 操作員是經過 OpenShift 認證的操作員。通過 OpenShift web 控制臺,只需單擊幾下鼠標即可安裝并開始使用 GPU 操作符。作為一名經過認證的操作員,使用 NVIDIA GPU s 和 Red Hat OpenShift 非常容易。

GPU 對 NVIDIA A40 、 A30 和 A10 的驅動程序支持

我們更新了 GPU 驅動程序版本,包括對 NVIDIA A40 、 A30 和 A10 的支持。

NVIDIA A40

NVIDIA A40 提供了設計師、工程師、藝術家和科學家所需的基于數(shù)據中心的解決方案,以應對當今的挑戰(zhàn)。 A40 基于 NVIDIA 安培架構,結合了最新一代 RT 核、張量核和 CUDA 核。它有 48 GB 的圖形內存,用于前所未有的圖形、渲染、計算和人工智能性能。從功能強大的虛擬工作站到專用的渲染和計算節(jié)點, A40 旨在處理來自數(shù)據中心的最苛刻的可視化計算工作負載。

NVIDIA A30

NVIDIA A30 張量核 GPU 是用于人工智能推理和企業(yè)工作負載的最通用的主流計算機 GPU 。具有 MIG 的 Tensor 內核與 165W 低功耗外殼中的快速內存帶寬結合在一起,所有這些都采用 PCIe 外形,是主流服務器的理想選擇。

A30 是為大規(guī)模人工智能推理而構建的,它還可以使用 TF32 快速重新訓練人工智能模型,并使用 FP64 張量核加速高性能計算的應用。 NVIDIA 安培體系結構張量內核和 MIG 的結合在不同的工作負載上提供了安全的加速,所有這些都由一個多功能的 GPU 提供動力,實現(xiàn)了彈性數(shù)據中心。多功能 A30 計算能力為主流企業(yè)提供最大價值。

NVIDIA A10

NVIDIA A10 張量核 GPU 是具有人工智能的主流媒體和圖形的理想 GPU 。第二代 RT 核和第三代 Tensor 核通過強大的 AI 豐富了圖形和視頻應用程序。 NVIDIA A10 為密集服務器提供了一個寬、全高、全長 PCIe 外形尺寸和 150W 電源外殼。

NVIDIA A10 Tensor Core GPU 專為具有強大 AI 功能的圖形、媒體和云游戲應用程序而設計,可提供豐富的媒體體驗。與 NVIDIA T4 張量內核 GPU 相比,它提供了高達 4k 的云游戲,圖形性能是 NVIDIA T4 張量內核的 2 . 5 倍,推理性能是 GPU 的 3 倍以上。

對 Containerd 的 RuntimeClass 支持

RuntimeClass 為您提供了選擇每個 Pod 的容器運行時配置,然后為每個節(jié)點上的所有 Pod 應用默認運行時配置的靈活性。通過這種支持,您可以為運行 GPU – 加速工作負載的 pod 指定特定的運行時配置,并為通用工作負載選擇其他運行時。

GPU Operator v1 . 7 . 0 現(xiàn)在支持在安裝過程中將默認運行時選擇為 containerd 時自動創(chuàng)建 nvidia RuntimeClass 。 運行使用 GPU 的應用程序時,可以顯式指定此 RuntimeClass 名稱。

 apiVersion: node.k8s.io/v1beta1
 handler: nvidia
 kind: RuntimeClass
 metadata:
 labels:
  app.kubernetes.io/component: gpu-operator

name: nvidia 關于作者

Troy Estes 是 NVIDIA Edge 和企業(yè)計算解決方案的產品營銷經理。在加入 Edge & Enterprise 業(yè)務部門之前,特洛伊曾在自主汽車業(yè)務部門和 NVIDIA 電網產品集團從事營銷活動和支持產品 GTM 。

Erik Bohnhorst 是 NVIDIA 的高級產品經理,專注于云本地技術,為 edge 和數(shù)據中心構建一流的解決方案。 Erik 于 2014 年加入 NVIDIA ,以解決方案架構師的身份幫助客戶構建世界一流的虛擬化遠程工作站。埃里克領導技術營銷團隊,直到他加入了 EGX 團隊。

審核編輯:郭婷

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    5594

    瀏覽量

    109751
  • gpu
    gpu
    +關注

    關注

    28

    文章

    5194

    瀏覽量

    135467
  • 人工智能
    +關注

    關注

    1817

    文章

    50098

    瀏覽量

    265408
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    借助NVIDIA CUDA Tile IR后端推進OpenAI Triton的GPU編程

    NVIDIA CUDA Tile 是基于 GPU 的編程模型,其設計目標是為 NVIDIA Tensor Cores 提供可移植性,從而釋放 GPU 的極限性能。CUDA Tile 的
    的頭像 發(fā)表于 02-10 10:31 ?245次閱讀

    NVIDIA RTX PRO 5000 Blackwell GPU的深度評測

    NVIDIA RTX PRO 5000 Blackwell 是 NVIDIA RTX 5000 Ada Generation 的升級迭代產品,其各項核心指標均針對 GPU 加速工作流的高性能
    的頭像 發(fā)表于 01-06 09:51 ?2324次閱讀
    <b class='flag-5'>NVIDIA</b> RTX PRO 5000 Blackwell <b class='flag-5'>GPU</b>的深度評測

    NVIDIA RTX PRO 4000 Blackwell GPU性能測試

    Generation 的全面超越。那么,這款劃時代的專業(yè) GPU 在真實應用場景中的表現(xiàn)究竟如何?今天,我們將通過深度實測,為您揭曉 NVIDIA RTX PRO 4000 Blackwell 相較于前代產品的性能躍遷。
    的頭像 發(fā)表于 12-29 15:30 ?1360次閱讀
    <b class='flag-5'>NVIDIA</b> RTX PRO 4000 Blackwell <b class='flag-5'>GPU</b>性能測試

    NVIDIA RTX PRO 5000 72GB Blackwell GPU現(xiàn)已全面上市

    NVIDIA RTX PRO 5000 72GB Blackwell GPU 現(xiàn)已全面上市,將基于 NVIDIA Blackwell 架構的強大代理式與生成式 AI 能力帶到更多桌面和專業(yè)用戶手中。
    的頭像 發(fā)表于 12-24 10:32 ?835次閱讀
    <b class='flag-5'>NVIDIA</b> RTX PRO 5000 72GB Blackwell <b class='flag-5'>GPU</b>現(xiàn)已全面上市

    在Python中借助NVIDIA CUDA Tile簡化GPU編程

    NVIDIA CUDA 13.1 版本新增了基于 Tile 的GPU 編程模式。它是自 CUDA 發(fā)明以來 GPU 編程最核心的更新之一。借助 GPU tile kernels,可以用
    的頭像 發(fā)表于 12-13 10:12 ?1203次閱讀
    在Python中借助<b class='flag-5'>NVIDIA</b> CUDA Tile簡化<b class='flag-5'>GPU</b>編程

    NVIDIA RTX PRO 2000 Blackwell GPU性能測試

    越來越多的應用正在使用 AI 加速,而無論工作站的大小或形態(tài)如何,都有越來越多的用戶需要 AI 性能。NVIDIA RTX PRO 2000 Blackwell 是全新 NVIDIA
    的頭像 發(fā)表于 11-28 09:39 ?6320次閱讀
    <b class='flag-5'>NVIDIA</b> RTX PRO 2000 Blackwell <b class='flag-5'>GPU</b>性能測試

    NVIDIA Isaac Lab多GPU多節(jié)點訓練指南

    NVIDIA Isaac Lab 是一個適用于機器人學習的開源統(tǒng)一框架,基于 NVIDIA Isaac Sim 開發(fā),其模塊化高保真仿真適用于各種訓練環(huán)境,可提供各種物理 AI 功能和由 GP
    的頭像 發(fā)表于 09-23 17:15 ?2412次閱讀
    <b class='flag-5'>NVIDIA</b> Isaac Lab多<b class='flag-5'>GPU</b>多節(jié)點訓練指南

    NVIDIA RAPIDS 25.06版本新增多項功能

    RAPIDS 是一套面向 Python 數(shù)據科學的 NVIDIA CUDA-X 庫,最新發(fā)布的 25.06 版本引入了多項亮眼新功能,其中包括 Polars GPU 流執(zhí)行引擎——這是一種面向圖
    的頭像 發(fā)表于 09-09 09:54 ?1067次閱讀

    NVIDIA RTX PRO 4500 Blackwell GPU測試分析

    今天我們帶來全新 NVIDIA Blackwell 架構 GPU —— NVIDIA RTX PRO 4500 Blackwell 的測試,對比上一代產品 NVIDIA RTX 450
    的頭像 發(fā)表于 08-28 11:02 ?3995次閱讀
    <b class='flag-5'>NVIDIA</b> RTX PRO 4500 Blackwell <b class='flag-5'>GPU</b>測試分析

    NVIDIA桌面GPU系列擴展新產品

    NVIDIA 桌面 GPU 系列擴展,推出 NVIDIA RTX PRO 4000 SFF Edition GPU 和 RTX PRO 2000 Blackwell
    的頭像 發(fā)表于 08-18 11:50 ?1418次閱讀

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架構分析」閱讀體驗】+NVlink技術從應用到原理

    的應用層面的工作,對于芯片底層基本原理興趣缺缺,本帖結合自己實際生活與工作中對GPU新品的應用實例和書中內容分享下相關見解。 NVlink的初應用 **NVlink(SLI)**是NVIDIA公司針對
    發(fā)表于 06-18 19:31

    如何在Ubuntu上安裝NVIDIA顯卡驅動?

    專有顯卡驅動。本文將詳細介紹在Ubuntu系統(tǒng)上安裝NVIDIA顯卡驅動的多種方法,幫助用戶根據自身情況選擇最適合的安裝方式。 二,硬件參數(shù) 平臺:PX22_GPU CPU:I7-1165G7
    的頭像 發(fā)表于 05-07 16:05 ?2505次閱讀
    如何在Ubuntu上安裝<b class='flag-5'>NVIDIA</b>顯卡驅動?

    NVIDIA實現(xiàn)神經網絡渲染技術的突破性增強功能

    近日,NVIDIA 宣布了 NVIDIA RTX 神經網絡渲染技術的突破性增強功能。NVIDIA 與微軟合作,將在 4 月的 Microsoft DirectX 預覽版中增加神經網絡著
    的頭像 發(fā)表于 04-07 11:33 ?1182次閱讀

    NVIDIA虛擬GPU 18.0版本的亮點

    NVIDIA 虛擬 GPU(vGPU)技術可在虛擬桌面基礎設施(VDI)中解鎖 AI 功能,使其比以往更加強大、用途更加廣泛。vGPU 通過為各種虛擬化環(huán)境中的 AI 驅動工作負載提供動力,提高了
    的頭像 發(fā)表于 04-07 11:28 ?1435次閱讀

    使用NVIDIA RTX PRO Blackwell系列GPU加速AI開發(fā)

    NVIDIA GTC 推出新一代專業(yè)級 GPU 和 AI 賦能的開發(fā)者工具—同時,ChatRTX 更新現(xiàn)已支持 NVIDIA NIM,RTX Remix 正式結束測試階段,本月的 NVIDIA
    的頭像 發(fā)表于 03-28 09:59 ?1306次閱讀