91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

使用GPU Operator 1.8簡化GPU對部署場景的管理

星星科技指導員 ? 來源:NVIDIA ? 作者:NVIDIA ? 2022-04-11 16:06 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在本文中,我們將介紹 GPU Operator release 1.8 中添加的新功能,進一步簡化 GPU 對各種部署場景的管理,包括:

增加了對 GPU 操作員升級的支持

支持 NVX 交換機系統(tǒng),包括 DGX A100 和 NVIDIA HGX A100 服務(wù)器

支持收集 GPU 操作員狀態(tài)指標

GPU 運營商和網(wǎng)絡(luò)運營商改進多節(jié)點培訓

支持 Red Hat OpenShift 4.8

NVIDIA 軟件生命周期管理

GPU Operator 的 1.8 版為組織提供了更新機制,以更新其 GPU Operator 版本,而不會中斷運行 GPU Operator 的群集的工作流。 GPU Operator 的早期版本要求用戶在安裝新版本之前卸載以前的版本,這意味著在升級過程中群集中沒有可用的 GPU 。

從 1.8 開始,升級版本不會中斷工作流程。該機制以滾動方式一次更新一個節(jié)點,因此其他節(jié)點可以繼續(xù)使用。只有在安裝完成且上一個節(jié)點重新聯(lián)機時,下一個節(jié)點才會更新。用戶可以確信,在更新 GPU 操作員時,他們的工作流程將得到更好的管理。

現(xiàn)在支持 NVS 交換機系統(tǒng)

對于 1.8 , GPU 操作員自動在 NVIDIA 上部署初始化結(jié)構(gòu)所需的軟件 NVSwitch 系統(tǒng),包括 NVIDIA HGX A100 和 DGX A100 。一旦初始化,所有 GPU 都可以在全 NVLink 帶寬下相互通信,以創(chuàng)建一個可擴展的終端計算平臺。

GPU 操作員還經(jīng)過認證,可在 DGX A100 系統(tǒng)上與 Red Hat OpenShift 4 一起使用。

支持收集 GPU 操作員狀態(tài)指標

在 1.8 版本中, GPU 運營商現(xiàn)在報告各種指標,供用戶監(jiān)控 GPU 運營商和 GPU – 運營商資源命名空間下的運營商部署資源的總體運行狀況。 SRE 團隊和集群管理員現(xiàn)在可以配置必要的 Prometheus 用于收集指標以及在某些故障情況下觸發(fā)警報的資源。

對于 OpenShift 容器平臺,這些資源將在此版本中自動創(chuàng)建。監(jiān)控解決方案,如 Grafana 可用于構(gòu)建儀表板和可視化 GPU 操作員和節(jié)點組件的操作狀態(tài)。

更好地結(jié)合: NVIDIA 加速計算和聯(lián)網(wǎng)

最近, NVIDIA 發(fā)布了 NVIDIA Network Operator 。 模擬 NVIDIA GPU Operator ,網(wǎng)絡(luò)運營商通過自動化網(wǎng)絡(luò)部署和配置的各個方面簡化了 Kubernetes 的擴展網(wǎng)絡(luò)設(shè)計,否則需要手動操作。它在具有 NVIDIA 網(wǎng)絡(luò)接口的任何群集節(jié)點上加載所需的驅(qū)動程序、庫、設(shè)備插件和 CNI 。

當它們一起部署時, NVIDIA GPU 和網(wǎng)絡(luò)運營商啟用 GPU 直接 RDMA ,即不同節(jié)點上 NVIDIA GPU 之間的快速數(shù)據(jù)路徑。這是數(shù)據(jù)密集型工作負載(如 AI 多節(jié)點培訓)的關(guān)鍵技術(shù)促成因素。

了解有關(guān)最新版本的更多信息 NVIDIA 網(wǎng)絡(luò)運營商發(fā)布 。

增加了對 Red Hat OpenShift 的支持

我們繼續(xù)支持紅帽 OpenShift 。

GPU Operator 1.8 和 1.7 支持 Red Hat OpenShift 4.8 和 4 . 7

GPU 運算符 1.6 支持 Red Hat OpenShift 4. 7

GPU 運算符 1. 5 支持 Red Hat OpenShift 4 . 6

GPU Operator 1. 4 和1 .3 分別支持 Red Hat OpenShift 4.5 和 4.4

概括

以下資源可用于使用 NVIDIA GPU 運算符:

GPU 操作員 1.8 發(fā)行說明

入門指南

GPU NGC 上的操作員舵圖

GitHub 上的 GPU 運算符

NVIDIA GPU 運算符是許多應(yīng)用程序的關(guān)鍵組件 邊緣計算 解決。

關(guān)于作者

Troy Estes 是 NVIDIA Edge 和企業(yè)計算解決方案的產(chǎn)品營銷經(jīng)理。在加入 Edge & Enterprise 業(yè)務(wù)部門之前,特洛伊曾在自主汽車業(yè)務(wù)部門和 NVIDIA 電網(wǎng)產(chǎn)品集團從事營銷活動和支持產(chǎn)品 GTM 。

Erik Bohnhorst 是 NVIDIA 的高級產(chǎn)品經(jīng)理,專注于云本地技術(shù),為 edge 和數(shù)據(jù)中心構(gòu)建一流的解決方案。 Erik 于 2014 年加入 NVIDIA ,以解決方案架構(gòu)師的身份幫助客戶構(gòu)建世界一流的虛擬化遠程工作站。埃里克領(lǐng)導技術(shù)營銷團隊,直到他加入了 EGX 團隊。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5594

    瀏覽量

    109738
  • 數(shù)據(jù)中心
    +關(guān)注

    關(guān)注

    18

    文章

    5651

    瀏覽量

    75018
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    FPGA+GPU異構(gòu)混合部署方案設(shè)計

    為滿足對 “納秒級實時響應(yīng)” 與 “復(fù)雜數(shù)據(jù)深度運算” 的雙重需求,“FPGA+GPU”異構(gòu)混合部署方案通過硬件功能精準拆分與高速協(xié)同,突破單一硬件的性能瓶頸 ——FPGA聚焦低延遲實時交易鏈路,GPU承接高復(fù)雜度數(shù)據(jù)處理任務(wù),
    的頭像 發(fā)表于 01-13 15:20 ?350次閱讀

    在Python中借助NVIDIA CUDA Tile簡化GPU編程

    NVIDIA CUDA 13.1 版本新增了基于 Tile 的GPU 編程模式。它是自 CUDA 發(fā)明以來 GPU 編程最核心的更新之一。借助 GPU tile kernels,可以用比 SIMT
    的頭像 發(fā)表于 12-13 10:12 ?1197次閱讀
    在Python中借助NVIDIA CUDA Tile<b class='flag-5'>簡化</b><b class='flag-5'>GPU</b>編程

    汽車中的GPU是如何使用的?

    。我們從GPU在汽車中的應(yīng)用場景及其具體需求出發(fā),深入探討了GPU對汽車行業(yè)發(fā)展的影響,并對未來趨勢提出了關(guān)鍵判斷。1、GPU計算在汽車中的應(yīng)用場景
    的頭像 發(fā)表于 12-03 14:45 ?9578次閱讀
    汽車中的<b class='flag-5'>GPU</b>是如何使用的?

    如何看懂GPU架構(gòu)?一分鐘帶你了解GPU參數(shù)指標

    分析GPU核心參數(shù)體系:算力、顯存大小、顯存帶寬、熱門架構(gòu)特性等關(guān)鍵指標,旨在幫您理解不同應(yīng)用場景下,如何選擇最合適的GPU算力解決方案。1、算力GPU執(zhí)行浮點運算
    的頭像 發(fā)表于 10-09 09:28 ?1134次閱讀
    如何看懂<b class='flag-5'>GPU</b>架構(gòu)?一分鐘帶你了解<b class='flag-5'>GPU</b>參數(shù)指標

    NVIDIA桌面GPU系列擴展新產(chǎn)品

    NVIDIA 桌面 GPU 系列擴展,推出 NVIDIA RTX PRO 4000 SFF Edition GPU 和 RTX PRO 2000 Blackwell GPU,可提高工程、內(nèi)容創(chuàng)作和 3D 可視化等應(yīng)用的性能。
    的頭像 發(fā)表于 08-18 11:50 ?1414次閱讀

    aicube的n卡gpu索引該如何添加?

    請問有人知道aicube怎樣才能讀取n卡的gpu索引呢,我已經(jīng)安裝了cuda和cudnn,在全局的py里添加了torch,能夠調(diào)用gpu,當還是只能看到默認的gpu0,顯示不了gpu1
    發(fā)表于 07-25 08:18

    Cincoze GM-1100嵌入式MXM GPU工控機

    規(guī)格的GPU模塊,無論是輕量級或高性能AI應(yīng)用皆可彈性選擇。模塊化架構(gòu)讓后續(xù)升級更為便利,僅需更換MXM GPU模塊即可,簡化升級流程。 特殊散
    的頭像 發(fā)表于 07-23 11:11 ?490次閱讀
    Cincoze GM-1100嵌入式MXM <b class='flag-5'>GPU</b>工控機

    Say Hi to ERNIE!Imagination GPU率先完成文心大模型的端側(cè)部署

    ImaginationTechnologies宣布率先完成百度文心大模型(ERNIE4.5開源版)在其GPU硬件上的端側(cè)部署。適配完成后,開發(fā)者可在搭載ImaginationGPU的設(shè)備上實現(xiàn)高效
    的頭像 發(fā)表于 07-01 08:17 ?977次閱讀
    Say Hi to ERNIE!Imagination <b class='flag-5'>GPU</b>率先完成文心大模型的端側(cè)<b class='flag-5'>部署</b>

    GPU架構(gòu)深度解析

    、游戲娛樂等領(lǐng)域。本文將深入探討GPU架構(gòu)的演變歷程、核心組件以及其在不同應(yīng)用場景中的優(yōu)勢。1、GPU架構(gòu)的演變早期的GPU采用固定功能流水線架構(gòu),專為圖形渲染任務(wù)而
    的頭像 發(fā)表于 05-30 10:36 ?1855次閱讀
    <b class='flag-5'>GPU</b>架構(gòu)深度解析

    ARM Mali GPU 深度解讀

    ARM Mali GPU 深度解讀 ARM Mali 是 Arm 公司面向移動設(shè)備、嵌入式系統(tǒng)和基礎(chǔ)設(shè)施市場設(shè)計的圖形處理器(GPU)IP 核,憑借其異構(gòu)計算架構(gòu)、能效優(yōu)化和生態(tài)協(xié)同,成為全球移動
    的頭像 發(fā)表于 05-29 10:12 ?4333次閱讀

    iTOP-3588S開發(fā)板四核心架構(gòu)GPU內(nèi)置GPU可以完全兼容0penGLES1.1、2.0和3.2。

    ,8GB內(nèi)存,32GBEMMC。 四核心架構(gòu)GPU內(nèi)置GPU可以完全兼容0penGLES1.1、2.0和3.2。 內(nèi)置NPU RK3588S內(nèi)置NPU,支持INT4/INT8/INT16/FP16混合運算
    發(fā)表于 05-15 10:36

    可以手動構(gòu)建imx-gpu-viv嗎?

    使用 imx-gpu-viv-6.4.3.p4.2.aarch64.bin。 https://www.nxp.com/lgfiles/NMG/MAD/YOCTO//imx-gpu-viv-6.4.3.p4.2-aarch64.bin 我需要
    發(fā)表于 03-28 06:35

    極速部署!GpuGeek提供AI開發(fā)者的云端GPU最優(yōu)解

    在AI開發(fā)領(lǐng)域,算力部署的效率和資源調(diào)度的靈活性直接影響研發(fā)進程與創(chuàng)新速度。隨著模型復(fù)雜度的提升和全球化協(xié)作需求的增長,開發(fā)者對GPU云服務(wù)的核心訴求已從單純追求硬件性能,轉(zhuǎn)向?qū)?b class='flag-5'>部署效率、跨區(qū)域協(xié)作
    的頭像 發(fā)表于 03-17 11:27 ?759次閱讀
    極速<b class='flag-5'>部署</b>!GpuGeek提供AI開發(fā)者的云端<b class='flag-5'>GPU</b>最優(yōu)解

    使用GPU作為目標設(shè)備“無法創(chuàng)建插件libclDNNPlugin.so怎么解決?

    運行OpenVINO時的 GPU 驅(qū)動程序故障排除
    發(fā)表于 03-07 08:02