91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

企業(yè)可在Kubernetes上輕松擴(kuò)展NVIDIA GPU

星星科技指導(dǎo)員 ? 來源:NVIDIA ? 作者:NVIDIA ? 2022-04-11 14:56 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

NVIDIA GPU 運(yùn)營商允許企業(yè)在 Kubernetes 上輕松擴(kuò)展 NVIDIA GPU 。

通過使用 Kubernetes 簡化 GPU 的部署和管理, GPU 運(yùn)營商使基礎(chǔ)設(shè)施團(tuán)隊(duì)能夠在幾分鐘內(nèi)自動無誤地擴(kuò)展 GPU 應(yīng)用程序。

GPU Operator 1.9 現(xiàn)已推出,其中包括幾個關(guān)鍵功能,以及其他更新,使用戶可以更快地開始使用并保持不間斷服務(wù)。

GPU 操作員 1.9 包括:

支持使用 DGX 操作系統(tǒng)的 NVIDIA DGX A100 系統(tǒng)

簡化的安裝過程

使用 DGX 操作系統(tǒng)支持 DGX A100

對于 1.9 , GPU 操作員自動在 NVIDIA NVSwitch 系統(tǒng)上部署初始化結(jié)構(gòu)所需的軟件,包括與 DGX OS 一起使用時的 DGX A100 。一旦初始化,所有 GPU 都可以在全 NVLink 帶寬下相互通信,以創(chuàng)建端到端可擴(kuò)展計算平臺。

DGX A100 配備了世界上最先進(jìn)的加速器,使企業(yè)能夠?qū)⑴嘤?xùn)、推理和分析整合到統(tǒng)一、易于部署的 AI 基礎(chǔ)設(shè)施中?,F(xiàn)在,有了 GPU 運(yùn)營商的支持,企業(yè)可以將其應(yīng)用程序從培訓(xùn)擴(kuò)展到與世界上最先進(jìn)的系統(tǒng)相匹配。

簡化的安裝過程

對于 GPU 運(yùn)營商的早期版本,使用 GPU 運(yùn)營商和 OpenShift 的組織需要從 Red Hat 申請額外的權(quán)利,以便成功使用 GPU 運(yùn)營商。由于授權(quán)密鑰過期,用戶需要重新應(yīng)用這些密鑰,以確保其工作流程不會中斷。

GPU Operator 1.9 現(xiàn)在支持 OpenShift 的免授權(quán)驅(qū)動程序容器。這是通過利用 RedHat 提供的 Driver-Toolkit 映像以及為構(gòu)建 NVIDIA 內(nèi)核模塊而預(yù)先安裝的必要內(nèi)核包來實(shí)現(xiàn)的。用戶不再需要確保運(yùn)行 GPU 運(yùn)算符時始終應(yīng)用具有 RHEL 訂閱的有效證書。更重要的是,對于斷開連接的集群,它消除了對私有包存儲庫的依賴。

版本 1.9 還包括對帶有 MIG Manager 的預(yù)裝驅(qū)動程序的支持,對預(yù)裝 MOFED 使用 GPUDirect RDMA 的支持,對容器運(yùn)行時的自動檢測,以及對 NOUVEAU 的自動禁用–所有這些都旨在讓用戶更容易開始并繼續(xù)使用 GPU 加速的 Kubernetes 。

此外, GPU Operator 1.9 會自動檢測工作節(jié)點(diǎn)上安裝的容器運(yùn)行時。無需在安裝時指定容器運(yùn)行時。

GPU 操作員 1.9 :

helm install --wait --generate-name nvidia/gpu-operator

GPU 操作員 1.8 及更早版本:

helm install --wait --generate-name nvidia/gpu-operator --set operator.defaultRuntime=containerd

GPU 操作員要求禁用 Nouveau 。在以前的 GPU 操作員版本中, K8s 管理員必須按照文檔 禁用 Nouveau 。 GPU 操作員 1.9 會自動檢測 Nouveau 是否已啟用并為您禁用。

GPU 操作員資源

以下資源可用于使用 NVIDIA GPU 運(yùn)營商:

GPU 操作員 1.9 發(fā)行說明

入門指南

GPU NGC 上的操作員舵圖

GitHub 上的 GPU 運(yùn)算符

關(guān)于作者

Erik Bohnhorst 是 NVIDIA 的高級產(chǎn)品經(jīng)理,專注于云本地技術(shù),為 edge 和數(shù)據(jù)中心構(gòu)建一流的解決方案。 Erik 于 2014 年加入 NVIDIA ,以解決方案架構(gòu)師的身份幫助客戶構(gòu)建世界一流的虛擬化遠(yuǎn)程工作站。埃里克領(lǐng)導(dǎo)技術(shù)營銷團(tuán)隊(duì),直到他加入了 EGX 團(tuán)隊(duì)。

Troy Estes 是 NVIDIA Edge 和企業(yè)計算解決方案的產(chǎn)品營銷經(jīng)理。在加入 Edge & Enterprise 業(yè)務(wù)部門之前,特洛伊曾在自主汽車業(yè)務(wù)部門和 NVIDIA 電網(wǎng)產(chǎn)品集團(tuán)從事營銷活動和支持產(chǎn)品 GTM 。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5594

    瀏覽量

    109757
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5194

    瀏覽量

    135474
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    KubePi:開源Kubernetes可視化管理面板,讓集群管理如此簡單

    的部署、監(jiān)控和維護(hù),讓即使不具備深厚Kubernetes知識的用戶也能輕松管理集群。 1.2 核心價值:可視化多集群管理 KubePi允許管理員導(dǎo)入多個Kubernetes集群,并通過精細(xì)的權(quán)限控制將不
    發(fā)表于 02-11 12:53

    借助NVIDIA CUDA Tile IR后端推進(jìn)OpenAI Triton的GPU編程

    NVIDIA CUDA Tile 是基于 GPU 的編程模型,其設(shè)計目標(biāo)是為 NVIDIA Tensor Cores 提供可移植性,從而釋放 GPU 的極限性能。CUDA Tile 的
    的頭像 發(fā)表于 02-10 10:31 ?246次閱讀

    NVIDIA RTX PRO 5000 Blackwell GPU的深度評測

    NVIDIA RTX PRO 5000 Blackwell 是 NVIDIA RTX 5000 Ada Generation 的升級迭代產(chǎn)品,其各項(xiàng)核心指標(biāo)均針對 GPU 加速工作流的高性能
    的頭像 發(fā)表于 01-06 09:51 ?2334次閱讀
    <b class='flag-5'>NVIDIA</b> RTX PRO 5000 Blackwell <b class='flag-5'>GPU</b>的深度評測

    在Python中借助NVIDIA CUDA Tile簡化GPU編程

    NVIDIA CUDA 13.1 版本新增了基于 Tile 的GPU 編程模式。它是自 CUDA 發(fā)明以來 GPU 編程最核心的更新之一。借助 GPU tile kernels,可以用
    的頭像 發(fā)表于 12-13 10:12 ?1204次閱讀
    在Python中借助<b class='flag-5'>NVIDIA</b> CUDA Tile簡化<b class='flag-5'>GPU</b>編程

    NVIDIA RTX PRO 4500 Blackwell GPU測試分析

    今天我們帶來全新 NVIDIA Blackwell 架構(gòu) GPU —— NVIDIA RTX PRO 4500 Blackwell 的測試,對比上一代產(chǎn)品 NVIDIA RTX 450
    的頭像 發(fā)表于 08-28 11:02 ?3998次閱讀
    <b class='flag-5'>NVIDIA</b> RTX PRO 4500 Blackwell <b class='flag-5'>GPU</b>測試分析

    NVIDIA桌面GPU系列擴(kuò)展新產(chǎn)品

    NVIDIA 桌面 GPU 系列擴(kuò)展,推出 NVIDIA RTX PRO 4000 SFF Edition GPU 和 RTX PRO 20
    的頭像 發(fā)表于 08-18 11:50 ?1420次閱讀

    NVIDIA Jetson AGX Thor開發(fā)者套件概述

    NVIDIA Jetson AGX Thor 開發(fā)者套件為您提供出色的性能和可擴(kuò)展性。它由 NVIDIA Blackwell GPU和128 GB 顯存提供動力支持,提供高達(dá) 2070
    的頭像 發(fā)表于 08-11 15:03 ?1906次閱讀

    NVIDIA Dynamo新增對亞馬遜云科技服務(wù)的支持

    亞馬遜云科技 (AWS) 開發(fā)者和解決方案架構(gòu)師現(xiàn)在可以在基于 NVIDIA GPU 的 Amazon EC2 使用 NVIDIA Dynamo,包括由
    的頭像 發(fā)表于 07-28 14:31 ?981次閱讀
    <b class='flag-5'>NVIDIA</b> Dynamo新增對亞馬遜云科技服務(wù)的支持

    生產(chǎn)環(huán)境中Kubernetes容器安全的最佳實(shí)踐

    隨著容器化技術(shù)的快速發(fā)展,Kubernetes已成為企業(yè)級容器編排的首選平臺。然而,在享受Kubernetes帶來的便利性和可擴(kuò)展性的同時,安全問題也日益凸顯。本文將從運(yùn)維工程師的角度
    的頭像 發(fā)表于 07-14 11:09 ?738次閱讀

    NVIDIA技術(shù)助力企業(yè)創(chuàng)建主權(quán)AI智能體

    AI Factory 的經(jīng)驗(yàn)證設(shè)計將加速基礎(chǔ)設(shè)施與軟件(包括全新 NVIDIA NIM 微服務(wù)和經(jīng)擴(kuò)展NVIDIA Blueprint)相結(jié)合,為各國和企業(yè)簡化了全棧式 AI 開發(fā)
    的頭像 發(fā)表于 06-16 14:28 ?1350次閱讀

    如何在Ubuntu安裝NVIDIA顯卡驅(qū)動?

    專有顯卡驅(qū)動。本文將詳細(xì)介紹在Ubuntu系統(tǒng)安裝NVIDIA顯卡驅(qū)動的多種方法,幫助用戶根據(jù)自身情況選擇最適合的安裝方式。 二,硬件參數(shù) 平臺:PX22_GPU CPU:I7-1165G7
    的頭像 發(fā)表于 05-07 16:05 ?2505次閱讀
    如何在Ubuntu<b class='flag-5'>上</b>安裝<b class='flag-5'>NVIDIA</b>顯卡驅(qū)動?

    NVIDIA虛擬GPU 18.0版本的亮點(diǎn)

    NVIDIA 虛擬 GPU(vGPU)技術(shù)可在虛擬桌面基礎(chǔ)設(shè)施(VDI)中解鎖 AI 功能,使其比以往更加強(qiáng)大、用途更加廣泛。vGPU 通過為各種虛擬化環(huán)境中的 AI 驅(qū)動工作負(fù)載提供動力,提高了
    的頭像 發(fā)表于 04-07 11:28 ?1436次閱讀

    使用NVIDIA RTX PRO Blackwell系列GPU加速AI開發(fā)

    NVIDIA GTC 推出新一代專業(yè)級 GPU 和 AI 賦能的開發(fā)者工具—同時,ChatRTX 更新現(xiàn)已支持 NVIDIA NIM,RTX Remix 正式結(jié)束測試階段,本月的 NVIDIA
    的頭像 發(fā)表于 03-28 09:59 ?1307次閱讀

    英偉達(dá)GTC2025亮點(diǎn):NVIDIA認(rèn)證計劃擴(kuò)展企業(yè)存儲領(lǐng)域,加速AI工廠部署

    全新的存儲認(rèn)證和參考架構(gòu)讓企業(yè) IT 部門能更輕松地選擇和部署 AI 基礎(chǔ)設(shè)施,實(shí)現(xiàn)最優(yōu)的性能和能效。 AI 部署的成功依靠速度、數(shù)據(jù)和規(guī)模。因此,NVIDIA 正在擴(kuò)展
    的頭像 發(fā)表于 03-21 19:38 ?2059次閱讀

    英偉達(dá)GTC25亮點(diǎn):NVIDIA Dynamo開源庫加速并擴(kuò)展AI推理模型

    NVIDIA Dynamo 提高了推理性能,同時降低了擴(kuò)展測試時計算 (Scaling Test-Time Compute) 的成本;在 NVIDIA Blackwell 的推理優(yōu)化
    的頭像 發(fā)表于 03-20 15:03 ?1237次閱讀