91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

從GPU資源的虛擬化實(shí)現(xiàn)路徑看

SSDFans ? 來(lái)源:ssdfans ? 作者:ssdfans ? 2020-12-14 16:27 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

GPU小常識(shí):

GPU(Graphics Processing Unit),中文名:圖形處理器,曾用名:顯卡。

1999年,Nvidia(英偉達(dá))公司“ZAO”了GPU,這玩意除了極大的推動(dòng)了基于PC的游戲市場(chǎng)發(fā)展,還徹底改變了并行計(jì)算。

沒(méi)想到二十年后,Nvidia搖身一變成了高大上的AI計(jì)算公司,還用GPU綁架了整個(gè)人工智能圈子。

我有個(gè)客戶,幾年前新建了一個(gè)數(shù)據(jù)中心,通過(guò)P2V技術(shù)淘汰了大量X86物理服務(wù)器,直接在IT基礎(chǔ)設(shè)施上成功完成了服務(wù)器虛擬化轉(zhuǎn)型,之后就馬不停蹄的向云計(jì)算轉(zhuǎn)型,而當(dāng)下,又開始了人工智能轉(zhuǎn)型。

隨著智能商業(yè)時(shí)代的到來(lái),一些大公司對(duì)于AI技術(shù)的關(guān)注和使用也快速增加,這些企業(yè)都非常注重自身科技能力的構(gòu)建。其中,搭建自有AI平臺(tái),賦能業(yè)務(wù)成了這些有實(shí)力企業(yè)的首選。我這個(gè)客戶自然也不能免俗,采購(gòu)了大量的GPU服務(wù)器進(jìn)行部署。

在落地AI場(chǎng)景的同時(shí),客戶也希望對(duì)建立GPU資源池做一個(gè)評(píng)估。針對(duì)客戶需求,做了一些功課。對(duì)于AI,我依然只是知道一點(diǎn)皮毛,要說(shuō)什么算法和模型,我是沒(méi)戲的,但是可以把交流的學(xué)習(xí)心得分享一下。

GPU當(dāng)前主要應(yīng)用于計(jì)算、圖形和人工智能領(lǐng)域。從GPU資源的虛擬化實(shí)現(xiàn)路徑看,主要有三種技術(shù)方案。

VSGA(Virtual Shared Graphics Acceleration),把物理GPU分享給多個(gè)桌面用戶,每個(gè)VDI通過(guò)SVGA驅(qū)動(dòng)調(diào)用虛擬化的GPU驅(qū)動(dòng)程序,再來(lái)調(diào)用GPU的運(yùn)算能力,這個(gè)屬于典型的桌面虛擬化場(chǎng)景。

VDGA(Virtual Dedicated Graphics Acceleration),把物理GPU分配給一個(gè)指定的VM,資源專用,這種模式也稱為直通(PassThrough)模式,該方案具有比較高的性能優(yōu)勢(shì),但成本相對(duì)較高。

vGPU(Virtualized GPU),把一塊物理GPU虛擬成多塊vGPU卡,每個(gè)VM都獨(dú)占一塊vGPU,每個(gè)vGPU直接跟物理GPU對(duì)接。

現(xiàn)實(shí)世界的應(yīng)用狀況又是怎樣的呢?通過(guò)技術(shù)交流,發(fā)現(xiàn)傳統(tǒng)行業(yè)大多數(shù)的GPU資源池案例都是VDI的桌面虛擬化應(yīng)用場(chǎng)景,針對(duì)后臺(tái)服務(wù)器虛擬化的案例幾乎沒(méi)有。在互聯(lián)網(wǎng)行業(yè),像百度這樣在AI領(lǐng)域比較強(qiáng)的,用的都是自研的GPU服務(wù)器和資源調(diào)度平臺(tái)。真正的商業(yè)案例中,大量客戶使用的還是基于X86物理服務(wù)器搭配GPU卡的方式來(lái)部署AI應(yīng)用。

之后,對(duì)這個(gè)客戶也有做了相應(yīng)的調(diào)研。客戶現(xiàn)狀:針對(duì)AI技術(shù)部署了獨(dú)立的語(yǔ)音分析、OCR和人臉識(shí)別等多個(gè)平臺(tái),支撐整個(gè)公司對(duì)于AI場(chǎng)景的需求。(目前有GPU服務(wù)器:50臺(tái)+,GPU卡:180+,后續(xù)還有200+的GPU卡擴(kuò)容計(jì)劃)。針對(duì)調(diào)研情況,也做個(gè)簡(jiǎn)要分析。

應(yīng)用場(chǎng)景:

目前AI技術(shù)主要為兩種場(chǎng)景,訓(xùn)練(Training)和推理(Inference),從我這個(gè)客戶的使用情況看,幾乎都是推理場(chǎng)景,相對(duì)訓(xùn)練而言,對(duì)于GPU的算力的要求不是很高,這一點(diǎn)從用戶的性能數(shù)據(jù)上也有體現(xiàn)??蛻裟P陀?xùn)練都是在供應(yīng)商端進(jìn)行的。

技術(shù)方案:

GPU資源池只是一種概念,對(duì)于資源的形態(tài)來(lái)說(shuō),GPU是物理的還是虛擬的不是最重要的。從資源管理角度看,主要是考慮利用效率、訪問(wèn)性能、安全隔離等因素。

如果是物理服務(wù)器方案,上層最佳的部署形式的直接基于容器,但是現(xiàn)實(shí)情況是大多數(shù)用戶的應(yīng)用部署還是基于PM和VM的。另外,也可以考慮基于服務(wù)器虛擬化+多GPU卡的方案,一個(gè)VM對(duì)應(yīng)一個(gè)GPU卡的直通模式,但是應(yīng)用密度顯然受制于GPU卡的數(shù)量,如果這時(shí)再追加使用vGPU技術(shù),似乎方案在VM技術(shù)平臺(tái)上就更完美了,當(dāng)然容器嵌套VM的方案也是一種好的形式。

商務(wù)成本:

成熟的商業(yè)虛擬化軟件是有軟件許可費(fèi)的,而Nvidia的vGPU技術(shù)也需要支付相應(yīng)的軟件許可費(fèi),這樣每個(gè)GPU卡可以根據(jù)顯存的不同配置,被切分為固定數(shù)量的vGPU,在相同數(shù)據(jù)物理GPU卡配置情況下,提升VM的部署密度。

其他因素:

當(dāng)然,目前的“AI芯片”也不是只有Nvidia一家,國(guó)內(nèi)的寒武紀(jì)和華為也都用相應(yīng)的產(chǎn)品支撐AI應(yīng)用,對(duì)于主流的TensorFlow,Cafee框架可能還可以,但對(duì)于其他框架和模型在支持上略顯不足,還需要加強(qiáng)生態(tài)建設(shè)。畢竟連英偉達(dá)都聲稱自己是一家軟件研發(fā)公司。在這個(gè)Software Define Anything的時(shí)代,軟實(shí)力才是真正貼近用戶的硬實(shí)力。

關(guān)于建立后臺(tái)支撐AI算力的GPU資源池這件事,技術(shù)本身并不存在限制,是個(gè)具有規(guī)模效應(yīng)的事情。如果規(guī)模大了,也許百度的“孔明”平臺(tái)就是一個(gè)需要達(dá)到的高度。至于其他公有云服務(wù)商,現(xiàn)在也都提供了相應(yīng)的GPU服務(wù),等有機(jī)會(huì)再去調(diào)研一下。

啥叫Deep Learning?就是這種不斷學(xué)習(xí)更新,還要用輸出倒逼輸入的方式!

責(zé)任編輯:lq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5209

    瀏覽量

    135604
  • 服務(wù)器
    +關(guān)注

    關(guān)注

    14

    文章

    10280

    瀏覽量

    91566
  • 虛擬化
    +關(guān)注

    關(guān)注

    1

    文章

    404

    瀏覽量

    30932

原文標(biāo)題:GPU虛擬化,看這一篇就夠了!

文章出處:【微信號(hào):SSDFans,微信公眾號(hào):SSDFans】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    企業(yè)級(jí)KVM虛擬平臺(tái)搭建實(shí)戰(zhàn)

    企業(yè)IT基礎(chǔ)設(shè)施經(jīng)歷了物理機(jī)時(shí)代到虛擬化時(shí)代的演進(jìn)。傳統(tǒng)數(shù)據(jù)中心中,每臺(tái)物理服務(wù)器運(yùn)行單一應(yīng)用,資源利用率普遍不足20%。硬件采購(gòu)周期長(zhǎng)、擴(kuò)容慢、運(yùn)維成本高,難以滿足業(yè)務(wù)快速發(fā)展的需求。虛擬
    的頭像 發(fā)表于 03-11 09:38 ?299次閱讀

    Windows平臺(tái)EtherCAT實(shí)時(shí)控制:抖動(dòng)抑制到虛擬架構(gòu)解析

    Windows平臺(tái)EtherCAT實(shí)時(shí)控制:抖動(dòng)抑制到虛擬架構(gòu)解析
    的頭像 發(fā)表于 01-29 15:26 ?268次閱讀
    Windows平臺(tái)EtherCAT實(shí)時(shí)控制:<b class='flag-5'>從</b>抖動(dòng)抑制到<b class='flag-5'>虛擬</b><b class='flag-5'>化</b>架構(gòu)解析

    虛擬電廠的虛實(shí)共生:聚合資源實(shí)現(xiàn)系統(tǒng)價(jià)值的躍遷之路

    ,而是數(shù)字技術(shù)與能源系統(tǒng)深度融合的新型能源樞紐。在新能源規(guī)模發(fā)展的今天,它正以“聚合分散資源、優(yōu)化能源配置”的能力,成為電力系統(tǒng)的核心參與者。本文將從核心定義、“虛擬”本質(zhì)、實(shí)體價(jià)值到邊界劃分,帶您一站式讀懂
    的頭像 發(fā)表于 11-11 14:01 ?1294次閱讀
    <b class='flag-5'>虛擬</b>電廠的虛實(shí)共生:<b class='flag-5'>從</b>聚合<b class='flag-5'>資源</b>到<b class='flag-5'>實(shí)現(xiàn)</b>系統(tǒng)價(jià)值的躍遷之路

    車載軟件vECU虛擬測(cè)試解決方案

    虛擬測(cè)試:利用虛擬技術(shù),實(shí)現(xiàn)將真實(shí)域控制器轉(zhuǎn)化為虛擬域控制器,運(yùn)行在PC或服務(wù)器環(huán)境中運(yùn)行,
    的頭像 發(fā)表于 10-30 09:34 ?1719次閱讀
    車載軟件vECU<b class='flag-5'>虛擬</b><b class='flag-5'>化</b>測(cè)試解決方案

    什么是服務(wù)器虛擬?一文讀懂原理、優(yōu)勢(shì)與實(shí)戰(zhàn)部署

    什么是服務(wù)器虛擬?當(dāng)企業(yè)服務(wù)器CPU利用率長(zhǎng)期低于15%,卻仍需不斷采購(gòu)新硬件應(yīng)對(duì)業(yè)務(wù)增長(zhǎng)時(shí),一場(chǎng)基礎(chǔ)設(shè)施領(lǐng)域的革命早已悄然發(fā)生——服務(wù)器虛擬。這項(xiàng)技術(shù)通過(guò)將物理服務(wù)器劃分為多個(gè)獨(dú)
    的頭像 發(fā)表于 08-25 10:52 ?1238次閱讀
    什么是服務(wù)器<b class='flag-5'>虛擬</b><b class='flag-5'>化</b>?一文讀懂原理、優(yōu)勢(shì)與實(shí)戰(zhàn)部署

    上海虛擬電廠的發(fā)展邏輯:資源稟賦到技術(shù)落地的路徑探索

    安科瑞 呂夢(mèng)怡 187+0616=2527 作為典型的人口聚集、負(fù)荷密集區(qū)域,上海市具有外來(lái)電比例高、本地資源稟賦不足的特點(diǎn)。發(fā)電側(cè)角度來(lái)看,近年來(lái)上海風(fēng)、光等新能源發(fā)電裝機(jī)比例逐年提升,傳統(tǒng)
    的頭像 發(fā)表于 08-12 10:59 ?605次閱讀
    上海<b class='flag-5'>虛擬</b>電廠的發(fā)展邏輯:<b class='flag-5'>從</b><b class='flag-5'>資源</b>稟賦到技術(shù)落地的<b class='flag-5'>路徑</b>探索

    車機(jī)交互測(cè)試自動(dòng)實(shí)現(xiàn)路徑與案例分析

    測(cè)試設(shè)備是車機(jī)交互測(cè)試自動(dòng)實(shí)現(xiàn)的核心支撐,通過(guò)合理選型、部署和應(yīng)用北京沃華慧通測(cè)控技術(shù)有限公司汽車測(cè)試設(shè)備,結(jié)合科學(xué)的實(shí)現(xiàn)路徑和豐富的案例經(jīng)驗(yàn),能夠有效提高車機(jī)交互測(cè)試的效率和質(zhì)量,
    的頭像 發(fā)表于 07-10 09:24 ?1428次閱讀
    車機(jī)交互測(cè)試自動(dòng)<b class='flag-5'>化</b><b class='flag-5'>實(shí)現(xiàn)</b><b class='flag-5'>路徑</b>與案例分析

    車用虛擬技術(shù):域控融合的必經(jīng)之路

    本文闡述了汽車電子架構(gòu)分布式向集中演進(jìn)的趨勢(shì),黑芝麻智能分析了集中帶來(lái)的安全隔離、實(shí)時(shí)性等關(guān)鍵挑戰(zhàn),并指出車用虛擬技術(shù)是
    的頭像 發(fā)表于 07-05 16:14 ?1311次閱讀

    通信設(shè)備EMC整改:救火到防火的體系轉(zhuǎn)型路徑

    深圳南柯電子|通信設(shè)備EMC整改:救火到防火的體系轉(zhuǎn)型路徑
    的頭像 發(fā)表于 06-25 11:14 ?664次閱讀

    硅谷GPU云服務(wù)器是什么意思?使用指南詳解

    硅谷GPU云服務(wù)器本質(zhì)上是一種IaaS(基礎(chǔ)設(shè)施即服務(wù))產(chǎn)品,它將物理服務(wù)器上的GPU資源通過(guò)虛擬技術(shù)分割成可彈性調(diào)配的云服務(wù)。與普通CP
    的頭像 發(fā)表于 06-16 09:41 ?620次閱讀

    如何破解GPU集群集合通信路徑的“黑盒”難題?

    集合通信庫(kù)(如NCCL、HCCL)的運(yùn)行細(xì)節(jié)用戶完全無(wú)感知,形成“黑盒”狀態(tài)。EPS通過(guò)實(shí)時(shí)解析集合通信庫(kù)的底層運(yùn)行狀態(tài),將隱蔽的通信路徑、GPU與網(wǎng)卡狀態(tài)等信息可視,并提供智能路由推薦,幫助用戶快速優(yōu)化集群性能。
    的頭像 發(fā)表于 05-22 10:13 ?970次閱讀
    如何破解<b class='flag-5'>GPU</b>集群集合通信<b class='flag-5'>路徑</b>的“黑盒”難題?

    云電競(jìng)服務(wù)器 工作原理

    云電競(jìng)服務(wù)器工作原理詳解 一、核心架構(gòu)原理 虛擬資源池? 通過(guò) ?KVM/VMware? 等虛擬技術(shù)將物理服務(wù)器(含NVIDIA
    的頭像 發(fā)表于 05-14 07:44 ?638次閱讀
    云電競(jìng)服務(wù)器 工作原理

    基于云端虛擬技術(shù)云手機(jī)解決方案

    云手機(jī)解決方案基于云端虛擬技術(shù),通過(guò)整合軟硬件資源實(shí)現(xiàn)多設(shè)備集群化管理與智能操作,以下是針對(duì)不同應(yīng)用場(chǎng)景的核心要素與技術(shù)架構(gòu)解析: 一、
    的頭像 發(fā)表于 05-09 08:04 ?864次閱讀
    基于云端<b class='flag-5'>虛擬</b><b class='flag-5'>化</b>技術(shù)云手機(jī)解決方案

    提升AI訓(xùn)練性能:GPU資源優(yōu)化的12個(gè)實(shí)戰(zhàn)技巧

    在人工智能與機(jī)器學(xué)習(xí)技術(shù)迅速發(fā)展的背景下,GPU計(jì)算資源的高效利用已成為關(guān)鍵技術(shù)指標(biāo)。優(yōu)化的GPU資源分配不僅能顯著提升模型訓(xùn)練速度,還能實(shí)現(xiàn)
    的頭像 發(fā)表于 05-06 11:17 ?1577次閱讀
    提升AI訓(xùn)練性能:<b class='flag-5'>GPU</b><b class='flag-5'>資源</b>優(yōu)化的12個(gè)實(shí)戰(zhàn)技巧

    NVIDIA虛擬GPU 18.0版本的亮點(diǎn)

    NVIDIA 虛擬 GPU(vGPU)技術(shù)可在虛擬桌面基礎(chǔ)設(shè)施(VDI)中解鎖 AI 功能,使其比以往更加強(qiáng)大、用途更加廣泛。vGPU 通過(guò)為各種虛擬
    的頭像 發(fā)表于 04-07 11:28 ?1473次閱讀