91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

GPU虛擬化的4個主要指標和4種實現(xiàn)策略

汽車玩家 ? 來源:CSDN ? 作者:YuanruiZJU ? 2020-05-03 12:04 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

GPU虛擬化的評價標準

4個主要指標用于評價GPU虛擬化的方法:

性能(performance)

保真度(fidelity)

資源復(fù)用(multiplexing)

是否支持虛擬化的特性(interposition)

其中性能和保真度強調(diào)減小GPU虛擬化的代價,性能是指執(zhí)行操作的速度,保真度是指支持多少GPU提供的特性,以及對這些特性的支持的質(zhì)量。資源復(fù)用以及是否支持虛擬化的特性則強調(diào)虛擬化為我們帶來價值。資源復(fù)用是指能夠使多臺虛擬機共享同一個物理GPU的能力,資源復(fù)用要求虛擬機之間的安全隔離,GPU資源復(fù)用提高了GPU資源利用率,在保持虛擬機內(nèi)GPU性能不下降的情況下,復(fù)用一個GPU的虛擬機越多,對應(yīng)的GPU虛擬化方案越符合資源復(fù)用的要求。是否支持虛擬化的特性是指GPU虛擬化的方案是否能支持虛擬化技術(shù)提供的虛擬機與物理機之間的中介過程,如要求虛擬機創(chuàng)建系統(tǒng)還原點,或者掛起,以及更加高級的特性,如熱遷移、可容錯執(zhí)行等。這些標準經(jīng)常是相對的,比如要提升性能,就需要犧牲虛擬化的其他特性。

GPU虛擬化技術(shù)的實現(xiàn)策略分類

GPU虛擬化的目標是為虛擬機提供虛擬GPU設(shè)備的支持,使得虛擬機內(nèi)部調(diào)用的與GPU相關(guān)的指令或者與GPU相關(guān)的API(比如OpenCL或者CUDA)能夠正常得執(zhí)行。

為了提升GPU虛擬化的性能,虛擬機需要利用GPU硬件來實現(xiàn)加速,也就是說虛擬機內(nèi)部調(diào)用的GPU相關(guān)的命令或者GPU相關(guān)的API,能夠在硬件GPU上運行。所有GPU虛擬化技術(shù)的實現(xiàn)策略以及GPU虛擬化技術(shù)的發(fā)展都圍繞著這一目標。

下面列舉了四種GPU虛擬化技術(shù)的實現(xiàn)策略,按照利用GPU硬件加速的程度從小到大分別為分為設(shè)備模擬(Device Emulation)、API轉(zhuǎn)發(fā)(API Forwarding)、中介傳遞(Mediated Pass-through)和直接傳遞(Direct Pass-through也被稱為Fixed Pass-through),如圖所示。

下面對這四種實現(xiàn)策略分別介紹:

設(shè)備模擬(Device Emulation)

設(shè)備模擬是指通過軟件的方法來為虛擬機模擬GPU設(shè)備,這種方法的好處是虛擬機內(nèi)部都可以調(diào)用GPU命令,可以完全記錄GPU設(shè)備的狀態(tài),保證虛擬化技術(shù)的全部特性,滿足四個標準中的資源復(fù)用和支持虛擬化特性的標準。QEMU 通過軟件模擬實現(xiàn)了傳統(tǒng)的VGA設(shè)備,但是該設(shè)備的性能很低,只能支持基礎(chǔ)的功能。軟件模擬設(shè)備的方法幾乎不會使用硬件加速,因此其實現(xiàn)的GPU性能已經(jīng)無法滿足現(xiàn)在虛擬機的圖形圖像處理和高性能計算的需求。而且正如前文提到的,現(xiàn)代GPU架構(gòu)具有很高的復(fù)雜性,而且缺少文檔,因此很難實現(xiàn)對一個真實的物理GPU進行軟件模擬。這意味著設(shè)備模擬方法只能模擬少量的API,只能保證少量的GPU特性提供給虛擬機。由于設(shè)備模擬的方法在性能和支持的GPU特性上和真實的GPU相差過大,設(shè)備模擬的技術(shù)已經(jīng)不再應(yīng)用到GPU虛擬化技術(shù)中。

API轉(zhuǎn)發(fā)(API Forwarding)

API轉(zhuǎn)發(fā)是指通過實現(xiàn)包裹圖形API的庫,這些庫在虛擬機調(diào)用相關(guān)的API時,將這些圖形API通過遠程過程調(diào)用的方法轉(zhuǎn)發(fā)到主機上,然后調(diào)用主機上的圖形驅(qū)動提供的API支持完成調(diào)用。通過給高層的API實現(xiàn)包裹庫,客戶機就能支持高層的API如CUDA。vCUDA、vGRIS等虛擬化方案都是利用API轉(zhuǎn)發(fā)的方法。這種方法的優(yōu)點是利于實現(xiàn),而且一定程度上利用了GPU硬件實現(xiàn)加速,同時可以使多個虛擬機調(diào)用的GPU相關(guān)指令與API在物理GPU上執(zhí)行。但是API轉(zhuǎn)發(fā)的主要問題在于這種方法失去了語言和庫的靈活性選擇,包裹庫和支持的API的不匹配會造成GPU虛擬化不成功。而如果在遷移的過程中,目標主機與源主機的包裹庫版本不一致,可能會造成遷移之后GPU虛擬化不成功,因此API轉(zhuǎn)發(fā)會影響虛擬化提供的特性。

中介傳遞(Mediated Pass-through)

GPU已經(jīng)可以支持多個獨立的上下文,中介傳遞的方法使虛擬機只占用這些上下文的一個或者子集。高帶寬操作(指令緩存提交、幀緩存提交)需要使用映射到物理GPU的內(nèi)存或者MMIO資源,低帶寬操作(資源分配、傳統(tǒng)的特性)可能會通過使用全虛擬化的資源來實現(xiàn)。

直接傳遞(Direct Pass-through)

直接傳遞是指給一臺虛擬機使用一個物理GPU的全部訪問權(quán)限。Intel提供了Intel VT-d硬件輔助技術(shù),使研究者不需要去了解GPU的編程接口就可以直接實現(xiàn)一臺虛擬機占用物理GPU的全部訪問權(quán)限。這種方法的好處在于可以提供與真實機器相近的性能以及保真度,亞馬遜的Amazon EC2提供的GPU資源就是使用這種虛擬化策略。但是這種方法問題在于一個物理GPU只能被一臺虛擬機使用,犧牲了GPU資源在多臺機器之間共享的條件。而且虛擬化的遷移功能也會受到影響,因為不同體系架構(gòu)的GPU之間可能存在不兼容。

全虛擬化與半虛擬化

GPU虛擬化實現(xiàn)策略按照是否需要修改客戶機操作系統(tǒng)內(nèi)部的驅(qū)動代碼分為GPU全虛擬化和GPU半虛擬化。GPU全虛擬化是指實現(xiàn)在多個虛擬機之間共享GPu資源的同時不需要修改虛擬機內(nèi)部的圖形驅(qū)動。GPU半虛擬化是指向虛擬機提供軟件實現(xiàn)的理想設(shè)備模型,對客戶機的圖形驅(qū)動進行底層的控制。使用GPU半虛擬化的方法,比API轉(zhuǎn)發(fā)的性能消耗更小,但是客戶機的設(shè)備驅(qū)動必須要改寫。主流的GPU虛擬化方案GPUvm使用半虛擬化的實現(xiàn)策略對虛擬機GPU的性能有明顯的改善。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5194

    瀏覽量

    135434
  • 虛擬機
    +關(guān)注

    關(guān)注

    1

    文章

    972

    瀏覽量

    30466
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    AI大算力的存儲技術(shù), HBM 4E轉(zhuǎn)向定制

    電子發(fā)燒友網(wǎng)報道(文/黃晶晶)如今英偉達GPU迭代速度加快至每年一次,HBM存儲速率如何跟上GPU發(fā)展節(jié)奏。越來越多的超大規(guī)模云廠商、GPU廠商開始轉(zhuǎn)向定制HBM。而HBM存儲廠商以
    的頭像 發(fā)表于 11-30 00:31 ?8460次閱讀
    AI大算力的存儲技術(shù), HBM <b class='flag-5'>4</b>E轉(zhuǎn)向定制<b class='flag-5'>化</b>

    結(jié)構(gòu)布線中使用電纜標簽的4主要優(yōu)勢

    帶來諸多顯著的優(yōu)勢。本文將深入探討在結(jié)構(gòu)布線中使用電纜標簽的4主要優(yōu)勢,幫助讀者更好地理解這一細節(jié)的重要性。 提高布線系統(tǒng)的可管理性 清晰標識電纜用途 在復(fù)雜的布線系統(tǒng)中,各種電纜
    的頭像 發(fā)表于 11-24 10:34 ?326次閱讀

    車載軟件vECU虛擬測試解決方案

    虛擬測試:利用虛擬技術(shù),實現(xiàn)將真實域控制器轉(zhuǎn)化為虛擬域控制器,運行在PC或服務(wù)器環(huán)境中運行,
    的頭像 發(fā)表于 10-30 09:34 ?1694次閱讀
    車載軟件vECU<b class='flag-5'>虛擬</b><b class='flag-5'>化</b>測試解決方案

    多網(wǎng)融合時代:4G/Wi-Fi/以太網(wǎng)/虛擬網(wǎng)卡配置實戰(zhàn)!

    在物聯(lián)網(wǎng)與邊緣計算快速發(fā)展的今天,掌握多種網(wǎng)絡(luò)接口的配置至關(guān)重要。本文以實戰(zhàn)為導(dǎo)向,詳解4G、Wi-Fi、以太網(wǎng)和虛擬網(wǎng)卡的接入與協(xié)同策略。 網(wǎng)絡(luò)適配器,它的一更廣為人知的名字是——
    的頭像 發(fā)表于 10-09 18:25 ?305次閱讀
    多網(wǎng)融合時代:<b class='flag-5'>4</b>G/Wi-Fi/以太網(wǎng)/<b class='flag-5'>虛擬</b>網(wǎng)卡配置實戰(zhàn)!

    如何看懂GPU架構(gòu)?一分鐘帶你了解GPU參數(shù)指標

    分析GPU核心參數(shù)體系:算力、顯存大小、顯存帶寬、熱門架構(gòu)特性等關(guān)鍵指標,旨在幫您理解不同應(yīng)用場景下,如何選擇最合適的GPU算力解決方案。1、算力GPU執(zhí)行浮點運算
    的頭像 發(fā)表于 10-09 09:28 ?1131次閱讀
    如何看懂<b class='flag-5'>GPU</b>架構(gòu)?一分鐘帶你了解<b class='flag-5'>GPU</b>參數(shù)<b class='flag-5'>指標</b>

    為什么無法在GPU上使用INT8 和 INT4量化模型獲得輸出?

    安裝OpenVINO? 2024.0 版本。 使用 optimum-intel 程序包將 whisper-large-v3 模型轉(zhuǎn)換為 int 4 和 int8,并在 GPU 上使用 OpenVINO? 運行推理。 沒有可用的輸出。
    發(fā)表于 06-23 07:11

    電壓放大器的主要指標是什么意思

    是一需要重點考慮的指標。 電壓放大器的主要指標包括增益、帶寬、輸入阻抗、輸出阻抗、噪聲系數(shù)、失真度、功率輸出、頻率響應(yīng)、動態(tài)范圍、電源電壓和功耗等。這些指標共同決定了放大器的性能和適
    發(fā)表于 06-12 14:33

    提供4觸摸輸入端口及4直接輸出端口的4鍵觸摸檢測IC-CT8224C

    CT8224C是一款使用電容式感應(yīng)原理設(shè)計的觸摸IC,此款I(lǐng)C內(nèi)建穩(wěn)壓電路給觸摸感測器使用,穩(wěn)定的感應(yīng)方式可以應(yīng)用到各種不同電子類產(chǎn)品。面板介質(zhì)可以是完全絕源的材料,專為取代傳統(tǒng)的機械結(jié)構(gòu)開關(guān)或普通按鍵而設(shè)計,提供4觸摸輸入端口及4
    的頭像 發(fā)表于 06-05 09:38 ?777次閱讀
    提供<b class='flag-5'>4</b><b class='flag-5'>個</b>觸摸輸入端口及<b class='flag-5'>4</b><b class='flag-5'>個</b>直接輸出端口的<b class='flag-5'>4</b>鍵觸摸檢測IC-CT8224C

    虛擬數(shù)據(jù)恢復(fù)—XenServer虛擬平臺上VPS不可用的數(shù)據(jù)恢復(fù)案例

    虛擬環(huán)境: 某品牌720服務(wù)器中有一組通過型號為H710P的RAID卡+4塊STAT硬盤組建的RAID10,上層部署Xen Server服務(wù)器虛擬
    的頭像 發(fā)表于 05-30 11:35 ?690次閱讀
    <b class='flag-5'>虛擬</b><b class='flag-5'>化</b>數(shù)據(jù)恢復(fù)—XenServer<b class='flag-5'>虛擬</b><b class='flag-5'>化</b>平臺上VPS不可用的數(shù)據(jù)恢復(fù)案例

    六類非屏蔽雙絞線主要指標有哪些

    六類非屏蔽雙絞線(CAT6 UTP)是綜合布線系統(tǒng)中常用的高性能傳輸介質(zhì),其核心指標直接決定了網(wǎng)絡(luò)傳輸?shù)姆€(wěn)定性、速度和抗干擾能力。以下是其主要技術(shù)指標及分析: 1. 傳輸性能 帶寬:250MHz
    的頭像 發(fā)表于 05-08 10:09 ?3677次閱讀

    基于Infineon TC4D9+TLF4D985的Aurix StartKit

    狀態(tài)預(yù)測,提升續(xù)航里程、充電速度和電池壽命;牽引逆變器領(lǐng)域,其創(chuàng)新cDSP與虛擬傳感技術(shù)優(yōu)化能量回收與控制策略;在電源轉(zhuǎn)換方面,TC4xx支持SiC和GaN材料,集成高效控制功能,提升系統(tǒng)效率。
    的頭像 發(fā)表于 04-16 14:16 ?1260次閱讀
    基于Infineon TC<b class='flag-5'>4D9+TLF4</b>D985的Aurix StartKit

    NVIDIA虛擬GPU 18.0版本的亮點

    NVIDIA 虛擬 GPU(vGPU)技術(shù)可在虛擬桌面基礎(chǔ)設(shè)施(VDI)中解鎖 AI 功能,使其比以往更加強大、用途更加廣泛。vGPU 通過為各種虛擬
    的頭像 發(fā)表于 04-07 11:28 ?1430次閱讀

    數(shù)字萬用表的主要指標及相互關(guān)系

    隨著電子技術(shù)的進步,科研和生產(chǎn)中,對數(shù)字多用表(以下簡稱數(shù)字表)的顯示位數(shù)、分辨力、測試精度和測試功能的要求不斷提高。這里給大家詳細講講數(shù)字萬用表的主要指標和相互關(guān)系。一、數(shù)字萬用表的主要指標1
    的頭像 發(fā)表于 04-03 17:21 ?1605次閱讀
    數(shù)字萬用表的<b class='flag-5'>主要指標</b>及相互關(guān)系

    RT-Thread虛擬部署DeepSeek大模型實踐

    Cortex-A55,8GBLPDDR4),通過虛擬技術(shù)實現(xiàn)虛擬Linux+RTOS混合部署
    的頭像 發(fā)表于 03-12 18:38 ?1287次閱讀
    RT-Thread<b class='flag-5'>虛擬</b><b class='flag-5'>化</b>部署DeepSeek大模型實踐

    4芯光纜是不是代表可以走4路網(wǎng)絡(luò)

    4芯光纜并不意味著可以直接走4路網(wǎng)絡(luò)。光纜的芯數(shù)主要指的是光纜內(nèi)部光纖的數(shù)量,而光纖則是用來傳輸光信號的媒介。在光纜中,每一根光纖都可以獨立地傳輸一路光信號,因此理論上4芯光纜可以支持
    的頭像 發(fā)表于 03-12 11:01 ?1282次閱讀