91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

釋放GPU的處理潛力

星星科技指導(dǎo)員 ? 來(lái)源:嵌入式計(jì)算設(shè)計(jì) ? 作者:DUNCAN YOUNG ? 2022-11-07 15:12 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

高性能圖形處理單元 (GPU) 的內(nèi)部計(jì)算架構(gòu)已從固定功能圖形執(zhí)行單元發(fā)展為完全可編程的單指令多數(shù)據(jù) (SIMD) 處理器陣列。這種演變是由視頻游戲社區(qū)的需求推動(dòng)的,即并行執(zhí)行通用物理計(jì)算,以使煙霧、碎片、火災(zāi)和流體等行為更加逼真。將這些相同類型的重復(fù)并行計(jì)算卸載和加速到 GPU 上的能力為雷達(dá)、聲納和圖像處理等軍事技術(shù)提供了巨大的潛力。高效實(shí)施的關(guān)鍵是新一代工具,如 OpenCL 和 CUDA,它們集成了跨異構(gòu) CPU/GPU 架構(gòu)的代碼開(kāi)發(fā)以及支持它們的內(nèi)存和 I/O 帶寬。

單邊處理光線

高性能 GPU 設(shè)備的核心通常具有多達(dá) 128 個(gè) 32 位單精度處理器內(nèi)核,主頻為 1 GHz 或更高。它們被組織為并行 SIMD 陣列,以便處理器組可以在不同的數(shù)據(jù)集上并行執(zhí)行相同的指令。作為 GPU 運(yùn)行時(shí),主要要求是利用動(dòng)畫 3D 圖形功能,例如著色器。然而,GPU 正在從特定的著色器處理器演變而成為更通用的數(shù)學(xué)處理器,現(xiàn)在稱為“流處理器”。借助正確的工具,GPU 可以更廣泛地應(yīng)用于加速多種基于 PC 的應(yīng)用程序,例如基因研究、地震處理、氣象處理和 DSP,其成本遠(yuǎn)低于其他更具體的硬件加速形式。

一家主要的GPU制造商N(yùn)VIDIA開(kāi)發(fā)了一種稱為CUDA的軟件環(huán)境,以將GPU的潛力釋放到這些其他應(yīng)用領(lǐng)域。CUDA 通過(guò)允許通過(guò)隱藏 GPU 流處理器及其與 CPU 接口的抽象函數(shù)庫(kù)進(jìn)行內(nèi)聯(lián) C 代碼開(kāi)發(fā)來(lái)支持 CPU 和 GPU 的組合。這提供了一個(gè)非常靈活的編程接口,并允許將來(lái)對(duì)流處理器進(jìn)行增長(zhǎng)甚至根本性更改,而不會(huì)影響現(xiàn)有代碼。為了減少錯(cuò)誤的范圍,CUDA 采用簡(jiǎn)單的編程模型,在內(nèi)部管理多個(gè)線程以優(yōu)化處理器利用率,因此無(wú)需編寫顯式線程代碼。

沒(méi)有圖形的圖形 GPU

矛盾的是,會(huì)有一類嵌入式應(yīng)用程序根本不會(huì)生成任何本地圖形輸出。通常,此類可能包括無(wú)人機(jī)或水下遙控車輛(ROV)或許多其他類型的無(wú)人傳感器中的圖像處理。具有 GPU 的嵌入式 PC 成為圖像增強(qiáng)、穩(wěn)定、模式識(shí)別、目標(biāo)跟蹤、視頻編碼或加密/解密的理想平臺(tái)。這些都是可以用常規(guī) C 代碼編寫以在高性能 PC 上運(yùn)行的應(yīng)用程序,但可以通過(guò) GPU 流處理器加速以運(yùn)行速度快幾個(gè)數(shù)量級(jí)。GPU 提供已經(jīng)集成到許多 PC 配置中的通用并行處理,并且通過(guò)使用現(xiàn)成的工具(如 CUDA、MathWorksMATLAB 和移植的 VSIPL DSP 庫(kù))來(lái)構(gòu)建、測(cè)試和驗(yàn)證應(yīng)用程序,需要的專業(yè)技能低于 FPGA 開(kāi)發(fā)。

PCI Express 是性能的關(guān)鍵

嵌入式傳感器處理應(yīng)用需要高數(shù)據(jù)帶寬來(lái)接收和處理連續(xù)的傳入原始圖像數(shù)據(jù)流。CUDA 處理多線程并因此最大化 GPU SIMD 陣列的處理負(fù)載的能力取決于外部接口及其本地內(nèi)存接口的性能。高端GPU設(shè)備將使用16通道PCI Express 2.0,是早期PCI Express 1.0數(shù)據(jù)速率的兩倍,理論上每通道500 MBps。對(duì)于堅(jiān)固耐用的嵌入式應(yīng)用,這非常適合VPX (ANSI/VITA 46)封裝標(biāo)準(zhǔn)的流行3U和6U格式,并具有擴(kuò)展的高速連接性。GE Fanuc Intelligent Platforms的MAGIC1強(qiáng)固型嵌入式PC(如圖1所示)基于3U VPX外形,并經(jīng)過(guò)重新設(shè)計(jì)和增強(qiáng),以支持NVIDIA支持CUDA的GPU。雖然這種嵌入式PC非常適合3U格式,但6U配置文件還具有空間和更大的連接性,有可能基于許多多核處理器和GPU使用PCI Express 2.0作為互連的新型強(qiáng)大多計(jì)算引擎。

GPU 正在迅速發(fā)展,創(chuàng)造了一種處理能力,可在許多不同的市場(chǎng)中得到廣泛的應(yīng)用。CUDA 和類似的開(kāi)發(fā)環(huán)境提供了對(duì)這種未開(kāi)發(fā)性能儲(chǔ)備的可訪問(wèn)性。因此,堅(jiān)固耐用的軍事和航空航天領(lǐng)域似乎將改變復(fù)雜、耗時(shí)的傳感器應(yīng)用的開(kāi)發(fā)、測(cè)試、驗(yàn)證和成功部署方式。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    20255

    瀏覽量

    252341
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5194

    瀏覽量

    135483
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    借助NVIDIA CUDA Tile IR后端推進(jìn)OpenAI Triton的GPU編程

    NVIDIA CUDA Tile 是基于 GPU 的編程模型,其設(shè)計(jì)目標(biāo)是為 NVIDIA Tensor Cores 提供可移植性,從而釋放 GPU 的極限性能。CUDA Tile 的一大優(yōu)勢(shì)是允許開(kāi)發(fā)者基于其構(gòu)建自定義的 DS
    的頭像 發(fā)表于 02-10 10:31 ?248次閱讀

    恩智浦全新S32N7處理釋放軟件定義汽車(SDV)的全部潛力

    · S32N7處理器系列實(shí)現(xiàn)核心車輛功能的全面數(shù)字化和集中化 · 汽車制造商能夠降低系統(tǒng)復(fù)雜性,并在整個(gè)車隊(duì)釋放AI驅(qū)動(dòng)的創(chuàng)新潛力 · 博世率先在其車輛集成平臺(tái)中部署S32N7 拉斯維加斯國(guó)際消費(fèi)
    的頭像 發(fā)表于 01-19 17:06 ?6.6w次閱讀
    恩智浦全新S32N7<b class='flag-5'>處理</b>器<b class='flag-5'>釋放</b>軟件定義汽車(SDV)的全部<b class='flag-5'>潛力</b>

    汽車中的GPU是如何使用的?

    (HMI)的發(fā)展尤為迅猛。隨著電子電氣架構(gòu)(EEA)的集中化,車輛對(duì)高性能計(jì)算能力的需求顯著提升,GPU(圖形處理單元)的靈活性、可擴(kuò)展性以及高效并行計(jì)算能力,使其成為支持這些創(chuàng)新應(yīng)用的核心組件
    的頭像 發(fā)表于 12-03 14:45 ?9580次閱讀
    汽車中的<b class='flag-5'>GPU</b>是如何使用的?

    如何通過(guò)交替式幾何處理實(shí)現(xiàn)更優(yōu)的多核?GPU?擴(kuò)展

    在理論上,通過(guò)增加更多GPU核心來(lái)提升性能似乎很簡(jiǎn)單:核心越多,性能越強(qiáng)。但在實(shí)踐中,這是圖形架構(gòu)領(lǐng)域最棘手的挑戰(zhàn)之一。雖然某些工作負(fù)載因其獨(dú)立特性能實(shí)現(xiàn)良好擴(kuò)展,但另一些工作負(fù)載(尤其是幾何處理
    的頭像 發(fā)表于 12-01 10:12 ?652次閱讀
    如何通過(guò)交替式幾何<b class='flag-5'>處理</b>實(shí)現(xiàn)更優(yōu)的多核?<b class='flag-5'>GPU</b>?擴(kuò)展

    戴爾科技PowerStore如何釋放QLC閃存全部潛力

    轉(zhuǎn)眼間,QLC SSD問(wèn)世已有幾個(gè)年頭,從問(wèn)世之初被質(zhì)疑的“短命鬼”,到如今市場(chǎng)的又一大主流選擇,QLC和它的前輩們一樣,在批判中前進(jìn),在螺旋中上升。
    的頭像 發(fā)表于 11-30 09:25 ?652次閱讀

    基于米爾RK3576的環(huán)視實(shí)時(shí)性方案解析

    ,造成嚴(yán)重卡頓和延遲,也使得CPU再無(wú)余力處理其他系統(tǒng)任務(wù),此方案不具備產(chǎn)品化價(jià)值。GPU方案:潛力巨大,穩(wěn)定性是當(dāng)前關(guān)鍵瓶頸卓越的算力體現(xiàn): 在畸變矯正和投影變換環(huán)節(jié),Mali-G52 GP
    發(fā)表于 11-28 16:57

    Dell PowerScale助力企業(yè)充分釋放GPU投資價(jià)值

    盡管算力層面的“軍備競(jìng)賽”仍在持續(xù)加劇,但隨著GPU集群規(guī)模擴(kuò)展至數(shù)千臺(tái)服務(wù)器,存力作為支撐算力持續(xù)運(yùn)行的關(guān)鍵要素,已獲得與算力同等重要的戰(zhàn)略地位。
    的頭像 發(fā)表于 11-06 09:06 ?711次閱讀

    摩爾線程吳慶詳解 MUSA 軟件棧:以技術(shù)創(chuàng)新釋放 KUAE 集群潛能,引領(lǐng) GPU 計(jì)算新高度?

    的分享。GPU 計(jì)算軟件開(kāi)發(fā)總監(jiān)吳慶登上講臺(tái),發(fā)表了題為《摩爾線程 MUSA 軟件棧助力 KUAE 集群釋放無(wú)限潛能》的演講。他從專業(yè)視角出發(fā),為在場(chǎng)聽(tīng)眾深入剖析了 MUSA 軟件棧在驅(qū)動(dòng) KUAE 集群高效運(yùn)轉(zhuǎn)方面的核心技術(shù)與創(chuàng)新成果。 ? 摩爾線程
    的頭像 發(fā)表于 07-28 13:47 ?6085次閱讀
    摩爾線程吳慶詳解 MUSA 軟件棧:以技術(shù)創(chuàng)新<b class='flag-5'>釋放</b> KUAE 集群潛能,引領(lǐng) <b class='flag-5'>GPU</b> 計(jì)算新高度?

    aicube的n卡gpu索引該如何添加?

    請(qǐng)問(wèn)有人知道aicube怎樣才能讀取n卡的gpu索引呢,我已經(jīng)安裝了cuda和cudnn,在全局的py里添加了torch,能夠調(diào)用gpu,當(dāng)還是只能看到默認(rèn)的gpu0,顯示不了gpu1
    發(fā)表于 07-25 08:18

    GPU架構(gòu)深度解析

    GPU架構(gòu)深度解析從圖形處理到通用計(jì)算的進(jìn)化之路圖形處理單元(GPU),作為現(xiàn)代計(jì)算機(jī)中不可或缺的一部分,已經(jīng)從最初的圖形渲染專用處理器,發(fā)
    的頭像 發(fā)表于 05-30 10:36 ?1858次閱讀
    <b class='flag-5'>GPU</b>架構(gòu)深度解析

    ARM Mali GPU 深度解讀

    ARM Mali GPU 深度解讀 ARM Mali 是 Arm 公司面向移動(dòng)設(shè)備、嵌入式系統(tǒng)和基礎(chǔ)設(shè)施市場(chǎng)設(shè)計(jì)的圖形處理器(GPU)IP 核,憑借其異構(gòu)計(jì)算架構(gòu)、能效優(yōu)化和生態(tài)協(xié)同,成為全球移動(dòng)
    的頭像 發(fā)表于 05-29 10:12 ?4340次閱讀

    高效地?cái)U(kuò)展Polars GPU Parquet讀取器

    處理大型數(shù)據(jù)集時(shí),數(shù)據(jù)處理工具的性能至關(guān)重要。Polars 作為一個(gè)以速度和效率著稱的開(kāi)源數(shù)據(jù)處理庫(kù),它提供了由 cuDF 驅(qū)動(dòng)的 GPU 加速后端,能夠顯著提升性能。
    的頭像 發(fā)表于 04-21 17:12 ?912次閱讀
    高效地?cái)U(kuò)展Polars <b class='flag-5'>GPU</b> Parquet讀取器

    NVIDIA虛擬GPU 18.0版本的亮點(diǎn)

    NVIDIA 虛擬 GPU(vGPU)技術(shù)可在虛擬桌面基礎(chǔ)設(shè)施(VDI)中解鎖 AI 功能,使其比以往更加強(qiáng)大、用途更加廣泛。vGPU 通過(guò)為各種虛擬化環(huán)境中的 AI 驅(qū)動(dòng)工作負(fù)載提供動(dòng)力,提高了
    的頭像 發(fā)表于 04-07 11:28 ?1440次閱讀

    可以手動(dòng)構(gòu)建imx-gpu-viv嗎?

    使用 imx-gpu-viv-6.4.3.p4.2.aarch64.bin。 https://www.nxp.com/lgfiles/NMG/MAD/YOCTO//imx-gpu-viv-6.4.3.p4.2-aarch64.bin 我需要
    發(fā)表于 03-28 06:35