91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

GPU平臺生態(tài):英偉達CUDA和AMD ROCm對比分析

智能計算芯世界 ? 來源:架構師技術聯(lián)盟 ? 2023-06-06 14:36 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

成熟且完善的平臺生態(tài)是GPU廠商的護城河。相較于持續(xù)迭代的微架構帶來的技術壁壘硬實力,成熟的軟件生態(tài)形成的強大用戶粘性將在長時間內(nèi)塑造GPU廠商的軟實力。以英偉達CUDA為例的軟硬件設計架構提供了硬件的直接訪問接口,不必依賴圖形API映射,降低GPGPU開發(fā)者編譯難度,以此實現(xiàn)高粘性的開發(fā)者生態(tài)。目前主流的開發(fā)平臺還包括AMD ROCm以及OpenCL。

CUDA(Compute Unified Device Architectecture),是NVIDIA于2006年推出的通用并行計算架構,包含CUDA指令集架構(ISA)和GPU內(nèi)部的并行計算引擎。該架構允許開發(fā)者使用高級編程語言(例如C語言)利用GPU硬件的并行計算能力并對計算任務進行分配和管理,CUDA提供了一種比CPU更有效的解決大規(guī)模數(shù)據(jù)計算問題的方案,在深度學習訓練和推理領域被廣泛使用。

7853142a-042f-11ee-90ce-dac502259ad0.png

CUDA除了是并行計算架構外,還是CPU和GPU協(xié)調(diào)工作的通用語言。在CUDA編程模型中,主要有Host(主機)和Device(設備)兩個概念,Host包含CPU和主機內(nèi)存,Device包含GPU和顯存,兩者之間通過PCI Express總線進行數(shù)據(jù)傳輸。在具體的CUDA實現(xiàn)中,程序通常劃分為兩部分,在主機上運行的Host代碼和在設備上運行的Device代碼。Host代碼負責程序整體的流程控制和數(shù)據(jù)交換,而Device代碼則負責執(zhí)行具體的計算任務。

一個完整的CUDA程序是由一系列的設備端函數(shù)并行部分和主機端的串行處理部分共同組成的,主機和設備通過這種方式可以高效地協(xié)同工作,實現(xiàn)GPU的加速計算。

78655c16-042f-11ee-90ce-dac502259ad0.png

CUDA在Host運行的函數(shù)庫包括了開發(fā)庫(Libraries)、運行時(Runtime)和驅動(Driver)三大部分。其中,Libraries提供了一些常見的數(shù)學和科學計算任務運算庫,Runtime API提供了便捷的應用開發(fā)接口和運行期組件,開發(fā)者可以通過調(diào)用API自動管理GPU資源,而Driver API提供了一系列C函數(shù)庫,能更底層、更高效地控制GPU資源,但相應的開發(fā)者需要手動管理模塊編譯等復雜任務。

787714ba-042f-11ee-90ce-dac502259ad0.png

CUDA在Device上執(zhí)行的函數(shù)為內(nèi)核函數(shù)(Kernel)通常用于并行計算和數(shù)據(jù)處理。在Kernel中,并行部分由K個不同的CUDA線程并行執(zhí)行K次,而有別于普通的C/C++函數(shù)只有1次。每一個CUDA內(nèi)核都以一個聲明指定器開始,程序員通過使用內(nèi)置變量__global__為每個線程提供一個唯一的全局ID。一組線程被稱為CUDA塊(block)。CUDA塊被分組為一個網(wǎng)格(grid),一個內(nèi)核以線程塊的網(wǎng)格形式執(zhí)行。每個CUDA塊由一個流式多處理器(SM)執(zhí)行,不能遷移到GPU中的其他SM,一個SM可以運行多個并發(fā)的CUDA塊,取決于CUDA塊所需的資源,每個內(nèi)核在一個設備上執(zhí)行,CUDA支持在一個設備上同時運行多個內(nèi)核。

7881a0e2-042f-11ee-90ce-dac502259ad0.png

788b7edc-042f-11ee-90ce-dac502259ad0.png

豐富而成熟的軟件生態(tài)是CUDA被廣泛使用的關鍵原因。

(1)編程語言:CUDA從最初的1.0版本僅支持C語言編程,到現(xiàn)在的CUDA 12.0支持C、C++、Fortran、Python等多種編程語言。此外,NVIDIA還支持了如PyCUDA、ltimesh Hybridizer、OpenACC等眾多第三方工具鏈,不斷提升開發(fā)者的使用體驗。

(2)庫:NVIDIA在CUDA平臺上提供了名為CUDA-X的集合層,開發(fā)人員可以通過CUDA-X快速部署如cuBLA、NPP、NCCL、cuDNN、TensorRT、OpenCV等多領域常用庫。

(3)其他:NVIDIA還為CUDA開發(fā)人員提供了容器部署流程簡化以及集群環(huán)境擴展應用程序的工具,讓應用程序更易加速,使得CUDA技術能夠適用于更廣泛的領域。

ROCm(Radeon Open Compute Platform)是AMD基于開源項目的GPU計算生態(tài)系統(tǒng),類似于NVIDIA的CUDA。ROCm支持多種編程語言、編譯器、庫和工具,以加速科學計算、人工智能機器學習等領域的應用。ROCm還支持多種加速器廠商和架構,提供了開放的可移植性和互操作性。

ROCm支持HIP(類CUDA)和OpenCL兩種GPU編程模型,可實現(xiàn)CUDA到ROCm的遷移。最新的ROCm 5.0支持AMD Infinity Hub上的人工智能框架容器,包括TensorFlow 1.x、PyTorch 1.8、MXNet等,同時改進了ROCm庫和工具的性能和穩(wěn)定性,包括MIOpen、MIVisionX、rocBLAS、rocFFT、rocRAND等。

7897e212-042f-11ee-90ce-dac502259ad0.png

78a13970-042f-11ee-90ce-dac502259ad0.png

OpenCL(Open Compute Language),是面向異構系統(tǒng)通用并行編程、可以在多個平臺和設備上運行的開放標準。OpenCL支持多種編程語言和環(huán)境,并提供豐富的工具來幫助開發(fā)和調(diào)試,可以同時利用CPU、GPU、DSP等不同類型的加速器來執(zhí)行任務,并支持數(shù)據(jù)傳輸和同步。

78b03a1a-042f-11ee-90ce-dac502259ad0.png

78b8f9ca-042f-11ee-90ce-dac502259ad0.png

此外,OpenCL支持細粒度和粗粒度并行編程模型,可根據(jù)應用需求選擇合適模型提高性能和效率。而OpenCL可移植性有限,不同平臺和設備的功能支持和性能表現(xiàn)存在一定差異,與CUDA相比缺少廣泛的社區(qū)支持和成熟的生態(tài)圈。

審核編輯:湯梓紅
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • amd
    amd
    +關注

    關注

    25

    文章

    5682

    瀏覽量

    139925
  • gpu
    gpu
    +關注

    關注

    28

    文章

    5194

    瀏覽量

    135419
  • C語言
    +關注

    關注

    183

    文章

    7644

    瀏覽量

    145551
  • CUDA
    +關注

    關注

    0

    文章

    127

    瀏覽量

    14473
  • 英偉達
    +關注

    關注

    23

    文章

    4084

    瀏覽量

    99163

原文標題:GPU平臺生態(tài):英偉達CUDA和AMD ROCm對比分析

文章出處:【微信號:AI_Architect,微信公眾號:智能計算芯世界】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    英偉AMD、英特爾GPU產(chǎn)品及優(yōu)勢匯總

    電子發(fā)燒友網(wǎng)報道(文/李彎彎)隨著人工智能技術的快速發(fā)展,GPU的市場規(guī)模在全球范圍內(nèi)持續(xù)提升。目前,GPU市場主要由英偉、AMD和英特爾
    的頭像 發(fā)表于 05-10 00:59 ?9799次閱讀

    軟件生態(tài)上超越CUDA,究竟有多難?

    神壇的,還是圍繞CUDA打造的一系列軟件生態(tài)。 ? 英偉——CUDA的絕對統(tǒng)治 ? 相信對GPU
    的頭像 發(fā)表于 06-20 00:09 ?5726次閱讀

    打破英偉CUDA壁壘?AMD顯卡現(xiàn)在也能無縫適配CUDA

    電子發(fā)燒友網(wǎng)報道(文/梁浩斌)一直以來,圍繞CUDA打造的軟件生態(tài),是英偉GPU領域最大的護城河,尤其是隨著目前AI領域的發(fā)展加速,市場
    的頭像 發(fā)表于 07-19 00:16 ?7224次閱讀

    aicube的n卡gpu索引該如何添加?

    請問有人知道aicube怎樣才能讀取n卡的gpu索引呢,我已經(jīng)安裝了cuda和cudnn,在全局的py里添加了torch,能夠調(diào)用gpu,當還是只能看到默認的gpu0,顯示不了
    發(fā)表于 07-25 08:18

    英偉發(fā)布新一代 GPU 架構圖靈和 GPU 系列 Quadro RTX

    在 8 月 14 日的 SIGGRAPH 2018 大會上,英偉 CEO 黃仁勛正式發(fā)布了新一代 GPU 架構 Turing(圖靈),以及一系列基于圖靈架構的 GPU,包括全球首批支
    發(fā)表于 08-15 10:59

    恩智浦S32V/英偉DRIVE PX2/TI的TDA4/寒武紀1M/高通SA8155對比分析哪個好?

    恩智浦S32V/英偉DRIVE PX2/TI的TDA4/寒武紀1M/高通SA8155對比分析哪個好?
    發(fā)表于 09-30 07:03

    英偉DPU的過“芯”之處

    芯片的路徑”,在一個是DOCA試圖再一次復制“CUDAGPU通用化過程中所起到的開創(chuàng)生態(tài)之功”。如果和不久前英偉收購ARM的消息結合起來
    發(fā)表于 03-29 14:42

    英偉黃仁勛:GPU加速計算是發(fā)展方向

    據(jù)介紹,英偉已經(jīng)售出15億塊GPU,如今在使用的每塊GPU都兼容CUDA。而英偉
    的頭像 發(fā)表于 12-18 14:26 ?2982次閱讀

    國產(chǎn)GPU繞不開的CUDA生態(tài)

    CUDA(Compute Unified Device Architecture,統(tǒng)一計算架構)是由英偉所推出的一種集成技術,是該公司對于GPGPU的正式名稱。通過這個技術,用戶可利用NVIDIA的
    的頭像 發(fā)表于 11-29 09:36 ?5783次閱讀

    GPU平臺生態(tài),英偉CUDAAMD ROCm對比分析

    CUDA 除了是并行計算架構外,還是 CPU 和 GPU 協(xié)調(diào)工作的通用語言。在CUDA 編程模型中,主要有 Host(主機)和 Device(設備)兩個概念,Host 包含 CPU 和主機內(nèi)存,Device 包含
    的頭像 發(fā)表于 05-18 09:57 ?3799次閱讀
    <b class='flag-5'>GPU</b><b class='flag-5'>平臺</b><b class='flag-5'>生態(tài)</b>,<b class='flag-5'>英偉</b><b class='flag-5'>達</b><b class='flag-5'>CUDA</b>和<b class='flag-5'>AMD</b> <b class='flag-5'>ROCm</b><b class='flag-5'>對比分析</b>

    AMD 發(fā)布新的AMD ROCm 5.6開放軟件平臺

    ? ? ? ?? 近日,AMD 發(fā)布了新的 AMD ROCm 5.6 開放軟件平臺,AMD AI群組高級副總裁 Vamsi Boppana
    的頭像 發(fā)表于 07-25 16:29 ?1678次閱讀

    英偉A100和A40的對比

    英偉A100和A40的對比 A100是英偉推出的一款強大的數(shù)據(jù)中心GPU,采用全新的Ampe
    的頭像 發(fā)表于 08-08 15:08 ?2.1w次閱讀

    GPU技術、生態(tài)及算力分析

    對比AMD從2013年開始建設GPU生態(tài),近10年時間后用于通用計算的ROCm開放式軟件平臺才逐
    的頭像 發(fā)表于 01-14 10:06 ?2739次閱讀
    <b class='flag-5'>GPU</b>技術、<b class='flag-5'>生態(tài)</b>及算力<b class='flag-5'>分析</b>

    AMD將推新GPU,效能媲美英偉RTX 4080

    據(jù)悉,AMD正努力研制新品級GPU,性能堪比英偉的RTX 4080,而售價卻只有后者的一半。據(jù)多個在線社區(qū)反映,AMD即將發(fā)布的Radeo
    的頭像 發(fā)表于 01-31 10:00 ?4414次閱讀

    英國公司實現(xiàn)英偉CUDA軟件在AMD GPU上的無縫運行

    7月18日最新資訊,英國創(chuàng)新科技企業(yè)Spectral Compute震撼發(fā)布了其革命性GPGPU編程工具包——“SCALE”,該工具包實現(xiàn)了英偉CUDA軟件在AMD
    的頭像 發(fā)表于 07-18 14:40 ?1859次閱讀