完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>
標簽 > cuda
文章:103個 瀏覽:14504次 帖子:19個
TensorRT創(chuàng)建層時序緩存以保存層分析信息
為了減少構(gòu)建器時間,TensorRT 創(chuàng)建了一個層時序緩存,以在構(gòu)建器階段保存層分析信息。它包含的信息特定于目標構(gòu)建器設(shè)備、CUDA 和 TensorR...
NVIDIA宣布CUDA支持Arm 開辟實現(xiàn)百萬兆級超算的新途徑
NVIDIA近日宣布支持Arm CPU,為高性能計算行業(yè)開辟了一條全新途徑,以構(gòu)建具有極高能效水平的百萬兆級AI超級計算機。
使用新的Nsight Compute改進導(dǎo)航和性能可視化
源頁面上的度量分組和選擇選項有改進,使其更易于使用。此外,此版本還增加了對在基于 ARM SBSA 和 L4T 的平臺上運行 Nsight Comp...
新 Volta GPU 架構(gòu)的一個定義性特征是它的 張量核 ,它使 Tesla V100 加速器的峰值吞吐量是上一代 Tesla P100 的 32...
2022-04-28 標簽:神經(jīng)網(wǎng)絡(luò)人工智能CUDA 3.8k 0
使用模塊化流簡化RHEL 8上的NVIDIA驅(qū)動程序部署
NVIDIA GPUs 已成為加速機器學(xué)習(xí)、高性能計算( HPC )、內(nèi)容創(chuàng)建工作流和數(shù)據(jù)中心應(yīng)用程序等多種工作負載的主流。對于這些企業(yè)用例, NV...
如何使用DPDK和GPUdev增強內(nèi)聯(lián)數(shù)據(jù)包處理
對于特定于 NVIDIA 的 GPU , GPUdev 庫功能通過 CUDA 驅(qū)動程序 DPDK 庫 。要為 NVIDIA GPU 啟用所有g(shù)pud...
下面左邊的代碼示例效率低下,因為第一個 cudaFree 調(diào)用必須等待 kernelA 完成,所以它會在釋放內(nèi)存之前同步設(shè)備。為了提高運行效率,可以預(yù)先...
CUDA和NVIDIA Ampere微體系結(jié)構(gòu)GPUs
A100 是第一款 GPU 可以通過 NVLink 擴展到完整的 GPU ,也可以通過降低每個 GPU 實例的成本,使用 MIG 擴展到許多用戶。 ...
近日有媒體爆料稱,英偉達旗下最新型號顯卡產(chǎn)品RTX 3080 Ti首發(fā)定價曝光:與AMD RX 6900 XT一致,在999美元左右,約合7000元人民幣。
用NVIDIA CUDA11.2 C ++編譯器提高應(yīng)用性能
使用 CUDA 11. 2 ,大多數(shù)內(nèi)聯(lián)函數(shù)都可以在 cuda-gdb 和 Nsight 調(diào)試器的調(diào)用堆?;厮葜锌吹健D鷵碛行阅軆?yōu)化代碼路徑的一致回...
我們使用了 NVIDIA 的 CUDA 庫 直接在 NVIDIA GPUs 上運行應(yīng)用程序并執(zhí)行批處理。下面的代碼片段使用 CUDA 執(zhí)行矩陣乘法。
2022-04-28 標簽:gpuCUDA深度學(xué)習(xí) 2.9k 0
在 CUDA 上下文中,內(nèi)核作為 PTX 或二進制對象由主機代碼顯式加載,如模塊中所述。 因此,用 C++ 編寫的內(nèi)核必須單獨編譯成 PTX 或二進制對...
2022-05-07 標簽:API應(yīng)用程序CUDA 2.8k 0
為了最好地確保 RPM 和 Debian 軟件包存儲庫的安全性和可靠性, NVIDIA 從 2022 年 4 月 27 日開始更新并輪換apt、dn...
沐曦攻堅高性能通用GPU 完成數(shù)億元PreA+輪融資
沐曦擬采用業(yè)界最先進的5nm工藝技術(shù),專注研發(fā)全兼容CUDA及ROCm生態(tài)的國產(chǎn)高性能GPU芯片,滿足HPC、數(shù)據(jù)中心及AI等方面的計算需求,
隨著自主機器的發(fā)展,我們可以在生活中經(jīng)??吹阶灾鳈C器的應(yīng)用。有傳統(tǒng)應(yīng)用的倉庫工廠 AMR、機械臂、銀行酒店里面的服務(wù)機器人、家庭機器人、無人物流車、自主...
換一批
編輯推薦廠商產(chǎn)品技術(shù)軟件/工具OS/語言教程專題
| 電機控制 | DSP | 氮化鎵 | 功率放大器 | ChatGPT | 自動駕駛 | TI | 瑞薩電子 |
| BLDC | PLC | 碳化硅 | 二極管 | OpenAI | 元宇宙 | 安森美 | ADI |
| 無刷電機 | FOC | IGBT | 逆變器 | 文心一言 | 5G | 英飛凌 | 羅姆 |
| 直流電機 | PID | MOSFET | 傳感器 | 人工智能 | 物聯(lián)網(wǎng) | NXP | 賽靈思 |
| 步進電機 | SPWM | 充電樁 | IPM | 機器視覺 | 無人機 | 三菱電機 | ST |
| 伺服電機 | SVPWM | 光伏發(fā)電 | UPS | AR | 智能電網(wǎng) | 國民技術(shù) | Microchip |
| Arduino | BeagleBone | 樹莓派 | STM32 | MSP430 | EFM32 | ARM mbed | EDA |
| 示波器 | LPC | imx8 | PSoC | Altium Designer | Allegro | Mentor | Pads |
| OrCAD | Cadence | AutoCAD | 華秋DFM | Keil | MATLAB | MPLAB | Quartus |
| C++ | Java | Python | JavaScript | node.js | RISC-V | verilog | Tensorflow |
| Android | iOS | linux | RTOS | FreeRTOS | LiteOS | RT-THread | uCOS |
| DuerOS | Brillo | Windows11 | HarmonyOS |