91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

近600個應(yīng)用程序通過NVIDIA GPU實現(xiàn)了提速

NVIDIA英偉達企業(yè)解決方案 ? 來源:cc ? 2019-02-14 14:15 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

十幾年前,還不曾有加速應(yīng)用程序。而如今已有近600個應(yīng)用程序通過NVIDIA GPU實現(xiàn)了提速。

這些應(yīng)用程序涵蓋了物理、生物科學(xué)、分子動力學(xué)、化學(xué)和天氣預(yù)報等各個領(lǐng)域。其中包括全球最熱門的15個高性能計算應(yīng)用程序,也都是通過GPU實現(xiàn)加速的。去年,NVIDIA GPU應(yīng)用程序目錄收錄了100多個應(yīng)用程序,接下來還會有更多的程序?qū)⒈魂懤m(xù)添加到目錄中。

Intersect 360研究所的一份報告中收錄了數(shù)據(jù)中心運行的各個關(guān)鍵應(yīng)用程序。其中,排名前15的應(yīng)用程序均由GPU加速,這些都是一系列殺手級的核心科學(xué)應(yīng)用程序。其中包括:

GROMACS(化學(xué))– 分子動力學(xué)應(yīng)用程序,旨在模擬包含了數(shù)百到數(shù)百萬個粒子的系統(tǒng)的牛頓運動方程。

ANSYS(流體動力學(xué)分析)– 模擬液體和氣體與表面的相互作用。

Gaussian(化學(xué))– 預(yù)測分子系統(tǒng)的能量、分子結(jié)構(gòu)和振動頻率。

VASP(化學(xué))– 用于從頭計算法量子力學(xué)分子動力學(xué)模擬。

NAMD(化學(xué))– 大型生物分子系統(tǒng)的高性能模擬。

Simulia Abaqus(結(jié)構(gòu)分析)– 用于結(jié)構(gòu)力學(xué)的模擬和分析。

WRF(天氣/環(huán)境建模)– 數(shù)值天氣預(yù)報系統(tǒng),專為大氣研究和操作預(yù)測應(yīng)用程序而設(shè)計。

OpenFOAM(流體動力學(xué)分析)– 通用型 CFD 軟件的求解器庫。

ANSYS(結(jié)構(gòu)分析)– 對高頻和高速電子元件中的 3D 全波電磁場進行建模。

LS-DYNA(結(jié)構(gòu)分析)– 結(jié)構(gòu)力學(xué)的模擬和分析工具。

BLAST(生物科學(xué))– 應(yīng)用最為廣泛的生物信息學(xué)工具之一。

LAMMPS(化學(xué))– 經(jīng)典分子動力學(xué)程序包。

Amber(化學(xué))– 專門針對生物分子系統(tǒng)模擬而開發(fā)的分子動力學(xué)應(yīng)用程序。

Quantum Espresso(化學(xué))– 一套集成的計算機代碼,用于電子結(jié)構(gòu)計算和納米級材料建模。

GAMESS(化學(xué))– 用于模擬原子和分子電子結(jié)構(gòu)的計算化學(xué)套件。

這些工具本身無法實現(xiàn)性能的遞增性提升。但通過采用NVIDIA GPU的服務(wù)器,其性能通??商岣?0 倍或更多。并且,GPU加速可以改善數(shù)據(jù)中心的經(jīng)濟效益。

預(yù)測天氣

天氣預(yù)報是一項遠比其看起來更加困難的工作。天氣預(yù)報是高性能計算領(lǐng)域的一個重要分支。準(zhǔn)確可靠的天氣預(yù)報不僅可以拯救生命,還有助于航空、能源和公用事業(yè)、保險、零售和其他行業(yè)做出經(jīng)濟決策。

天氣預(yù)報需要大量的計算資源,包括幾何尺度(尤其是全球天氣預(yù)報),和大量描述大氣狀態(tài)的變量。

但是,受限于可用的計算量和應(yīng)用程序的性能,當(dāng)前的天氣預(yù)報模型僅限于低分辨率的模擬,例如12公里的分辨率。

這些模型忽略了一些重要的細節(jié),例如云層的影響(云層可以反射太陽輻射,在天氣模式中扮演著重要的角色)。采用1公里云分辨率可以改善預(yù)測效果,但這需要 應(yīng)用程序的性能提升1700倍。

GPU加速可以彌補此差距,提高天氣預(yù)報的準(zhǔn)確性。

加速空氣動力學(xué)模擬

使用NASA的FUN3D代碼模擬SLS Block 1B助推器分離流場。該圖片由Jamie Meeroff,Henry Lee,NASA/Ames提供。

火箭能夠以超高的速度飛行,然而利用大規(guī)??諝鈩恿W(xué)模擬,我們可以對其進行改進,讓火箭可以飛得更快、更高效。

NASA蘭利研究中心開發(fā)的FUN3D計算流體動力學(xué)軟件,可用于模擬各種空氣動力學(xué)應(yīng)用程序中的流體流動。該應(yīng)用程序在NASA Pleiades超級計算機上消耗的周期比其他任何應(yīng)用程序都要多。借助于GPU加速,采用了6個NVIDIA V100 Tensor Core GPU的服務(wù)器能夠以高出雙插槽CPU服務(wù)器30倍的性能運行這些模擬。

總結(jié):GPU具備非常好的性能,從而高效地計算規(guī)模更大、更復(fù)雜的模擬。NASA已經(jīng)證明,在Summit超級計算機上,僅需運行1000臺GPU服務(wù)器就可以完成100多萬個CPU核心的工作。而且,其能源成本遠低于CPU。

性能持續(xù)提升

我們在各個加速計算領(lǐng)域都擁有深厚的儲備。結(jié)合由100多萬名開發(fā)人員組成的生態(tài)系統(tǒng),我們將共同形成一個不斷改進的平臺。該平臺可以在相同的 GPU加速服務(wù)器上提供更高的應(yīng)用程序性能。

例如,在包含 11 個高性能計算應(yīng)用程序的組合中,對于采用4個NVIDIA Tesla P100 GPU的服務(wù)器,其當(dāng)前的運行速度比兩年前提高了2倍。如果同時改進軟件堆棧和GPU架構(gòu),您可以獲得更大的性能提升。

現(xiàn)在,通過單一平臺,您可以加速各種高性能計算領(lǐng)域的應(yīng)用程序:科學(xué)計算、工業(yè)模擬、深度學(xué)習(xí)機器學(xué)習(xí)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5606

    瀏覽量

    109837
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5204

    瀏覽量

    135573

原文標(biāo)題:GPU已加速的近600個高性能計算應(yīng)用程序都有哪些?

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    借助NVIDIA CUDA Tile IR后端推進OpenAI Triton的GPU編程

    NVIDIA CUDA Tile 是基于 GPU 的編程模型,其設(shè)計目標(biāo)是為 NVIDIA Tensor Cores 提供可移植性,從而釋放 GPU 的極限性能。CUDA Tile 的
    的頭像 發(fā)表于 02-10 10:31 ?292次閱讀

    NVIDIA RTX PRO 5000 Blackwell GPU的深度評測

    NVIDIA RTX PRO 5000 Blackwell 是 NVIDIA RTX 5000 Ada Generation 的升級迭代產(chǎn)品,其各項核心指標(biāo)均針對 GPU 加速工作流的高性能
    的頭像 發(fā)表于 01-06 09:51 ?2565次閱讀
    <b class='flag-5'>NVIDIA</b> RTX PRO 5000 Blackwell <b class='flag-5'>GPU</b>的深度評測

    NVIDIA RTX PRO 4000 Blackwell GPU性能測試

    Generation 的全面超越。那么,這款劃時代的專業(yè) GPU 在真實應(yīng)用場景中的表現(xiàn)究竟如何?今天,我們將通過深度實測,為您揭曉 NVIDIA RTX PRO 4000 Blackwell 相較于前代產(chǎn)品的性能躍遷。
    的頭像 發(fā)表于 12-29 15:30 ?1435次閱讀
    <b class='flag-5'>NVIDIA</b> RTX PRO 4000 Blackwell <b class='flag-5'>GPU</b>性能測試

    在Python中借助NVIDIA CUDA Tile簡化GPU編程

    NVIDIA CUDA 13.1 版本新增基于 Tile 的GPU 編程模式。它是自 CUDA 發(fā)明以來 GPU 編程最核心的更新之一。借助 GP
    的頭像 發(fā)表于 12-13 10:12 ?1223次閱讀
    在Python中借助<b class='flag-5'>NVIDIA</b> CUDA Tile簡化<b class='flag-5'>GPU</b>編程

    NVIDIA RTX PRO 2000 Blackwell GPU性能測試

    越來越多的應(yīng)用正在使用 AI 加速,而無論工作站的大小或形態(tài)如何,都有越來越多的用戶需要 AI 性能。NVIDIA RTX PRO 2000 Blackwell 是全新 NVIDIA
    的頭像 發(fā)表于 11-28 09:39 ?6416次閱讀
    <b class='flag-5'>NVIDIA</b> RTX PRO 2000 Blackwell <b class='flag-5'>GPU</b>性能測試

    NVIDIA Isaac Lab多GPU多節(jié)點訓(xùn)練指南

    NVIDIA Isaac Lab 是一適用于機器人學(xué)習(xí)的開源統(tǒng)一框架,基于 NVIDIA Isaac Sim 開發(fā),其模塊化高保真仿真適用于各種訓(xùn)練環(huán)境,可提供各種物理 AI 功能和由 GP
    的頭像 發(fā)表于 09-23 17:15 ?2435次閱讀
    <b class='flag-5'>NVIDIA</b> Isaac Lab多<b class='flag-5'>GPU</b>多節(jié)點訓(xùn)練指南

    學(xué)生適合使用的SOLIDWORKS 云應(yīng)用程序

    隨著科技的不斷發(fā)展,計算機輔助設(shè)計(CAD)技術(shù)已經(jīng)成為現(xiàn)代工程教育的重要組成部分。SOLIDWORKS作為一款CAD軟件,其教育版云應(yīng)用程序為學(xué)生提供強大而靈活的設(shè)計平臺。本文將探討
    的頭像 發(fā)表于 09-15 10:39 ?804次閱讀
    學(xué)生適合使用的SOLIDWORKS 云<b class='flag-5'>應(yīng)用程序</b>

    DeepSeek R1 MTP在TensorRT-LLM中的實現(xiàn)與優(yōu)化

    TensorRT-LLM 在 NVIDIA Blackwell GPU 上創(chuàng)下了 DeepSeek-R1 推理性能的世界紀(jì)錄,Multi-Token Prediction (MTP) 實現(xiàn)
    的頭像 發(fā)表于 08-30 15:47 ?4477次閱讀
    DeepSeek R1 MTP在TensorRT-LLM中的<b class='flag-5'>實現(xiàn)</b>與優(yōu)化

    NVIDIA RTX PRO 4500 Blackwell GPU測試分析

    今天我們帶來全新 NVIDIA Blackwell 架構(gòu) GPU —— NVIDIA RTX PRO 4500 Blackwell 的測試,對比上一代產(chǎn)品 NVIDIA RTX 450
    的頭像 發(fā)表于 08-28 11:02 ?4032次閱讀
    <b class='flag-5'>NVIDIA</b> RTX PRO 4500 Blackwell <b class='flag-5'>GPU</b>測試分析

    NVIDIA桌面GPU系列擴展新產(chǎn)品

    NVIDIA 桌面 GPU 系列擴展,推出 NVIDIA RTX PRO 4000 SFF Edition GPU 和 RTX PRO 2000 Blackwell
    的頭像 發(fā)表于 08-18 11:50 ?1450次閱讀

    NVIDIA Blackwell GPU優(yōu)化DeepSeek-R1性能 打破DeepSeek-R1在最小延遲場景中的性能紀(jì)錄

    本文將探討 NVIDIA TensorRT-LLM 如何基于 8 NVIDIA Blackwell GPU 的配置,打破 DeepSeek-R1 在最小延遲場景中的性能紀(jì)錄:在 G
    的頭像 發(fā)表于 07-02 19:31 ?3315次閱讀
    <b class='flag-5'>NVIDIA</b> Blackwell <b class='flag-5'>GPU</b>優(yōu)化DeepSeek-R1性能 打破DeepSeek-R1在最小延遲場景中的性能紀(jì)錄

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗】+NVlink技術(shù)從應(yīng)用到原理

    兩種結(jié)構(gòu): ①GPU-GPU ②CPU-GPU 這是書中介紹的一包括完全
    發(fā)表于 06-18 19:31

    NVIDIA虛擬GPU 18.0版本的亮點

    NVIDIA 虛擬 GPU(vGPU)技術(shù)可在虛擬桌面基礎(chǔ)設(shè)施(VDI)中解鎖 AI 功能,使其比以往更加強大、用途更加廣泛。vGPU 通過為各種虛擬化環(huán)境中的 AI 驅(qū)動工作負載提供動力,提高了
    的頭像 發(fā)表于 04-07 11:28 ?1453次閱讀

    使用NVIDIA RTX PRO Blackwell系列GPU加速AI開發(fā)

    NVIDIA GTC 推出新一代專業(yè)級 GPU 和 AI 賦能的開發(fā)者工具—同時,ChatRTX 更新現(xiàn)已支持 NVIDIA NIM,RTX Remix 正式結(jié)束測試階段,本月的 NVIDIA
    的頭像 發(fā)表于 03-28 09:59 ?1322次閱讀

    可以手動構(gòu)建imx-gpu-viv嗎?

    所需的庫版本。但是當(dāng)我嘗試運行應(yīng)用程序時,它導(dǎo)致分段錯誤。 有沒有辦法在 Debian 10 中自己構(gòu)建 imx-gpu 庫,這樣它們就不需要 glibc 2.28 版本? 如
    發(fā)表于 03-28 06:35