十幾年前,還不曾有加速應(yīng)用程序。而如今已有近600個應(yīng)用程序通過NVIDIA GPU實現(xiàn)了提速。
這些應(yīng)用程序涵蓋了物理、生物科學(xué)、分子動力學(xué)、化學(xué)和天氣預(yù)報等各個領(lǐng)域。其中包括全球最熱門的15個高性能計算應(yīng)用程序,也都是通過GPU實現(xiàn)加速的。去年,NVIDIA GPU應(yīng)用程序目錄收錄了100多個應(yīng)用程序,接下來還會有更多的程序?qū)⒈魂懤m(xù)添加到目錄中。

Intersect 360研究所的一份報告中收錄了數(shù)據(jù)中心運行的各個關(guān)鍵應(yīng)用程序。其中,排名前15的應(yīng)用程序均由GPU加速,這些都是一系列殺手級的核心科學(xué)應(yīng)用程序。其中包括:
GROMACS(化學(xué))– 分子動力學(xué)應(yīng)用程序,旨在模擬包含了數(shù)百到數(shù)百萬個粒子的系統(tǒng)的牛頓運動方程。
ANSYS(流體動力學(xué)分析)– 模擬液體和氣體與表面的相互作用。
Gaussian(化學(xué))– 預(yù)測分子系統(tǒng)的能量、分子結(jié)構(gòu)和振動頻率。
VASP(化學(xué))– 用于從頭計算法量子力學(xué)分子動力學(xué)模擬。
NAMD(化學(xué))– 大型生物分子系統(tǒng)的高性能模擬。
Simulia Abaqus(結(jié)構(gòu)分析)– 用于結(jié)構(gòu)力學(xué)的模擬和分析。
WRF(天氣/環(huán)境建模)– 數(shù)值天氣預(yù)報系統(tǒng),專為大氣研究和操作預(yù)測應(yīng)用程序而設(shè)計。
OpenFOAM(流體動力學(xué)分析)– 通用型 CFD 軟件的求解器庫。
ANSYS(結(jié)構(gòu)分析)– 對高頻和高速電子元件中的 3D 全波電磁場進行建模。
LS-DYNA(結(jié)構(gòu)分析)– 結(jié)構(gòu)力學(xué)的模擬和分析工具。
BLAST(生物科學(xué))– 應(yīng)用最為廣泛的生物信息學(xué)工具之一。
LAMMPS(化學(xué))– 經(jīng)典分子動力學(xué)程序包。
Amber(化學(xué))– 專門針對生物分子系統(tǒng)模擬而開發(fā)的分子動力學(xué)應(yīng)用程序。
Quantum Espresso(化學(xué))– 一套集成的計算機代碼,用于電子結(jié)構(gòu)計算和納米級材料建模。
GAMESS(化學(xué))– 用于模擬原子和分子電子結(jié)構(gòu)的計算化學(xué)套件。
這些工具本身無法實現(xiàn)性能的遞增性提升。但通過采用NVIDIA GPU的服務(wù)器,其性能通??商岣?0 倍或更多。并且,GPU加速可以改善數(shù)據(jù)中心的經(jīng)濟效益。
預(yù)測天氣
天氣預(yù)報是一項遠比其看起來更加困難的工作。天氣預(yù)報是高性能計算領(lǐng)域的一個重要分支。準(zhǔn)確可靠的天氣預(yù)報不僅可以拯救生命,還有助于航空、能源和公用事業(yè)、保險、零售和其他行業(yè)做出經(jīng)濟決策。
天氣預(yù)報需要大量的計算資源,包括幾何尺度(尤其是全球天氣預(yù)報),和大量描述大氣狀態(tài)的變量。
但是,受限于可用的計算量和應(yīng)用程序的性能,當(dāng)前的天氣預(yù)報模型僅限于低分辨率的模擬,例如12公里的分辨率。
這些模型忽略了一些重要的細節(jié),例如云層的影響(云層可以反射太陽輻射,在天氣模式中扮演著重要的角色)。采用1公里云分辨率可以改善預(yù)測效果,但這需要 應(yīng)用程序的性能提升1700倍。
GPU加速可以彌補此差距,提高天氣預(yù)報的準(zhǔn)確性。
加速空氣動力學(xué)模擬
使用NASA的FUN3D代碼模擬SLS Block 1B助推器分離流場。該圖片由Jamie Meeroff,Henry Lee,NASA/Ames提供。
火箭能夠以超高的速度飛行,然而利用大規(guī)??諝鈩恿W(xué)模擬,我們可以對其進行改進,讓火箭可以飛得更快、更高效。
NASA蘭利研究中心開發(fā)的FUN3D計算流體動力學(xué)軟件,可用于模擬各種空氣動力學(xué)應(yīng)用程序中的流體流動。該應(yīng)用程序在NASA Pleiades超級計算機上消耗的周期比其他任何應(yīng)用程序都要多。借助于GPU加速,采用了6個NVIDIA V100 Tensor Core GPU的服務(wù)器能夠以高出雙插槽CPU服務(wù)器30倍的性能運行這些模擬。
總結(jié):GPU具備非常好的性能,從而高效地計算規(guī)模更大、更復(fù)雜的模擬。NASA已經(jīng)證明,在Summit超級計算機上,僅需運行1000臺GPU服務(wù)器就可以完成100多萬個CPU核心的工作。而且,其能源成本遠低于CPU。
性能持續(xù)提升
我們在各個加速計算領(lǐng)域都擁有深厚的儲備。結(jié)合由100多萬名開發(fā)人員組成的生態(tài)系統(tǒng),我們將共同形成一個不斷改進的平臺。該平臺可以在相同的 GPU加速服務(wù)器上提供更高的應(yīng)用程序性能。
例如,在包含 11 個高性能計算應(yīng)用程序的組合中,對于采用4個NVIDIA Tesla P100 GPU的服務(wù)器,其當(dāng)前的運行速度比兩年前提高了2倍。如果同時改進軟件堆棧和GPU架構(gòu),您可以獲得更大的性能提升。
現(xiàn)在,通過單一平臺,您可以加速各種高性能計算領(lǐng)域的應(yīng)用程序:科學(xué)計算、工業(yè)模擬、深度學(xué)習(xí)和機器學(xué)習(xí)。
-
NVIDIA
+關(guān)注
關(guān)注
14文章
5606瀏覽量
109837 -
gpu
+關(guān)注
關(guān)注
28文章
5204瀏覽量
135573
原文標(biāo)題:GPU已加速的近600個高性能計算應(yīng)用程序都有哪些?
文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
借助NVIDIA CUDA Tile IR后端推進OpenAI Triton的GPU編程
NVIDIA RTX PRO 5000 Blackwell GPU的深度評測
NVIDIA RTX PRO 4000 Blackwell GPU性能測試
在Python中借助NVIDIA CUDA Tile簡化GPU編程
NVIDIA RTX PRO 2000 Blackwell GPU性能測試
NVIDIA Isaac Lab多GPU多節(jié)點訓(xùn)練指南
學(xué)生適合使用的SOLIDWORKS 云應(yīng)用程序
DeepSeek R1 MTP在TensorRT-LLM中的實現(xiàn)與優(yōu)化
NVIDIA RTX PRO 4500 Blackwell GPU測試分析
NVIDIA桌面GPU系列擴展新產(chǎn)品
NVIDIA Blackwell GPU優(yōu)化DeepSeek-R1性能 打破DeepSeek-R1在最小延遲場景中的性能紀(jì)錄
近600個應(yīng)用程序通過NVIDIA GPU實現(xiàn)了提速
評論