雖然世界在不斷變化,但開發(fā)人員仍在不斷推動他們使用創(chuàng)新技術應對挑戰(zhàn)。最近的臺灣計算云( TWCC ) GPU Hackathon 就是這樣一個例子,它是開發(fā)者和工程師使用 GPU 推進 HPC 和 AI 項目的催化劑。
國家高性能計算中心 、 臺灣網(wǎng)絡服務公司 、 NVIDIA 和 OpenACC 、 12 個團隊和 15 名 NVIDIA 導師之間的合作,使用了從人工智能驅動的制造調度模型到快速洪水預測模型的各種方法來加速項目。
利用人工智能優(yōu)化生產效率
智能制造的關鍵領域之一是優(yōu)化和自動化生產線流程。團隊 AI 調度員和 工業(yè)技術研究中心(工研院) 的 計算智能技術中心( CITC ) 成員來到 hackathon ,使用機器學習開發(fā)他們的制造調度模型。
傳統(tǒng)的調度模型大多采用啟發(fā)式規(guī)則,能夠即時響應動態(tài)事件。然而,他們的短期方法通常不會帶來最佳解決方案,并且在處理變化的變量時被證明是不靈活的,這限制了他們的持續(xù)生存能力。
該團隊的方法使用蒙特卡羅樹搜索( MCTS )方法,將經(jīng)典的樹搜索實現(xiàn)與強化學習的機器學習原理結合起來。該方法解決了現(xiàn)有的啟發(fā)式限制,提高了整體調度模型的效率,提高了效率。
通過與導師合作,團隊 AI Scheduler 學會了使用 NVIDIA Nsight 系統(tǒng) 來識別瓶頸,并使用 GPU 來并行化代碼?;顒咏Y束時,團隊能夠加快 MCTS 算法的模擬步驟。這將調度時間從 6 小時減少到 30 分鐘,并使總體調度效率提高了 11.3 倍。
工研院 CITC 的曾正蘇博士和黃浩哲博士說:“在本次黑客大會上證明了使用 GPU 加速我們的模型的可行性之后,下一步是將其應用到我們的商業(yè)模型中,供工業(yè)使用?!?。
使用 GPU 了解地球科學的全局
臺灣位于歐亞大陸和菲律賓海板塊之間,是世界上構造最活躍的地區(qū)之一,也是全球地震研究的重要基地。地質研究和構造活動的時間尺度通常以數(shù)千年或數(shù)萬年為單位。這需要使用大量數(shù)據(jù)和足夠的計算能力來進行有效分析。
由 中央研究院地球研究所 的譚博士領導的 IES 地球動力學團隊來到 GPU Hackathon 加速他們的數(shù)值地球動力學模型。它名為 DynEarthSol ,模擬地幔對流、俯沖、造山和構造。此前,該團隊通過將數(shù)據(jù)分塊并限制計算過程以適應 CPU 有限的計算能力來減少計算和步驟的數(shù)量,從而處理大量數(shù)據(jù)。這使得很難看到研究的全貌。

圖 2 俯沖帶的動畫模擬。
在黑客競賽的過程中,團隊使用了一種新的數(shù)據(jù)輸入方法,利用 GPU 計算數(shù)據(jù)和多個步驟。使用 OpenACC , IES 地球動力學團隊能夠將 80% 的模型移植到 GPU ,并實現(xiàn)了 13.6 倍的加速。
“這是我第二次參加 GPU 黑客競賽,我肯定會參加下一次,”中央研究院國際研究所研究員譚恩恩教授說?!拔覀円呀?jīng)學會了采用 GPU 的適當方法,用戶友好的分析工具為我們提供了一個優(yōu)化模型的好主意?!?/p>
該團隊將繼續(xù)致力于移植其模型的剩余 20% 。他們期待使用 GPU 運行更多高分辨率模型,以更深入地了解臺灣的編隊活動。
用于應急規(guī)劃和響應的快速洪水評估
洪水是最具破壞性的自然災害之一。每年造成大量人員傷亡和經(jīng)濟損失, 全世界平均有 2100 萬人受洪水影響 ,由于氣候變化和其他因素,預計人數(shù)還會增加。預防和減輕這些危害是一項關鍵工作。
來自 國立楊橋大學( NYCU ) 的 THINKLAB 團隊正在開發(fā)一種模型,該模型可以為緊急情況提供快速準確的結果,同時保持操作的簡單性。所提出的 混合淹沒模型( HIM ) 通過元胞自動機方法求解零慣性方程,并與亞網(wǎng)格級插值策略配合使用,以生成更高分辨率的結果。

圖 3 HIM 產生的洪水范圍示例。
使用 Python 和 NumPy 庫開發(fā)的 HIM 模型在 hackathon 開始時沒有并行或 GPU 計算。在活動期間, THINKLAB 團隊使用 CuPy 為了使他們的代碼在 GPU 上并行運行,然后重點將用戶定義的 CUDA 內核應用于參數(shù)。結果是 672 倍加速,計算時間從 2 周縮短到大約 30 分鐘。
THINKLAB 團隊成員 Obaja Wijaya 說:“我們在這次活動中學到了很多技巧,并向其他人強烈推薦這些活動?!薄!癗VIDIA 是這一領域的專家,通過與他們的導師合作,我們學會了如何使用 GPU 編程優(yōu)化模型/代碼?!?/p>
關于作者
Izumi Barker 是 NVIDIA GPU 黑客競賽和訓練營的項目經(jīng)理,也是 OpenACC Standard 的公關總監(jiān)。組織。在這些角色之前,她在鳳凰城大學、 CeCon 集團、囊性纖維化基金會和 LLP 安永等高等教育、生命科學、技術和出版行業(yè)的公司舉辦了戰(zhàn)略營銷和傳播職位。
審核編輯:郭婷
-
gpu
+關注
關注
28文章
5194瀏覽量
135414 -
python
+關注
關注
57文章
4876瀏覽量
90016 -
CUDA
+關注
關注
0文章
127瀏覽量
14473
發(fā)布評論請先 登錄
無法在GPU上運行ONNX模型的Benchmark_app怎么解決?
優(yōu)化模型與Lindo/Lingo優(yōu)化軟件
【招聘】算法、圖像檢索、嵌入式、測試、架構、GPU優(yōu)化等職位(bj&sh)
請問Mali GPU的并行化計算模型是怎樣構建的?
在Ubuntu上使用Nvidia GPU訓練模型
Mali GPU支持tensorflow或者caffe等深度學習模型嗎
Mali-Valhall系列GPU可編程內核
Keil C編譯器編程規(guī)則和代碼優(yōu)化
數(shù)據(jù)流編程模型優(yōu)化
谷歌發(fā)布用于輔助編程的代碼大模型CodeGemma
Triton編譯器與GPU編程的結合應用
在Python中借助NVIDIA CUDA Tile簡化GPU編程
如何使用GPU編程優(yōu)化模型/代碼
評論