91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

利用NVIDIA GPU并行計算技術(shù)解決AI研究問題

星星科技指導(dǎo)員 ? 來源:NVIDIA ? 作者:Solee Moon ? 2022-04-19 16:44 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

由于冠狀病毒的存在, 2021 年韓國科學技術(shù)信息研究所( KISTI ) GPU 黑客大賽在 KISTI NVIDIA 和 OpenACC 組織的專家導(dǎo)師指導(dǎo)下舉行。為了激發(fā)科學家加速 AI 研究或 HPC 代碼的可能性, hackathon 提供了利用 NVIDIA GPU并行計算技術(shù)解決研究問題和擴展專業(yè)知識的機會。

以面對面活動而聞名的虛擬黑客大會對與會者和主持人都提出了自己的挑戰(zhàn)。新的模式還需要兼顧由三個 HPC 和 AI 團隊、四個高等教育和研究團隊以及兩個行業(yè)團隊組成的多樣化團隊。

活動團隊發(fā)現(xiàn)以下配方有助于為參與者創(chuàng)造有意義的成功體驗:

指導(dǎo)

基于他們在特定領(lǐng)域或編程語言方面的專業(yè)知識,專門的導(dǎo)師與團隊一起進行指導(dǎo),以設(shè)定目標,并考慮不同的方法。導(dǎo)師們合作解決團隊遇到的問題并排除障礙。每天的導(dǎo)師同步電話讓每個人都集中精力,朝著實現(xiàn)目標的最佳策略努力。

社交

每個人都知道,只工作不玩耍實際上會阻礙團隊的生產(chǎn)力。 hackathon 為參與者和導(dǎo)師提供了 TGIF 社交時間會議。使用 Metaverse Gather 城鎮(zhèn)空間,導(dǎo)師和團隊分享經(jīng)驗,為電池充電,并建立聯(lián)系,幫助他們在活動期間繼續(xù)前進。

資源和現(xiàn)場研討會

成功的另一個重要因素是為與會者提供專門的培訓(xùn)和資源。例如, NVIDIA 深度學習培訓(xùn)中心( DLI )的一位大使和導(dǎo)師介紹了一個涵蓋 CUDA C / C ++主題的研討會。其他導(dǎo)師提供了團隊專用的技術(shù)課程,重點是TRT和 NVIDIA Triton 、OpenACC和 NSight 系統(tǒng)的評測、并行計算和優(yōu)化。

努力工作是有回報的

延世大學的帕斯卡團隊正在開發(fā)一種熱流體解算器,該解算器可以有效地計算湍流的熱運動。在這次黑客大會上,團隊通過 OpenACC 和 cuFFT 庫將基于 CPU 的現(xiàn)有代碼轉(zhuǎn)換為多 GPU 環(huán)境。這使得最耗時的子程序之一的計算速度加快了 4 . 84 倍 RHS (右側(cè),分步)。

來自 AmorePacific 化妝品公司的 Amore Opt 團隊致力于 GPU 優(yōu)化 DeepLabV3 +細分模型。通過應(yīng)用他們對 TensorRT 推理優(yōu)化器和 NVIDIA Triton 推理服務(wù)器的了解,他們提高了推理速度,使推理速度提高了 26 倍。他們做到了這一點,同時保持人工智能模型的準確性,以便為未來的大規(guī)??蛻舴?wù)檢測皮膚問題。

首爾國立大學的 TFC 團隊參與了一個項目,以加速基于 CPU 的 Fortran 內(nèi)部流體計算代碼。通過在 KISTI 使用 NVIDIA GPU s ,團隊加速了耗時的三對角矩陣算法( TDMA )用于熱解算器和動量解算器,以及快速傅立葉變換( FFT )用于壓力解算器計算。他們在一臺 V100 GPU 上實現(xiàn)了 11.15 倍的速度。

NVIDIA Inception 成員 Nota 和杭陽大學合作,通過利用 NVIDIA GPU s 中的張量核進行 INT4 量化,優(yōu)化了 Nota 模型壓縮引擎。名為 NOTA-HYU 的團隊學會了使用 NVIDIA 分析工具 NSight 系統(tǒng)和 NSight 計算。然后,他們應(yīng)用 NVIDIA 庫彎刀,通過 CUDA 優(yōu)化,使剩余塊的總體速度提高 1.85 倍。

關(guān)于作者

Solee Moon 是 NVIDIA 高等教育與研究( HER )和 NVIDIA 深度學習培訓(xùn)中心( DLI )項目的企業(yè)營銷專家,專注于支持 AI 開發(fā)者社區(qū)的發(fā)展。在 NVIDIA 之前, Solee 曾在三星電子 CTR 擔任品牌營銷專家,執(zhí)行各種整合營銷傳播活動。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5594

    瀏覽量

    109754
  • 深度學習
    +關(guān)注

    關(guān)注

    73

    文章

    5599

    瀏覽量

    124400
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    為啥 AI 計算速度這么驚人?—— 聊聊 GPU、內(nèi)存與并行計算

    提到AI,大家常說它“算得快”,其實是指AI能在眨眼間處理海量數(shù)據(jù)。可它為啥有這本事?答案就藏在“GPU+高速內(nèi)存+并行計算”這trio(組合)里。咱們可以把
    的頭像 發(fā)表于 12-05 14:35 ?870次閱讀
    為啥 <b class='flag-5'>AI</b> <b class='flag-5'>計算</b>速度這么驚人?—— 聊聊 <b class='flag-5'>GPU</b>、內(nèi)存與<b class='flag-5'>并行計算</b>

    一文看懂AI大模型的并行訓(xùn)練方式(DP、PP、TP、EP)

    大家都知道,AI計算(尤其是模型訓(xùn)練和推理),主要以并行計算為主。AI計算中涉及到的很多具體算法(例如矩陣相乘、卷積、循環(huán)層、梯度運算等),
    的頭像 發(fā)表于 11-28 08:33 ?1858次閱讀
    一文看懂<b class='flag-5'>AI</b>大模型的<b class='flag-5'>并行</b>訓(xùn)練方式(DP、PP、TP、EP)

    神經(jīng)網(wǎng)絡(luò)的并行計算與加速技術(shù)

    問題。因此,并行計算與加速技術(shù)在神經(jīng)網(wǎng)絡(luò)研究和應(yīng)用中變得至關(guān)重要,它們能夠顯著提升神經(jīng)網(wǎng)絡(luò)的性能和效率,滿足實際應(yīng)用中對快速響應(yīng)和大規(guī)模數(shù)據(jù)處理的需求。神經(jīng)網(wǎng)絡(luò)并行
    的頭像 發(fā)表于 09-17 13:31 ?1130次閱讀
    神經(jīng)網(wǎng)絡(luò)的<b class='flag-5'>并行計算</b>與加速<b class='flag-5'>技術(shù)</b>

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+可期之變:從AI硬件到AI濕件

    生物化學計算機,它通過離子、分子間的相互作用來進行復(fù)雜的并行計算。因而未來可期的前景是AI硬件將走向AI濕件。 根據(jù)研究,估算出大腦的功率是
    發(fā)表于 09-06 19:12

    從自然仿真到智能調(diào)度——GPU并行計算的多場景突破

    我們正在參加全球電子成就獎的評選,歡迎大家?guī)臀覀兺镀薄x謝支持隨著復(fù)雜計算問題的不斷涌現(xiàn),傳統(tǒng)的CPU串行計算在處理大規(guī)模數(shù)據(jù)與高并發(fā)任務(wù)時逐漸顯露瓶頸。GPU(圖形處理單元)憑借其高度
    的頭像 發(fā)表于 09-03 10:32 ?831次閱讀
    從自然仿真到智能調(diào)度——<b class='flag-5'>GPU</b><b class='flag-5'>并行計算</b>的多場景突破

    Votee AI借助NVIDIA技術(shù)加速方言小語種LLM開發(fā)

    Votee AI 利用 NVIDIAGPU 硬件、NeMo Curator 數(shù)據(jù)處理軟件、NeMo Framework 模型訓(xùn)練框架及 Auto Configurator 優(yōu)化工
    的頭像 發(fā)表于 08-20 14:21 ?861次閱讀

    AI 芯片浪潮下,職場晉升新契機?

    方向,就明確涵蓋了人工智能芯片的研發(fā)、部署與優(yōu)化技術(shù)崗位 。如果你從事 GPU 相關(guān)研發(fā)工作,在申報職稱時,就需著重突出在圖形處理加速、大規(guī)模并行計算等方面的成果,因為 GPU 的高
    發(fā)表于 08-19 08:58

    AI芯片:加速人工智能計算的專用硬件引擎

    處理等應(yīng)用落地的關(guān)鍵硬件基礎(chǔ)。 ? AI芯片的核心技術(shù)特點 ? ? AI芯片的設(shè)計重點在于提升計算效率,主要技術(shù)特點包括: ? 1. ?
    的頭像 發(fā)表于 07-09 15:59 ?1586次閱讀

    全球各大品牌利用NVIDIA AI技術(shù)提升運營效率

    歐萊雅、LVMH 集團和雀巢利用 NVIDIA 加速的智能體 AI 和物理 AI,大幅提升產(chǎn)品設(shè)計、營銷及物流等方面的運營效率。
    的頭像 發(fā)表于 06-19 14:36 ?1207次閱讀

    邊緣AI廣泛應(yīng)用推動并行計算崛起及創(chuàng)新GPU滲透率快速提升

    是時候重新教育整個生態(tài)了。邊緣AI的未來不屬于那些高度優(yōu)化但功能狹窄的芯片,而是屬于可編程的、可適配的并行計算平臺,它們能與智能軟件共同成長并擴展。
    的頭像 發(fā)表于 06-11 14:57 ?679次閱讀

    并行計算的崛起:為什么GPU將在邊緣AI中取代NPU

    人工智能(AI)不僅是一項技術(shù)突破,它更是軟件編寫、理解和執(zhí)行方式的一次永久性變革。傳統(tǒng)的軟件開發(fā)基于確定性邏輯和大多是順序執(zhí)行的流程,而如今這一范式正在讓位于概率模型、訓(xùn)練行為以及數(shù)據(jù)驅(qū)動的計算
    的頭像 發(fā)表于 06-06 14:55 ?703次閱讀
    <b class='flag-5'>并行計算</b>的崛起:為什么<b class='flag-5'>GPU</b>將在邊緣<b class='flag-5'>AI</b>中取代NPU

    Imagination與澎峰科技攜手推動GPU+AI解決方案,共拓計算生態(tài)

    的繁榮發(fā)展。 本次合作將聚焦以下兩大方向: 聯(lián)合打造面向AI應(yīng)用的高性能計算解決方案 ? 依托 Imagination GPU并行計算和能效
    發(fā)表于 05-21 09:40 ?1220次閱讀

    讀懂極易并行計算:定義、挑戰(zhàn)與解決方案

    GPU經(jīng)常與人工智能同時提及,其中一個重要原因在于AI與3D圖形處理本質(zhì)上屬于同一類問題——它們都適用極易并行計算。什么是極易并行計算?極易并行計算
    的頭像 發(fā)表于 04-17 09:11 ?821次閱讀
    讀懂極易<b class='flag-5'>并行計算</b>:定義、挑戰(zhàn)與解決方案

    使用NVIDIA RTX PRO Blackwell系列GPU加速AI開發(fā)

    NVIDIA GTC 推出新一代專業(yè)級 GPUAI 賦能的開發(fā)者工具—同時,ChatRTX 更新現(xiàn)已支持 NVIDIA NIM,RTX Remix 正式結(jié)束測試階段,本月的
    的頭像 發(fā)表于 03-28 09:59 ?1306次閱讀

    通用汽車和NVIDIA合作構(gòu)建定制化AI系統(tǒng)

    通用汽車和 NVIDIA 宣布正在借助 AI、仿真和加速計算技術(shù),合作打造下一代汽車、工廠和機器人。
    的頭像 發(fā)表于 03-20 14:40 ?1739次閱讀