91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Fugaku超級(jí)計(jì)算機(jī)程序已實(shí)現(xiàn)100倍的速度提升

NVIDIA英偉達(dá)企業(yè)解決方案 ? 來源:NVIDIA英偉達(dá)企業(yè)解決方案 ? 作者:NVIDIA英偉達(dá)企業(yè)解 ? 2021-12-28 09:26 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在不到18個(gè)月的時(shí)間里,密歇根大學(xué)的一個(gè)團(tuán)隊(duì)采用GPU,為一個(gè)基于復(fù)雜數(shù)學(xué)的程序?qū)崿F(xiàn)了20倍的提速。該程序?yàn)榱孔涌茖W(xué)奠定了基礎(chǔ)。

Vikram Gavini 的實(shí)驗(yàn)室以創(chuàng)紀(jì)錄的速度,跨越了微觀世界的一座重要里程碑。

這支由三人組成的密歇根大學(xué)團(tuán)隊(duì)創(chuàng)建了一個(gè)使用復(fù)雜的數(shù)學(xué)來深入觀察原子世界的程序。該程序?qū)⑼苿?dòng)許多科學(xué)領(lǐng)域的發(fā)展,以及多重領(lǐng)域的設(shè)計(jì)工作——從更輕的汽車到更高效的藥物。

憑借 GPU ,該團(tuán)隊(duì)開放源碼庫(kù)中的代碼在短短18個(gè)月內(nèi)實(shí)現(xiàn)了20倍速度提升。

通往Summit的旅程

2018年年中,當(dāng)該團(tuán)隊(duì)正準(zhǔn)備發(fā)布一個(gè)在 CPU 上運(yùn)行的代碼版本時(shí),他們收到了橡樹嶺國(guó)家實(shí)驗(yàn)室 GPU 黑客馬拉松的邀請(qǐng)。全球最快的超級(jí)計(jì)算機(jī)之一—— Summit 就位于該實(shí)驗(yàn)室。

機(jī)械工程和材料科學(xué)教授 Gavini 表示:“我們當(dāng)時(shí)的想法是看看我們能實(shí)現(xiàn)什么。”

該實(shí)驗(yàn)室的博士后 Sambit Das 參加了這場(chǎng)為期五天的活動(dòng)。他認(rèn)為:“我們很快意識(shí)到我們的代碼可以充分發(fā)揮GPU大規(guī)模并行處理的能力?!?/p>

在活動(dòng)結(jié)束前, Das 和另一位實(shí)驗(yàn)室成員 Phani Motamarri 將代碼轉(zhuǎn)移到 CUDA 及其庫(kù)中,實(shí)現(xiàn)了5倍速度提升。這也讓他們意識(shí)到,未來能實(shí)現(xiàn)的還有更多。

6個(gè)月內(nèi)實(shí)現(xiàn)從5倍到20倍的速度提升

在接下來的幾個(gè)月里,該實(shí)驗(yàn)室繼續(xù)對(duì)該程序進(jìn)行調(diào)優(yōu),使其能夠?qū)?萬個(gè)鎂原子中的10萬個(gè)電子進(jìn)行分析。到2019年初,該程序已經(jīng)可以在 Summit 上運(yùn)行。

隨著 Summit 的節(jié)點(diǎn)數(shù)量不斷增加,該實(shí)驗(yàn)室采用迭代法,在節(jié)點(diǎn)上運(yùn)行越來越多的代碼。截止4月,該實(shí)驗(yàn)室使用了該系統(tǒng)27,000個(gè) GPU 中的大部分,實(shí)現(xiàn)了近 46 petaflops 的性能,達(dá)到了之前的20倍。

對(duì)于一個(gè)基于密度泛函理論(DFT)的程序來說,這是一個(gè)前所未有的結(jié)果。密度函數(shù)理論是一項(xiàng)解釋亞原子粒子之間量子相互作用的復(fù)雜數(shù)學(xué)理論。

適用于高難度算法的分布式計(jì)算

DFT 算法的復(fù)雜性和基礎(chǔ)性使其目前占用了所有公共研究計(jì)算機(jī)四分之一的時(shí)間。在被引用次數(shù)最多的100篇科學(xué)論文中,有12篇是 DFT 為主題的。該計(jì)算還被用來分析從天體物理學(xué)到 DNA 鏈的一切。

最初,根據(jù)該實(shí)驗(yàn)室的報(bào)告,該程序使用了 Summit 的頂尖理論性能的近30%,這是一個(gè)異常高的效率。相比之下,大多數(shù)其他 DFT 代碼除了能夠使用數(shù)個(gè)處理器之外,很難實(shí)現(xiàn)進(jìn)一步的擴(kuò)展,因此就連效率報(bào)告都沒有。

Gavini 表示:“能實(shí)現(xiàn)這一前所未有的效率令我們感到非常高興?!?/p>

聲名鵲起

2019年底,該團(tuán)隊(duì)被提名為戈登貝爾獎(jiǎng)的入圍者。這是該實(shí)驗(yàn)室首次參加這一“高性能計(jì)算領(lǐng)域諾貝爾獎(jiǎng)”的評(píng)選。

Gavini 表示:“這為我們的實(shí)驗(yàn)室和大學(xué)帶來了很高的知名度,我認(rèn)為這次努力還只是一個(gè)開始?!?/p>

事實(shí)上,自評(píng)選以來,實(shí)驗(yàn)室在 Summit 上,將代碼的性能提升到了 64 petaflops ,效率亦達(dá)到38%。并且該實(shí)驗(yàn)室已經(jīng)在探索在其他系統(tǒng)和應(yīng)用上的使用。

尋求更多的應(yīng)用和更高的性能

最初,這項(xiàng)工作被用于分析鎂。這種比當(dāng)今汽車和飛機(jī)使用的鋼和鋁輕得多的金屬有望大幅節(jié)省燃料。去年,該實(shí)驗(yàn)室與另一團(tuán)隊(duì)合作,研究電子在 DNA 中的移動(dòng)方式,這項(xiàng)工作可以幫助其他研究者研發(fā)出更有效的藥物。

接下來重要的一步是在 Perlmutter 上運(yùn)行代碼。這是一臺(tái)使用最新 NVIDIA A100 Tensor Core GPU 的超級(jí)計(jì)算機(jī)。根據(jù)Das的報(bào)告,基于A100 GPU對(duì)TensorFloat-32的支持,與 Summit GPU 相比,這臺(tái)計(jì)算機(jī)目前已經(jīng)實(shí)現(xiàn)了4倍速度提升。TensorFloat-32 是一種既能提供快速結(jié)果,又能實(shí)現(xiàn)高精度的混合精度格式。

與其他 DFT 代碼相比,該實(shí)驗(yàn)室程序已實(shí)現(xiàn)100倍的速度提升,但 Gavini 并沒有就此止步。他已經(jīng)在考慮在 Fugaku 上測(cè)試它。Fugaku 是基于 Arm 系統(tǒng)的全球最快的超級(jí)計(jì)算機(jī)。

他表示:“眼下的收獲總會(huì)令人欣喜,但‘路漫漫其修遠(yuǎn)兮,吾將上下而求索’。這次的成果也是我們新征程的開始?!?/p>

原文標(biāo)題:借助數(shù)學(xué)的力量:密歇根團(tuán)隊(duì)破解亞原子世界的密碼

文章出處:【微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

審核編輯:彭菁
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5196

    瀏覽量

    135515
  • 計(jì)算機(jī)
    +關(guān)注

    關(guān)注

    19

    文章

    7809

    瀏覽量

    93232
  • 代碼
    +關(guān)注

    關(guān)注

    30

    文章

    4968

    瀏覽量

    74010

原文標(biāo)題:借助數(shù)學(xué)的力量:密歇根團(tuán)隊(duì)破解亞原子世界的密碼

文章出處:【微信號(hào):NVIDIA-Enterprise,微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    使用NVIDIA技術(shù)驅(qū)動(dòng)的超級(jí)計(jì)算機(jī)助力開放科學(xué)研究

    五個(gè)備受矚目的 HPC 獎(jiǎng)決賽入圍項(xiàng)目憑借 Alps、JUPITER 和 Perlmutter 超級(jí)計(jì)算機(jī)的支持在氣候建模、流體模擬等領(lǐng)域取得了重大突破。
    的頭像 發(fā)表于 11-25 11:17 ?835次閱讀

    快450000000!超導(dǎo)量子計(jì)算機(jī)“天衍-287”建成

    平臺(tái)誕生,處理特定問題的速度較當(dāng)前最快超級(jí)計(jì)算機(jī)快4.5億,成為全球量子計(jì)算實(shí)用化進(jìn)程中的關(guān)鍵里程碑。 ? ? “天衍-287”的核心競(jìng)爭(zhēng)
    的頭像 發(fā)表于 11-18 08:40 ?8645次閱讀
    快450000000<b class='flag-5'>倍</b>!超導(dǎo)量子<b class='flag-5'>計(jì)算機(jī)</b>“天衍-287”建成

    谷歌芯片實(shí)現(xiàn)量子計(jì)算新突破,比超算快13000

    在特定任務(wù)上的運(yùn)行速度比傳統(tǒng)超級(jí)計(jì)算機(jī)快13000,并且這種算法可以在類似平臺(tái)上得到重現(xiàn)。 ? 量子比特極易受到環(huán)境干擾,導(dǎo)致計(jì)算錯(cuò)誤,這
    的頭像 發(fā)表于 10-27 06:51 ?9697次閱讀

    今日看點(diǎn):谷歌芯片實(shí)現(xiàn)量子計(jì)算比經(jīng)典超算快13000;NFC 技術(shù)突破:讀取距離從 5 毫米提升至 20 毫米

    性能甚至超越了最快的經(jīng)典超級(jí)計(jì)算機(jī)速度快 13000 。 ? Willow是谷歌于去年12月宣布推出的量子芯片。當(dāng)時(shí),Willow量子芯片在5分鐘內(nèi)完成了一項(xiàng)傳統(tǒng)
    發(fā)表于 10-23 10:20 ?1560次閱讀

    NVIDIA助力AI超級(jí)計(jì)算機(jī)Isambard-AI投入使用

    英國(guó)布里斯托大學(xué)的超級(jí)計(jì)算機(jī) Isambard-AI 采用 NVIDIA Grace Hopper 超級(jí)芯片,其 AI 算力達(dá)到了 21 ExaFLOPS,不僅是英國(guó)最快的系統(tǒng),同時(shí)也是全球能效最高的系統(tǒng)之一。
    的頭像 發(fā)表于 07-28 15:07 ?1254次閱讀

    自動(dòng)化計(jì)算機(jī)的功能與用途

    工業(yè)自動(dòng)化是指利用自動(dòng)化計(jì)算機(jī)來控制工業(yè)環(huán)境中的流程、機(jī)器人和機(jī)械,以制造產(chǎn)品或其部件。工業(yè)自動(dòng)化的目的是提高生產(chǎn)率、增加靈活性,并提升制造過程的質(zhì)量。工業(yè)自動(dòng)化在汽車制造中體現(xiàn)得最為明顯,其中許多
    的頭像 發(fā)表于 07-15 16:32 ?751次閱讀
    自動(dòng)化<b class='flag-5'>計(jì)算機(jī)</b>的功能與用途

    NVIDIA驅(qū)動(dòng)的現(xiàn)代超級(jí)計(jì)算機(jī)如何突破速度極限并推動(dòng)科學(xué)發(fā)展

    現(xiàn)代高性能計(jì)算不僅使得更快的計(jì)算成為可能,它正驅(qū)動(dòng)著 AI 系統(tǒng)解鎖更多領(lǐng)域的科學(xué)突破。 高性能計(jì)算經(jīng)歷了多次迭代,每一次都源于對(duì)技術(shù)的創(chuàng)造性再利用。例如,早期的超級(jí)
    的頭像 發(fā)表于 06-26 19:39 ?1273次閱讀
    NVIDIA驅(qū)動(dòng)的現(xiàn)代<b class='flag-5'>超級(jí)</b><b class='flag-5'>計(jì)算機(jī)</b>如何突破<b class='flag-5'>速度</b>極限并推動(dòng)科學(xué)發(fā)展

    Blue Lion超級(jí)計(jì)算機(jī)將在NVIDIA Vera Rubin上運(yùn)行

    德國(guó)萊布尼茨超算中心(LRZ)將迎來全新超級(jí)計(jì)算機(jī) Blue Lion,其算力比該中心現(xiàn)有的 SuperMUC-NG 高性能計(jì)算機(jī)提升了約 30
    的頭像 發(fā)表于 06-12 15:39 ?1162次閱讀

    NVIDIA技術(shù)賦能歐洲最快超級(jí)計(jì)算機(jī)JUPITER

    NVIDIA 宣布,搭載 NVIDIA Grace Hopper 平臺(tái)的 JUPITER 超級(jí)計(jì)算機(jī)成為歐洲最快超級(jí)計(jì)算機(jī),其運(yùn)行 HPC 和 AI 工作負(fù)載的
    的頭像 發(fā)表于 06-12 15:33 ?1442次閱讀

    NVIDIA助力全球最大量子研究超級(jí)計(jì)算機(jī)

    NVIDIA 宣布將開設(shè)量子-AI 技術(shù)商業(yè)應(yīng)用全球研發(fā)中心(G-QuAT),該中心部署了全球最大量子計(jì)算研究專用超級(jí)計(jì)算機(jī) ABCI-Q。
    的頭像 發(fā)表于 05-22 09:44 ?911次閱讀

    一文帶你了解工業(yè)計(jì)算機(jī)尺寸

    一項(xiàng)艱巨的任務(wù)。本博客將指導(dǎo)您了解關(guān)鍵的工業(yè)計(jì)算機(jī)尺寸、使用案例。關(guān)鍵工業(yè)計(jì)算機(jī)外形要素及其使用案例一、工業(yè)微型PC尺寸范圍:寬度:100毫米-180毫米深度:10
    的頭像 發(fā)表于 04-24 13:35 ?1058次閱讀
    一文帶你了解工業(yè)<b class='flag-5'>計(jì)算機(jī)</b>尺寸

    計(jì)算機(jī)網(wǎng)絡(luò)入門指南

    計(jì)算機(jī)網(wǎng)絡(luò)是指將地理位置不同且具有獨(dú)立功能的多臺(tái)計(jì)算機(jī)及其外部設(shè)備,通過通信線路連接起來,在網(wǎng)絡(luò)操作系統(tǒng)、網(wǎng)絡(luò)管理軟件及網(wǎng)絡(luò)通信協(xié)議的管理和協(xié)調(diào)下,實(shí)現(xiàn)資源共享和信息傳遞的計(jì)算機(jī)系統(tǒng)。
    的頭像 發(fā)表于 04-22 14:29 ?2275次閱讀
    <b class='flag-5'>計(jì)算機(jī)</b>網(wǎng)絡(luò)入門指南

    AWG全新DDS固件如何提升量子計(jì)算機(jī)的開發(fā)效率?

    凱澤斯勞滕理工大學(xué)通過引入先進(jìn)的德思特任意波形發(fā)生器(AWG)新DDS固件選件,顯著加速了量子計(jì)算機(jī)的開發(fā)進(jìn)程。德思特帶您了解AWG全新DDS固件如何提升量子計(jì)算機(jī)的開發(fā)效率。
    的頭像 發(fā)表于 03-21 16:50 ?776次閱讀
    AWG全新DDS固件如何<b class='flag-5'>提升</b>量子<b class='flag-5'>計(jì)算機(jī)</b>的開發(fā)效率?

    NVIDIA 宣布推出 DGX Spark 個(gè)人 AI 計(jì)算機(jī)

    臺(tái)式超級(jí)計(jì)算機(jī)由 NVIDIA Grace Blackwell 驅(qū)動(dòng),為開發(fā)者、研究人員和數(shù)據(jù)科學(xué)家提供加速 AI 功能;系統(tǒng)由頭部計(jì)算機(jī)制造商(包括華碩、Dell Technologies、HP
    發(fā)表于 03-19 09:59 ?792次閱讀
       NVIDIA 宣布推出 DGX Spark 個(gè)人 AI <b class='flag-5'>計(jì)算機(jī)</b>

    超級(jí)計(jì)算與 HPC 之間的界限日趨模糊

    本文由半導(dǎo)體產(chǎn)業(yè)縱橫(ID:ICVIEWS)編譯自semiengineering由于人工智能和分解而加速的性能改進(jìn)正在推動(dòng)計(jì)算前沿的重大變革。由于人工智能的普及,超級(jí)計(jì)算機(jī)和高性能計(jì)算機(jī)
    的頭像 發(fā)表于 03-17 10:33 ?1034次閱讀
    <b class='flag-5'>超級(jí)</b><b class='flag-5'>計(jì)算</b>與 HPC 之間的界限日趨模糊