91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Cygnus超算成為第一臺(tái)進(jìn)入超算top500榜單的GPU、FPGA混合加速超級(jí)計(jì)算機(jī)

DPVg_AI_era ? 來(lái)源:lp ? 2019-04-21 09:39 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

異構(gòu)超級(jí)計(jì)算機(jī)時(shí)代已經(jīng)到來(lái)。近日,日本筑波大學(xué)上線(xiàn)的Cygnus超算成為第一臺(tái)進(jìn)入超算top500榜單的GPUFPGA混合加速超級(jí)計(jì)算機(jī)。在如何讓CPU、GPU、FPGA多硬件協(xié)調(diào)、高效、同步提供算力上邁出了重要一步。

如果說(shuō)“異構(gòu)超級(jí)計(jì)算機(jī)”的時(shí)代已經(jīng)到來(lái),那么本月早些時(shí)候在日本筑波大學(xué)上線(xiàn)的 CPU、GPU、FPGA混合硬件超算系統(tǒng)就是這個(gè)時(shí)代的首批探索者之一。

這臺(tái)超算名為Cygnus,由NEC制造,目前在日本筑波大計(jì)算科學(xué)中心(CCS)運(yùn)行,由Intel Xeon CPU,Nvidia Tesla GPU和Intel Stratix 10 FPGA共同提供硬件支持。

Cygnus系統(tǒng)架構(gòu):所有80個(gè)Cygnus節(jié)點(diǎn)都配備了兩個(gè)Xeon“Skylake”黃金 CPU和四個(gè)Tesla V100 GPU,同時(shí)在32個(gè)節(jié)點(diǎn)中,還和GPU搭載了兩個(gè)Stratix 10 FPGA。48個(gè)CPU-GPU專(zhuān)用節(jié)點(diǎn)稱(chēng)為“Deneb節(jié)點(diǎn)”(以最亮的Cygnus A星命名),而32個(gè)CPU-GPU-FPGA節(jié)點(diǎn)稱(chēng)為Albireo節(jié)點(diǎn)(以Cygnus A雙星命名)。

FPGA型號(hào)為Bittware 520N PCIe卡,供應(yīng)商為Nallatech,這些“重型”FPGA卡可以提供10 teraflops的單精度性能,以及四組DDR4內(nèi)存。尤其是,該卡配備了四個(gè)100G光纖網(wǎng)絡(luò)端口,共提供400Gbps帶寬,可以通過(guò)自身結(jié)構(gòu)直接與其他520N FPGA進(jìn)行通信。在Cygnus中,可將8×8的2D環(huán)形網(wǎng)絡(luò)中的64個(gè)FPGA相互連接。Bittware包括一個(gè)板級(jí)支持包(BSP),可供OpenCL開(kāi)發(fā)人員使用。

每個(gè)Cygnus節(jié)點(diǎn)的雙精度浮點(diǎn)性能為30 teraflops,其中28個(gè)節(jié)點(diǎn)算力由四個(gè)V100 GPU提供。由兩個(gè)Stratix 10器件在配備FPGA的節(jié)點(diǎn)上提供20個(gè)單精度teraflops。整機(jī)可提供算力為2.4 petaflop(64位浮點(diǎn))或5.12 petaflop(32位浮點(diǎn))算力。

目前,Cygnus正在取代該機(jī)構(gòu)之前使用的COMA,COMA是一款由Intel Xeon CPU和Xeon Phi協(xié)處理器驅(qū)動(dòng)的Cray CS300計(jì)算機(jī)集群。它于2014年組建,今年3月底退役,為Cygnus讓位。

Mellanox HDR InfiniBand負(fù)責(zé)Cygnus上的系統(tǒng)互連,與獨(dú)立的FPGA網(wǎng)絡(luò)一樣,系統(tǒng)設(shè)計(jì)人員確保了足夠的帶寬來(lái)進(jìn)行節(jié)點(diǎn)間通信。每個(gè)節(jié)點(diǎn)使用四個(gè)100Gbps HDR通道,連接為全二分fat樹(shù)網(wǎng)絡(luò)。InfiniBand網(wǎng)絡(luò)還用于訪(fǎng)問(wèn)托管在DataDirect Networks ES14KX設(shè)備上的2.5 PB Lustre文件系統(tǒng)。

盡管“雙加速硬件”的設(shè)定很新潮,但其實(shí)Cygnus并不是試驗(yàn)機(jī)。其組建的主要用途是為宇宙學(xué)、粒子物理學(xué)、生命科學(xué)和人工智能等領(lǐng)域科學(xué)研究提供生產(chǎn)力。通過(guò)CPUGPUFPGA的組合,力求在實(shí)際科學(xué)研究中最有效地發(fā)揮這些硬件各自的計(jì)算優(yōu)勢(shì)。

具體來(lái)說(shuō),GPU負(fù)責(zé)提供粗粒度并行計(jì)算,主要擅長(zhǎng)SIMD友好型計(jì)算,而FPGA提供細(xì)粒度并行計(jì)算,更適合應(yīng)用于非SIMD算法。而對(duì)于氣候模擬,生物信息學(xué)、分子動(dòng)力學(xué)、地球物理學(xué)和線(xiàn)性代數(shù)中使用的一些特定算法,F(xiàn)PGA已經(jīng)證明能夠?qū)崿F(xiàn)比CPU、GPU更快、更高效的運(yùn)算。不過(guò),在科學(xué)上可以通過(guò)代碼同時(shí)高效利用這兩種架構(gòu)。

Cygnus系統(tǒng)架構(gòu)圖

Cygnus的目標(biāo)應(yīng)用之一是模擬早期宇宙,模擬光源的輻射傳輸。模擬過(guò)程是在一個(gè)套為ARGOT的代碼中實(shí)現(xiàn)的,其中名為“ART”(真實(shí)輻射傳輸)的光線(xiàn)追蹤算法是該模擬中的重要部分,ART部分更適合FPGA硬件平臺(tái)上的大規(guī)模運(yùn)行。

不過(guò),ARGOT的其他部分在GPU上運(yùn)行更合適,因此利用“雙硬件加速”成為最佳解決方案。該應(yīng)用程序在GPU和FPGA之間使用基于PCIe的直接存儲(chǔ)器訪(fǎng)問(wèn)來(lái)實(shí)現(xiàn)協(xié)調(diào),避免了使CPU受到影響而出現(xiàn)延遲。

ART實(shí)現(xiàn)是使用相對(duì)較高級(jí)別的OpenCL實(shí)現(xiàn)的,這表明其他開(kāi)發(fā)人員也可以這樣做。Bittware方面表示,使用OpenCL實(shí)現(xiàn)的用戶(hù)與嚴(yán)格使用硬件描述語(yǔ)言(HDL)實(shí)現(xiàn)的用戶(hù)進(jìn)行對(duì)比發(fā)現(xiàn),在許多情況下,OpenCL實(shí)現(xiàn)在性能方面與后者“足夠接近”。

過(guò)去幾年來(lái),F(xiàn)PGA軟件開(kāi)發(fā)的進(jìn)展促使微軟、亞馬遜和百度等巨頭越來(lái)越廣泛地采用FPGA硬件,尤其是在機(jī)器學(xué)習(xí)和推理等應(yīng)用上。

但是,在高性能計(jì)算平臺(tái)中,使用FPGA的設(shè)備更少。筑波大學(xué)的這臺(tái)Cygnus將是唯一一個(gè)進(jìn)入超算TOP500榜單的采用FPGA加速的超級(jí)計(jì)算機(jī)。德國(guó)帕德博恩大學(xué)去年安裝了一臺(tái)使用FPGA的超算,Cray CS500超級(jí)計(jì)算機(jī),配備了32塊Bittware 520N卡,不過(guò)該機(jī)沒(méi)有配備GPU。

還有一些其他FPGA式的HPC集群遍布世界各地,包括美國(guó)佛羅里達(dá)州的CHREC(現(xiàn)改稱(chēng)SHREC)的Nova-G#系統(tǒng),英國(guó)Hartree中心的Maxeler HPC-X以及Catapult 1和TACC的HARP v2計(jì)算機(jī)集群。

未來(lái)是否會(huì)有更多更強(qiáng)大的異構(gòu)超級(jí)計(jì)算機(jī)誕生?這不僅取決于使用者的需求,更多還要取決于硬件廠(chǎng)商和開(kāi)發(fā)者是否繼續(xù)從上到下推動(dòng)生態(tài)系統(tǒng)建設(shè)。

從Bittware的角度來(lái)看,關(guān)鍵的推動(dòng)力一定是來(lái)自中間層面的,同時(shí)有賴(lài)于對(duì)高級(jí)語(yǔ)言和更成熟的開(kāi)發(fā)工具更充分的支持。目前的好消息是,業(yè)界最大的兩家FPGA制造商——英特爾和賽林思都在為開(kāi)發(fā)人員提供更好的工具,并將這些工具與下一代FPGA產(chǎn)品整合在一起。

從這一點(diǎn)上看,我們似乎可以對(duì)異構(gòu)超算的未來(lái)保持一份謹(jǐn)慎的樂(lè)觀。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • FPGA
    +關(guān)注

    關(guān)注

    1660

    文章

    22428

    瀏覽量

    637010
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5205

    瀏覽量

    135585
  • 超級(jí)計(jì)算機(jī)

    關(guān)注

    2

    文章

    482

    瀏覽量

    43402

原文標(biāo)題:迎接“異構(gòu)超算”新時(shí)代:日本Cygnus超算GPU和FPGA雙硬件加持,TOP500榜單只此一臺(tái)

文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    AI驅(qū)動(dòng)量子化學(xué)計(jì)算!4100萬(wàn)核心國(guó)產(chǎn)取得世界級(jí)突破!

    電子發(fā)燒友網(wǎng)報(bào)道(文/梁浩斌)中國(guó)的高光時(shí)刻,是2016年到2017年期間,神威·太湖之光連續(xù)四次登頂全球超級(jí)計(jì)算機(jī)TOP
    的頭像 發(fā)表于 10-26 06:15 ?1w次閱讀

    上汽大眾第一臺(tái)EA211黃金增程器正式下線(xiàn)

    近日,上汽大眾第一臺(tái)EA211黃金增程器正式下線(xiàn),并將率先搭載于ID. ERA 9X車(chē)型,新車(chē)將于3月底正式開(kāi)啟預(yù)售。作為MQB平臺(tái)的核心動(dòng)力基石之,EA211發(fā)動(dòng)機(jī)家族自2011年誕生以來(lái),全國(guó)累計(jì)保有量已突破2,000萬(wàn)臺(tái)
    的頭像 發(fā)表于 03-03 16:32 ?558次閱讀

    邁向云端力巔峰:昆侖芯K200 AI加速卡全面解讀

    槽位設(shè)計(jì),支持從計(jì)算機(jī)視覺(jué)到自然語(yǔ)言處理的混合精度計(jì)算。K200與邊緣側(cè)K100共享軟件生態(tài),實(shí)現(xiàn)云邊端力協(xié)同,為金融、政務(wù)等領(lǐng)域提供了高性能?chē)?guó)產(chǎn)化
    的頭像 發(fā)表于 12-14 11:17 ?1979次閱讀
    邁向云端<b class='flag-5'>算</b>力巔峰:昆侖芯K200 AI<b class='flag-5'>加速</b>卡全面解讀

    深圳中國(guó)首個(gè)光量子計(jì)算機(jī)制造工廠(chǎng)落成

    據(jù)央視新聞報(bào)道;在24日;深圳南山區(qū)國(guó)內(nèi)首個(gè)光量子計(jì)算機(jī)制造工廠(chǎng)正式進(jìn)入小規(guī)模生產(chǎn)階段,據(jù)悉該工廠(chǎng)是隸屬于玻色量子;總面積約5000平方米,集研發(fā)、制造、測(cè)試于體,用于實(shí)現(xiàn)光量子計(jì)算機(jī)
    的頭像 發(fā)表于 11-25 17:17 ?2056次閱讀

    CCF HPC China 2025鄂爾多斯完美謝幕,共譜新篇章

    全球三大盛會(huì)之,本屆大會(huì)延續(xù) “學(xué)術(shù)引領(lǐng)、產(chǎn)業(yè)融合” 特色,以學(xué)術(shù)研討的深度突破為核心,聯(lián)動(dòng)全球力產(chǎn)業(yè)生態(tài)視野,交出了份兼具學(xué)術(shù)高
    的頭像 發(fā)表于 08-21 13:06 ?524次閱讀
    CCF HPC China 2025鄂爾多斯完美謝幕,共譜<b class='flag-5'>超</b><b class='flag-5'>算</b>新篇章

    能發(fā)布節(jié)點(diǎn)服務(wù)器,128顆BM1690芯片組成

    的BM1690芯片組成的128顆芯片節(jié)點(diǎn),每層有16顆芯片,共8層,統(tǒng)裝在個(gè)服務(wù)器里。 ? 節(jié)點(diǎn)是通過(guò)高速互聯(lián)技術(shù),將大量服務(wù)器芯
    的頭像 發(fā)表于 08-03 07:33 ?7831次閱讀
    <b class='flag-5'>算</b>能發(fā)布<b class='flag-5'>超</b>節(jié)點(diǎn)服務(wù)器,128顆BM1690芯片組成

    力板卡:驅(qū)動(dòng)智能時(shí)代的核心引擎

    在人工智能、大數(shù)據(jù)和云計(jì)算高速發(fā)展的今天,力已成為推動(dòng)技術(shù)進(jìn)步的關(guān)鍵資源。作為力的物理載體,力板卡(如
    的頭像 發(fā)表于 08-01 10:25 ?1475次閱讀

    NVIDIA助力AI超級(jí)計(jì)算機(jī)Isambard-AI投入使用

    英國(guó)布里斯托大學(xué)的超級(jí)計(jì)算機(jī) Isambard-AI 采用 NVIDIA Grace Hopper 超級(jí)芯片,其 AI 力達(dá)到了 21 ExaFLOPS,不僅是英國(guó)最快的系統(tǒng),同時(shí)也
    的頭像 發(fā)表于 07-28 15:07 ?1281次閱讀

    NVIDIA驅(qū)動(dòng)的現(xiàn)代超級(jí)計(jì)算機(jī)如何突破速度極限并推動(dòng)科學(xué)發(fā)展

    ,研究人員用個(gè)人電腦構(gòu)建了強(qiáng)大的集群,甚至改造游戲顯卡,把它們用于科學(xué)研究。 當(dāng)今的高性能計(jì)算系統(tǒng)專(zhuān)為高速計(jì)算而設(shè)計(jì),其中許多都采用了 NVIDIA 加速計(jì)算技術(shù)。在 ISC 2025
    的頭像 發(fā)表于 06-26 19:39 ?1288次閱讀
    NVIDIA驅(qū)動(dòng)的現(xiàn)代<b class='flag-5'>超級(jí)</b><b class='flag-5'>計(jì)算機(jī)</b>如何突破速度極限并推動(dòng)科學(xué)發(fā)展

    【「力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗(yàn)】+NVlink技術(shù)從應(yīng)用到原理

    自家GPU 提出的多卡力互連技術(shù),是早期為了應(yīng)對(duì)深度學(xué)習(xí)對(duì)超高力需求而單卡力不足的局面的解決方案,當(dāng)然這都是官方用來(lái)吹牛的話(huà)術(shù)。我自己在2019年左右
    發(fā)表于 06-18 19:31

    軟通智完成億級(jí)A輪融資,加速AI力產(chǎn)業(yè)布局

    北京 2025年6月18日 /美通社/ -- 近日,軟通動(dòng)力旗下軟通智科技(廣東)集團(tuán)有限公司(以下簡(jiǎn)稱(chēng)"軟通智")完成億級(jí)A輪融資,本輪融資由盛景嘉成創(chuàng)投領(lǐng)投,廣發(fā)信德、毅達(dá)資本等多家知名
    的頭像 發(fā)表于 06-18 15:37 ?600次閱讀

    Blue Lion超級(jí)計(jì)算機(jī)將在NVIDIA Vera Rubin上運(yùn)行

    德國(guó)萊布尼茨中心(LRZ)將迎來(lái)全新超級(jí)計(jì)算機(jī) Blue Lion,其力比該中心現(xiàn)有的 SuperMUC-NG 高性能
    的頭像 發(fā)表于 06-12 15:39 ?1174次閱讀

    NVIDIA技術(shù)賦能歐洲最快超級(jí)計(jì)算機(jī)JUPITER

    NVIDIA 宣布,搭載 NVIDIA Grace Hopper 平臺(tái)的 JUPITER 超級(jí)計(jì)算機(jī)成為歐洲最快超級(jí)計(jì)算機(jī),其運(yùn)行 HPC
    的頭像 發(fā)表于 06-12 15:33 ?1464次閱讀

    加速卡是什么東西?它真能在AI戰(zhàn)場(chǎng)上干掉GPU和TPU!

    隨著AI技術(shù)火得塌糊涂,大家都在談"大模型"、"AI加速"、"智能計(jì)算",可真到了落地環(huán)節(jié),力才是硬通貨。你有沒(méi)有發(fā)現(xiàn),現(xiàn)在越來(lái)越多的AI企業(yè)不光用
    的頭像 發(fā)表于 06-05 13:39 ?1702次閱讀
    智<b class='flag-5'>算</b><b class='flag-5'>加速</b>卡是什么東西?它真能在AI戰(zhàn)場(chǎng)上干掉<b class='flag-5'>GPU</b>和TPU!

    力領(lǐng)域常用名詞解釋

    、力評(píng)估指標(biāo)以及力戰(zhàn)略概念?;A(chǔ)概念力(ComputingPower):是指計(jì)算機(jī)系統(tǒng)處理數(shù)據(jù)的能力。它通常用FLOPS(每秒浮點(diǎn)運(yùn)算次數(shù))來(lái)衡量,表示
    的頭像 發(fā)表于 04-07 11:21 ?1593次閱讀
    <b class='flag-5'>算</b>力領(lǐng)域常用名詞解釋