91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Arm Neoverse家族新增V1和N2兩大平臺(tái),突破高性能計(jì)算瓶頸

E4Life ? 來(lái)源:電子發(fā)燒友原創(chuàng) ? 作者:周凱揚(yáng) ? 2021-04-30 16:20 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Arm 近日公開了Arm? Neoverse V1 和 N2 平臺(tái)的產(chǎn)品細(xì)節(jié),兩者滿足了基礎(chǔ)設(shè)施應(yīng)用的各種需求。這兩個(gè)平臺(tái)的設(shè)計(jì)旨在解決當(dāng)前正在運(yùn)行的各種工作負(fù)載和應(yīng)用問題,與上一代N1相比,并分別帶來(lái) 50%和 40%的性能提升。此外,Arm也同時(shí)發(fā)布了CMN-700,作為構(gòu)建基于Neoverse V1和 N2 平臺(tái)高性能SoC的關(guān)鍵部件。

Neoverse V1:最寬微架構(gòu)+SVE矢量運(yùn)算

Neoverse V1平臺(tái) / Arm

與上一代N1相比,Neoverse V1帶來(lái)了50%的性能提升和1.8倍的矢量工作負(fù)載優(yōu)化、以及4倍的機(jī)器學(xué)習(xí)工作負(fù)載優(yōu)化。得益于Arm迄今為止最寬的微架構(gòu)以及SVE功能,Neoverse V1可以容納更多運(yùn)行中的指令,延長(zhǎng)了代碼存活期,也為芯片設(shè)計(jì)人員提供了靈活性。Arm 現(xiàn)有的 SIMD 指令集 NEON 難以對(duì)某些代碼進(jìn)行矢量化處理,而 SVE 可以直接取用相同的代碼,并很好地對(duì)其進(jìn)行自動(dòng)矢量化,相比于 NEON,SVE可將處理速度提高近3.5倍。

已經(jīng)用到Neoverse V1的HPC項(xiàng)目 / Arm

目前法國(guó)芯片公司SiPearl、印度信息技術(shù)部(MEITY)韓國(guó)電子通信研究所(ETRI)都在各自的HPC項(xiàng)目中用到了Neoverse V1。

Neoverse N2:首個(gè)Armv9+SVE2平臺(tái)

Neoverse N2提高云端到邊緣性能效率 / Arm

Arm在幾周前發(fā)布了Armv9架構(gòu),以滿足全球?qū)o(wú)所不在的專用處理能力的需求,而新公布的Neoverse N2平臺(tái)正是第一個(gè)基于Armv9架構(gòu)的平臺(tái)。

SVE2 / Arm
相比于N1,Neoverse N2在保持相同水平的功率和面積效率的基礎(chǔ)上,單線程性能提升了40%。不僅如此,Neoverse N2也是第一個(gè)具備SVE2功能的平臺(tái),作為SVE和Neon的超集,SVE2為云端到邊緣的性能效率帶來(lái)了巨大提升。SVE主要用于加速HPC,而SVE2可廣泛運(yùn)用于機(jī)器學(xué)習(xí)、數(shù)字信號(hào)處理和5G等應(yīng)用場(chǎng)景,同時(shí)兼具SVE的編程簡(jiǎn)易性和可移植性等優(yōu)勢(shì)。

CMN-700:下一代總線賦能異構(gòu)SoC

Neoverse CMN-700 / Arm

作為上一代CMN-600的升級(jí),CMN-700支持的最大核心數(shù)可達(dá)512顆。通過對(duì)CCIX 2.0和CXL 2.0的支持,也為客戶提供了更多的定制和擴(kuò)展選項(xiàng),為緊密耦合的異構(gòu)計(jì)算提供了更大的靈活性。

異構(gòu)計(jì)算的趨勢(shì)

隨著異構(gòu)計(jì)算的逐步發(fā)展,我們已經(jīng)看到了很多CPUGPU搭配的趨勢(shì),比如英偉達(dá)近期公布的基于Arm Neoverse的Grace芯片,就是一個(gè)用于AI超算的CPU。英偉達(dá)在互聯(lián)技術(shù)上采用的是自研的NVLink技術(shù),而非PCIE。Arm基礎(chǔ)設(shè)施事業(yè)部高級(jí)副總裁兼總經(jīng)理 Chris Bergey提到,與多樣化的加速器功能進(jìn)行互聯(lián),比如AI加速器,這對(duì)未來(lái)的市場(chǎng)時(shí)相當(dāng)關(guān)鍵的。比如CMN-700已經(jīng)支持了CXL和CCIX這樣的互聯(lián)標(biāo)準(zhǔn),未來(lái)Arm期待給市場(chǎng)帶來(lái)更多的靈活性,并支持更多像Grace這樣的系統(tǒng)。

這樣的異構(gòu)趨勢(shì)也囊括了FPGA,Arm基礎(chǔ)設(shè)施事業(yè)部全球高級(jí)總監(jiān)鄒挺補(bǔ)充道,現(xiàn)在已經(jīng)有合作伙伴將Neoverse N2和FPGA加速卡放在異構(gòu)計(jì)算系統(tǒng)中使用。有的Arm合作伙伴還將FPGA加速器和N2放在一個(gè)芯片上做成SoC,通過Chiplet的技術(shù)來(lái)實(shí)現(xiàn)異構(gòu)計(jì)算的靈活性。

公有云的廣泛應(yīng)用

騰訊云加碼Arm生態(tài) / Arm 騰訊云

Neoverse的廣泛應(yīng)用在公有云廠商中尤為明顯,比如AWS、阿里云和騰訊云等。騰訊專項(xiàng)測(cè)試技術(shù)中心總監(jiān)黃聞欣提到騰訊去年和Arm正式簽署了一份合作協(xié)議,希望通過合作加速Arm Neoverse技術(shù)的測(cè)評(píng)和適配。通過TencentBench測(cè)試框架發(fā)現(xiàn),得益于更多可擴(kuò)展的CPU核心數(shù),Arm服務(wù)器比傳統(tǒng)的服務(wù)器性能表現(xiàn)更強(qiáng)勁,尤其是在AI推理和圖片處理領(lǐng)域。

Arm架構(gòu)為Java性能帶來(lái)的提升 / Arm 阿里云

阿里巴巴首席工程師周經(jīng)森(Kingsum Chow)談道:Arm的CPU資源的話,在我們現(xiàn)有的軟件里會(huì)有兩個(gè)考慮的點(diǎn),一個(gè)是我們有些軟件是需要重新編譯的,另外一種不需要重新編譯,只需要我們把Java applications在JVM(Java Virtual Machine)上跑好就可以了。在這方面,一年之前,我們就跟Arm的員工一起合作,把JVM的性能提高。過去一年里,我們從JDK8到JDK11,通過OpenJDK, 通過阿里巴巴 Dragonwell(OpenJDK的一個(gè)發(fā)行版),就把我們現(xiàn)有一些Java應(yīng)用的一些性能提高了50%。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • ARM
    ARM
    +關(guān)注

    關(guān)注

    135

    文章

    9553

    瀏覽量

    391861
  • HPC
    HPC
    +關(guān)注

    關(guān)注

    0

    文章

    346

    瀏覽量

    24974
  • 高性能計(jì)算
    +關(guān)注

    關(guān)注

    0

    文章

    96

    瀏覽量

    13808
  • Neoverse
    +關(guān)注

    關(guān)注

    0

    文章

    16

    瀏覽量

    4969
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    如何在Arm Neoverse N2平臺(tái)上提升llama.cpp擴(kuò)展性能

    跨 NUMA 內(nèi)存訪問可能會(huì)限制 llama.cpp 在 Arm Neoverse 平臺(tái)上的擴(kuò)展能力。本文將為你詳細(xì)分析這一問題,并通過引入原型驗(yàn)證補(bǔ)丁來(lái)加以解決。測(cè)試結(jié)果表明,在基于 Neo
    的頭像 發(fā)表于 02-11 10:06 ?165次閱讀

    HZ-RK3506G2-MiniEVM技術(shù)規(guī)格說(shuō)明書V1

    HZ-RK3506G2-MiniEVM技術(shù)規(guī)格說(shuō)明書V1
    發(fā)表于 01-21 14:14 ?0次下載

    Arm Neoverse平臺(tái)集成NVIDIA NVLink Fusion

    生態(tài)系統(tǒng),實(shí)現(xiàn)全緩存一致性與高帶寬互連。 隨著 AI 數(shù)據(jù)中心對(duì) Arm Neoverse 的需求持續(xù)增長(zhǎng),客戶在將工作負(fù)載加速器連接至 Arm 平臺(tái)時(shí)擁有更多選擇。 人工智能 (A
    的頭像 發(fā)表于 11-26 11:08 ?476次閱讀

    RISC-V V擴(kuò)展的指令代碼

    1.指令集V擴(kuò)展的主要內(nèi)容: 矢量指令:針對(duì)數(shù)據(jù)并行性,增加了一系列新的矢量指令,可以同時(shí)對(duì)多個(gè)數(shù)據(jù)進(jìn)行操作,提高了計(jì)算效率。浮點(diǎn)指令:新增了一些浮點(diǎn)指令,支持更高精度的
    發(fā)表于 10-21 13:11

    全新Arm Lumex CSS平臺(tái)實(shí)現(xiàn)位數(shù)性能提升

    及下一代個(gè)人電腦加速其人工智能 (AI) 體驗(yàn)的先進(jìn)計(jì)算平臺(tái)。Lumex CSS 平臺(tái)集成了搭載第二代可伸縮矩陣擴(kuò)展 (SME2) 技術(shù)的最高性能
    的頭像 發(fā)表于 09-10 16:14 ?929次閱讀
    全新<b class='flag-5'>Arm</b> Lumex CSS<b class='flag-5'>平臺(tái)</b>實(shí)現(xiàn)<b class='flag-5'>兩</b>位數(shù)<b class='flag-5'>性能</b>提升

    西門子 Veloce CS 助力 Arm Neoverse 計(jì)算子系統(tǒng)驗(yàn)證與確認(rèn)

    西門子數(shù)字化工業(yè)軟件近日宣布,Veloce Strato CS 與Veloce proFPGA CS 已被 Veloce 的長(zhǎng)期合作伙伴 Arm 部署應(yīng)用,作為Arm Neoverse 計(jì)算
    的頭像 發(fā)表于 08-06 09:26 ?2895次閱讀

    知合計(jì)算:RISC-V架構(gòu)創(chuàng)新,阿基米德系列劍指高性能計(jì)算

    在2025 RISC-V中國(guó)峰會(huì)上,知合計(jì)算處理器設(shè)計(jì)總監(jiān)劉暢就高性能RISC-V處理器架構(gòu)探索與實(shí)踐進(jìn)行了精彩分享。 在以X86和ARM
    的頭像 發(fā)表于 07-18 14:17 ?2740次閱讀
    知合<b class='flag-5'>計(jì)算</b>:RISC-<b class='flag-5'>V</b>架構(gòu)創(chuàng)新,阿基米德系列劍指<b class='flag-5'>高性能</b><b class='flag-5'>計(jì)算</b>

    Arm Neoverse N2平臺(tái)實(shí)現(xiàn)DeepSeek-R1滿血版部署

    頗具優(yōu)勢(shì)。Arm 攜手合作伙伴,在 Arm Neoverse N2 平臺(tái)上使用開源推理框架 llama.cpp 實(shí)現(xiàn) DeepSeek-R
    的頭像 發(fā)表于 07-03 14:37 ?1239次閱讀
    <b class='flag-5'>Arm</b> <b class='flag-5'>Neoverse</b> <b class='flag-5'>N2</b><b class='flag-5'>平臺(tái)</b>實(shí)現(xiàn)DeepSeek-R<b class='flag-5'>1</b>滿血版部署

    臺(tái)安N2變頻器與Modbus RTU轉(zhuǎn)Profinet網(wǎng)關(guān)實(shí)現(xiàn)數(shù)據(jù)互換

    在工業(yè)自動(dòng)化領(lǐng)域,Modbus RTU協(xié)議與Profinet協(xié)議的轉(zhuǎn)換需求日益凸顯,尤其是當(dāng)涉及到臺(tái)安N2變頻器等設(shè)備的應(yīng)用時(shí)。本文將深入探討Modbus RTU轉(zhuǎn)Profinet網(wǎng)關(guān)與臺(tái)安N2變頻器通訊的相關(guān)知識(shí),幫助讀者更好地理解和應(yīng)用這一技術(shù)。
    的頭像 發(fā)表于 06-29 13:28 ?568次閱讀
    臺(tái)安<b class='flag-5'>N2</b>變頻器與Modbus RTU轉(zhuǎn)Profinet網(wǎng)關(guān)實(shí)現(xiàn)數(shù)據(jù)互換

    AMD實(shí)現(xiàn)首個(gè)基于臺(tái)積電N2制程的硅片里程碑

    代號(hào)為“Venice”的新一代AMD EPYC CPU是首款基于臺(tái)積電新一代N2制程的高性能計(jì)算產(chǎn)品。 ? AMD表示,其代號(hào)為“Venice”的新一代AMD EPYC?處理器是業(yè)界首款完成流片并
    的頭像 發(fā)表于 05-06 14:46 ?761次閱讀
    AMD實(shí)現(xiàn)首個(gè)基于臺(tái)積電<b class='flag-5'>N2</b>制程的硅片里程碑

    解讀基于Arm Neoverse V2平臺(tái)的Google Axion處理器

    計(jì)算需求在人工智能 (AI) 時(shí)代的爆發(fā)式增長(zhǎng),推動(dòng)了開發(fā)者尋求性能優(yōu)化且高能效的解決方案,以降低總體擁有成本 (TCO)。Arm 致力于通過 Arm
    的頭像 發(fā)表于 04-21 13:47 ?1070次閱讀

    如何在基于Arm Neoverse平臺(tái)的CPU上構(gòu)建分布式Kubernetes集群

    在本文中,我們將以 X(原 Twitter)為例,演示如何在基于 Arm Neoverse 平臺(tái)的 CPU 上構(gòu)建分布式 Kubernetes 集群,以根據(jù)推文實(shí)時(shí)監(jiān)控情緒變化。如此一來(lái),你可以充分利用
    的頭像 發(fā)表于 03-25 15:58 ?836次閱讀
    如何在基于<b class='flag-5'>Arm</b> <b class='flag-5'>Neoverse</b><b class='flag-5'>平臺(tái)</b>的CPU上構(gòu)建分布式Kubernetes集群

    Banana Pi 發(fā)布 BPI-AI2N &amp; BPI-AI2N Carrier,助力 AI 計(jì)算與嵌入式開發(fā)

    RZ/V2N——近期在嵌入式世界2025上新發(fā)布,為 AI 計(jì)算、嵌入式系統(tǒng)及工自動(dòng)化提供強(qiáng)大支持。這款全新的計(jì)算平臺(tái)旨在滿足開發(fā)者和企業(yè)用戶對(duì)高性
    發(fā)表于 03-19 17:54

    Banana Pi 發(fā)布 BPI-AI2N &amp; BPI-AI2N Carrier,助力 AI 計(jì)算與嵌入式開發(fā)

    2025年3月19日——Banana Pi 今日正式發(fā)布 BPI-AI2N & BPI-AI2N Carrier,基于瑞薩電子(Renesas)同步發(fā)布的最新的高性能處理器RZ/V2N
    的頭像 發(fā)表于 03-19 17:53 ?1793次閱讀
    Banana Pi 發(fā)布 BPI-AI<b class='flag-5'>2N</b> &amp; BPI-AI<b class='flag-5'>2N</b> Carrier,助力 AI <b class='flag-5'>計(jì)算</b>與嵌入式開發(fā)

    采用雙核Arm Cortex-A57 CPU的超高性能微處理器RZ/G2N數(shù)據(jù)手冊(cè)

    RZ/G2N憑借雙核 Arm? Cortex?-A57(1.5GHz)處理器,具備更高規(guī)格的處理性能,同時(shí)擁有 3D 圖形處理能力以及 4K 視頻編碼/ 解碼功能。作為該產(chǎn)品的軟件平臺(tái)
    的頭像 發(fā)表于 03-10 17:05 ?1157次閱讀
    采用雙核<b class='flag-5'>Arm</b> Cortex-A57 CPU的超<b class='flag-5'>高性能</b>微處理器RZ/G<b class='flag-5'>2N</b>數(shù)據(jù)手冊(cè)