91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

Arm編譯器現(xiàn)在基于LLVM 13

安芯教育科技 ? 來源:極術社區(qū) ? 作者:Ashok Bhat ? 2022-06-15 09:19 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Arm編譯器Linux 22.0版現(xiàn)在提供了改進的編譯器和庫。Arm編譯器Linux版(ACfL)是Arm C/C++編譯器(armclang)、Arm Fortran編譯器(armflang)和Arm性能庫(ArmPL)的組合。在本博客中,我們將探討此版本的新增功能。

Arm編譯器現(xiàn)在基于LLVM 13

Arm編譯器現(xiàn)在基于LLVM 13,這提高了性能。

db2122e6-ec47-11ec-ba43-dac502259ad0.png

我們看到SPEC CPU 2017的許多次級基準得到了改進,geomean總分比之前的21.1版本提高了2.2%。該基準測試在AWS c6g.metal(帶Arm Neoverse-N1核心)上運行。

針對Neoverse-V1進行了更好的調整

(AWS Graviton 3核心)

22.0版本的Arm編譯器為Neoverse-V1提供了一個優(yōu)化的成本模型,并提供了許多與SVE代碼生成相關的改進。這包括(1)優(yōu)化使用SVE的Gather/Scatter功能(2)將循環(huán)(loop)填充對齊,以更好地利用指令緩存(3)在將向量的一個元素插入另一個元素時,優(yōu)化使用SVE拼接操作。

db2ae59c-ec47-11ec-ba43-dac502259ad0.png

這些優(yōu)化的累積效應可以在前面的圖中看到。我們在這里將Neoverse-V1優(yōu)化的SVE代碼和為Neoverse-V1優(yōu)化的Neon代碼做一個對比。我們的基準是在開發(fā)SVE架構擴展時使用的一組具有代表性的微基準(micro-benchmarks)。您可以看到,22.0(橙色條)中的編譯器優(yōu)于21.1版(藍色條)。通過這些改進,22.0版本已準備好在AWS Graviton 3上開發(fā)HPC應用程序。

GCC 11更新

該軟件包現(xiàn)在提供GCC 11系列編譯器,并有許多性能改進https://community.arm.com/arm-community-blogs/b/tools-software-ides-blog/posts/performance-improvements-in-gcc-11

具有CPU運行時檢測的單個ArmPL

Arm性能庫不再為SVE和非SVE內核打包為單獨的庫。我們現(xiàn)在提供一個庫,其中包含所有受支持內核(包括SVE)的優(yōu)化版本。在運行時,庫通過檢測核的類型,來選擇最佳的例程和配置。作為用戶,您可以自動受益于庫中最快的調整,而無需重新鏈接到特定于核的庫。

更快的BLAS、LAPACK和FFT

ArmPL 22.0進一步改進了BLAS和LAPACK例程。

db4d41dc-ec47-11ec-ba43-dac502259ad0.png

db655f9c-ec47-11ec-ba43-dac502259ad0.png

上圖顯示了22.0版本比21.0版本的改進(2021年初發(fā)布)。這些數(shù)據(jù)來自5000多個個案的基準測試,涵蓋:廣泛BLAS例程的基準測試,一系列重要的LAPACK例程,用于串行(1線程)和并行(8線程)執(zhí)行中的小O(10)、中O(100)和大O(1000)不同的問題場景。

數(shù)學函數(shù)的改進

在22.0中,我們改進了許多數(shù)學函數(shù)的性能。其中包括標量函數(shù)(atan、atan2、atan2f、cos、exp、sin和erf)和向量函數(shù)(atanf、atan2f、cosf、erfcf、expo、logf、pow、sinf和tanf)的改進。在下圖中,您可以看到Elefunt benchmark在AWS Graviton 2(Neoverse N1)系統(tǒng)上運行時的影響。

db7cbd2c-ec47-11ec-ba43-dac502259ad0.png

模塊名稱變更

該包提供模塊文件,以便輕松加載所需的編譯器或庫。對于22.0版本,請使用以下模塊命令。

db958514-ec47-11ec-ba43-dac502259ad0.png

結論

Arm編譯器Linux 22.0版與前21.x系列版相比有許多改進和變化。我們將繼續(xù)進行進一步的改進,并計劃在2022年9月/10月發(fā)布下一版本22.1。

最新版本下載地址:

https://developer.arm.com/downloads/-/arm-compiler-for-linux

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • Linux
    +關注

    關注

    88

    文章

    11758

    瀏覽量

    219013
  • 編譯器
    +關注

    關注

    1

    文章

    1672

    瀏覽量

    51599

原文標題:技術分享 | Arm編譯器Linux版:22.0版本中的新增功能有哪些?

文章出處:【微信號:Ithingedu,微信公眾號:安芯教育科技】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    性能突破 | SpacemiT-X60 在 LLVM 編譯器上實現(xiàn) 16% 顯著提升

    2025年10月,在北美RISC-V峰會上,Igalia編譯器工程師Mikhail發(fā)表專題演講《Unlocking15%MorePerformance
    的頭像 發(fā)表于 11-21 18:04 ?8880次閱讀
    性能突破 | SpacemiT-X60 在 <b class='flag-5'>LLVM</b> <b class='flag-5'>編譯器</b>上實現(xiàn) 16% 顯著提升

    開源鴻蒙技術大會2025丨編譯器與編程語言分論壇:語言驅動系統(tǒng)創(chuàng)新,編譯賦能生態(tài)繁榮

    在萬物智聯(lián)的時代背景下,操作系統(tǒng)底層能力的構建離不開編程語言與編譯器的關鍵支撐。作為開源鴻蒙生態(tài)的核心技術,語言設計與編譯器、虛擬機實現(xiàn)的進步直接關系到開發(fā)效率、運行性能與系統(tǒng)安全。本次分論壇聚焦
    的頭像 發(fā)表于 11-20 17:24 ?917次閱讀
    開源鴻蒙技術大會2025丨<b class='flag-5'>編譯器</b>與編程語言分論壇:語言驅動系統(tǒng)創(chuàng)新,<b class='flag-5'>編譯</b>賦能生態(tài)繁榮

    【CPKCOR-RA8D1】AI人臉檢測(安裝對應版本的FSP及LLVM

    本文主要聚焦于Flexible Software Package (FSP) v5.3.0 與LLVM Embedded Toolchain for Arm v17.0.1 安裝上面 由于現(xiàn)在直接
    發(fā)表于 10-31 11:22

    請問如何在keil μVision 5上進行ARM編譯器的代碼優(yōu)化?

    如何在keil μVision 5上進行ARM編譯器的代碼優(yōu)化?
    發(fā)表于 08-20 07:37

    如何在Keil中將NuMicro BSP從Arm編譯器5遷移到編譯器6?

    在Keil中將NuMicro BSP從Arm編譯器5遷移到編譯器6!
    發(fā)表于 08-20 06:29

    求助,關于NanoEdge AI Studio生成的庫交叉編譯器版本疑問求解

    20231009\", 那么問題來了,怎么在NanoEdge AI Studio設定交叉編譯器呢,比如設置為armcc、armclang、iccram,因為我需要將庫加到keil或者iar工程里面。 看樣子這個軟件生成的庫是arm-gcc
    發(fā)表于 08-08 07:25

    邊緣設備AI部署:編譯器如何實現(xiàn)輕量化與高性能?

    電子發(fā)燒友網綜合報道 AI編譯器是專門為人工智能(AI)和機器學習(ML)模型設計的編譯器,其核心目標是將高級的AI模型描述(如計算圖、神經網絡結構)轉換為特定硬件平臺(如CPU、GPU、FPGA
    的頭像 發(fā)表于 07-06 05:49 ?6633次閱讀

    編譯器功能安全驗證的關鍵要素

    在汽車、工業(yè)、醫(yī)療等安全關鍵型應用中,確保功能安全合規(guī)性需要嚴格的工具鏈驗證。開發(fā)安全關鍵型軟件的企業(yè)必須遵守ISO 26262、IEC 61508、ISO 62304等國際標準對編譯器工具鏈進行全面的驗證。
    的頭像 發(fā)表于 07-05 13:37 ?1574次閱讀

    兆松科技ZCC編譯器全面支持芯來科技NA系列處理

    近日,兆松科技(武漢)有限公司(以下簡稱“兆松科技”)宣布正式發(fā)布高性能RISC-V編譯器ZCC 4.0.0版本。
    的頭像 發(fā)表于 06-11 09:56 ?1704次閱讀

    RISC-V架構下的編譯器自動向量化

    進迭時空專注于研發(fā)基于RISC-V的高性能新AICPU,對于充分發(fā)揮CPU核的性能而言,編譯器是不可或缺的一環(huán),而在AI時代,毫無疑問向量算力將發(fā)揮越來越重要的作用。進迭時空非常重視RISC-V
    的頭像 發(fā)表于 06-06 16:59 ?1230次閱讀
    RISC-V架構下的<b class='flag-5'>編譯器</b>自動向量化

    RVCT編譯器是否比GNU的編譯器的代碼執(zhí)行速度更快?

    使用FX3S遇到了RVCT編譯器的問題。 1、在SDK的release note中有支持RVCT的描述, 但是在EZ USB Suite的設置中沒有找到RVCT的選項, 請問支持的具體版本
    發(fā)表于 05-08 07:49

    HighTec編譯器全面支持芯馳科技車規(guī)MCU芯片E3650

    近日,HighTec與芯馳科技共同宣布HighTec編譯器套件將全面支持芯馳新一代旗艦智控MCU-E3650芯片。此次合作,進一步豐富了芯馳車芯產品的工具鏈生態(tài),雙方將攜手為客戶提供高性能、高安全性的解決方案。
    的頭像 發(fā)表于 04-28 15:20 ?1793次閱讀

    TASKING編譯器全面支持紫光同芯THA6 Gen2系列產品

    近日,TASKING 針對Arm架構的編譯器平臺VX-toolset for Arm迎來了全新升級,最新版本VX-toolset for Arm v7.1r1已深度適配紫光同芯汽車域控
    的頭像 發(fā)表于 04-03 17:12 ?1328次閱讀

    HighTec編譯器全面適配紫光同芯THA6 Gen2系列產品

    近日,紫光同芯與全球領先的汽車級C/C++編譯器供應商HighTec共同宣布,HighTec編譯器完成對紫光同芯THA6 Gen2系列產品的全面適配。此次合作實現(xiàn)了從指令集優(yōu)化到功能安全的全棧支持,是國產高端車規(guī)芯片與國際領先開發(fā)工具的深度技術融合,將為全球汽車電子開發(fā)者
    的頭像 發(fā)表于 04-02 09:42 ?1182次閱讀

    請問基于GCC編譯器的initcall在STM32如何實現(xiàn)?

    請問各位基于GCC編譯器的initcall在STM32如何實現(xiàn)?有哪位實現(xiàn)了嗎?
    發(fā)表于 03-13 06:24