91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

電子發(fā)燒友App

硬聲App

掃碼添加小助手

加入工程師交流群

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示
創(chuàng)作
電子發(fā)燒友網(wǎng)>電子資料下載>電子資料>AKG深度學(xué)習(xí)網(wǎng)絡(luò)優(yōu)化程序

AKG深度學(xué)習(xí)網(wǎng)絡(luò)優(yōu)化程序

2022-06-17 | zip | 14.33 MB | 次下載 | 2積分

資料介紹

授權(quán)協(xié)議 Apache-2.0
開發(fā)語言 C/C++ Python
操作系統(tǒng) 跨平臺(tái)
軟件類型 開源軟件

軟件簡(jiǎn)介

AKG(Auto Kernel Generator)對(duì)深度神經(jīng)網(wǎng)絡(luò)中的算子進(jìn)行優(yōu)化,并提供特定模式下的算子自動(dòng)融合功能。AKG與MindSpore的圖算融合功能協(xié)同工作,可提升在不同硬件后端上運(yùn)行網(wǎng)絡(luò)的性能。

AKG由四個(gè)基本的優(yōu)化模塊組成:規(guī)范化、自動(dòng)調(diào)度、指令發(fā)射和后端優(yōu)化。

  • 規(guī)范化:?為了解決polyhedral表達(dá)能力的局限性(只能處理靜態(tài)的線性程序),需要首先對(duì)計(jì)算公式IR進(jìn)行規(guī)范化。規(guī)范化模塊中的優(yōu)化主要包括自動(dòng)運(yùn)算符inline、循環(huán)拆分和公共子表達(dá)式優(yōu)化等。

  • 自動(dòng)調(diào)度:?自動(dòng)調(diào)度模塊基于polyhedral技術(shù),主要包括自動(dòng)向量化、自動(dòng)切分、依賴分析和數(shù)據(jù)搬移等。

  • 指令發(fā)射:?指令發(fā)射模塊的優(yōu)化主要包括循環(huán)規(guī)范化、標(biāo)簽自動(dòng)生成和指令發(fā)射等。

  • 后端優(yōu)化:?后端優(yōu)化模塊的優(yōu)化主要包括雙緩沖區(qū)、存儲(chǔ)重寫和同步指令插入等。

    pYYBAGKn-6mAHUgiAAF6cN7bGNE543.png

硬件后端支持

當(dāng)前支持Ascend910gpu v100/A100等,更多硬件后端支持待開發(fā)。

構(gòu)建

從MindSpore側(cè)構(gòu)建

詳細(xì)細(xì)節(jié)請(qǐng)參考MindSpore README.md。

獨(dú)立構(gòu)建

我們建議您從MindSpore側(cè)構(gòu)建運(yùn)行AKG代碼,但同時(shí)為了方便開發(fā),我們提供了獨(dú)立編譯運(yùn)行AKG的方式。 詳細(xì)的編譯依賴請(qǐng)參考MindSpore安裝指南。

bash build.sh -t $target // target can set 'gpu' or 'ascend'

運(yùn)行

  1. 設(shè)置環(huán)境變量
  • Ascend910

    cd tests
    source ./test_env.sh amd64
    export 
    export PATH=${PATH}:${YOUR_CCEC_COMPILER_PATH}
  • GPU V100/A100

    cd tests
    source ./test_env.sh gpu
  1. 運(yùn)行測(cè)試用例
  • Ascend910
    cd tests/operators/vector
    pytest -s test_abs_001.py -m "level0" # 運(yùn)行l(wèi)evel0測(cè)試用例
  • GPU V100/A100
    cd tests/operators/gpu
    python3 test_all.py -a "op_name" #運(yùn)行op_name算子測(cè)試用例
?

神經(jīng)網(wǎng)絡(luò) 開源 深度學(xué)習(xí)
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

下載該資料的人也在下載 下載該資料的人還在閱讀
更多 >

評(píng)論

查看更多

下載排行

本周

  1. 11節(jié)電池用電池保護(hù)IC S-8261D系列數(shù)據(jù)手冊(cè)
  2. 3.07 MB   |  1次下載  |  1 積分
  3. 2海信LED42T29GP電路圖資料
  4. 0.06 MB   |  次下載  |  10 積分
  5. 3海信LED42T29GP說明書
  6. 25.83 MB   |  次下載  |  10 積分
  7. 4海信LED42T29GP電路圖資料
  8. 0.64 MB   |  次下載  |  10 積分
  9. 5HERO8Black說明書
  10. 4.96 MB   |  次下載  |  免費(fèi)
  11. 6九陽JYCP-21ZD-A主控板電路圖資料
  12. 2.33 MB   |  次下載  |  10 積分
  13. 7格力空調(diào)2p通訊電路圖紙資料
  14. 2.48 MB   |  次下載  |  免費(fèi)
  15. 8HT3112規(guī)格書V1
  16. 977.90 KB  |  次下載  |  免費(fèi)

本月

  1. 1美的電磁爐電路原理圖資料
  2. 4.39 MB   |  20次下載  |  10 積分
  3. 2反激式開關(guān)電源設(shè)計(jì)解析
  4. 0.89 MB   |  12次下載  |  5 積分
  5. 3耗盡型MOS FET產(chǎn)品目錄選型表
  6. 0.14 MB   |  3次下載  |  免費(fèi)
  7. 4簡(jiǎn)易光伏控制器原理圖資料
  8. 0.07 MB   |  1次下載  |  5 積分
  9. 5FP7135V060-G1/FP7125替代物料pin to pin
  10. 495.40 KB  |  1次下載  |  免費(fèi)
  11. 62EDL05x06xx系列 600V半橋門驅(qū)動(dòng)器帶集成自舉二極管(BSD)手冊(cè)
  12. 0.69 MB   |  1次下載  |  免費(fèi)
  13. 7TI系列-米爾TI AM62L核心板開發(fā)板-高能效低功耗嵌入式平臺(tái)
  14. 1.51 MB  |  1次下載  |  免費(fèi)
  15. 81節(jié)電池用電池保護(hù)IC S-8261D系列數(shù)據(jù)手冊(cè)
  16. 3.07 MB   |  1次下載  |  1 積分

總榜

  1. 1matlab軟件下載入口
  2. 未知  |  935137次下載  |  10 積分
  3. 2開源硬件-PMP21529.1-4 開關(guān)降壓/升壓雙向直流/直流轉(zhuǎn)換器 PCB layout 設(shè)計(jì)
  4. 1.48MB  |  420064次下載  |  10 積分
  5. 3Altium DXP2002下載入口
  6. 未知  |  233095次下載  |  10 積分
  7. 4電路仿真軟件multisim 10.0免費(fèi)下載
  8. 340992  |  191457次下載  |  10 積分
  9. 5十天學(xué)會(huì)AVR單片機(jī)與C語言視頻教程 下載
  10. 158M  |  183360次下載  |  10 積分
  11. 6labview8.5下載
  12. 未知  |  81605次下載  |  10 積分
  13. 7Keil工具M(jìn)DK-Arm免費(fèi)下載
  14. 0.02 MB  |  73831次下載  |  10 積分
  15. 8LabVIEW 8.6下載
  16. 未知  |  65991次下載  |  10 積分