資料介紹
軟件簡(jiǎn)介
AKG(Auto Kernel Generator)對(duì)深度神經(jīng)網(wǎng)絡(luò)中的算子進(jìn)行優(yōu)化,并提供特定模式下的算子自動(dòng)融合功能。AKG與MindSpore的圖算融合功能協(xié)同工作,可提升在不同硬件后端上運(yùn)行網(wǎng)絡(luò)的性能。
AKG由四個(gè)基本的優(yōu)化模塊組成:規(guī)范化、自動(dòng)調(diào)度、指令發(fā)射和后端優(yōu)化。
-
規(guī)范化:?為了解決polyhedral表達(dá)能力的局限性(只能處理靜態(tài)的線性程序),需要首先對(duì)計(jì)算公式IR進(jìn)行規(guī)范化。規(guī)范化模塊中的優(yōu)化主要包括自動(dòng)運(yùn)算符inline、循環(huán)拆分和公共子表達(dá)式優(yōu)化等。
-
自動(dòng)調(diào)度:?自動(dòng)調(diào)度模塊基于polyhedral技術(shù),主要包括自動(dòng)向量化、自動(dòng)切分、依賴分析和數(shù)據(jù)搬移等。
-
指令發(fā)射:?指令發(fā)射模塊的優(yōu)化主要包括循環(huán)規(guī)范化、標(biāo)簽自動(dòng)生成和指令發(fā)射等。
-
后端優(yōu)化:?后端優(yōu)化模塊的優(yōu)化主要包括雙緩沖區(qū)、存儲(chǔ)重寫和同步指令插入等。

硬件后端支持
當(dāng)前支持Ascend910,gpu v100/A100等,更多硬件后端支持待開發(fā)。
構(gòu)建
從MindSpore側(cè)構(gòu)建
詳細(xì)細(xì)節(jié)請(qǐng)參考MindSpore README.md。
獨(dú)立構(gòu)建
我們建議您從MindSpore側(cè)構(gòu)建運(yùn)行AKG代碼,但同時(shí)為了方便開發(fā),我們提供了獨(dú)立編譯運(yùn)行AKG的方式。 詳細(xì)的編譯依賴請(qǐng)參考MindSpore安裝指南。
bash build.sh -t $target // target can set 'gpu' or 'ascend'
運(yùn)行
- 設(shè)置環(huán)境變量
-
Ascend910
cd tests source ./test_env.sh amd64 export export PATH=${PATH}:${YOUR_CCEC_COMPILER_PATH}
-
GPU V100/A100
cd tests source ./test_env.sh gpu
- 運(yùn)行測(cè)試用例
-
Ascend910
cd tests/operators/vector pytest -s test_abs_001.py -m "level0" # 運(yùn)行l(wèi)evel0測(cè)試用例
-
GPU V100/A100
cd tests/operators/gpu python3 test_all.py -a "op_name" #運(yùn)行op_name算子測(cè)試用例
- 基于深度遷移學(xué)習(xí)網(wǎng)絡(luò)的肺結(jié)節(jié)輔助CT診斷 8次下載
- 端到端的深度學(xué)習(xí)網(wǎng)絡(luò)人體自動(dòng)摳圖算法 10次下載
- 基于預(yù)訓(xùn)練模型和長短期記憶網(wǎng)絡(luò)的深度學(xué)習(xí)模型 19次下載
- 3小時(shí)學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí)課件下載 0次下載
- 深度神經(jīng)網(wǎng)絡(luò)模型的壓縮和優(yōu)化綜述 20次下載
- 深度模型中的優(yōu)化與學(xué)習(xí)課件下載 3次下載
- 使用TensorFlow建立深度學(xué)習(xí)和機(jī)器學(xué)習(xí)網(wǎng)絡(luò) 18次下載
- 一種基于深度學(xué)習(xí)的地下淺層震源定位方法 10次下載
- 基于Python的理論與實(shí)現(xiàn)進(jìn)行深度學(xué)習(xí)的入門教程 6次下載
- 深度學(xué)習(xí)網(wǎng)絡(luò)訓(xùn)練技巧的詳細(xì)資料匯總 10次下載
- 快速了解神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí)的教程資料免費(fèi)下載 33次下載
- 深度學(xué)習(xí)優(yōu)化器方法及學(xué)習(xí)率衰減方式的詳細(xì)資料概述 9次下載
- 深度學(xué)習(xí)是什么?了解深度學(xué)習(xí)難嗎?讓你快速了解深度學(xué)習(xí)的視頻講解 16次下載
- 基于卷積神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)參數(shù)分布對(duì)網(wǎng)絡(luò)性能的影響 0次下載
- 基于深度學(xué)習(xí)的安卓惡意應(yīng)用檢測(cè) 4次下載
- 神經(jīng)網(wǎng)絡(luò)優(yōu)化器有哪些 1.6k次閱讀
- 深度神經(jīng)網(wǎng)絡(luò)(DNN)架構(gòu)解析與優(yōu)化策略 5.1k次閱讀
- 神經(jīng)網(wǎng)絡(luò)優(yōu)化算法有哪些 1.9k次閱讀
- 深度學(xué)習(xí)與卷積神經(jīng)網(wǎng)絡(luò)的應(yīng)用 1.9k次閱讀
- 深度學(xué)習(xí)模型訓(xùn)練過程詳解 4k次閱讀
- 深度學(xué)習(xí)的模型優(yōu)化與調(diào)試方法 2.5k次閱讀
- 詳解深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)與卷積神經(jīng)網(wǎng)絡(luò)的應(yīng)用 3.5k次閱讀
- 深度學(xué)習(xí)神器DYnet++:輕松駕馭復(fù)雜自由曲面,3D測(cè)量無難度! 1.3k次閱讀
- 深度學(xué)習(xí)中的圖像分割 2k次閱讀
- 深度學(xué)習(xí)中多種優(yōu)化算法 3.1k次閱讀
- 深度學(xué)習(xí)模型小型化處理的五種方法 5k次閱讀
- 深度學(xué)習(xí)和普通機(jī)器學(xué)習(xí)的區(qū)別 5k次閱讀
- 深度學(xué)習(xí)在各個(gè)領(lǐng)域有什么樣的作用深度學(xué)習(xí)網(wǎng)絡(luò)的使用示例分析 9.1k次閱讀
- 基于Keras搭建的深度學(xué)習(xí)網(wǎng)絡(luò)示例 8.8k次閱讀
- 如何估算深度神經(jīng)網(wǎng)絡(luò)的最優(yōu)學(xué)習(xí)率(附代碼教程) 2.7k次閱讀
下載排行
本周
- 11節(jié)電池用電池保護(hù)IC S-8261D系列數(shù)據(jù)手冊(cè)
- 3.07 MB | 1次下載 | 1 積分
- 2海信LED42T29GP電路圖資料
- 0.06 MB | 次下載 | 10 積分
- 3海信LED42T29GP說明書
- 25.83 MB | 次下載 | 10 積分
- 4海信LED42T29GP電路圖資料
- 0.64 MB | 次下載 | 10 積分
- 5HERO8Black說明書
- 4.96 MB | 次下載 | 免費(fèi)
- 6九陽JYCP-21ZD-A主控板電路圖資料
- 2.33 MB | 次下載 | 10 積分
- 7格力空調(diào)2p通訊電路圖紙資料
- 2.48 MB | 次下載 | 免費(fèi)
- 8HT3112規(guī)格書V1
- 977.90 KB | 次下載 | 免費(fèi)
本月
- 1美的電磁爐電路原理圖資料
- 4.39 MB | 20次下載 | 10 積分
- 2反激式開關(guān)電源設(shè)計(jì)解析
- 0.89 MB | 12次下載 | 5 積分
- 3耗盡型MOS FET產(chǎn)品目錄選型表
- 0.14 MB | 3次下載 | 免費(fèi)
- 4簡(jiǎn)易光伏控制器原理圖資料
- 0.07 MB | 1次下載 | 5 積分
- 5FP7135V060-G1/FP7125替代物料pin to pin
- 495.40 KB | 1次下載 | 免費(fèi)
- 62EDL05x06xx系列 600V半橋門驅(qū)動(dòng)器帶集成自舉二極管(BSD)手冊(cè)
- 0.69 MB | 1次下載 | 免費(fèi)
- 7TI系列-米爾TI AM62L核心板開發(fā)板-高能效低功耗嵌入式平臺(tái)
- 1.51 MB | 1次下載 | 免費(fèi)
- 81節(jié)電池用電池保護(hù)IC S-8261D系列數(shù)據(jù)手冊(cè)
- 3.07 MB | 1次下載 | 1 積分
總榜
- 1matlab軟件下載入口
- 未知 | 935137次下載 | 10 積分
- 2開源硬件-PMP21529.1-4 開關(guān)降壓/升壓雙向直流/直流轉(zhuǎn)換器 PCB layout 設(shè)計(jì)
- 1.48MB | 420064次下載 | 10 積分
- 3Altium DXP2002下載入口
- 未知 | 233095次下載 | 10 積分
- 4電路仿真軟件multisim 10.0免費(fèi)下載
- 340992 | 191457次下載 | 10 積分
- 5十天學(xué)會(huì)AVR單片機(jī)與C語言視頻教程 下載
- 158M | 183360次下載 | 10 積分
- 6labview8.5下載
- 未知 | 81605次下載 | 10 積分
- 7Keil工具M(jìn)DK-Arm免費(fèi)下載
- 0.02 MB | 73831次下載 | 10 積分
- 8LabVIEW 8.6下載
- 未知 | 65991次下載 | 10 積分
電子發(fā)燒友App





創(chuàng)作
發(fā)文章
發(fā)帖
提問
發(fā)資料
發(fā)視頻
上傳資料賺積分
評(píng)論