91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

電子發(fā)燒友App

硬聲App

掃碼添加小助手

加入工程師交流群

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示
創(chuàng)作
電子發(fā)燒友網>電子資料下載>電子資料>基于AdderNet的深度學習推理加速器

基于AdderNet的深度學習推理加速器

2022-10-31 | zip | 0.19 MB | 次下載 | 免費

資料介紹

描述

該項目介紹了我們對基于稱為 AdderNet 的新型深度學習模型的硬件推理加速器設計和優(yōu)化的研究。通過用絕對和 (SAD) 內核替換計算密集型卷積 (CONV) 操作,可以通過具有成本效益的加法器/減法器電路消除大量乘法器,這可以提高計算吞吐量,因為硬件限制。我們在 FPGA 設備上展示了基線 ResNet-20 實現(xiàn) (CNN-ResNet-20) 和兩個 AdderNet 設計變體 (ADD-ResNet-20) 之間的比較研究。我們利用自動 HLS(高級綜合)和手動轉換將 SAD 操作映射到 Xilinx Zynq MPSoC 的 FPGA DSP 塊 (DSP48E2)。尤其是,當 DSP48 模塊配置為 SIMD(單指令多數(shù)據(jù))模式時,我們可以用一個 DSP 模塊和最少的 LUT 邏輯資源支持至少兩個 SAD 操作。在這個研究階段,我們選擇使用一個 DSP 來支持 2 個 SAD 操作,以增加 10% 的 LUT 和 5% 的推理時間開銷為代價,總共可以減少 45.43% 的 DSP 利用率。這些結果鼓勵我們探索新的深度學習加速器設計策略,以利用新興的基于 SAD 內核的 AdderNet 模型以及每個 DSP ≥4 SAD 的積極 SIMD 配置來提高推理吞吐量。我們選擇使用 1 個 DSP 支持 2 個 SAD 操作,以增加 10% 的 LUT 和 5% 的推理時間開銷為代價,總共可以減少 45.43% 的 DSP 利用率。這些結果鼓勵我們探索新的深度學習加速器設計策略,以利用新興的基于 SAD 內核的 AdderNet 模型以及每個 DSP ≥4 SAD 的積極 SIMD 配置來提高推理吞吐量。我們選擇使用 1 個 DSP 支持 2 個 SAD 操作,以增加 10% 的 LUT 和 5% 的推理時間開銷為代價,總共可以減少 45.43% 的 DSP 利用率。這些結果鼓勵我們探索新的深度學習加速器設計策略,以利用新興的基于 SAD 內核的 AdderNet 模型以及每個 DSP ≥4 SAD 的積極 SIMD 配置來提高推理吞吐量。

卷積神經網絡(CNN)已廣泛應用于計算機視覺任務領域。例如工業(yè)檢測、自主視覺和機器人檢測。然而,由于其大量的乘法運算和參數(shù),很難將這些標準神經網絡部署到具有效率吞吐量和功耗的嵌入式設備中。作為一種解決方案,AdderNet 在深度神經網絡,尤其是卷積神經網絡 (CNN) 中使用這些大規(guī)模乘法,以獲得更便宜的加法以降低計算成本。

?

poYBAGNYkzSAZtZ4AAEWACNpmlk452.png
?

?

Function.1 CNN

pYYBAGNYkzeAYSjPAAA8aQRjnxA683.png
?

Function.2 人工神經網絡

?

poYBAGNYkzmAcAdtAAA8nghBA2o263.png
?

?

作為案例研究,我們選擇 ResNet-20-CIFAR10 作為基線設計。ResNet-20-CIFAR10的處理引擎如圖1所示。據(jù)我們所知,CNN 加速器有兩種通用方法:單個 PE 和多個 PE。在這項工作中,我們在應用程序中使用了多個 PE 以獲得更好的吞吐量。

?

poYBAGNYkzyAZMbKAAD4aK2Y-co167.png
?

自動 HLS 和手動轉換

Xilinx Vitis HLS 上的自動綜合:

Xilinx Vitis HLS 可以從 C++ 代碼自動生成 FPGA 項目。

對于 CNN-ResNet-20,綜合報告顯示該項目的硬件符合我們的目的。

對于 ADD-ResNet-20,合成報告并沒有遵循我們之前的目的,因為 Vitis HLS 中的 C 合成不支持將 DSP48 配置為 SIMD 模式。

我們的解決方案:

將 SAD 操作設計為 C++ 中的獨立函數(shù)。

替換 Xilinx Vitis HLS 生成的 Verilog 源文件中的 SAD 代碼。

在 Xilinx Vivado 中重新綜合該項目。

此外,通過編輯 SAD 代碼,我們可以為 DSP48E2 配置更多選項。

?

poYBAGNYkz-AZzxVAAECFa4TFRI733.png
?

Batch Normalization 融合可以減少計算量,并為模型量化提供更簡潔的結構。

如 Function.3 和 4 所示,將細化權重應用于卷積層作為原始推理。但是考慮左邊顯示的加法器層的功能,作為卷積添加到函數(shù)中的細化權重不能用作卷積層。

由于乘法和加法的開銷,這個函數(shù)不能提供 AdderNet 的硬件優(yōu)勢。

為了避免這種開銷,我們使用額外的 for 循環(huán)來處理乘法和加法的開銷,這將花費更多的時鐘周期和硬件。

?

?

poYBAGNYk0KANUA2AADWnMPxk8U046.png
?

DSP配置方法

在本節(jié)中,將介紹兩種 DSP48E2 配置方法:

方法 a:利用與 CONV 相同數(shù)量的 DSP,但與方法 b 相比,LUT 更少。

方法 b:利用一半的 DSP 作為 CONV,但與方法 a 相比,LUT 更多。

?

pYYBAGNYk0WAX_YnAAB6R53Kge0129.png
?

?

該報告顯示,通過比較解決方案 a、解決方案 b 和 ResNet-20 基線的結果,我們的方法可以以增加 10% 的 LUT 和 5% 的推理時間開銷為代價,減少大約 45% 的 DSP 利用率。

?

pYYBAGNYk0iAV0oyAABzMg9n7XU261.png
?

?


加速器 深度學習
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

下載該資料的人也在下載 下載該資料的人還在閱讀
更多 >

評論

查看更多

下載排行

本周

  1. 1新一代網絡可視化(NPB 2.0)
  2. 3.40 MB  |  1次下載  |  免費
  3. 2冷柜-電氣控制系統(tǒng)講解
  4. 13.68 MB   |  1次下載  |  10 積分
  5. 3MDD品牌三極管MMBT3906數(shù)據(jù)手冊
  6. 2.33 MB  |  次下載  |  免費
  7. 4MDD品牌三極管S9012數(shù)據(jù)手冊
  8. 2.62 MB  |  次下載  |  免費
  9. 5LAT1218 如何選擇和設置外部晶體適配 BlueNRG-X
  10. 0.60 MB   |  次下載  |  3 積分
  11. 6LAT1216 Blue NRG-1/2 系列芯片 Flash 操作與 BLE 事件的互斥處理
  12. 0.89 MB   |  次下載  |  3 積分
  13. 7收音環(huán)繞擴音機 AVR-1507手冊
  14. 2.50 MB   |  次下載  |  免費
  15. 8MS1000TA 超聲波測量模擬前端芯片技術手冊
  16. 0.60 MB   |  次下載  |  免費

本月

  1. 1愛華AIWA HS-J202維修手冊
  2. 3.34 MB   |  37次下載  |  免費
  3. 2PC5502負載均流控制電路數(shù)據(jù)手冊
  4. 1.63 MB   |  23次下載  |  免費
  5. 3NB-IoT芯片廠商的資料說明
  6. 0.31 MB   |  22次下載  |  1 積分
  7. 4UWB653Pro USB口測距通信定位模塊規(guī)格書
  8. 838.47 KB  |  5次下載  |  免費
  9. 5蘇泊爾DCL6907(即CHK-S007)單芯片電磁爐原理圖資料
  10. 0.04 MB   |  4次下載  |  1 積分
  11. 6蘇泊爾DCL6909(即CHK-S009)單芯片電磁爐原理圖資料
  12. 0.08 MB   |  2次下載  |  1 積分
  13. 7100W準諧振反激式恒流電源電路圖資料
  14. 0.09 MB   |  2次下載  |  1 積分
  15. 8FS8025B USB的PD和OC快充協(xié)議電壓誘騙控制器IC技術手冊
  16. 1.81 MB   |  1次下載  |  免費

總榜

  1. 1matlab軟件下載入口
  2. 未知  |  935137次下載  |  10 積分
  3. 2開源硬件-PMP21529.1-4 開關降壓/升壓雙向直流/直流轉換器 PCB layout 設計
  4. 1.48MB  |  420064次下載  |  10 積分
  5. 3Altium DXP2002下載入口
  6. 未知  |  233089次下載  |  10 積分
  7. 4電路仿真軟件multisim 10.0免費下載
  8. 340992  |  191439次下載  |  10 積分
  9. 5十天學會AVR單片機與C語言視頻教程 下載
  10. 158M  |  183353次下載  |  10 積分
  11. 6labview8.5下載
  12. 未知  |  81602次下載  |  10 積分
  13. 7Keil工具MDK-Arm免費下載
  14. 0.02 MB  |  73822次下載  |  10 積分
  15. 8LabVIEW 8.6下載
  16. 未知  |  65991次下載  |  10 積分