91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

基于Xilinx FPGA的SDK端的深度學習開發(fā)工具包

電子工程師 ? 來源:祥瑞Coding ? 作者:祥瑞Coding ? 2021-03-30 10:33 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

背景:深鑒科技的DNNDK,是一個基于Xilinx FPGASDK端的深度學習開發(fā)工具包,能夠快速的實現(xiàn)深度學習的硬件化。

目的:了解深鑒科技DNNDK內(nèi)容。

參考內(nèi)容:

http://www.deephi.com/technology/dnndk

deephi_dnndk_1.10_betadocs user Guide

本篇目錄

1. 概覽

1.1 DNNDK基于什么?

1.2DP-8000開發(fā)板

2. DNNDK Framework

3. DPU應(yīng)用部署

3.1模型壓縮

3.2模型編譯

4. DPU編程

4.1DPU Kernel

4.2DPU Task

4.3DPU Node

4.4DPU Tensor

5. 混合編譯

6. 運行

7. 重要信息

7.1 板子是否為xilinx的開發(fā)板?

7.2 源碼是否公開?

正文

1概覽

DNNDK (Deep Neural Network Development Kit) - DeePhi deep learning SDK, is designed as an integrated framework, which aims to simplify & accelerate DL (Deep Learning) applications development and deployment on DeePhi DPU (Deep Learning Processing Unit) platform. (Click DNNDK for more information.)

1.1 DNNDK基于什么?

深鑒科技基于 XILINX FPGA芯片 (包括 ZYNQ-7020,ZU2,ZU3,ZU9, KU115等)實現(xiàn)了多個DPU開發(fā)平臺(2018年將對外提供深鑒自主研發(fā)的對外提供深鑒自主研發(fā)的 DPU Soc芯片) ,DNNDK對所有 DPU開發(fā)平臺向用 戶提供統(tǒng)一的工具鏈和戶編程接口 APIs。

1.2DP-8000開發(fā)板

運用zynq7020芯片,開發(fā)板與FPGA芯片是不一樣的。

A complete set of solid optimization toolchains, covering compression, compilation and runtime

Lightweight standard C/C++ programming APIs

Easy-to-use & flat/gentle learning curve

2DNNDK Framework

DNNDK組成:

DEep ComprEssioN Tool (DECENT),深度壓縮工具:提供剪枝和定點化運算。

Deep Neural Network Compiler (DNNC), 神經(jīng)網(wǎng)絡(luò)編譯器:將網(wǎng)絡(luò)算法編譯到DPU平臺高效運行。運用DECENT后的caffe網(wǎng)絡(luò)模型作為輸入。

Deep Neural Network Assembler (DNNAS), 神經(jīng)網(wǎng)絡(luò)集成器:將DPU指令流會編程標準的ELF二進制文件

Neural Network Runtime (N2Cube), 神經(jīng)網(wǎng)絡(luò)運行,運行時支持環(huán)境,神經(jīng)網(wǎng)絡(luò)的加載,資源管理,調(diào)度。N2Cube核心組件包括四個部分 : DPU驅(qū)動程序 (Driver),加載器 (Loader)、性能分析器 (Profiler)及編程開發(fā)庫編程開發(fā)庫 (Library)。

DPU Simulator and Profiler. 深度學習處理單元模擬器。simulator用于驗證二進制指令流,只是深鑒科技內(nèi)部使用,沒有對外發(fā)布。

e04dd5cc-8c65-11eb-8b86-12bb97331649.png

3DPU應(yīng)用部署

1. 模型壓縮 (主機)
2. 模型編譯 (主機)
3. DPU編程開發(fā) (主機或開發(fā)板)
4. 混合編譯 (開發(fā)板)
5. 運行 (開發(fā)板)

3.1模型壓縮

DECENT工具:

e0b7bc58-8c65-11eb-8b86-12bb97331649.png

3.2模型編譯

e11b24dc-8c65-11eb-8b86-12bb97331649.png

編譯器前端( Parser)主要處理網(wǎng)絡(luò)模型的分析與轉(zhuǎn)換,解析輸入網(wǎng)絡(luò)模型的拓撲結(jié)構(gòu)并將其為 DNNC內(nèi)部與深度學習框架生成的計算圖用IR表示。

中端為優(yōu)化器 (Optimizer),它基于內(nèi)部IR實施各種編譯優(yōu)化遍 ,包括融合計算圖中不同節(jié)點間的操作 、高效調(diào)度指令 、充分復用 DPU片上數(shù)據(jù)等 。

代碼生成器 (Code-generator)為DNNC編譯后端, 主要負責把經(jīng)過中端優(yōu)化后的計算圖IR映射成為高效運行在DPU上的指令流 。

4DPU編程

4.1DPU Kernel

將神經(jīng)網(wǎng)絡(luò)實現(xiàn)為FPGA上實體(可以看作IPcore)。DPU Kernel可以理解為在DPU平臺上部署的平臺上部署的一個深度學習網(wǎng)絡(luò)模型的實 體。每個神經(jīng)網(wǎng)絡(luò)對應(yīng) 一個 DPU匯編文件,通過調(diào)用DPU運行N2Cube時的dpuLoadKernel()成為一個可運行實體。 DPU的運行時將其加載到特定內(nèi)存空間并為其分配硬件資源。 然后通過調(diào)用 dpuCreateTask()將其實例化為多個DPU Task。

4.2DPU Task

DPU Task是 DPU Kernel的一個運行實例 。每個 DPU Task中處理一個具體的計算任務(wù)。每個 DPU Task之間的內(nèi)存空間相互獨立,使得我們可以通過多線程來運行多個 DPU Task,以此來提高系統(tǒng)效率和吞吐量 。

4.3DPU Node

DPU Node是DPU上運行網(wǎng)絡(luò)模型的一個組成部分 。每個 DPU Node都有其對應(yīng)的輸入、出以及其對應(yīng)的輸入、出以及相關(guān)參數(shù)。DPU Node依靠其名稱來索引,我們可以依靠其名稱來索引,我們可以通過 DNNDK提供的 API來獲取每個 Node的相關(guān)信息 的相關(guān)信息 。

4.4DPU Tensor

DPU Tensor是多維數(shù)據(jù)的集合 ,用來存儲網(wǎng)絡(luò)在運行過程中的數(shù)據(jù)信息。我們可以通過DNNDK提供的 API獲取某個 Tensor對應(yīng)的屬性,如 Height, Width,Channel以及地址信息。

5混合編譯

e17b2756-8c65-11eb-8b86-12bb97331649.png

6運行

e1cd9fa4-8c65-11eb-8b86-12bb97331649.png

DPU運行時主要包含四部分:加載器 (Loader)、性能 、性能分析器( Profiler)、庫( Library)和 DPU驅(qū)動( DPU Driver)。

7重要信息

7.1 板子是否為xilinx的開發(fā)板?

不是Xilinx的開發(fā)板,只是包含Xilinx的FPGA芯片7z020,開發(fā)板是深鑒科技的開發(fā)板DP-8000,但是有DPU及相應(yīng)工具的情況下可以運用Xilinx的開發(fā)板來實現(xiàn)。

7.2 源碼是否公開?

僅僅公開了主函數(shù)和.h頭文件,并沒有公開驅(qū)動和IPcore的源碼。

相當于對DPU的定義封裝到安裝文件和二進制文件中,無法看到源碼。

責任編輯:lq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4838

    瀏覽量

    107915
  • Xilinx
    +關(guān)注

    關(guān)注

    73

    文章

    2202

    瀏覽量

    131305
  • 驅(qū)動程序
    +關(guān)注

    關(guān)注

    19

    文章

    869

    瀏覽量

    50530

原文標題:深鑒科技DNNDK概覽

文章出處:【微信號:HXSLH1010101010,微信公眾號:FPGA技術(shù)江湖】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    入門宇樹機器人開發(fā):從SDK源碼探索到實戰(zhàn)操作

    宇樹機器人(Unitree)作為全球領(lǐng)先的四足機器人研發(fā)企業(yè),其推出的unitree_sdk2是面向旗下 Go2、H1、B2 等系列機器人的第二代軟件開發(fā)工具包。該 SDK 提供了豐富的接口和示例代碼,支持
    的頭像 發(fā)表于 02-06 16:43 ?2912次閱讀
    入門宇樹機器人<b class='flag-5'>開發(fā)</b>:從<b class='flag-5'>SDK</b>源碼探索到實戰(zhàn)操作

    Microchip推出SDI IP內(nèi)核與四通道CoaXPress?橋接工具包,進一步擴展PolarFire? FPGA智能嵌入式視頻生態(tài)系統(tǒng)

    )今日宣布擴展其 PolarFire ? FPGA 智能嵌入式視頻生態(tài)系統(tǒng),助力開發(fā)者實現(xiàn)可靠、低功耗且高帶寬的視頻連接。該嵌入式視覺解決方案協(xié)議棧整合了硬件評估工具包、開發(fā)工具、IP
    的頭像 發(fā)表于 01-27 12:14 ?436次閱讀
    Microchip推出SDI IP內(nèi)核與四通道CoaXPress?橋接<b class='flag-5'>工具包</b>,進一步擴展PolarFire? <b class='flag-5'>FPGA</b>智能嵌入式視頻生態(tài)系統(tǒng)

    智能顯示模塊配套的界面開發(fā)工具怎么獲???

    想要試用你們的液晶屏,請問界面開發(fā)工具怎么獲???
    發(fā)表于 01-19 15:44

    芯源都有哪些開發(fā)工具?具體性能如何?

    芯源都有哪些開發(fā)工具?具體性能如何?
    發(fā)表于 11-14 07:58

    PYQT 應(yīng)用程序框架及開發(fā)工具

    特點,已成為嵌入式領(lǐng)域的重要開發(fā)工具 PyQt 是一個創(chuàng)建 GUI 應(yīng)用程序的工具包。它是 Python 編程語言和 Qt 庫的成功融合。因為可用的類有很多,他們被分成幾個模塊。QtCore 模塊
    發(fā)表于 10-29 07:15

    華大電子支持的主流開發(fā)工具有哪些

    華大電子支持的主流開發(fā)工具
    的頭像 發(fā)表于 09-28 10:43 ?572次閱讀
    華大電子支持的主流<b class='flag-5'>開發(fā)工具</b>有哪些

    三種開發(fā)工具的功能和優(yōu)勢

    您喜歡搗鼓電子設(shè)備并自己動手制作項目嗎?如果是,您可能會對Raspberry Pi、Arduino、ROCK及其他能幫助實現(xiàn)DIY目標的開發(fā)工具感興趣。Raspberry Pi在全球已售出約3000萬臺,這一令人矚目的成績說明這類開發(fā)工具正在改變我們的創(chuàng)新方式。
    的頭像 發(fā)表于 09-25 16:45 ?961次閱讀

    eForce無線通信軟件開發(fā)工具包兼容WLAN模塊WKR612AA1

    近期,eForce株式會社宣布,其面向嵌入式設(shè)備的無線通信軟件開發(fā)工具包(μC3-WLAN SDK)現(xiàn)已兼容 KAGA FEI 生產(chǎn)的無線局域網(wǎng)(WLAN)模塊"WKR612AA1"。
    的頭像 發(fā)表于 09-24 15:16 ?1321次閱讀

    IAR開發(fā)工具鏈有什么優(yōu)勢

    開發(fā)安全關(guān)鍵型應(yīng)用時,選擇具備成熟歷史的硬件平臺、完善的應(yīng)用與診斷軟件,以及經(jīng)過功能安全認證的開發(fā)工具鏈,是確保項目順利啟動并高效完成開發(fā)和認證的關(guān)鍵。這一組合不僅顯著節(jié)省時間與成本,還能幫助
    的頭像 發(fā)表于 08-06 09:36 ?1156次閱讀

    IQM 宣布 Resonance 量子云平臺重大升級,推出全新軟件開發(fā)工具包

    進程,并為終端用戶帶來性能強大的新一代量子系統(tǒng)。 此次升級將 Qrisp——一個源自德國弗勞恩霍夫 FOKUS 研究所的項目——設(shè)為平臺新的默認軟件開發(fā)工具包 (SDK)。Qrisp 為量子開發(fā)
    的頭像 發(fā)表于 07-11 11:03 ?694次閱讀

    Silicon Labs最新版本Simplicity Studio開發(fā)工具包SiSDK 2025.6.0增添多項無線技術(shù)協(xié)作

    ? Silicon Labs(芯科科技)在2025年第二季度發(fā)布了Simplicity Studio軟件開發(fā)工具的最新版本— SiSDK 2025.6.0。此次更新在無線協(xié)議棧、通信協(xié)議及開發(fā)工具
    的頭像 發(fā)表于 07-02 15:39 ?2439次閱讀

    IAR開發(fā)平臺升級Arm和RISC-V開發(fā)工具鏈,加速現(xiàn)代嵌入式系統(tǒng)開發(fā)

    IAR正式發(fā)布其旗艦產(chǎn)品的重大更新版本:Arm開發(fā)工具鏈v9.70和RISC-V開發(fā)工具鏈v3.40。
    的頭像 發(fā)表于 06-11 14:28 ?985次閱讀

    rk3568開發(fā)工具

    rk3568開發(fā)工具
    發(fā)表于 04-16 17:03 ?7次下載

    AI開發(fā)工具分類與功能

    當下,AI開發(fā)工具不僅簡化了AI開發(fā)的復雜流程,還提高了開發(fā)效率,推動了AI技術(shù)的廣泛應(yīng)用。下面,AI部落小編為大家介紹AI開發(fā)工具的分類及其功能。
    的頭像 發(fā)表于 04-12 10:12 ?1301次閱讀

    鴻蒙北向開發(fā)OpenHarmony5.0 DevEco Studio開發(fā)工具安裝與配置

    本文介紹OpenHarmony5.0 DevEco Studio開發(fā)工具安裝與配置,鴻蒙北向開發(fā)入門必備!由觸覺智能Purple Pi OH鴻蒙開發(fā)板演示。搭載了瑞芯微RK3566四核處理器,支持開源鴻蒙OpenHarmony3
    的頭像 發(fā)表于 03-28 18:05 ?1665次閱讀
    鴻蒙北向<b class='flag-5'>開發(fā)</b>OpenHarmony5.0 DevEco Studio<b class='flag-5'>開發(fā)工具</b>安裝與配置