精品一区二区三区亚洲有限公司,免费草草草草草视频,在线播放A片人人看人人看

Xilinx zynq系列FPGA實(shí)現(xiàn)神經(jīng)網(wǎng)絡(luò)評(píng)估

本篇目錄

1. 內(nèi)存占用

1.1FPGA程序中內(nèi)存的實(shí)現(xiàn)方式

1.2Zynq的BRAM內(nèi)存大小

1.3一個(gè)卷積操作占用的內(nèi)存

2. PipeCNN可實(shí)現(xiàn)性

PipeCNN論文解析：用OpenCL實(shí)現(xiàn)FPGA上的大型卷積網(wǎng)絡(luò)加速

2.1已實(shí)現(xiàn)的PipeCNN資源消耗

3. 實(shí)現(xiàn)大型神經(jīng)網(wǎng)絡(luò)的方法

4. Virtex-7高端FPGA概覽、7系列FPGA相關(guān)文檔

正文

0Zynq7000系列概覽

1內(nèi)存占用

1.1 FPGA程序中內(nèi)存的實(shí)現(xiàn)方式

參閱xilinx文檔UG998

FPGA并沒有像軟件那樣用已有的cache，F(xiàn)PGA的HLS編譯器會(huì)在FPGA中創(chuàng)建一個(gè)快速的memory architecture以最好的適應(yīng)算法中的數(shù)據(jù)樣式（data layout）。因此FPGA可以有相互獨(dú)立的不同大小的內(nèi)部存儲(chǔ)空間，例如寄存器，移位寄存器，F(xiàn)IFOs和BRAMs。

寄存器：最快的內(nèi)存結(jié)構(gòu)，集成在在運(yùn)算單元之中，獲取不需要額外的時(shí)延。

移位寄存器：可以被當(dāng)作一個(gè)數(shù)據(jù)序列，每一個(gè)數(shù)據(jù)可以在不同的運(yùn)算之中被重復(fù)使用。將其中所有數(shù)據(jù)移動(dòng)到相鄰的存儲(chǔ)設(shè)備中只需要一個(gè)時(shí)鐘周期。

FIFO：只有一個(gè)輸入和輸出的數(shù)據(jù)序列，通常被用于循環(huán)或循環(huán)函數(shù)，細(xì)節(jié)會(huì)被HLS編譯器處理。

BRAM：集成在FPGA fabric模塊中的RAM，每個(gè)xilinx的FPGA中集成有多個(gè)這樣的BRAM?？梢员划?dāng)作有以下特性的cache：1.不支持像處理器cache中那樣的緩存一致性（cache coherency,collision）,不支持處理器中的一些邏輯類型。2.只在設(shè)備有電時(shí)保持內(nèi)存。3.不同的BRAM塊可以同時(shí)傳輸數(shù)據(jù)。

1.2Zynq的BRAM內(nèi)存大小

zynq 7z020的BRAM為4.9Mb，7z035的BRAM為17.6Mb（2.2MB）

1.3一個(gè)卷積操作占用的內(nèi)存

例如，我們實(shí)現(xiàn)的卷積函數(shù)，輸入27×600，卷積核16×27，輸出16×600，數(shù)據(jù)類型為float。

//convolution operationfor (i = 0; i < 16; i++) { for (j = 0; j < 600; j++) { result = 0; for (k = 0; k < 27; k++) { temp = weights[i*27+k] * buf_in[k*600+j]; result += temp; } buf_out[i*600+j] = result; } }

在HLS中生成的IPcore占用硬件資源為：

在vivado中搭建好系統(tǒng)，占用的資源為：

2PipeCNN可實(shí)現(xiàn)性

PipeCNN是一個(gè)基于OpenCL的FPGA實(shí)現(xiàn)大型卷積網(wǎng)絡(luò)的加速器。

PipeCNN解析文檔：

PipeCNN論文解析：用OpenCL實(shí)現(xiàn)FPGA上的大型卷積網(wǎng)絡(luò)加速

github地址：https://github.com/doonny/PipeCNN#how-to-use

2.1 已實(shí)現(xiàn)的PipeCNN資源消耗

對(duì)于Altera FPGA，運(yùn)用Intel's OpenCL SDKv16.1 toolset.

對(duì)于Xilinx FPGAs, theSDAcceldevelopment environment v2017.2 can be used.

Xilinx'sKCU1500(XCKU115 FPGA)（已經(jīng)有xilin的板子實(shí)現(xiàn)過pipeCNN，但是型號(hào)比zynq高很多）

硬件資源可以被三個(gè)宏調(diào)控，device/hw_param.cl. Change the following macros

VEC_SIZE

LANE_NUM

CONV_GP_SIZE_X

消耗資源為：

3實(shí)現(xiàn)大型神經(jīng)網(wǎng)絡(luò)的方法

方案一：壓縮模型到<2.2MB，可實(shí)現(xiàn)在BRAM中

優(yōu)點(diǎn)：1.速度快 2.實(shí)現(xiàn)方便

缺點(diǎn)：1.模型壓縮難度 2.難以實(shí)現(xiàn)大型網(wǎng)絡(luò)

方案二：用FPGA調(diào)用DDR

優(yōu)點(diǎn)：1.速度中等 2.可實(shí)現(xiàn)大型網(wǎng)絡(luò)

缺點(diǎn)：調(diào)用DDR有難度，開發(fā)周期長(zhǎng)

方案三：用片上單片機(jī)調(diào)用DDR（插入SD卡）分包傳入IPcore運(yùn)算

優(yōu)點(diǎn)：可實(shí)現(xiàn)大型網(wǎng)絡(luò)

缺點(diǎn)：速度較慢

4Virtex-7高端FPGA概覽

Virtex-7為高端FPGA，比Zynq高了一個(gè)檔次。

7系列FPGA相關(guān)文檔：

責(zé)任編輯：lq

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

FPGA

FPGA

+關(guān)注

關(guān)注
1660

文章
22412

瀏覽量
636418
神經(jīng)網(wǎng)絡(luò)

神經(jīng)網(wǎng)絡(luò)

+關(guān)注

關(guān)注
42

文章
4838

瀏覽量
107808
Xilinx

Xilinx

+關(guān)注

關(guān)注
73

文章
2200

瀏覽量
131159

原文標(biāo)題：Xilinx Zynq系列FPGA實(shí)現(xiàn)神經(jīng)網(wǎng)絡(luò)中相關(guān)資源評(píng)估

文章出處：【微信號(hào)：HXSLH1010101010，微信公眾號(hào)：FPGA技術(shù)江湖】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲日韩欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

搜索歷史

Xilinx Zynq系列FPGA實(shí)現(xiàn)神經(jīng)網(wǎng)絡(luò)中相關(guān)資源評(píng)估

評(píng)論