91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

利用Block Design加速設(shè)計(jì)

Comtech FPGA ? 來(lái)源:Comtech FPGA ? 作者:Comtech FPGA ? 2022-12-15 14:04 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

一 Block Design設(shè)計(jì)方法

早期的FPGA,資源是比較有限的,設(shè)計(jì)規(guī)模相對(duì)也比較小,之前的設(shè)計(jì)流程中工程師常用的設(shè)計(jì)以HDL+Xilinx IP為結(jié)構(gòu),設(shè)計(jì)中也會(huì)顧慮到FPGA資源的節(jié)省。

隨著FPGA的資源越來(lái)越大,設(shè)計(jì)的快速構(gòu)建、易修改、隨著版本可迭代的要求越來(lái)越高。好比在早期單片機(jī)時(shí)代,C語(yǔ)言是主流的工具;而處理器越來(lái)越強(qiáng),腳本類語(yǔ)言能更快構(gòu)建最終應(yīng)用。

Xilinx越來(lái)越多的例程,給出的參考設(shè)計(jì)是基于Block Design設(shè)計(jì)方法的,block design設(shè)計(jì)方法具備如下優(yōu)勢(shì):

A. 框圖形式,直觀易懂
Block Design基于框圖的形式,搭積木+連線的方式; B. 節(jié)省大量的Coding時(shí)間

互聯(lián)總線連線,可以鼠標(biāo)單一連線。Block Design的一個(gè)IP往往可以獨(dú)立運(yùn)行,比代碼的方式只是一個(gè)wrapper包含的內(nèi)容更多;

C. 可以隨著Vivado升級(jí),快速更新IP,保持設(shè)計(jì)更新
傳統(tǒng)HDL+IP的方式,IP升級(jí)后還需要檢查對(duì)應(yīng)HDL的適配。Block Design一般來(lái)說(shuō),IP作為一個(gè)模塊升級(jí),基本上Block Design直接升級(jí),內(nèi)部不用再干預(yù); D. 包括大量的通用IP,可以靈活構(gòu)建設(shè)計(jì)
尤其是基于AMBA的IP,可以幫助用戶快速靈活構(gòu)建設(shè)計(jì);

二 Block Design設(shè)計(jì)實(shí)例

如何理解Block Design設(shè)計(jì)方法、工具如何使用等問(wèn)題Xilinx有詳細(xì)的文檔手冊(cè)來(lái)介紹,本文中不做介紹,本文簡(jiǎn)單以一個(gè)實(shí)際的案例,介紹使用Block Design加速設(shè)計(jì)。

本文描述的這個(gè)設(shè)計(jì),需要4路光纖,運(yùn)行Aurora協(xié)議,各路Aurora線速率不同。最終Aurora協(xié)議的數(shù)據(jù)部分,還需要通過(guò)PCIe上傳到上位機(jī)。反過(guò)程是上位機(jī)的數(shù)據(jù),通過(guò)PCIe最終分發(fā)到4路Aurora光纖,向外傳輸。

本文描述的這個(gè)設(shè)計(jì)中的兩個(gè)要點(diǎn):

1. 利用DDR做大容量緩存

有很多應(yīng)用需要用DDR做緩存,例如常見(jiàn)的PCIe+Aurora收發(fā),或者ADC/DAC,圖像采集卡等,兩邊速率不匹配并且累計(jì)需要的容量超過(guò)FPGA內(nèi)部FIFO的時(shí)候,需要外部的DDR做緩沖。

早期Xilinx DDR IP的用戶接口,只提供了類似于FIFO那樣的接口,并且只有一個(gè)用戶接口。

05277c2c-7c3d-11ed-8abf-dac502259ad0.png

在傳統(tǒng)的RTL設(shè)計(jì)方法中,需要將DDR作為緩存,需要自己做如下設(shè)計(jì):

A. 多數(shù)據(jù)輸入輸出的接口,將app_接口擴(kuò)展多個(gè)獨(dú)立的接口,供不同的端口使用

B. 總線仲裁,多個(gè)獨(dú)立接口仲裁,按照round-robin,或者搶占式的方式提供仲裁

C. 地址管理,不同的端口深度要求不同的情況下,對(duì)應(yīng)管理不同的地址空間。

實(shí)現(xiàn)這些功能,大概需要寫(xiě)這么多代碼,對(duì)一個(gè)工程師來(lái)說(shuō),這些代碼可能需要2-4周的代碼和仿真時(shí)間:

053e1f7c-7c3d-11ed-8abf-dac502259ad0.png

如果使用Block Design實(shí)現(xiàn),1個(gè)小時(shí)差不多就可以實(shí)現(xiàn)上面的這些內(nèi)容,在Block Design中:

A. 最右側(cè)的DDR IP 直接出AXI接口;

B. 使用AXI Smart Connect實(shí)現(xiàn)多端口擴(kuò)展,自帶仲裁功能;

C. 使用DATAMOVER完成外圍FIFO數(shù)據(jù)到DDR的數(shù)據(jù)讀寫(xiě);

05516a6e-7c3d-11ed-8abf-dac502259ad0.png

搭建這個(gè)Block只需要10分鐘,到這一步為止,剩下的工作只需要控制DATAMOVER的命令接口即可。

2. 使用XDMA直接和DDR交互

過(guò)去Xilinx 平臺(tái)設(shè)計(jì)DMA,從最早的XAPP1052,到后來(lái)一些付費(fèi)的PLDA和NWlogicIP,設(shè)計(jì)復(fù)雜度不用說(shuō),哪怕購(gòu)買(mǎi)了IP也需要一些時(shí)間融入到自己的產(chǎn)品中。

Xilinx有一個(gè)XDMA IP,這個(gè)IP的介紹和使用參考PG195。這里使用Block Design,添加X(jué)DMA。

XDMA對(duì)外有2個(gè)接口:

A. 一個(gè)是AXI_LITE接口,這里接AXI_BRAM IP,對(duì)外是一個(gè)bram接口,用作寄存器接口,控制PCIe卡內(nèi)部的寄存器;

B. 一個(gè)是AXI Memory Full接口,可以直接對(duì)接DDR空間,訪問(wèn)所有的DDR部分;

05a198e0-7c3d-11ed-8abf-dac502259ad0.png

通過(guò)地址空間來(lái)看,DDR被PCIe XDMA和4路DATAMOVER共享,DATAMOVER外部接收的數(shù)據(jù)緩存在DDR空間,上位機(jī)可以直接讀走這片緩存的數(shù)據(jù),從而實(shí)現(xiàn)外部數(shù)據(jù)到上位機(jī)的過(guò)程。

05b4fdf4-7c3d-11ed-8abf-dac502259ad0.png

一個(gè)實(shí)際的PCIe Aurora光纖收發(fā)的工程,在Block Design中搭建這些框圖,外圍的代碼非常簡(jiǎn)單。下面是一個(gè)實(shí)際的工程,4光口的Aurora收發(fā)卡,使用DDR緩存,并且使用PCIe和上位機(jī)交互。

Block Design中包含了PCIe部分,以及上面的DDR緩沖的部分,外部只需要1個(gè)DATAMOVER寫(xiě)控制、1個(gè)DATAMOVER讀控制、1個(gè)寄存器接口,即完成整個(gè)設(shè)計(jì)。

05f96250-7c3d-11ed-8abf-dac502259ad0.png

三 結(jié)語(yǔ)

使用Block Design設(shè)計(jì)方法,主體部分都可以快速拖拽和連線完成,使得外圍所需要的的代碼大大簡(jiǎn)化,只需要區(qū)區(qū)3個(gè)模塊代碼,完成從數(shù)據(jù)流到DDR的緩沖以及通過(guò)XDMA讀取DDR的過(guò)程,從而完成外圍接口和上位機(jī)的通訊。

這個(gè)設(shè)計(jì)可以適配很多種Stream形式的設(shè)計(jì):

A. Aurora光纖收發(fā)卡;

B. Camera Link圖像采集卡;

C. AD/DA數(shù)據(jù)采集回放卡;

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • FPGA
    +關(guān)注

    關(guān)注

    1660

    文章

    22410

    瀏覽量

    636273
  • 代碼
    +關(guān)注

    關(guān)注

    30

    文章

    4968

    瀏覽量

    73960
  • Block
    +關(guān)注

    關(guān)注

    0

    文章

    26

    瀏覽量

    15154

原文標(biāo)題:利用Block Design加速設(shè)計(jì)

文章出處:【微信號(hào):Comtech FPGA,微信公眾號(hào):Comtech FPGA】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    利用Solido Design Environment準(zhǔn)確預(yù)測(cè)SRAM晶圓良率

    。本研究開(kāi)發(fā)出新型良率建模方法,將隨機(jī)離散缺陷注入 SRAM 良率預(yù)測(cè)。實(shí)踐表明,基于Solido Design Environment (Solido DE) 的新型位失效預(yù)測(cè)方法與硅實(shí)測(cè)數(shù)據(jù)幾乎完全吻合。
    的頭像 發(fā)表于 02-02 10:20 ?325次閱讀
    <b class='flag-5'>利用</b>Solido <b class='flag-5'>Design</b> Environment準(zhǔn)確預(yù)測(cè)SRAM晶圓良率

    利用NVIDIA Cosmos開(kāi)放世界基礎(chǔ)模型加速物理AI開(kāi)發(fā)

    NVIDIA 最近發(fā)布了 NVIDIA Cosmos 開(kāi)放世界基礎(chǔ)模型(WFM)的更新,旨在加速物理 AI 模型的測(cè)試與驗(yàn)證數(shù)據(jù)生成。借助 NVIDIA Omniverse 庫(kù)和 Cosmos,開(kāi)發(fā)者可以大規(guī)模生成基于物理學(xué)的合成數(shù)據(jù)。
    的頭像 發(fā)表于 12-01 09:25 ?1132次閱讀

    NVMe高速傳輸之?dāng)[脫XDMA設(shè)計(jì)45:上板資源占用率分析

    Block Design 設(shè)計(jì)后進(jìn)行綜合與實(shí)現(xiàn), NoP 邏輯加速引擎的在不同 FPGA 平臺(tái)中的資源占用率分別如表 1 和表 2 所示。 從表中可以看到, 本課題設(shè)計(jì)的 NoP邏輯加速
    發(fā)表于 11-13 08:36

    NVMe高速傳輸之?dāng)[脫XDMA設(shè)計(jì)44:工程設(shè)計(jì)考量?

    。 基于 VC709 FPGA 的 Block Design 工程設(shè)計(jì)如圖 1 所示。 圖中 CPU 模塊中包含了 Xilinx 提供的 Microblaze CPU 軟核以及一些內(nèi)存與復(fù)位模塊, 除時(shí)鐘
    發(fā)表于 11-12 09:52

    利用蜂鳥(niǎo)E203搭建SoC【1】——AXI總線的配置與板級(jí)驗(yàn)證

    由于Vivado中Block Design的友好的ui界面以及豐富的IP資源,在FPGA上實(shí)現(xiàn)SoC大多會(huì)采用Block Design進(jìn)行設(shè)計(jì)與實(shí)現(xiàn)。對(duì)于基于蜂鳥(niǎo)e203內(nèi)核的SoC設(shè)
    發(fā)表于 10-30 07:35

    利用蜂鳥(niǎo)E203搭建SoC【2】——外部中斷擴(kuò)展與驗(yàn)證

    /perips/sirv_plic_top.v,修改如下 加入后,對(duì)e203進(jìn)行打包,如下圖所示,其中usr_irq_0和usr_irq_1為擴(kuò)展的外部中斷端口,可以在Block Design中連接外設(shè)中斷信號(hào)
    發(fā)表于 10-29 07:14

    利用e203中NICE協(xié)處理器加速濾波運(yùn)算

    和加法器的方法來(lái)加速濾波運(yùn)算。 使用NICE協(xié)處理器加速的程序?yàn)橐粋€(gè)長(zhǎng)循環(huán),計(jì)算較長(zhǎng)(100到1000量級(jí))的兩個(gè)浮點(diǎn)數(shù)組乘累加的結(jié)果,分別命名為ifm (Input Feature Map
    發(fā)表于 10-21 13:40

    序禎達(dá)生物利用NVIDIA Parabricks技術(shù)加速多組學(xué)分析

    序禎達(dá)生物是中國(guó)領(lǐng)先的多組學(xué)和測(cè)序服務(wù)提供商之一,該公司利用 NVIDIA Parabricks 來(lái)加速多組學(xué)分析。借助 Parabricks,序禎達(dá)生物將全基因組測(cè)序的時(shí)間從 7 小時(shí)縮短至 31
    的頭像 發(fā)表于 09-29 16:05 ?967次閱讀

    如何利用硬件加速提升通信協(xié)議的安全性?

    產(chǎn)品實(shí)拍圖 利用硬件加速提升通信協(xié)議安全性,核心是通過(guò) 專用硬件模塊或可編程硬件 ,承接軟件層面難以高效處理的安全關(guān)鍵操作(如加密解密、認(rèn)證、密鑰管理等),在提升性能的同時(shí),通過(guò)硬件級(jí)隔離、防篡改等
    的頭像 發(fā)表于 08-27 09:59 ?976次閱讀
    如何<b class='flag-5'>利用</b>硬件<b class='flag-5'>加速</b>提升通信協(xié)議的安全性?

    The Ocean Cleanup攜手亞馬遜云科技 利用AI技術(shù)加速清除海洋塑料

    The Ocean Cleanup (“海洋清理”)展開(kāi)合作,充分利用亞馬遜云科技在人工智能(AI)、機(jī)器學(xué)習(xí)(ML)及云計(jì)算的能力,助力其清理大太平洋垃圾帶(Great Pacific Garbage
    的頭像 發(fā)表于 07-24 14:07 ?1011次閱讀

    全球各大品牌利用NVIDIA AI技術(shù)提升運(yùn)營(yíng)效率

    歐萊雅、LVMH 集團(tuán)和雀巢利用 NVIDIA 加速的智能體 AI 和物理 AI,大幅提升產(chǎn)品設(shè)計(jì)、營(yíng)銷及物流等方面的運(yùn)營(yíng)效率。
    的頭像 發(fā)表于 06-19 14:36 ?1201次閱讀

    粒子加速器?——?科技前沿的核心裝置

    粒子加速器全稱“荷電粒子加速器”,是一種利用電磁場(chǎng)在高真空環(huán)境中對(duì)帶電粒子(如電子、質(zhì)子、離子)進(jìn)行加速和控制,使其獲得高能量的特種裝置。粒子加速
    的頭像 發(fā)表于 06-19 12:05 ?3591次閱讀
    粒子<b class='flag-5'>加速</b>器?——?科技前沿的核心裝置

    新思科技利用人工智能加速芯片設(shè)計(jì)流程

    芯片開(kāi)發(fā)者常面臨極高設(shè)計(jì)復(fù)雜度與縮短產(chǎn)品上市時(shí)間的雙重壓力。任何有助于提升設(shè)計(jì)開(kāi)發(fā)效率、加速決策制定速度以及推進(jìn)其他進(jìn)度的舉措,都能為開(kāi)發(fā)者解燃眉之急。
    的頭像 發(fā)表于 04-17 10:12 ?874次閱讀

    S32Design Studio出錯(cuò)的原因?

    安裝 Windows 版本的 S32Design Studio 并構(gòu)建我們的項(xiàng)目時(shí),發(fā)生以下錯(cuò)誤。 ----- make -j12 全部 1 [main] make 1916 dofork:子進(jìn)程
    發(fā)表于 04-11 07:05

    安裝S32_Design_Studio_for_S32_Platform_3.6.0時(shí)出錯(cuò)怎么解決?

    我無(wú)法在 Windows 10 Pro 上安裝適用于 S32 平臺(tái) 3.6.0 的 S32 Design Studio。 安裝日志中有一個(gè)錯(cuò)誤條目: S32 Design Studio
    發(fā)表于 03-25 08:25