91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

后摩爾時代的創(chuàng)新:在米爾FPGA上實現(xiàn)Tiny YOLO V4,助力AIoT應(yīng)用

米爾電子 ? 2024-11-22 01:00 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

學(xué)習(xí)如何在 MYIR 的 ZU3EG FPGA 開發(fā)板上部署 Tiny YOLO v4,對比 FPGA、GPU、CPU 的性能,助力 AIoT 邊緣計算應(yīng)用。

一、為什么選擇 FPGA:應(yīng)對 7nm 制程與 AI 限制

在全球半導(dǎo)體制程限制和高端 GPU 受限的大環(huán)境下,F(xiàn)PGA 成為了中國企業(yè)發(fā)展的重要路徑之一。它可支持靈活的 AIoT 應(yīng)用,其靈活性與可編程性使其可以在國內(nèi)成熟的 28nm 工藝甚至更低節(jié)點的制程下實現(xiàn)高效的硬件加速。

米爾的 ZU3EG 開發(fā)板憑借其可重構(gòu)架構(gòu)為 AI 和計算密集型任務(wù)提供了支持,同時避免了 7nm 工藝對國產(chǎn)芯片設(shè)計的制約。通過在 ZU3EG 上部署 Tiny YOLO V4,我們可以為智能家居、智慧城市等 AIoT 應(yīng)用提供高效的解決方案。

1fd53440-a82a-11ef-8084-92fbcf53809c.png1ff59190-a82a-11ef-8084-92fbcf53809c.png

CPU GPU FPGA 架構(gòu)對比

二、了解 Tiny YOLO 模型及其適用性

YOLO(You Only Look Once)是一種實時物體檢測模型,它通過一次性掃描整個圖像,實現(xiàn)高效的對象識別。

而其簡化版 Tiny YOLO V4 更適合嵌入式設(shè)備,具有較少的層數(shù)和參數(shù)。其輕量化特性更適合在資源受限的設(shè)備上運行,尤其在低功耗、實時檢測的邊緣計算設(shè)備中表現(xiàn)出色。

相比傳統(tǒng) GPU,F(xiàn)PGA 能在小面積和低功耗下實現(xiàn)類似的推理性能,非常契合 AIoT 應(yīng)用。像米爾 ZU3EG 這樣的 FPGA 開發(fā)板,通過底板和豐富接口的載板設(shè)計,非常適合高效的嵌入式低功耗數(shù)據(jù)處理。

20207e64-a82a-11ef-8084-92fbcf53809c.png

Yolo V4 網(wǎng)絡(luò)結(jié)構(gòu)圖

204930fc-a82a-11ef-8084-92fbcf53809c.png

Tiny Yolo V4 網(wǎng)絡(luò)結(jié)構(gòu)圖

(通過優(yōu)化網(wǎng)絡(luò)結(jié)構(gòu)和參數(shù),保持較高檢測精度的同時,降低模型的計算量和內(nèi)存占用)

三、獲取數(shù)據(jù)集和模型

可下載開源訓(xùn)練集或預(yù)訓(xùn)練模型。為了確保兼容性,建議將模型轉(zhuǎn)換為 ONNX 格式,以便后續(xù)能在 FPGA 上完成優(yōu)化。

1.下載 Tiny YOLO V4 模型:從Darknet 的 GitHub 倉庫獲取 Tiny YOLO 的預(yù)訓(xùn)練權(quán)重,或者在 COCO 等數(shù)據(jù)集上自行訓(xùn)練模型。自定義的模型適用于特定應(yīng)用場景(如車輛檢測、人臉檢測等)。

2.數(shù)據(jù)準備:若要自定義模型,可使用 LabelImg 等工具對數(shù)據(jù)集進行標(biāo)注,將數(shù)據(jù)轉(zhuǎn)為 YOLO 格式。之后,可將 YOLO 格式轉(zhuǎn)換為 ONNX 格式,以便兼容 FPGA 優(yōu)化工具鏈。

206cb2fc-a82a-11ef-8084-92fbcf53809c.png

Tiny YOLO 在 Darknet 上訓(xùn)練的截圖

四、通過 Vivado HLS 為 FPGA 準備模型

要將模型部署到 FPGA,需要將神經(jīng)網(wǎng)絡(luò)操作轉(zhuǎn)換為硬件級描述。使用 Xilinx 的 Vitis HLS(高級綜合)可以將 Tiny YOLO v4 的 C++ 模型代碼的轉(zhuǎn)化為 Verilog RTL(寄存器傳輸級)代碼,從而將模型從軟件世界帶入硬件實現(xiàn)。

詳細步驟

1.模型層映射和優(yōu)化

  • 將 YOLO 的每一層(如卷積層、池化層)映射為硬件友好的 C/C++ 結(jié)構(gòu)。例如,將卷積映射為乘累加(MAC)數(shù)組,通過流水線實現(xiàn)并行化。

2.算子加速與指令優(yōu)化

  • 流水線(Pipelining):利用流水線來處理多項操作并行,減少延遲。

  • 循環(huán)展開(Loop Unrolling):展開循環(huán),以每周期處理更多數(shù)據(jù),尤其在卷積操作中有效。

  • 設(shè)置 DATAFLOW指令,使層間獨立處理。

3.量化與位寬調(diào)整

  • 將激活值和權(quán)重量化為定點精度(例如 INT8),而非浮點數(shù)。這在維持準確度的同時顯著降低計算量,尤其適合 FPGA 的固定點運算支持。
209fc19c-a82a-11ef-8084-92fbcf53809c.png

Tiny YOLO 模型在 Vivado HLS 中的層層轉(zhuǎn)化流程圖

五、使用 Vivado 綜合與部署 Verilog 到 米爾的ZU3EG FPGA開發(fā)板

當(dāng) HLS 生成的 RTL 代碼準備就緒后,可以使用 Vivado 將模型部署到 FPGA。

1.Vivado 中的設(shè)置

將 HLS 輸出的 RTL 文件導(dǎo)入 Vivado。

在 Vivado 中創(chuàng)建模塊設(shè)計,包括連接AXI 接口與 ZU3EG 的 ARM 核連接。

2.I/O 約束與時序

定義 FPGA 的 I/O 引腳約束,以匹配 ZU3EG 板的特定管腳配置。配置時鐘約束以滿足合適的數(shù)據(jù)速率(如視頻數(shù)據(jù) 100-200 MHz)。

進行時序分析,確保延遲和響應(yīng)速度達到實時要求。

3.生成比特流并下載到 ZU3EG

生成的比特流可以直接通過 JTAG 或以太網(wǎng)接口下載到 ZU3EG。

20e78144-a82a-11ef-8084-92fbcf53809c.png

將 Tiny YOLO 處理模塊連接到 米爾ZU3EG開發(fā)板 的外設(shè)和接口

六、在 FPGA 上測試并運行推理

現(xiàn)在 Tiny YOLO 已部署,可以驗證其實時對象檢測性能。

1.數(shù)據(jù)采集

  • 通過連接的相機模塊捕捉圖像或視頻幀,或者使用存儲的測試視頻。

  • 使用 ZU3EG 的 ARM 核上的 OpenCV 對幀進行預(yù)處理,再將它們傳入 FPGA 預(yù)處理后進行推理。

2.后處理與顯示

  • 模型檢測對象后,輸出邊框和類別標(biāo)簽。使用 OpenCV 將邊框映射回原始幀,并在每個檢測到的對象周圍顯示類別和置信度。

3.性能測試

  • 測量幀速率(FPS)和檢測準確度。微調(diào)量化位寬或數(shù)據(jù)流參數(shù),以優(yōu)化實時需求。
2109e676-a82a-11ef-8084-92fbcf53809c.png

Tiny YOLO 模型在 ZU3EG 上顯示檢測結(jié)果的實時輸出,視頻幀中標(biāo)注了檢測到的對象

七、性能優(yōu)化與調(diào)試技巧

為提高性能,可以進行以下調(diào)整:

  • 內(nèi)存訪問:設(shè)計數(shù)據(jù)存儲方式,最大限度利用緩存并減少數(shù)據(jù)傳輸,降低內(nèi)存瓶頸。

  • 降低延遲:重新評估關(guān)鍵路徑延遲。若延遲過高,調(diào)整 Vitis HLS 中的流水線深度,并驗證層間的數(shù)據(jù)依賴性。

  • 量化改進:嘗試 INT8 量化。Xilinx 的 Vitis AI 可幫助微調(diào)量化參數(shù),以平衡準確性與速度。

2148355c-a82a-11ef-8084-92fbcf53809c.png

不同優(yōu)化配置對資源使用的影響

215bf43e-a82a-11ef-8084-92fbcf53809c.png

米爾MYC-CZU3EG/4EV/5EV-V2核心板及開發(fā)板

在MYIR 的 ZU3EG 開發(fā)平臺上提供了一種高效的解決方案。利用 FPGA 獨特的靈活性和低功耗優(yōu)勢,助力未來 AIoT 設(shè)備的普及和智能升級。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • FPGA
    +關(guān)注

    關(guān)注

    1660

    文章

    22412

    瀏覽量

    636351
  • AIoT
    +關(guān)注

    關(guān)注

    8

    文章

    1643

    瀏覽量

    34119
  • 米爾電子
    +關(guān)注

    關(guān)注

    2

    文章

    189

    瀏覽量

    1071
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    攜手伏達半導(dǎo)體:RedPKG解決方案助力封裝自主,加速產(chǎn)品創(chuàng)新

    伴隨摩爾定律逐步放緩,摩爾時代正式來臨,半導(dǎo)體產(chǎn)業(yè)的技術(shù)創(chuàng)新重心向封裝領(lǐng)域持續(xù)傾斜。因此,追求高效與自主的半導(dǎo)體產(chǎn)業(yè)浪潮中,封裝已成為連
    的頭像 發(fā)表于 01-28 18:04 ?147次閱讀
    攜手伏達半導(dǎo)體:RedPKG解決方案<b class='flag-5'>助力</b>封裝自主,加速產(chǎn)品<b class='flag-5'>創(chuàng)新</b>

    YOLO5目標(biāo)檢測方案-基于米爾RK3576開發(fā)板

    本文基于米爾MYD-LR3576開發(fā)板,詳細記錄了如何利用500萬像素USB攝像頭實現(xiàn)640×640分辨率的YOLO5s目標(biāo)檢測,并將結(jié)果實時輸出至1080P屏幕的全流程。通過系統(tǒng)級的軟硬件協(xié)同優(yōu)化
    發(fā)表于 01-22 19:21

    米爾SECC方案助力國標(biāo)充電樁出海

    。 ISO 15118充電協(xié)議架構(gòu)三、米爾SECC方案核心架構(gòu) PLC調(diào)制解調(diào)電路:將高頻載波信號疊加在充電控制信號(CP)和地線(PE)實現(xiàn)充電樁與車輛之間的數(shù)據(jù)傳輸; CP信號生成電路:產(chǎn)生特定
    發(fā)表于 11-07 19:32

    如何利用Verilog HDLFPGA實現(xiàn)SRAM的讀寫測試

    本篇將詳細介紹如何利用Verilog HDLFPGA實現(xiàn)SRAM的讀寫測試。SRAM是一種非易失性存儲器,具有高速讀取和寫入的特點。
    的頭像 發(fā)表于 10-22 17:21 ?4345次閱讀
    如何利用Verilog HDL<b class='flag-5'>在</b><b class='flag-5'>FPGA</b><b class='flag-5'>上</b><b class='flag-5'>實現(xiàn)</b>SRAM的讀寫測試

    追加!30套FPGA開發(fā)板免費送!米爾-安路飛龍派創(chuàng)意秀活動再開啟

    大賽簡介 日前,米爾電子2025年舉辦的米爾-安路飛龍派FPGA/FPSoC創(chuàng)意開發(fā)大賽圓滿落幕,吸引了眾多工程師踴躍參與。為持續(xù)推動技術(shù)創(chuàng)新,
    發(fā)表于 09-22 10:26

    追加!30套FPGA開發(fā)板免費送!米爾-安路飛龍派創(chuàng)意秀活動再開啟

    大賽簡介日前,米爾電子2025年舉辦的米爾-安路飛龍派FPGA/FPSoC創(chuàng)意開發(fā)大賽圓滿落幕,吸引了眾多工程師踴躍參與。為持續(xù)推動技術(shù)創(chuàng)新,米爾
    的頭像 發(fā)表于 09-18 08:04 ?6232次閱讀
    追加!30套<b class='flag-5'>FPGA</b>開發(fā)板免費送!<b class='flag-5'>米爾</b>-安路飛龍派創(chuàng)意秀活動再開啟

    單板挑戰(zhàn)4路YOLOv8!米爾瑞芯微RK3576開發(fā)板性能實測

    *1080分辨率,30幀。經(jīng)過MYD-LR3576開發(fā)板處理,單路視頻輸出1920*1080,25fps,4路視頻加起來60~70幀,cpu占用率接近100%,NPU綜合利用率5
    發(fā)表于 09-12 17:52

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+工藝創(chuàng)新將繼續(xù)維持著摩爾神話

    有人認為摩爾神話會在2028年破滅,也有人在修正著不同的時間點,當(dāng)目前它還依然發(fā)揮著作用。不過它的持續(xù)有效性,并不意為著半導(dǎo)體技術(shù)的發(fā)展沒遇到挑戰(zhàn),伴隨著半導(dǎo)體設(shè)備的微型化,其物理極限已開始呈現(xiàn)
    發(fā)表于 09-06 10:37

    摩爾時代破局者:物元半導(dǎo)體領(lǐng)航中國3D集成制造產(chǎn)業(yè)

    全球半導(dǎo)體產(chǎn)業(yè)邁入“摩爾時代”的背景下,傳統(tǒng)制程微縮帶來的性能提升逐漸趨緩,而先進封裝技術(shù),尤其是2.5D/3D堆疊封裝,正成為延續(xù)芯片性能增長的關(guān)鍵路徑。 據(jù)Yole數(shù)據(jù)顯示,2022年全球
    的頭像 發(fā)表于 08-04 15:53 ?1234次閱讀
    <b class='flag-5'>后</b><b class='flag-5'>摩爾時代</b>破局者:物元半導(dǎo)體領(lǐng)航中國3D集成制造產(chǎn)業(yè)

    樹莓派5開啟YOLO姿態(tài)估計識別之旅!

    大家好,接下來會為大家開一個樹莓派5和YOLO的連載文章。內(nèi)容包括四個部分:樹莓派5使用YOLO進行物體和動物識別-入門指南樹莓派5
    的頭像 發(fā)表于 07-18 15:31 ?2498次閱讀
    <b class='flag-5'>在</b>樹莓派5<b class='flag-5'>上</b>開啟<b class='flag-5'>YOLO</b>姿態(tài)估計識別之旅!

    樹莓派5使用YOLO進行物體和動物識別-入門指南

    大家好,接下來會為大家開一個樹莓派5和YOLO的專題。內(nèi)容包括四個部分:樹莓派5使用YOLO進行物體和動物識別-入門指南樹莓派5
    的頭像 發(fā)表于 07-17 17:16 ?2054次閱讀
    <b class='flag-5'>在</b>樹莓派5<b class='flag-5'>上</b>使用<b class='flag-5'>YOLO</b>進行物體和動物識別-入門指南

    K230micropython下能實現(xiàn)同時用USB攝像頭和板載攝像頭YOLO識別并顯示IDE嗎?

    K230micropython下能實現(xiàn)同時用USB攝像頭和板載攝像頭YOLO識別并顯示IDE嗎?以及如何提高USB進行YOLO識別的幀數(shù)
    發(fā)表于 06-20 06:35

    米爾出席2025安路科技FPGA技術(shù)沙龍

    2025年6月12日,由安路科技主辦的2025FPGA技術(shù)沙龍南京正式召開,深圳市米爾電子有限公司(簡稱:米爾電子)作為國產(chǎn)FPGA的代表
    的頭像 發(fā)表于 06-19 08:04 ?1573次閱讀
    <b class='flag-5'>米爾</b>出席2025安路科技<b class='flag-5'>FPGA</b>技術(shù)沙龍

    強強聯(lián)手!米爾×安路IDH合作共筑FPGA新生態(tài)

    與高可靠性支持?。而米爾電子憑借嵌入式模組領(lǐng)域十余年的技術(shù)積累,已為超3萬家企業(yè)客戶提供基于ARM、FPGA、RISC-V等架構(gòu)的核心板解決方案,尤其
    發(fā)表于 04-27 16:43

    喜訊!米爾電子與安路科技達成IDH生態(tài)戰(zhàn)略合作,共筑FPGA創(chuàng)新生態(tài)

    及行業(yè)解決方案,助力開發(fā)者開發(fā)成功,加速工業(yè)控制、邊緣智能、汽車電子等領(lǐng)域的創(chuàng)新應(yīng)用落地?。米爾電子&安路科技IDH生態(tài)合作證書?硬核技術(shù)+生態(tài)協(xié)同?安路科技作為
    的頭像 發(fā)表于 04-25 08:06 ?2037次閱讀
    喜訊!<b class='flag-5'>米爾</b>電子與安路科技達成IDH生態(tài)戰(zhàn)略合作,共筑<b class='flag-5'>FPGA</b><b class='flag-5'>創(chuàng)新</b>生態(tài)