91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

干貨 | 機(jī)器學(xué)習(xí)加持,基于FPGA的高性能視覺(jué)應(yīng)用方案設(shè)計(jì)

5CTi_cirmall ? 來(lái)源:YXQ ? 2019-07-16 09:28 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

隨著攝像頭和其他設(shè)備產(chǎn)生的數(shù)據(jù)在快速增長(zhǎng),促使人們運(yùn)用機(jī)器學(xué)習(xí)從汽車(chē)、安防和其他應(yīng)用產(chǎn)生的影像中提取更多有用的信息。專(zhuān)用器件有望在嵌入式視覺(jué)應(yīng)用中實(shí)現(xiàn)高性能機(jī)器學(xué)習(xí) (ML) 推理。但是此類(lèi)器件大都處于早期開(kāi)發(fā)階段,因?yàn)樵O(shè)計(jì)人員正在努力尋找最有效的算法,甚至人工智能 (AI) 研究人員也在迅速推演新方法。

目前,開(kāi)發(fā)人員一般使用針對(duì) ML 的可用 FPGA 平臺(tái)來(lái)構(gòu)建嵌入式視覺(jué)系統(tǒng),以期滿足更高的性能要求。與此同時(shí),他們可以保持所需的靈活性,以跟上機(jī)器學(xué)習(xí)發(fā)展的步伐。

本文將介紹 ML 處理的要求,以及為何 FPGA 能解決許多性能問(wèn)題。然后,將介紹一個(gè)合適的基于 FPGA 的 ML 平臺(tái)及其使用方法。

機(jī)器學(xué)習(xí)算法和推理引擎

在 ML 算法中,卷積神經(jīng)網(wǎng)絡(luò) (CNN) 已成為圖像分類(lèi)的首選解決方案。其圖像識(shí)別的準(zhǔn)確率非常高,因而得以廣泛應(yīng)用于多種應(yīng)用,跨越不同的平臺(tái),例如智能手機(jī)、安防系統(tǒng)和汽車(chē)駕駛員輔助系統(tǒng)。作為一種深度神經(jīng)網(wǎng)絡(luò) (DNN),CNN 使用的神經(jīng)網(wǎng)絡(luò)架構(gòu)由專(zhuān)用層構(gòu)成。在對(duì)標(biāo)注圖像進(jìn)行訓(xùn)練期間,它會(huì)從圖像中提取特征,并使用這些特征給圖像分類(lèi)(參見(jiàn)“利用現(xiàn)成的軟硬件啟動(dòng)機(jī)器學(xué)習(xí)”)。

CNN 開(kāi)發(fā)人員通常在高性能系統(tǒng)或云平臺(tái)上進(jìn)行訓(xùn)練,使用圖形處理單元 (GPU) 加速在標(biāo)注圖像數(shù)據(jù)集(通常數(shù)以百萬(wàn)計(jì))上訓(xùn)練模型所需的巨量矩陣計(jì)算。訓(xùn)練完成之后,訓(xùn)練好的模型用在推理應(yīng)用中,對(duì)視頻流中的新圖像或幀進(jìn)行分類(lèi)。推理部署完成后,訓(xùn)練好的模型仍然需要執(zhí)行同樣的矩陣計(jì)算,但由于輸入量要少很多,開(kāi)發(fā)人員可以將 CNN 用于在通用硬件上運(yùn)行的普通機(jī)器學(xué)習(xí)應(yīng)用(參見(jiàn)“利用 Raspberry Pi 構(gòu)建機(jī)器學(xué)習(xí)應(yīng)用”)。

然而,對(duì)于許多應(yīng)用而言,通用平臺(tái)缺乏在 CNN 推理中同時(shí)實(shí)現(xiàn)高準(zhǔn)確率和高性能所需的性能。優(yōu)化技術(shù)和替代 CNN 架構(gòu)(如 MobileNet 或 SqueezeNet)有助于降低平臺(tái)要求,但通常會(huì)犧牲準(zhǔn)確率并增加推理延時(shí),而這可能與應(yīng)用要求相沖突。

與此同時(shí),快速發(fā)展的算法使得機(jī)器學(xué)習(xí) IC 的設(shè)計(jì)工作變得復(fù)雜,因?yàn)樾枰獧C(jī)器學(xué)習(xí) IC 既要足夠?qū)iT(mén)化以加速推理,又要足夠通用化以支持新算法。FPGA 多年來(lái)一直扮演著這一特定角色,提供加速關(guān)鍵算法所需的性能和靈活性,解決了通用處理器性能不足或沒(méi)有專(zhuān)用器件可用的問(wèn)題。

FPGA 作為機(jī)器學(xué)習(xí)平臺(tái)

對(duì)于機(jī)器學(xué)習(xí)而言,GPU 仍然是標(biāo)桿——這是早期的 FPGA 根本無(wú)法企及的。最近出現(xiàn)的一些器件,如 Intel Arria 10 GX FPGA 和 Lattice Semiconductor ECP5 FPGA,大大縮小了先進(jìn) FPGA 和 GPU 之間的差距。對(duì)于某些使用緊湊的整數(shù)數(shù)據(jù)類(lèi)型的 DNN 架構(gòu)來(lái)說(shuō),此類(lèi) FPGA 的性能/功耗比甚至高于主流 GPU。

高級(jí) FPGA 組合了嵌入式存儲(chǔ)器和數(shù)字信號(hào)處理 (DSP) 資源,對(duì)于一般矩陣乘法 (GEMM) 運(yùn)算能夠?qū)崿F(xiàn)很高的性能。其嵌入式存儲(chǔ)器靠近計(jì)算引擎,從而緩解了 CPU 存儲(chǔ)器瓶頸,而這種瓶頸通常會(huì)限制通用處理器上機(jī)器學(xué)習(xí)算法的性能。反之,相比于典型 DSP 器件(圖 1),F(xiàn)PGA 上的嵌入式 DSP 計(jì)算引擎提供了更多的并行乘法器資源。FPGA 廠商在交付專(zhuān)門(mén)用于機(jī)器學(xué)習(xí)的 FPGA 開(kāi)發(fā)平臺(tái)時(shí)充分利用了這些特性。

例如,Intel 最近推出的支持 FPGA 的 OPENVINO? 擴(kuò)展了該平臺(tái)將推理模型部署到不同類(lèi)型設(shè)備(包括 GPU、CPU 和 FPGA)的能力。在該平臺(tái)上,開(kāi)發(fā)人員可使用 Intel 的深度學(xué)習(xí)推理引擎工作流程,其中整合了 Intel 深度學(xué)習(xí)部署工具包和在 Intel OPENVINO 工具包中提供的 Intel 計(jì)算機(jī)視覺(jué)軟件開(kāi)發(fā)套件 (SDK)。開(kāi)發(fā)人員使用 SDK 的應(yīng)用編程接口 (API) 構(gòu)建模型,并且可利用 Intel 的運(yùn)行模型優(yōu)化器針對(duì)不同硬件平臺(tái)進(jìn)行優(yōu)化。

深度學(xué)習(xí)部署工具包旨在與 Intel DK-DEV-10AX115S-A Arria 10 GX FPGA 開(kāi)發(fā)套件配合使用,讓開(kāi)發(fā)人員能從領(lǐng)先的 ML 框架(包括 Caffe 和 TensorFlow)導(dǎo)入訓(xùn)練好的模型(圖 2)。在諸如 Arria 10 GX FPGA 開(kāi)發(fā)套件之類(lèi)目標(biāo)平臺(tái)或使用 Arria 10 GX FPGA 器件的定制設(shè)計(jì)上,工具包中的模型優(yōu)化器和推理引擎分別處理模型轉(zhuǎn)換和部署。

為了遷移預(yù)訓(xùn)練模型,開(kāi)發(fā)人員使用基于 Python 的模型優(yōu)化器生成了一個(gè)中間表示 (IR),該表示包含在一個(gè)提供網(wǎng)絡(luò)拓?fù)涞?xml 文件和一個(gè)以二進(jìn)制值提供模型參數(shù)的 bin 文件中。除了生成 IR 之外,模型優(yōu)化器還會(huì)執(zhí)行一項(xiàng)關(guān)鍵功能——移除模型中用于訓(xùn)練但對(duì)推理毫無(wú)作用的層。此外,該工具會(huì)在可能的情況下將每個(gè)提供獨(dú)立數(shù)學(xué)運(yùn)算的層合并到一個(gè)組合層中。

通過(guò)這種網(wǎng)絡(luò)修剪和合并,模型變得更緊湊,進(jìn)而加快推理時(shí)間并減少對(duì)目標(biāo)平臺(tái)的存儲(chǔ)器需求。

Intel 推理引擎是一個(gè) C++ 庫(kù),其中包含一組 C++ 類(lèi)。這些類(lèi)對(duì)于受支持的目標(biāo)硬件平臺(tái)來(lái)說(shuō)是通用的,因此可以在各個(gè)平臺(tái)上實(shí)現(xiàn)推理。對(duì)于推理應(yīng)用而言,開(kāi)發(fā)人員使用像 CNNNetReader 這樣的類(lèi)來(lái)讀取 xml 文件 (ReadNetwork) 中包含的 CNN 拓?fù)湟约?bin 文件 (ReadWeights) 中包含的模型參數(shù)。模型加載完成后,調(diào)用類(lèi)方法 Infer() 執(zhí)行阻塞推理,同時(shí)調(diào)用類(lèi)方法 StartAsync() 執(zhí)行異步推理,當(dāng)推理完成時(shí)使用等待或完成例程處理結(jié)果。

Intel 在 OPENVINO 環(huán)境提供的多個(gè)示例應(yīng)用程序中演示了完整的工作流程和詳細(xì)的推理引擎 API 調(diào)用。例如,安全屏障攝像機(jī)示例應(yīng)用程序展示了使用推理模型流水線,以首先確定車(chē)輛邊界框(圖 3)。流水線中的下一個(gè)模型檢查了邊界框中的內(nèi)容,識(shí)別車(chē)輛類(lèi)別、顏色和車(chē)牌位置等車(chē)輛屬性。

流水線中的最后一個(gè)模型使用這些車(chē)輛屬性從車(chē)牌中提取字符。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • FPGA
    +關(guān)注

    關(guān)注

    1660

    文章

    22412

    瀏覽量

    636318
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8553

    瀏覽量

    136948

原文標(biāo)題:機(jī)器學(xué)習(xí)加持,基于FPGA的高性能視覺(jué)應(yīng)用方案設(shè)計(jì)

文章出處:【微信號(hào):cirmall,微信公眾號(hào):電路設(shè)計(jì)技能】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    深度解析瑞芯微RK182X系列:一款為AI機(jī)器視覺(jué)而生的高性能協(xié)處理器

    在 AI 與機(jī)器視覺(jué)技術(shù)飛速發(fā)展的當(dāng)下,終端設(shè)備對(duì)算力、能效及兼容性的要求日益嚴(yán)苛。瑞芯微(Rockchip)于 2025 年推出的 RK182X 系列芯片,以 “高性能視覺(jué)協(xié)處理器”
    的頭像 發(fā)表于 02-09 16:44 ?1209次閱讀

    機(jī)器視覺(jué)網(wǎng)卡與普通網(wǎng)卡的5點(diǎn)關(guān)鍵不同

    隨著人工智能和工業(yè)自動(dòng)化的蓬勃發(fā)展,機(jī)器視覺(jué)技術(shù)扮演著越來(lái)越重要的角色。機(jī)器視覺(jué)系統(tǒng)依賴(lài)于高質(zhì)量的圖像數(shù)據(jù)進(jìn)行分析和決策,而高性能的網(wǎng)絡(luò)傳輸
    的頭像 發(fā)表于 01-15 16:38 ?225次閱讀
    <b class='flag-5'>機(jī)器</b><b class='flag-5'>視覺(jué)</b>網(wǎng)卡與普通網(wǎng)卡的5點(diǎn)關(guān)鍵不同

    國(guó)產(chǎn)高性能ONFI IP解決方案全解析

    1. 什么是ONFI IP?其在AI時(shí)代的作用是什么?ONFI (Open NAND Flash Interface) 是連接閃存控制器與NAND顆粒的關(guān)鍵高速接口協(xié)議。在AI和高性能計(jì)算(HPC
    發(fā)表于 01-13 16:15

    FPGA+GPU異構(gòu)混合部署方案設(shè)計(jì)

    為滿足對(duì) “納秒級(jí)實(shí)時(shí)響應(yīng)” 與 “復(fù)雜數(shù)據(jù)深度運(yùn)算” 的雙重需求,“FPGA+GPU”異構(gòu)混合部署方案通過(guò)硬件功能精準(zhǔn)拆分與高速協(xié)同,突破單一硬件的性能瓶頸 ——FPGA聚焦低延遲實(shí)
    的頭像 發(fā)表于 01-13 15:20 ?349次閱讀

    機(jī)器視覺(jué)的核心技術(shù)和應(yīng)用場(chǎng)景

    機(jī)器視覺(jué)正通過(guò)讓機(jī)器“看見(jiàn)”并解讀視覺(jué)數(shù)據(jù)來(lái)為行業(yè)帶來(lái)變革,進(jìn)而提升自動(dòng)化水平、質(zhì)量控制效率與運(yùn)營(yíng)效能。本文將深入探討機(jī)器
    的頭像 發(fā)表于 12-29 16:32 ?902次閱讀

    AMD UltraScale架構(gòu):高性能FPGA與SoC的技術(shù)剖析

    AMD UltraScale架構(gòu):高性能FPGA與SoC的技術(shù)剖析 在當(dāng)今的電子設(shè)計(jì)領(lǐng)域,高性能FPGA和MPSoC/RFSoC的需求日益增長(zhǎng)。AMD的UltraScale架構(gòu)憑借其創(chuàng)
    的頭像 發(fā)表于 12-15 14:35 ?558次閱讀

    Valens與 Imavix 聯(lián)手推出業(yè)界首款基于MIPI A-PHY 的機(jī)器視覺(jué)平臺(tái),CIS 同步發(fā)布首款符合A-PHY標(biāo)準(zhǔn)的攝像頭

    ”Imavix”)宣布,推出業(yè)內(nèi)首款量產(chǎn)級(jí)基于MIPI A-PHY的機(jī)器視覺(jué)平臺(tái),用于在機(jī)器視覺(jué)領(lǐng)域?qū)崿F(xiàn)高性能的 A-PHY 連接標(biāo)準(zhǔn)。該平
    的頭像 發(fā)表于 12-03 14:06 ?447次閱讀

    高精度機(jī)器人控制的核心——基于 MYD-LT536 開(kāi)發(fā)板的精密運(yùn)動(dòng)控制方案

    人控制”應(yīng)用中,系統(tǒng)必須具備高計(jì)算力、低延遲控制環(huán)路、實(shí)時(shí)反饋和多傳感器融合能力。 傳統(tǒng)的PLC或單片機(jī)方案在高并發(fā)計(jì)算與多軸同步控制方面往往性能不足,因此越來(lái)越多的工程師開(kāi)始采用基于高性能SoC平臺(tái)
    發(fā)表于 11-14 15:48

    機(jī)器視覺(jué)檢測(cè)PIN針

    : 結(jié)合形態(tài)學(xué)處理、特征提取(如長(zhǎng)寬比、面積)及深度學(xué)習(xí)(針對(duì)復(fù)雜缺陷),自動(dòng)檢出彎曲、斷裂、變形、污染等。輸出與控制:實(shí)時(shí)顯示檢測(cè)結(jié)果(OK/NG)及具體參數(shù)數(shù)值。生成檢測(cè)報(bào)告,支持?jǐn)?shù)據(jù)追溯。NG品自動(dòng)剔除信號(hào)輸出,無(wú)縫對(duì)接產(chǎn)線。了解更多機(jī)器
    發(fā)表于 09-26 15:09

    Molex莫仕適用于高性能機(jī)器視覺(jué)系統(tǒng)的先進(jìn)連接解決方案

    智能倉(cāng)儲(chǔ)和智能制造需要優(yōu)質(zhì)攝像頭和照明傳感器,無(wú)論是在履行服務(wù)還是生產(chǎn)流程時(shí),都能提供卓越的質(zhì)量控制。連接領(lǐng)域的最新創(chuàng)新可提供高性能系統(tǒng)所需的高數(shù)據(jù)速率、無(wú)縫通信和堅(jiān)固耐用性。Molex莫仕的組件
    的頭像 發(fā)表于 09-02 11:36 ?2613次閱讀

    FPGA機(jī)器學(xué)習(xí)中的具體應(yīng)用

    隨著機(jī)器學(xué)習(xí)和人工智能技術(shù)的迅猛發(fā)展,傳統(tǒng)的中央處理單元(CPU)和圖形處理單元(GPU)已經(jīng)無(wú)法滿足高效處理大規(guī)模數(shù)據(jù)和復(fù)雜模型的需求。FPGA(現(xiàn)場(chǎng)可編程門(mén)陣列)作為一種靈活且高效的硬件加速平臺(tái)
    的頭像 發(fā)表于 07-16 15:34 ?2890次閱讀

    【「# ROS 2智能機(jī)器人開(kāi)發(fā)實(shí)踐」閱讀體驗(yàn)】視覺(jué)實(shí)現(xiàn)的基礎(chǔ)算法的應(yīng)用

    閱讀心得體會(huì):ROS2機(jī)器視覺(jué)與地圖構(gòu)建技術(shù) 通過(guò)對(duì)本書(shū)第7章(ROS2視覺(jué)應(yīng)用)和第8章(ROS2地圖構(gòu)建)的學(xué)習(xí),我對(duì)機(jī)器
    發(fā)表于 05-03 19:41

    **【技術(shù)干貨】Nordic nRF54系列芯片:傳感器數(shù)據(jù)采集與AI機(jī)器學(xué)習(xí)的完美結(jié)合**

    【技術(shù)干貨】nRF54系列芯片:傳感器數(shù)據(jù)采集與AI機(jī)器學(xué)習(xí)的完美結(jié)合 近期收到不少伙伴咨詢nRF54系列芯片的應(yīng)用與技術(shù)細(xì)節(jié),今天我們整理幾個(gè)核心問(wèn)題與解答,帶你快速掌握如何在nRF54上部署AI
    發(fā)表于 04-01 00:00

    工業(yè)相機(jī)與采集卡配套方案:構(gòu)建高性能機(jī)器視覺(jué)系統(tǒng)的核心要素

    機(jī)器視覺(jué)技術(shù)作為人工智能和智能制造的關(guān)鍵組成部分,正日益廣泛地應(yīng)用于工業(yè)自動(dòng)化、質(zhì)量檢測(cè)、機(jī)器人引導(dǎo)等領(lǐng)域。而一套高性能機(jī)器
    的頭像 發(fā)表于 03-31 15:53 ?907次閱讀
    工業(yè)相機(jī)與采集卡配套<b class='flag-5'>方案</b>:構(gòu)建<b class='flag-5'>高性能</b><b class='flag-5'>機(jī)器</b><b class='flag-5'>視覺(jué)</b>系統(tǒng)的核心要素

    德晟達(dá)高性能服務(wù)器助力工業(yè)機(jī)器視覺(jué)落地

    處理以及多模態(tài)數(shù)據(jù)融合。在此背景下,服務(wù)器集群作為核心算力基礎(chǔ)設(shè)施,其高性能計(jì)算、低延遲推理及高可靠性特性,已成為支撐工業(yè)機(jī)器視覺(jué)系統(tǒng)規(guī)?;渴鸬年P(guān)鍵技術(shù)底座。
    的頭像 發(fā)表于 03-11 17:22 ?1138次閱讀