91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

在 FPGA 上實施 AI/ML 的選項

李晶 ? 2022-12-28 09:51 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

現(xiàn)場可編程門陣列 (FPGA) 以加速人工智能/機器學習應(yīng)用而聞名,但它是如何在 FPGA 中實現(xiàn)的,有哪些不同的方法?讓我們探索工程師的設(shè)計空間。

人工智能 (AI) 是云和邊緣應(yīng)用程序中的熱門話題。在許多情況下,人工智能可以實現(xiàn)更安全、更高效和安全的系統(tǒng)。人工智能已經(jīng)存在很長時間了,它于 1956 年由約翰·麥卡錫 (John McCarthy) 在第一次人工智能會議召開時首次使用。雖然幾十年來進行了大量研究,但僅在最近 5 到 10 年,人工智能系統(tǒng)才從實驗室和研究轉(zhuǎn)移到產(chǎn)品路線圖和產(chǎn)品中。

在云和邊緣環(huán)境中,部署最廣泛的 AI 形式之一是機器學習 (ML)。機器學習是對計算機算法的研究,它允許計算機程序通過經(jīng)驗自動改進。這方面的一個例子是為 ML 網(wǎng)絡(luò)提供帶有標簽的圖像數(shù)據(jù)集。機器學習算法識別圖像的特征和元素,以便在輸入新的未標記的、以前未見過的圖像時,ML 算法確定圖像包含任何已學習特征和元素的可能性??梢杂柧毚祟?ML 算法來檢測圖像中的對象、處理語音中的關(guān)鍵字以及分析傳感器數(shù)據(jù)的異常情況。典型應(yīng)用包括視覺引導(dǎo)機器人、車輛自主操作以及工業(yè)和安全關(guān)鍵系統(tǒng)的預(yù)測。

因此,ML 學習算法分為兩個要素,第一個是針對訓練數(shù)據(jù)集對網(wǎng)絡(luò)進行訓練。第二個是訓練網(wǎng)絡(luò)領(lǐng)域的部署,這些元素分別稱為訓練和推理。訓練準確的模型需要一個帶標簽的大型數(shù)據(jù)集,并且通常在基于云的 GPU 上執(zhí)行以加速訓練過程。設(shè)計工程師可以跨從 MCU 到 GPU 和 FPGA 的一系列技術(shù)部署訓練有素的網(wǎng)絡(luò)。

在 FPGA 中嵌入 AI

幾個非常流行的框架——Caffe、TensorFlow。和 Pytorch——幫助訓練和部署 AI/ML 系統(tǒng)。這些框架用于網(wǎng)絡(luò)定義、訓練和推理。

許多基于邊緣的人工智能系統(tǒng)的關(guān)鍵要素之一是能夠在確定的時間范圍內(nèi)執(zhí)行推理。例如,自動駕駛汽車必須快速檢測車輛、障礙物和行人以防止碰撞。這需要一個既響應(yīng)又確定的解決方案,響應(yīng)是因為傳感器數(shù)據(jù)必須以最小延遲快速處理,確定是因為每個輸入的響應(yīng)時間必須相同并且不依賴于系統(tǒng)操作條件或資源使用,例如,使用共享 DDR 內(nèi)存會減慢響應(yīng)時間。

由于響應(yīng)性和確定性的要求,基于邊緣的解決方案的開發(fā)人員通常以 FPGA 或基于異構(gòu) SoC 的解決方案為目標。這些為開發(fā)人員提供了可編程邏輯,是實現(xiàn)機器學習網(wǎng)絡(luò)的理想選擇,因為它的并行特性支持響應(yīng)式應(yīng)用程序和非常確定的解決方案。

在可編程邏輯中實現(xiàn) ML 推理時,可以采用兩種方法。在使用浮點數(shù)學開發(fā)和訓練神經(jīng)網(wǎng)絡(luò)時,無論采用哪種方法,F(xiàn)PGA 或異構(gòu) SoC 中的實現(xiàn)通常都使用定點實現(xiàn)。從浮點數(shù)到定點數(shù)的轉(zhuǎn)換過程稱為量化,推理精度會略有下降;然而,對于大多數(shù)應(yīng)用程序,可以使用量化的權(quán)重和激活來執(zhí)行額外的訓練以恢復(fù)準確性。

第一種方法直接在可編程邏輯中實現(xiàn)神經(jīng)網(wǎng)絡(luò)。為推理訓練的權(quán)重被加載到網(wǎng)絡(luò)中。這可以在運行時或在設(shè)計的編譯/綜合期間實現(xiàn)。

這些神經(jīng)網(wǎng)絡(luò)的一個例子是 AMD-Xilinx FINN 網(wǎng)絡(luò),它可用于在 FPGA 中實現(xiàn)量化神經(jīng)網(wǎng)絡(luò)。這些量化神經(jīng)網(wǎng)絡(luò)被實現(xiàn)為具有二進制權(quán)重和兩位激活的量化神經(jīng)網(wǎng)絡(luò)。

有了量化神經(jīng)網(wǎng)絡(luò),神經(jīng)網(wǎng)絡(luò)可以在 FPGA 中實現(xiàn),資源更少,因為不需要外部 DDR 或 SoC 支持。使該方法成為空間、組件和成本非常寶貴的受限開發(fā)的理想選擇。雖然它需要更多的專業(yè)知識才能集成到整體解決方案中,但它可能非常有效。可能使用此類方法的典型示例可能是工業(yè)機械的預(yù)測,例如軸承磨損或振動等。

在 FPGA 邏輯中使用神經(jīng)網(wǎng)絡(luò)直接實現(xiàn)的替代方法是使用高度專業(yè)化的神經(jīng)網(wǎng)絡(luò)加速器。神經(jīng)網(wǎng)絡(luò)加速器在可編程邏輯中實現(xiàn),并與具有高帶寬鏈路的 DDR 存儲器以及異構(gòu) SoC 中的專用處理器緊密耦合。

在使用神經(jīng)網(wǎng)絡(luò)加速器的應(yīng)用程序中,它們由軟件應(yīng)用程序提供網(wǎng)絡(luò)和權(quán)重/激活和偏差。因此,這使得 ML 推理更容易集成到整個應(yīng)用程序中。神經(jīng)網(wǎng)絡(luò)加速器的一個例子是 AMD-Xilinx 深度學習單元,它可以與 Pytorch、Caffe 和 TensorFlow 中定義的網(wǎng)絡(luò)一起工作,并為應(yīng)用程序執(zhí)行所有量化、再訓練和程序生成。這樣可以更輕松地集成到正在開發(fā)的應(yīng)用程序中。這種方法的典型應(yīng)用是基于視覺的高性能應(yīng)用,例如視覺引導(dǎo)機器人、智能城市解決方案,當然還有提高汽車 SAE 自主水平。

最高的準確性和性能來自于使用專門的神經(jīng)網(wǎng)絡(luò)加速器,并且易于集成通常提供更好的整體解決方案。因此,這種方法被多家供應(yīng)商用于他們的 AI 解決方案。這種方法更容易與更高級別的軟件框架和抽象堆棧集成,這是利用整體性能的關(guān)鍵,因為 AI 通常只是整體解決方案的一小部分(但很重要)。

最后的想法

很多時候,選擇哪種解決方案取決于最終應(yīng)用,即使 AI 可能是主要的營銷元素。在現(xiàn)實世界中,人工智能通常只是整個解決方案的一小部分,因為傳感器接口、預(yù)處理、執(zhí)行器驅(qū)動和構(gòu)成解決方案的其他元素也會有自己的限制和要求。

可編程邏輯使開發(fā)人員能夠構(gòu)建具有響應(yīng)性和確定性的 AI/ML 解決方案。通過將這些解決方案與行業(yè)標準框架相結(jié)合,開發(fā)人員可以使云和邊緣 AI/ML 應(yīng)用程序更安全、更高效、更安全。

審核編輯黃昊宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • FPGA
    +關(guān)注

    關(guān)注

    1660

    文章

    22412

    瀏覽量

    636417
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    使用NORDIC AI的好處

    × CPU 運行時可快 10×、更省電,平均模型體積 <5 KB。[Edge AI 軟件頁] Axon NPU 對同一 TensorFlow Lite 模型:* 推理速度最高可比
    發(fā)表于 01-31 23:16

    你相信光嗎?| Samtec助力AI/ML系統(tǒng)拓撲中的光連接

    前 言 ? ? ?? 當前,持續(xù)演進的AI/ML硬件生態(tài)中,“新” 的元素無處不在:新的大語言模型(LLM)、新的加速器、新的系統(tǒng)拓撲、新的內(nèi)存實現(xiàn)方式、新的供電方案…… 諸如此類,不勝枚舉
    的頭像 發(fā)表于 11-13 15:03 ?1917次閱讀
    你相信光嗎?| Samtec助力<b class='flag-5'>AI</b>/<b class='flag-5'>ML</b>系統(tǒng)拓撲中的光連接

    如何利用Verilog HDLFPGA實現(xiàn)SRAM的讀寫測試

    本篇將詳細介紹如何利用Verilog HDLFPGA實現(xiàn)SRAM的讀寫測試。SRAM是一種非易失性存儲器,具有高速讀取和寫入的特點。FPGA
    的頭像 發(fā)表于 10-22 17:21 ?4349次閱讀
    如何利用Verilog HDL<b class='flag-5'>在</b><b class='flag-5'>FPGA</b><b class='flag-5'>上</b>實現(xiàn)SRAM的讀寫測試

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI芯片的需求和挑戰(zhàn)

    的工作嗎? 從書中也了解到了AI芯片都有哪些?像CPU、GPU、FPGA、ASIC都是AI芯片。 其他的還是知道的,FPGA屬于AI芯片這個
    發(fā)表于 09-12 16:07

    普迪飛 | AI預(yù)測建模工具,釋放AI/ML的強大潛力!

    問題、精準把握良品率的能力,已成為企業(yè)發(fā)展的關(guān)鍵勝負手。各公司正在加大AIML技術(shù)的投入,目標是針對研發(fā)制造端預(yù)測的新模型,力求在這場“制造力競賽”中脫穎而出。但不
    的頭像 發(fā)表于 08-19 13:53 ?439次閱讀
    普迪飛 | <b class='flag-5'>AI</b>預(yù)測建模工具,釋放<b class='flag-5'>AI</b>/<b class='flag-5'>ML</b>的強大潛力!

    AI 芯片浪潮下,職場晉升新契機?

    職場、渴望專業(yè)領(lǐng)域更進一步的人來說,AI 芯片與職稱評審之間,實則有著千絲萬縷的聯(lián)系,為職業(yè)晉升開辟了新的路徑。 AI 芯片領(lǐng)域細分與職稱對應(yīng) 目前,AI 芯片從技術(shù)架構(gòu)
    發(fā)表于 08-19 08:58

    AI狂飆, FPGA會掉隊嗎? (下)

    上篇和中篇,我們介紹了FPGA的四大特點,以及這些特點所帶來的市場和應(yīng)用機會,概述如下:硬件可編程:通信網(wǎng)絡(luò),芯片驗證等;并行和實時:視頻圖像處理,AI推理等;高集成度:工業(yè)機器人,激光雷達等
    的頭像 發(fā)表于 08-11 09:25 ?3909次閱讀
    <b class='flag-5'>AI</b>狂飆, <b class='flag-5'>FPGA</b>會掉隊嗎? (下)

    MCU AI/ML - 彌合智能和嵌入式系統(tǒng)之間的差距

    本文將探討MCU技術(shù)和AI/ML的交集,以及它如何影響低功耗邊緣設(shè)備。同時將討論電池供電設(shè)備的MCU運行人工智能的困難、創(chuàng)新和實際應(yīng)用場景。
    的頭像 發(fā)表于 08-01 09:02 ?579次閱讀

    Altera FPGA 的PIO IP當中bidir和inout選項的區(qū)別

    ? PIO IP是FPGA 設(shè)計中比較簡單常用的IP, 當設(shè)置PIO IP的Direction的時候,可以看到有如下4個選項: Input代表這組IO是輸入引腳,Output代表這組IO是輸出引腳
    的頭像 發(fā)表于 07-07 11:55 ?2592次閱讀
    Altera <b class='flag-5'>FPGA</b> 的PIO IP當中bidir和inout<b class='flag-5'>選項</b>的區(qū)別

    FPGA邊緣AI中的應(yīng)用

    從聊天機器人、內(nèi)容生成到高級數(shù)據(jù)分析,AI 已無處不在。過去,大多數(shù) AI 處理都在云端完成。然而,隨著模型功能日益強大以及對實時洞察的需求持續(xù)增長,AI 正在向邊緣轉(zhuǎn)移。智能攝像頭和傳感器中的卷積
    的頭像 發(fā)表于 06-24 09:31 ?1718次閱讀

    智多晶FPGA設(shè)計工具HqFpga接入DeepSeek大模型

    AI 賦能工程設(shè)計的時代浪潮中,智多晶率先邁出關(guān)鍵一步——智多晶正式宣布旗下 FPGA 設(shè)計工具 HqFpga 接入 DeepSeek 大模型,并推出
    的頭像 發(fā)表于 06-06 17:06 ?1548次閱讀

    NanoEdge AI Studio 面向STM32開發(fā)人員機器學習(ML)技術(shù)

    NanoEdge? AI Studio*(NanoEdgeAIStudio)是一種新型機器學習(ML)技術(shù),可以讓終端用戶輕松享有真正的創(chuàng)新成果。只需幾步,開發(fā)人員便可基于最少量的數(shù)據(jù)為其項目創(chuàng)建
    的頭像 發(fā)表于 04-22 11:09 ?1347次閱讀
    NanoEdge <b class='flag-5'>AI</b> Studio 面向STM32開發(fā)人員機器學習(<b class='flag-5'>ML</b>)技術(shù)

    AIML如何重塑電子制造業(yè)

    隨著工業(yè)4.0的到來,人工智能(AI)和機器學習(ML)不僅僅是流行詞,它們正在重塑制造業(yè)。這場科技的浪潮,特別在電子制造領(lǐng)域,帶來了令人驚嘆的突破和機遇。以數(shù)據(jù)驅(qū)動決策,以人為本理念的推動下,先進的制造技術(shù)使電子制造業(yè)正變得
    的頭像 發(fā)表于 04-17 14:49 ?1056次閱讀

    Nordic nRF54 系列芯片:開啟 AI 與物聯(lián)網(wǎng)新時代?

    系列無線 SoC 更是樹立了新的行業(yè)標桿。這一系列產(chǎn)品效率、處理能力和設(shè)計選項實現(xiàn)了顯著提升,以滿足不斷增長的低功耗藍牙和物聯(lián)網(wǎng)應(yīng)用需求。nRF54L 系列的三款器件將 2.4 GHz 無線電
    發(fā)表于 04-01 00:18

    Raspberry Pi Pico 2 實現(xiàn):實時機器學習(ML)音頻噪音抑制功能

    Arm公司的首席軟件工程師SandeepMistry為我們展示了一種全新的巧妙方法:RaspberryPiPico2如何將音頻噪音抑制應(yīng)用于麥克風輸入。機器學習(ML)技術(shù)徹底改變了許多軟件應(yīng)用
    的頭像 發(fā)表于 03-25 09:46 ?1228次閱讀
    Raspberry Pi Pico 2 <b class='flag-5'>上</b>實現(xiàn):實時機器學習(<b class='flag-5'>ML</b>)音頻噪音抑制功能