91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

Xilinx助力計算平臺滿足CNN的嵌入式AI要求

e9Zb_gh_8734352 ? 來源:未知 ? 作者:胡薇 ? 2018-10-22 16:03 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

隨著智能安全、機器人無人駕駛汽車等應用越來越依靠嵌入式人工智能技術(shù)來提高性能,交付全新的用戶體驗,傳統(tǒng)計算平臺上的推斷引擎很難在有限的功耗、時延和物理尺寸限制下滿足實際要求。推斷引擎必須滿足嚴格定義的推斷精度,還受限于總線寬度,而且存儲器難以為最佳速度、效率和芯片面積進行調(diào)整優(yōu)化。我們需要靈活應變的計算平臺來滿足運行一流卷積神經(jīng)網(wǎng)絡 (CNN) 的嵌入式 AI 的要求。

放眼未來,適應于更多前沿神經(jīng)網(wǎng)絡的靈活性是我們的主要關(guān)注點。今天廣受歡迎的 CNN 正加速被新型的先進架構(gòu)所取代。然而,傳統(tǒng)的 SoC 設計要使用當前的神經(jīng)網(wǎng)絡架構(gòu)知識,從開發(fā)開始到未來部署通常需要大約三年時間。RNN 或 Capsule Network 等新型神經(jīng)網(wǎng)絡可能會讓傳統(tǒng) SoC 變得低效,也難以提供保持競爭力所需的性能。

嵌入式 AI 要滿足最終用戶期望,特別是要跟上可預見的未來不斷提升的需求,就必須采用更加靈活的自適應計算平臺。我們可利用用戶可配置的多核片上系統(tǒng) (MPSoC) 器件,整合主應用處理器和可擴展的可編程邏輯結(jié)構(gòu),包含可配置的存儲器架構(gòu)和滿足可變精度推斷所需的信號處理技術(shù),從而滿足上述要求。

推 斷 精 度

在傳統(tǒng)的 SoC 中,決定性能的特性如存儲器架構(gòu)和計算精確度等是固定的。最小值通常為 8 位,由核心 CPU 定義,不過就給定的算法而言最佳精度可能更低。MPSoC 支持可編程邏輯優(yōu)化至晶體管層面,這就能根據(jù)需要讓推斷精度降低到 1 位。此外,這類器件還包含成千上萬可配置的 DSP slice,能高效處理乘積累加 (MAC) 計算。

能自由優(yōu)化推斷精度,根據(jù)平方律提供剛好滿足需求的計算效率,也就是說單位的運算用 1 位核心執(zhí)行,相對于用 8 位核心完成相同計算而言,所需的邏輯僅為 1/64。此外,MPSoC 能讓推斷精度針對神經(jīng)網(wǎng)絡的每層做出不同優(yōu)化,從而以最大的效率提供所需的性能。

存 儲 器 架 構(gòu)

除了通過改變推斷精度來提高計算效率之外,配置可編程片上存儲器的帶寬和結(jié)構(gòu)能進一步提高嵌入式 AI 的性能和效率。定制 MPSoC 相對于運行相同推斷引擎的傳統(tǒng)計算平臺而言,片上存儲器可能達到 4 倍多,存儲器—接口帶寬可能達到 6 倍。存儲器的可配置性使得用戶能減少瓶頸,并優(yōu)化芯片資源的利用率。此外,典型的子系統(tǒng)只有有限的片上集成高速緩存,必須與片外存儲設備頻繁交互,這就會增加時延和功耗。在 MPSoC 中,大多數(shù)存儲器交換都在片上進行,這就會大幅提高速度,而且相對于片外存儲器交互而言功耗降低超過 99%。

芯 片 面 積

解決方案的尺寸也越來越重要,特別就采用移動 AI 的無人機、機器人或無人/自動駕駛汽車而言尤其如此。MPSoC 的 FPGA 結(jié)構(gòu)上實現(xiàn)的推斷引擎可能僅占用傳統(tǒng) SoC 八分之一的芯片面積,這就能讓開發(fā)人員在更小的器件中構(gòu)建功能更強大的引擎。

此外,MPSoC 器件系列為設計人員提供了實現(xiàn)推斷引擎的豐富選擇,能支持最節(jié)能、成本效率最高、面積占用最小的方案,從而滿足系統(tǒng)性能要求。一些通過汽車應用認證的部件具備硬件功能安全特性,達到業(yè)界標準的 ISO 26262 ASIL-C 安全規(guī)范,這對自動駕駛應用而言至關(guān)重要。比如賽靈思的 Automotive XA Zynq UltraScale+ 系列采用 64 位四核 ARM Cortex-A53 和雙核 ARM Cortex-R5 處理系統(tǒng)以及可擴展的可編程邏輯結(jié)構(gòu),這就能在單個芯片上整合控制處理、機器學習算法和安全電路,同時提供故障容錯功能。

今天,嵌入式推斷引擎可用單個 MPSoC 器件實現(xiàn),功耗低至 2 瓦,這對移動機器人或自動駕駛汽車而言都是比較合適的功耗水平。傳統(tǒng)計算平臺即便現(xiàn)在也無法用這么低的功耗運行實時 CNN 應用,未來也不太可能在更嚴格的功耗限制條件下滿足更快響應和更復雜功能的日益嚴格的要求。基于可編程 MPSoC 的平臺能夠提供更高的計算性能,更高的效率,也能在 15瓦以上的功率水平下減小面積和減輕重量。

如果開發(fā)人員不能在自己的項目中輕松地實現(xiàn)這些優(yōu)勢,那么這種可配置型多平行計算架構(gòu)的優(yōu)勢就僅限于學術(shù)領域。成功需要適當?shù)墓ぞ邅韼椭_發(fā)人員優(yōu)化目標推斷引擎的實現(xiàn)。為了滿足有關(guān)需求,賽靈思不斷擴展開發(fā)工具生態(tài)系統(tǒng)和機器學習軟件堆棧,并與專業(yè)合作伙伴合作,一起簡化和加速計算機視覺和視頻監(jiān)控等應用的實現(xiàn)。

面 向 未 來 的 靈 活 性

利用 SoC 的可配置性為手頭應用創(chuàng)建最佳平臺,也使得 AI 開發(fā)人員能夠靈活地跟上神經(jīng)網(wǎng)絡架構(gòu)快速發(fā)展演進的要求。業(yè)界可能遷移到新型神經(jīng)網(wǎng)絡的可能性,對于平臺開發(fā)人員來說是一個巨大的風險??芍嘏渲玫?MPSoC 通過重配置并用當前最先進的策略來構(gòu)建最高效的處理引擎,能夠讓開發(fā)人員靈活地響應神經(jīng)網(wǎng)絡架構(gòu)方式的變化。

AI 越來越多地嵌入到各種設備中,包括工業(yè)控制、醫(yī)療設備、安全系統(tǒng)、機器人和自動駕駛汽車等。利用可編程邏輯結(jié)構(gòu)的 MPSoC 器件的靈活應變加速技術(shù),是提供保持競爭力所需的快速響應和高級功能的關(guān)鍵。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • Xilinx
    +關(guān)注

    關(guān)注

    73

    文章

    2200

    瀏覽量

    131147
  • 人工智能
    +關(guān)注

    關(guān)注

    1817

    文章

    50098

    瀏覽量

    265406

原文標題:Xilinx助力人工智能新型領域的應用

文章出處:【微信號:gh_873435264fd4,微信公眾號:FPGA技術(shù)聯(lián)盟】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    什么是嵌入式應用開發(fā)?

    系統(tǒng)中,用于控制、監(jiān)測或通信等特定用途。與一般計算機系統(tǒng)不同,嵌入式系統(tǒng)通常具有較小的存儲容量、處理能力和功耗,且需要滿足特定的實時性、可靠性和安全性要求?。 應用領域
    發(fā)表于 01-12 16:13

    arm嵌入式主板優(yōu)缺點

    。   二、強大的擴展功能和網(wǎng)絡傳輸功能:隨著更多的行業(yè)開始使用到嵌入式主板,導致市場對主板功能的要求的差異化越來越大。嵌入式主板ARM的出現(xiàn),恰恰滿足了這個個性化的需求。從擴展性上
    發(fā)表于 01-08 07:08

    重磅合作!Quintauris 聯(lián)手 SiFive,加速 RISC-V 在嵌入式AI 領域落地

    之后,要打造的是高可靠性、高能效還支持可擴展的 RISC-V 設計方案。而且合作的核心目標特別明確: 讓 RISC-V 處理器在嵌入式、物聯(lián)網(wǎng)、AI 系統(tǒng)里更快普及; 用集成 IP 和軟件
    發(fā)表于 12-18 12:01

    嵌入式需要掌握哪些核心技能?

    )。 企業(yè)需求:招聘崗位中,C語言是100%必備技能,C++和匯編語言的需求隨項目復雜度提升。 2)嵌入式硬件架構(gòu) 主流平臺:ARM Cortex-M/A系列、RISC-V內(nèi)核,需掌握寄存器配置、時鐘
    發(fā)表于 10-21 16:25

    飛凌嵌入式FCU3501嵌入式控制單元:工業(yè)級邊緣AI計算的“硬核擔當”

    邊緣計算設備的性能與穩(wěn)定提出了更加嚴苛的要求。飛凌嵌入式推出的FCU3501嵌入式控制單元,正是為這類場景量身打造的“工業(yè)級AI
    的頭像 發(fā)表于 09-19 08:03 ?7280次閱讀
    飛凌<b class='flag-5'>嵌入式</b>FCU3501<b class='flag-5'>嵌入式</b>控制單元:工業(yè)級邊緣<b class='flag-5'>AI</b><b class='flag-5'>計算</b>的“硬核擔當”

    新一代嵌入式開發(fā)平臺 AMD嵌入式軟件和工具2025.1版現(xiàn)已推出

    搶先體驗 SHEL 流程簡化所有 AMD 嵌入式開發(fā)平臺上的軟件項目生成過程 Zephyr RTOS 兼容性已擴展至第二代 AMD Versal AI Edge 系列、Kria SOM
    的頭像 發(fā)表于 08-20 09:15 ?3980次閱讀

    AMD嵌入式處理器為您的應用添能助力

    ,AMD 銳龍嵌入式處理器和 EPYC(霄龍)嵌入式處理器均能滿足所需,憑借出色的耐用性、可靠性、能效及性能為要求嚴苛的應用添能助力。
    的頭像 發(fā)表于 07-07 14:09 ?1896次閱讀

    飛凌嵌入式2025嵌入式及邊緣AI技術(shù)論壇圓滿結(jié)束

    飛凌嵌入式「2025嵌入式及邊緣AI技術(shù)論壇」在深圳深鐵皇冠假日酒店盛大舉行,此次活動邀請到了200余位嵌入式技術(shù)領域的技術(shù)專家、企業(yè)代表和工程師用戶,共享
    的頭像 發(fā)表于 04-28 13:57 ?4138次閱讀
    飛凌<b class='flag-5'>嵌入式</b>2025<b class='flag-5'>嵌入式</b>及邊緣<b class='flag-5'>AI</b>技術(shù)論壇圓滿結(jié)束

    Neousys宸曜發(fā)布支持酷睿200S的強固型無風扇嵌入式計算平臺

    強固型嵌入式計算平臺廠商Neousys宸曜科技發(fā)布了新的無風扇嵌入式計算平臺Nuvo-11000
    的頭像 發(fā)表于 04-23 16:52 ?787次閱讀
    Neousys宸曜發(fā)布支持酷睿200S的強固型無風扇<b class='flag-5'>嵌入式</b><b class='flag-5'>計算</b><b class='flag-5'>平臺</b>

    全新STM32MP257開發(fā)板震撼發(fā)布!異核架構(gòu)x接口豐富x邊緣AI助力ARM嵌入式工業(yè)4.0應用!

    全新STM32MP257開發(fā)板震撼發(fā)布!異核架構(gòu)x接口豐富x邊緣AI,助力ARM嵌入式工業(yè)4.0應用! ATK-DLMP257B開發(fā)板是正點原子基于STM32MP257DAK3處理器研發(fā)的一款
    發(fā)表于 04-12 12:04

    飛凌嵌入式「2025嵌入式及邊緣AI技術(shù)論壇」議程公布

    4月22日,飛凌嵌入式“2025嵌入式及邊緣AI技術(shù)論壇”將在深圳舉行,論壇以“新生態(tài),智未來”為主題,旨在匯聚行業(yè)智慧,探討嵌入式技術(shù)與邊緣AI
    的頭像 發(fā)表于 04-02 15:12 ?1359次閱讀
    飛凌<b class='flag-5'>嵌入式</b>「2025<b class='flag-5'>嵌入式</b>及邊緣<b class='flag-5'>AI</b>技術(shù)論壇」議程公布

    新生態(tài) 智未來「飛凌嵌入式2025嵌入式及邊緣AI技術(shù)論壇」開啟報名!

    在這個技術(shù)日新月異的時代,每一場思想的碰撞都可能成為推動行業(yè)前行的力量,每一次深度對話都可能迸發(fā)出改變時代的強光——2025年4月22日,飛凌嵌入式將在深圳舉辦“2025嵌入式及邊緣AI技術(shù)論壇”,本次論壇以“新生態(tài),智未來”為
    的頭像 發(fā)表于 03-28 08:05 ?1233次閱讀
    新生態(tài) 智未來「飛凌<b class='flag-5'>嵌入式</b>2025<b class='flag-5'>嵌入式</b>及邊緣<b class='flag-5'>AI</b>技術(shù)論壇」開啟報名!

    Banana Pi 發(fā)布 BPI-AI2N &amp; BPI-AI2N Carrier,助力 AI 計算嵌入式開發(fā)

    RZ/V2N——近期在嵌入式世界2025上新發(fā)布,為 AI 計算、嵌入式系統(tǒng)及工自動化提供強大支持。這款全新的計算
    發(fā)表于 03-19 17:54

    Banana Pi 發(fā)布 BPI-AI2N &amp; BPI-AI2N Carrier,助力 AI 計算嵌入式開發(fā)

    ——近期在嵌入式世界2025上新發(fā)布,為 AI 計算、嵌入式系統(tǒng)及工自動化提供強大支持。這款全新的計算
    的頭像 發(fā)表于 03-19 17:53 ?1799次閱讀
    Banana Pi 發(fā)布 BPI-<b class='flag-5'>AI</b>2N &amp; BPI-<b class='flag-5'>AI</b>2N Carrier,<b class='flag-5'>助力</b> <b class='flag-5'>AI</b> <b class='flag-5'>計算</b>與<b class='flag-5'>嵌入式</b>開發(fā)

    IAR發(fā)布云端平臺,助力現(xiàn)代嵌入式軟件開發(fā)團隊

    平臺嵌入式軟件開發(fā)人員提供前所未有的自由度與靈活性,助力開發(fā)團隊在工具選擇和日常工作流中實現(xiàn)更高效的協(xié)作與創(chuàng)新。
    的頭像 發(fā)表于 03-12 11:56 ?812次閱讀