91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

用一顆簡(jiǎn)單的MCU,讓深度學(xué)習(xí)在網(wǎng)絡(luò)邊緣上跑起來(lái)

電子設(shè)計(jì) ? 來(lái)源:電子設(shè)計(jì) ? 作者:電子設(shè)計(jì) ? 2020-10-30 05:46 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

就在幾年前,人們普遍認(rèn)為,機(jī)器學(xué)習(xí)(ML)甚至深度學(xué)習(xí)(DL)只能通過(guò)由網(wǎng)關(guān)、邊緣服務(wù)器或數(shù)據(jù)中心執(zhí)行的邊緣訓(xùn)練和推理,在高端硬件上完成。這種想法在當(dāng)時(shí)不無(wú)道理,因?yàn)樵谠贫撕瓦吘壷g分配計(jì)算資源的趨勢(shì)尚處于早期發(fā)展階段。但如今,得益于業(yè)界和學(xué)術(shù)界的艱苦研發(fā)和不懈努力,情況已然發(fā)生了翻天覆地的變化。

處理器不必提供每秒數(shù)萬(wàn)億次操作(TOPS),也能執(zhí)行機(jī)器學(xué)習(xí)(ML)。越來(lái)越多的用例證明,只要使用最新的微控制器(部分帶有嵌入式 ML 加速器),就能在邊緣設(shè)備上開(kāi)展機(jī)器學(xué)習(xí)。

只需極低的成本和極低的功耗,這些設(shè)備就能出色地完成 ML,僅在絕對(duì)必要時(shí)才連接到云。簡(jiǎn)而言之,內(nèi)置 ML 加速器的微控制器代表著物聯(lián)網(wǎng)發(fā)展的下一階段:在生產(chǎn)數(shù)據(jù)的源頭,例如麥克風(fēng)、攝像頭和監(jiān)控其他環(huán)境條件的傳感器中引入智能計(jì)算,并使物聯(lián)網(wǎng)應(yīng)用受益。

邊緣有多深?

目前普遍認(rèn)為邊緣是物聯(lián)網(wǎng)網(wǎng)絡(luò)的最遠(yuǎn)點(diǎn),但通常指先進(jìn)的網(wǎng)關(guān)或邊緣服務(wù)器。不過(guò),這并不是邊緣的盡頭。真正的盡頭是鄰近用戶的傳感器。所以,合乎邏輯的做法是將盡可能多的分析能力安排在鄰近用戶的位置,而這也正是微處理器所擅長(zhǎng)的。

不同寬度乘數(shù)下的多個(gè) MobileNet V1 模型。圖中可見(jiàn),寬度乘數(shù)對(duì)參數(shù)的數(shù)量、計(jì)算結(jié)果和精度都有顯著影響。但是,如果只是將寬度乘數(shù)從 1.0 改為 0.75,TOP-1 精度并無(wú)太大變化,參數(shù)的數(shù)量和算力需求卻明顯不同。

可以說(shuō),單板計(jì)算機(jī)也能用于邊緣處理,因?yàn)樗鼈兙哂谐錾男阅埽浼嚎涉敲酪慌_(tái)小型超級(jí)計(jì)算機(jī)。但問(wèn)題是尺寸依然過(guò)大,而且對(duì)于大規(guī)模應(yīng)用所需的成百上千次部署而言,成本過(guò)于高昂。它們還需要連接外部直流電源,在某些情況下可能超出可用范圍;相比之下,MCU 的功耗只有幾毫瓦,并且可以使用紐扣電池或一些太陽(yáng)能電池來(lái)供電。

毫無(wú)意外,用于在邊緣執(zhí)行 ML 的微控制器成為了十分熱門(mén)的研發(fā)領(lǐng)域。甚至還有專有名稱——TinyML。TinyML 的目標(biāo)就是允許在資源受限的小型低功耗設(shè)備(尤其是微控制器),而不是在更大的平臺(tái)或云端上執(zhí)行模型推理,甚至最終能實(shí)現(xiàn)模型訓(xùn)練。這就需要縮小神經(jīng)網(wǎng)絡(luò)模型的尺寸,以容納這些設(shè)備中相對(duì)較少的算力、存儲(chǔ)空間和帶寬資源,同時(shí)不會(huì)嚴(yán)重降低功能性和精度。

這些方案對(duì)資源進(jìn)行了優(yōu)化,使設(shè)備可以采集充足的傳感器數(shù)據(jù)并發(fā)揮恰當(dāng)作用,同時(shí)微調(diào)精度并降低資源要求。因此,雖然數(shù)據(jù)可能仍被發(fā)送到云端(或者可能是先發(fā)送到邊緣網(wǎng)關(guān),然后再發(fā)送到云端),但數(shù)量少得多,因?yàn)橄喈?dāng)大一部分的分析已經(jīng)完成。

現(xiàn)實(shí)中,一個(gè)十分常見(jiàn)的 TinyML 用例就是基于攝像頭的對(duì)象檢測(cè)系統(tǒng),盡管能夠捕獲高分辨率圖像,但由于存儲(chǔ)空間有限,只能降低圖像分辨率??墒?,如果攝像頭內(nèi)置了數(shù)據(jù)分析功能,則只會(huì)捕獲所需的對(duì)象而非整個(gè)場(chǎng)景,而且因?yàn)橄嚓P(guān)的圖像區(qū)域更小,能保留高分辨率圖像。這種功能通常只見(jiàn)于更大型、性能更強(qiáng)大的設(shè)備,但是 TinyML 技術(shù)使得微控制器也能實(shí)現(xiàn)。

小巧卻不簡(jiǎn)單!

盡管 TinyML 還只是相對(duì)較新的一種范式,但已經(jīng)表現(xiàn)出了不容小覷的推理能力(即便使用的是相對(duì)溫和的微控制器)和訓(xùn)練(在性能更強(qiáng)大的微控制器上)成效,且精度損耗控制在最低限度。最近的示例包括:語(yǔ)音和面部識(shí)別、語(yǔ)音命令和自然語(yǔ)言處理,甚至同時(shí)運(yùn)行多個(gè)復(fù)雜的視覺(jué)算法。

實(shí)際說(shuō)來(lái),這意味著一臺(tái)裝載 500MHz Arm Cortex-M7 內(nèi)核的微控制器,花費(fèi)不超過(guò) 2 美元,內(nèi)存容量從 28 Kb 到 128 KB 不等,卻能提供強(qiáng)大的性能,使傳感器實(shí)現(xiàn)真正智能。例如,恩智浦的 i.MX RT 跨界 MCU 就使用運(yùn)行 TensorFlow Lite 運(yùn)行時(shí)引擎的小型 ML 模型實(shí)現(xiàn)了此種性能。以基本對(duì)象識(shí)別為例,通常在 200ms 內(nèi)即可完成,而且精度接近 95%。

即使在這個(gè)價(jià)格和性能水平上,這些微處理器配備了多個(gè)安全功能(包括 AES-128),并支持多個(gè)外部存儲(chǔ)器類型、以太網(wǎng)、USB 和 SPI,同時(shí)還包含或支持多種類型的傳感器以及藍(lán)牙、Wi-Fi、SPDIF 和 I2C 音頻接口。價(jià)格稍高一些的設(shè)備則是通常搭載 1GHz Arm Cortex-M7、400MHz Cortex-M4、2 Mbytes RAM 和圖形加速。采用 3.3 VDC 電源供電時(shí),功耗一般遠(yuǎn)低于單板計(jì)算機(jī)。

TOPS 有意義嗎?

會(huì)使用單一指標(biāo)來(lái)評(píng)判性能的不僅是消費(fèi)者;設(shè)計(jì)者和市場(chǎng)營(yíng)銷部門(mén)也一直如此,因?yàn)樽鳛橐豁?xiàng)主要規(guī)格,它可以輕松地區(qū)分設(shè)備。一個(gè)經(jīng)典示例就是 CPU,多年來(lái)人們一直通過(guò)時(shí)鐘速率來(lái)評(píng)判性能;幸運(yùn)的是,現(xiàn)在的設(shè)計(jì)者和消費(fèi)者已不再如此。只用一個(gè)指標(biāo)評(píng)定 CPU 性能就像是按照發(fā)動(dòng)機(jī)的峰值轉(zhuǎn)速來(lái)評(píng)估汽車性能。盡管峰值轉(zhuǎn)速有一定參考意義,但幾乎無(wú)法體現(xiàn)發(fā)動(dòng)機(jī)的強(qiáng)勁或汽車的駕駛性能,這些特性取決于許多其他因素。

遺憾的是,同樣的尷尬也發(fā)生在以每秒數(shù)十億次或上萬(wàn)億次操作來(lái)界定的神經(jīng)網(wǎng)絡(luò)加速器(包括高性能 MPU 或微控制器中的加速器),原因一樣,簡(jiǎn)單的數(shù)字好記。在實(shí)踐中,單獨(dú)的 GOPS 和 TOPS 只是相對(duì)無(wú)意義的指標(biāo),代表的是實(shí)驗(yàn)室而非實(shí)際操作環(huán)境中的一次測(cè)量結(jié)果(毫無(wú)疑問(wèn)是最好的結(jié)果)。例如,TOPS 沒(méi)有考慮內(nèi)存帶寬的限制、所需要的 CPU 開(kāi)支、預(yù)處理和后處理以及其他因素。如果將所有這些和其他因素都一并考慮在內(nèi),例如在實(shí)際操作中應(yīng)用于特定電路板時(shí),系統(tǒng)級(jí)別的性能或許只能達(dá)到數(shù)據(jù)表上 TOPS 值的 50%或 60%。

所有這些數(shù)字都是硬件中的計(jì)算單元乘以對(duì)應(yīng)的時(shí)鐘速率所得到的數(shù)值,而不是需要運(yùn)行時(shí)數(shù)據(jù)已經(jīng)就緒的頻率。如果數(shù)據(jù)一直即時(shí)可用,也不存在功耗問(wèn)題和內(nèi)存限制,并且算法能無(wú)縫映射到硬件,則這種統(tǒng)計(jì)方式更有參考價(jià)值。然而,現(xiàn)實(shí)中并沒(méi)有這樣理想的環(huán)境。

當(dāng)應(yīng)用于微控制器中的 ML 加速器時(shí),該指標(biāo)更沒(méi)有價(jià)值。這些小型設(shè)備的 GOPS 值通常在 1-3 之間,但仍然能夠提供許多 ML 應(yīng)用中所需要的推理功能。這些設(shè)備也依賴專為低功耗 ML 應(yīng)用而設(shè)計(jì)的 Arm Cortex 處理器。除了支持整數(shù)和浮點(diǎn)運(yùn)算以及微控制器中的許多其他功能之外,TOPS 或其他任何單一指標(biāo)明顯無(wú)法充分定義性能,無(wú)論是單獨(dú)使用還是在系統(tǒng)中都是如此。

邊緣計(jì)算的未來(lái)

隨著物聯(lián)網(wǎng)領(lǐng)域進(jìn)一步發(fā)展,在邊緣執(zhí)行盡可能多的處理,逐漸出現(xiàn)一種需求,即在直接位于或附著于傳感器上的微控制器上執(zhí)行推理。也就是說(shuō),微處理器中應(yīng)用處理器和神經(jīng)網(wǎng)絡(luò)加速器的發(fā)展速度十分迅猛,更完善的解決方案也層出不窮。總體趨勢(shì)是將更多以人工智能為中心的功能(例如神經(jīng)網(wǎng)絡(luò)處理)與應(yīng)用處理器一起整合到微處理器中,同時(shí)避免功耗或尺寸顯著增加。

如今,可以先在功能更強(qiáng)大的 CPU 或 GPU 上訓(xùn)練模型,然后在使用推理引擎(例如 TensorFlow Lite)的微控制器上實(shí)施,從而減小尺寸以滿足微控制器的資源要求??奢p松擴(kuò)展,以適應(yīng)更高的 ML 要求。相信不久之后,推理和訓(xùn)練就能在這些設(shè)備上同時(shí)執(zhí)行,讓微控制器的競(jìng)爭(zhēng)力直追更大、更昂貴的計(jì)算解決方案。

審核編輯 黃昊宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • mcu
    mcu
    +關(guān)注

    關(guān)注

    147

    文章

    18994

    瀏覽量

    400022
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5600

    瀏覽量

    124480
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    6G風(fēng)口背后的隱形英雄:一顆小晶振撐起整個(gè)網(wǎng)絡(luò)

    ?2026全國(guó)兩會(huì)剛落下帷幕,6G被明確列為未來(lái)重點(diǎn)產(chǎn)業(yè)。太赫茲通信、空天地體、超低時(shí)延——這些宏大概念迅速刷屏,成為輿論熱點(diǎn)。然而,在通信工程師的技術(shù)群里,在MWC2026展會(huì)結(jié)束后的復(fù)盤(pán)討論中,大家反復(fù)提到的,卻是一顆晶振。
    的頭像 發(fā)表于 03-13 16:45 ?589次閱讀
    6G風(fēng)口背后的隱形英雄:<b class='flag-5'>一顆</b>小晶振撐起整個(gè)<b class='flag-5'>網(wǎng)絡(luò)</b>

    極海Cortex-M52內(nèi)核MCU G32R501在CoreMark的表現(xiàn)如何

    要真正衡量一顆MCU的運(yùn)算實(shí)力,CoreMark成績(jī)往往是個(gè)比較客觀、公認(rèn)的參考指標(biāo)。到底這個(gè)G32R501跑起CoreMark來(lái)能交出怎樣的成績(jī)單?今天就讓我們
    的頭像 發(fā)表于 03-09 14:09 ?3555次閱讀
    極海Cortex-M52內(nèi)核<b class='flag-5'>MCU</b> G32R501在CoreMark的表現(xiàn)如何

    在Zephyr OS啟用NPU的實(shí)用方案

    今天,我們將正式在 Zephyr中加入NPU軟件支持,模型不僅能“跑起來(lái)”,還能“跑得飛快”。是的,本期開(kāi)始就是實(shí)戰(zhàn)環(huán)節(jié)!
    的頭像 發(fā)表于 03-09 10:37 ?639次閱讀
    在Zephyr OS<b class='flag-5'>上</b>啟用NPU的實(shí)用方案

    其利天下:論“高速風(fēng)筒驅(qū)動(dòng)方案”中那些看不見(jiàn)的設(shè)計(jì)關(guān)鍵

    聊到高速風(fēng)筒,大家首先想到的可能是十萬(wàn)轉(zhuǎn)的電機(jī)、超大風(fēng)量。但很多工程師朋友都知道,這些參數(shù)穩(wěn)定、安全、可靠地跑起來(lái),真正決定用戶體驗(yàn)“下限”的,往往是藏在里面那顆不顯眼的MCU(微控制器)及其整體方案。
    的頭像 發(fā)表于 02-05 16:44 ?1313次閱讀
    其利天下:論“高速風(fēng)筒驅(qū)動(dòng)方案”中那些看不見(jiàn)的設(shè)計(jì)關(guān)鍵

    燃?xì)獗硇枰?b class='flag-5'>一顆溫濕度傳感器推薦啥?

    嘿,朋友們,今天有個(gè)挺有意思的選型問(wèn)題想和大家聊聊。有客戶來(lái)問(wèn):“燃?xì)獗砝镄枰?b class='flag-5'>一顆溫濕度傳感器,溫度精度要求0.2℃,濕度精度要±2%RH,有合適的型號(hào)推薦嗎?”首先,咱們一起來(lái)琢磨下這個(gè)需求
    的頭像 發(fā)表于 01-28 12:05 ?238次閱讀
    燃?xì)獗硇枰?b class='flag-5'>一顆</b>溫濕度傳感器推薦啥?

    Solist?AI?: MCU 擁有“現(xiàn)場(chǎng)學(xué)習(xí)能力”的邊緣智能方案

    、從“規(guī)則驅(qū)動(dòng)”到“數(shù)據(jù)驅(qū)動(dòng)”:MCU 的下次進(jìn)化 在工業(yè)現(xiàn)場(chǎng)、家電設(shè)備、風(fēng)機(jī)泵類系統(tǒng)中,工程師們常常遇到這些挑戰(zhàn): 設(shè)備狀態(tài)隨時(shí)間漂移,固定閾值越來(lái)越不準(zhǔn) 網(wǎng)絡(luò)不穩(wěn)定甚至完全離線
    的頭像 發(fā)表于 12-12 14:36 ?1508次閱讀
    Solist?AI?:<b class='flag-5'>讓</b> <b class='flag-5'>MCU</b> 擁有“現(xiàn)場(chǎng)<b class='flag-5'>學(xué)習(xí)</b>能力”的<b class='flag-5'>邊緣</b>智能方案

    Linux 下交叉編譯實(shí)戰(zhàn):跑起來(lái)你的第個(gè) STM32 程序

    跑起來(lái)你的第個(gè)STM32程序。、準(zhǔn)備工作在開(kāi)始之前,需要準(zhǔn)備:1、Linux開(kāi)發(fā)環(huán)境Ubuntu、Debian或其他主流發(fā)行版都可以。2、ARMGCC交叉編譯工具
    的頭像 發(fā)表于 11-24 19:04 ?883次閱讀
    Linux 下交叉編譯實(shí)戰(zhàn):<b class='flag-5'>跑起來(lái)</b>你的第<b class='flag-5'>一</b>個(gè) STM32 程序

    長(zhǎng)晶接口電路CJLSF0102系列一顆料同時(shí)替代TI與安世

    在國(guó)產(chǎn)替代浪潮下,工程師最怕“一顆料買不著、兩料調(diào)不通”。長(zhǎng)晶科技(CJ)推出的CJLSF0102BAN/CJLSF0102VAN,一顆雙通道自動(dòng)雙向總線電平轉(zhuǎn)換芯片,同時(shí)把TI的
    的頭像 發(fā)表于 11-13 17:19 ?824次閱讀
    長(zhǎng)晶接口電路CJLSF0102系列<b class='flag-5'>一顆</b>料同時(shí)替代TI與安世

    如何自己設(shè)計(jì)個(gè)基于RISC-V的SoC架構(gòu),最后可以在FPGA跑起來(lái)?

    如何自己設(shè)計(jì)個(gè)基于RISC-V的SoC架構(gòu),最后可以在FPGA跑起來(lái)
    發(fā)表于 11-11 08:03

    請(qǐng)問(wèn)rt-thread 能在msp430跑起來(lái)嗎?

    剛看到tr-thread,認(rèn)為很不錯(cuò),關(guān)注中… 我想問(wèn)下,rt-thread能在msp430跑起來(lái)嗎? 有沒(méi)有人打算往上移植的? [s:175][s:175]
    發(fā)表于 09-22 07:54

    恩智浦MCXA345/A346通MCU產(chǎn)品介紹

    近日,恩智浦發(fā)布了MCXA345/A346通MCU,一顆主打混合信號(hào)(ADC輸入通道多達(dá)82個(gè))并且適用于電機(jī)控制的通用MCU。
    的頭像 發(fā)表于 08-13 11:42 ?5457次閱讀
    恩智浦MCXA345/A346通<b class='flag-5'>用</b><b class='flag-5'>MCU</b>產(chǎn)品介紹

    3-16串一顆芯片搞定 全解AMG8816全集成BMS主控的參數(shù)真相

    杠桿。 今天拆解的是 AMG8816 ——一顆支持 3~16串鋰電池 的全集成智能電池管理SoC芯片。我們不吹不黑,數(shù)據(jù)說(shuō)話,看它到底能不能扛起“單芯片主控”的名號(hào)。 、16串全集成采樣架構(gòu)
    的頭像 發(fā)表于 07-30 16:38 ?2023次閱讀
    3-16串<b class='flag-5'>一顆</b>芯片搞定 全解AMG8816全集成BMS主控的參數(shù)真相

    儲(chǔ)能BMS通信“卡殼”?CAN轉(zhuǎn)EtherCAT電池?cái)?shù)據(jù)“跑起來(lái)

    借助EtherCAT的高速率、大帶寬特性,BMS數(shù)據(jù)從“零星傳遞”升級(jí)為“全景監(jiān)控”。對(duì)工程師而言,這不僅是次協(xié)議轉(zhuǎn)換,更是為儲(chǔ)能電站裝上了“數(shù)據(jù)高速公路”,每節(jié)電池的狀態(tài)都能被精準(zhǔn)感知——這正是儲(chǔ)能系統(tǒng)穩(wěn)定運(yùn)行的核心底氣
    發(fā)表于 07-18 15:32

    LED 燈壞一顆全滅?這招故障 “無(wú)感自愈”,90% 工程師都在抄!

    想象下:戶外路燈突然熄滅段、汽車尾燈某燈珠罷工、商場(chǎng)LED屏出現(xiàn)暗區(qū)……這些場(chǎng)景的背后,往往是單個(gè)LED燈珠的開(kāi)路故障。LED燈珠串聯(lián)時(shí)最怕“一顆崩,全串黑!”熱震、靜電、雷擊隨
    的頭像 發(fā)表于 06-03 09:41 ?2598次閱讀
    LED 燈壞<b class='flag-5'>一顆</b>全滅?這招<b class='flag-5'>讓</b>故障 “無(wú)感自愈”,90% 工程師都在抄!

    智能車淺談——手把手跑起來(lái)(電磁篇)

    前言電磁尋跡小車之前智能車系列已經(jīng)做了個(gè)比較詳細(xì)的解析,但是美中不足是知識(shí)點(diǎn)被拆的太零散,可能對(duì)于新手來(lái)說(shuō)不太友好,所以借著有空就再寫(xiě)點(diǎn)能讓車跑起來(lái)的方案。當(dāng)然,也就僅僅限于可以跑起來(lái)
    的頭像 發(fā)表于 05-22 19:32 ?2931次閱讀
    智能車淺談——手把手<b class='flag-5'>讓</b>車<b class='flag-5'>跑起來(lái)</b>(電磁篇)