91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

你知道TinyML運行效能誰說了算嗎?

jf_cVC5iyAO ? 來源:易心Microbit編程 ? 2023-08-03 16:06 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

AI芯片或神經(jīng)加速處理器(Neural Network Processing Unit, NPU或Deep Learning Accelerator, DLA)領(lǐng)域中,大家也都說自家的芯片世界最棒,對手看不到車尾燈,難道沒有一個較為公正衡量芯片運行(推論)效能,就像手機跑分軟件一樣,讓大家比較信服的基準嗎?

其實在AI芯片領(lǐng)域中所謂的「效能」,可能因關(guān)心的重點不同而會有不同定義和解讀。分別可從硬件每秒可執(zhí)行乘加的次數(shù)(又可細分FP32,FP16及INT8等)、對于特定模型在指定推論精度下每秒可執(zhí)行次數(shù)或推論一次所需時間(包含有無模型優(yōu)化處理)、特定模型推論功耗(推論一次耗費焦耳數(shù))、每瓦特可執(zhí)行乘加指令次數(shù)及其它特定規(guī)范時的表現(xiàn),甚至有用每塊美金獲得算力來當(dāng)成基準。所以常會遇到誰也不服誰,老王賣瓜自賣自夸的現(xiàn)象。

目前較被大家接受的就是ML Commons所提出的MLPerf規(guī)范,其中包含訓(xùn)練及推論兩大項,而推論部份又可細分為數(shù)據(jù)中心(Datacenter)、邊緣(Edge)、行動(Mobile)及微型(Tiny,大多為MCU)。前不久(2023/6/27)才剛公布了Tiny v1.1測試結(jié)果報告,接下來就幫大家解讀一下這份報告,讓大家能更了解未來單芯片運行AI的方向及可行性。

評測場景及項目

目前ML Commons在Tiny部份先前已經(jīng)過三輪(v0.5, v0.7, v1.0)測試,此次公布的是v1.1結(jié)果。測試時分為封閉(Closed)及開放(Open)型式,前者依官方規(guī)范測,而后者廠商可提出依自己規(guī)范測試更優(yōu)的結(jié)果,不過不是每輪評測都會有開放型式。

目前主要評測項目如Fig.1 所示,共有四個項目,包含關(guān)鍵詞偵測(Keyword Spoting, KS)、視覺喚醒字(Visual Wake Words, VW)、影像分類(Image Classification, IC)及異常偵測(Anomaly Detection, AD)。而每個項目都是采單串流數(shù)據(jù)(Single Stream)方式進行,即推論完一筆再取下一筆進行推論。依照不同項目,分別使用對應(yīng)的數(shù)據(jù)集和模型,并在指定的推論質(zhì)量下進行評量。

wKgZomTLYEaANXFwAAFCAFJOc0s385.jpg

Fig.1 MLPerf v1.1 工作場景及效能評量項目

參與評測公司、硬件及軟件

本次參與評測的項目共有32項,以下依不同項目分別介紹。

參與評測公司:共有10家,Krai, Nuvoton(新唐科技), STMicroelectronics(簡稱STM), Skymizer(臺灣發(fā)展軟件科技), cTuning, fpgaconvnet, Plumerai, Syntiant, Robert Bosh GmbH, kai-jiang(個人)。

參與評測開發(fā)板:共有14種,規(guī)格下如下所示。

STM NUCLEO-H7A3ZI-Q, Arm Cortex-M7(DSP+FPU) @280MHz

STM NUCLEO-L4R5ZI, Arm Cortex-M4(DSP+FPU) @120MHz

STM NUCLEO-U575ZI-Q, Arm Cortex-M33(DSP+FPU) @160MHz

STM NUCLEO-G0B1RE, Arm Cortex-M0+ @64MHz

STM DISCO-F746NG, Arm Cortex-M7(DSP+FPU) @216MHz

Nordic nRF5340 DK, Arm Cortex-M33(DSP+FPU) @128MHz

Nuvoton NUMAKER-M467HJ, Arm Cortex-M4F @200MHz

DIGILENT Cora Z7, Arm Cortex-A9 @667MHz

DIGILENT ZC706, Arm Cortex-A9 @650MHz

DIGILENT ZedBoard, Arm Cortex-A9 @650MHz

DIGILENT ZyBo, Arm Cortex-A9 @650MHz

Infineon CY8CPROTO-062-4343W, Arm Cortex-M4 (DSP + FPU) @150MHz

Syntiant NDP9120, HiFi3+M0 @30.7MHz/98.7MHz

ZCU106, RISC-V @20MHz

主要CPU規(guī)格:共有7大類。只有1項使用RISC-V,1項為MCU+NPU,其余皆是Arm Based。Cortex-M為單芯片(MCU)等級,Cortex-A為微處理器(MPU)等級芯片,用于手機或單板微電腦

Arm Cortex-M0+ (1項)

Arm Cortex-M33 (4項)

Arm Cortex-M4/M4F (13項)

Arm Cortex-M7 (7項)

Arm Cortex-A9 (4項)

Syntiant HiFi3+M0 (2項)

RISC-V (1項)

主要軟件及函式庫:共有9種。

Skymizer ONNC

MicroTVM

Plumerai Inference Engine

Syntiant TDK+SDK

Bosch Hardware-Aware Lowering Engine(HALE)

STM X-CUBE-AI

fpgaConvNet(Model+Optimiser)

Arm CMSIS-5

TVM

評測結(jié)果:

由于芯片等級落差頗大,單從推論時間(毫秒ms)及能耗(微焦耳uJ 比較可能會有點不公平,所以這里依CPU等級及工作頻率來分會更清楚些。Fig. 2分別列出各等級中推論速度表現(xiàn)最好的。

wKgaomTLYEaAHbHTAAP1WwqQPI8795.jpg

Fig.2 MLPerf Tiny v1.1各等級CPU及不同應(yīng)用表現(xiàn)最佳清單。

另外從此次提交的項目亦可看出Arm Cortex-M4已成為TinyML的主流,若推論仍不夠快時,則可再提升到Cortex-M7。而新上市的Cortex-M33效能已高過Cortex-M4,略低于Cortex-M7,讓使用者有多一點性價比的選擇空間。

小結(jié)

在邊緣智能(Edge AI)裝置及智能物聯(lián)網(wǎng)(AIoT)應(yīng)用中使用單芯片(MCU)來運行AI(TinyML)已是現(xiàn)在進行式,透過此次的評比結(jié)果,可讓大家更了解各家芯片性能及模型優(yōu)化工具的進展,未來隨著MCU+NPU的普及,相信下一次的評比結(jié)果可能就有更大躍升,就讓大家一起期待吧!



審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • ARM處理器
    +關(guān)注

    關(guān)注

    6

    文章

    361

    瀏覽量

    43279
  • MPU
    MPU
    +關(guān)注

    關(guān)注

    0

    文章

    454

    瀏覽量

    51315
  • Cortex-M4
    +關(guān)注

    關(guān)注

    6

    文章

    100

    瀏覽量

    47967
  • 加速處理器
    +關(guān)注

    關(guān)注

    0

    文章

    8

    瀏覽量

    6544
  • AI芯片
    +關(guān)注

    關(guān)注

    17

    文章

    2126

    瀏覽量

    36763

原文標題:TinyML (MCU AI) 運行效能誰說了算?

文章出處:【微信號:易心Microbit編程,微信公眾號:易心Microbit編程】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    【迅為iTOP-Hi3403開發(fā)板】一站式啟動Hi3403 NPU開發(fā):從運行例程開始,快速驗證AI效能

    【迅為iTOP-Hi3403開發(fā)板】一站式啟動Hi3403 NPU開發(fā):從運行例程開始,快速驗證AI效能
    的頭像 發(fā)表于 02-12 15:59 ?971次閱讀
    【迅為iTOP-Hi3403開發(fā)板】一站式啟動Hi3403 NPU開發(fā):從<b class='flag-5'>運行</b>例程開始,快速驗證AI<b class='flag-5'>效能</b>

    飛騰主板以E2000Q四核強芯為支撐,開啟云終端高力時代

    在信創(chuàng)浪潮奔涌、數(shù)字化轉(zhuǎn)型提速的當(dāng)下,云終端已成為政企辦公、工業(yè)控制、智慧教育等領(lǐng)域的核心載體,而主板作為“核心大腦”,其力、安全與適配性直接決定云終端的運行效能。
    的頭像 發(fā)表于 02-02 11:05 ?152次閱讀
    飛騰主板以E2000Q四核強芯為支撐,開啟云終端高<b class='flag-5'>算</b>力時代

    [工具討論] 如果有一款國產(chǎn)圖形化配置工具STM32Cube,支持所有內(nèi)核和廠商MCU,會用嗎?

    ,McuStudio或許值得試試 寫在最后 工具好不好用,最終還是要用戶說了算。 我們想通過這個討論帖,真實地了解大家的需求和顧慮。如果有任何問題或建議,歡迎在評論區(qū)暢所欲言。 討論不分對錯,每個觀點對我們都有價值。歡迎轉(zhuǎn)發(fā)!
    發(fā)表于 01-26 10:30

    具身機器人走得穩(wěn)不穩(wěn)?它可以說了算!

    對走得穩(wěn)!實測環(huán)境拓撲:ZMC600E主站連接TI雙從站,模擬具身機器人主從節(jié)點狀態(tài),使用EtherCAT-Analyzer分析儀分析數(shù)據(jù)。pc:運行ZMC主站軟
    的頭像 發(fā)表于 01-05 11:43 ?154次閱讀
    具身機器人走得穩(wěn)不穩(wěn)?它可以<b class='flag-5'>說了算</b>!

    力湘軍,讓力變成生產(chǎn)力?

    腦極體
    發(fā)布于 :2025年11月25日 22:56:58

    從CPU、GPU到NPU,美格智能持續(xù)優(yōu)化異構(gòu)力計算效能

    前言AI力已成為數(shù)字經(jīng)濟時代的核心生產(chǎn)力,但全球AI產(chǎn)業(yè)正面臨“供給不足、成本高企、生態(tài)待建”三重挑戰(zhàn)。據(jù)行業(yè)統(tǒng)計,行業(yè)力資源平均利用率僅為30%~40%,存在嚴重的力浪費現(xiàn)象。國內(nèi)領(lǐng)先
    的頭像 發(fā)表于 11-21 16:05 ?1148次閱讀
    從CPU、GPU到NPU,美格智能持續(xù)優(yōu)化異構(gòu)<b class='flag-5'>算</b>力計算<b class='flag-5'>效能</b>

    鈣鈦礦電池穩(wěn)定性評估誰說了算?實驗室間比對表明:測量方法是關(guān)鍵

    鈣鈦礦材料因在高效低成本下一代光伏電池中的潛力受關(guān)注,其太陽能電池效率已超22%,但因復(fù)雜動態(tài)行為,效率測量較其他技術(shù)更復(fù)雜,長期認為這會大幅降低測量可靠性,卻未明確定量程度,且缺乏標準化測量方法,影響對新材料與制備工藝的正確評估,阻礙技術(shù)發(fā)展。美能鈣鈦礦復(fù)合式MPPT測試儀采用AAA級LED太陽光模擬器作為老化光源,可通過多種方式對電池進行控溫并控制電池所
    的頭像 發(fā)表于 10-29 09:04 ?333次閱讀
    鈣鈦礦電池穩(wěn)定性評估<b class='flag-5'>誰說了算</b>?實驗室間比對表明:測量方法是關(guān)鍵

    低功耗藍牙定位模塊

    商城聯(lián)合知名方案公司推出了可用于可穿戴設(shè)備和物聯(lián)網(wǎng)項目。單面表貼設(shè)計和板載藍牙天線可以極大地促進物聯(lián)網(wǎng)項目的快速部署。 首次具備無線功能,支持藍牙 5.0,并能夠以低功耗運行。 藍牙
    發(fā)表于 10-23 14:01

    知道板卡廠商參與芯片研發(fā)的α階段意味著什么?

    大家都知道芯片很重要,但是否知道一顆芯片從設(shè)計構(gòu)思到最終量產(chǎn),需要經(jīng)歷怎樣一個漫長的過程嗎?
    的頭像 發(fā)表于 09-24 17:08 ?7605次閱讀
    <b class='flag-5'>你</b><b class='flag-5'>知道</b>板卡廠商參與芯片研發(fā)的α階段意味著什么?

    基于米爾瑞芯微RK3576開發(fā)板部署運行TinyMaix:超輕量級推理框架

    inference library for microcontrollers (TinyML).]運行mnist手寫數(shù)字識別任務(wù)cd examples/mnist mkdir build cd
    發(fā)表于 07-25 16:35

    高能工控主板:力強、運行快、多擴展、場景廣

    在工業(yè)自動化、智能制造、邊緣計算等領(lǐng)域,高性能、高可靠性的工控主板是支撐系統(tǒng)穩(wěn)定運行的核心。國產(chǎn)主板,憑借強勁的力、高效的運行速度、豐富的擴展接口以及廣泛的應(yīng)用場景,成為工業(yè)級計算設(shè)備的理想選擇。
    的頭像 發(fā)表于 07-14 09:23 ?443次閱讀

    這次說了算!先楫半導(dǎo)體開發(fā)者生態(tài)技術(shù)日

    HPM為開發(fā)者量身打造的生態(tài)活動正在規(guī)劃中! 趕緊動動發(fā)財?shù)男∈痔顐€小問卷,告訴我們關(guān)心的話題和期待的場景,我們會認真閱讀每一份問卷,聽取大家的寶貴建議,期待您的反饋哈!
    發(fā)表于 07-10 11:21

    這次說了算!先楫半導(dǎo)體開發(fā)者生態(tài)技術(shù)日規(guī)劃中,調(diào)查問卷等你來填

    HPM為開發(fā)者量身打造的生態(tài)活動正在規(guī)劃中! 趕緊動動發(fā)財?shù)男∈痔顐€小問卷,告訴我們關(guān)心的話題和期待的場景,我們會認真閱讀每一份問卷,聽取大家的寶貴建議,期待您的反饋哈!
    發(fā)表于 07-10 11:10

    知道船用變壓器有哪些嗎?

    在船舶和海洋平臺上,電力系統(tǒng)的穩(wěn)定運行至關(guān)重要,而船用變壓器作為其中的關(guān)鍵設(shè)備,其種類繁多,各具特點。知道船用變壓器有哪些嗎?讓我們一起來揭開它們的神秘面紗。CSD船用變壓器是船舶供電系統(tǒng)中
    的頭像 發(fā)表于 06-01 00:00 ?734次閱讀
    <b class='flag-5'>你</b><b class='flag-5'>知道</b>船用變壓器有哪些嗎?

    推拉力測試設(shè)備制造廠商,專不專業(yè)您說了算!#專業(yè)制造廠家#工廠#

    測試儀
    力標精密設(shè)備
    發(fā)布于 :2025年05月16日 16:52:35