91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何設(shè)計(jì)更智能的Edge AI

星星科技指導(dǎo)員 ? 來源:嵌入式計(jì)算設(shè)計(jì) ? 作者:Tony King-Smith ? 2022-07-10 11:30 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

作為一名擁有 40 多年半導(dǎo)體業(yè)務(wù)研發(fā)總監(jiān)和 CMO 經(jīng)驗(yàn)的工程師,我認(rèn)為我自己和我的同行是合乎邏輯的。然而,我們當(dāng)中有多少人可以誠實(shí)地說我們沒有被諸如“我的小部件比你的快?”這樣的說法所誘惑??峙逻@只是人性,尤其是當(dāng)我們對你的專業(yè)知識沒有信心來調(diào)查這些說法時。

問題始終是一個定義:我如何定義“更快”或“更低功率”或“更便宜”?這是基準(zhǔn)試圖解決的問題——它是關(guān)于具有一致的上下文和外部標(biāo)準(zhǔn),以確保您將同類與同類進(jìn)行比較。任何使用基準(zhǔn)測試的人都非常清楚這一點(diǎn)(aiMotive 誕生于一家領(lǐng)先的 GPU 基準(zhǔn)測試公司)。

在嘗試比較汽車 AI 應(yīng)用的硬件平臺時,解決這種轟炸式索賠的需求從未像現(xiàn)在這樣緊迫。

10 TOPS 什么時候不是 10 TOPS?

無論是否有專用的 NPU,大多數(shù) SoC 都將其執(zhí)行 NN 工作負(fù)載的能力稱為 TOPS:每秒 Tera 操作。這只是 NPU(或整個 SoC)原則上每秒可以執(zhí)行的算術(shù)運(yùn)算總數(shù),無論全部集中在專用 NPU 中還是分布在多個計(jì)算引擎中,例如 GPU、CPU 矢量協(xié)處理器、或其他加速器。

但是,沒有任何硬件執(zhí)行引擎能以 100% 的效率執(zhí)行任何工作負(fù)載的各個方面。對于神經(jīng)網(wǎng)絡(luò)推理,某些層(例如池化或激活)在數(shù)學(xué)上與卷積非常不同。在卷積本身(或其他層,如池化)可以開始之前,數(shù)據(jù)必須重新排列或從一個地方移動到另一個地方。其他時候,NPU 可能需要等待來自控制它的主機(jī) CPU 的新指令或數(shù)據(jù),每個層甚至每個數(shù)據(jù)塊。這些都導(dǎo)致完成的計(jì)算更少,從而限制了理論上的最大容量。

硬件利用率——不是它看起來的樣子

許多 NPU 供應(yīng)商會引用硬件利用率來表明他們的 NPU 執(zhí)行給定 NN 工作負(fù)載的情況。這基本上是說,“這就是我的 NPU 的理論容量有多少被用于執(zhí)行 NN 工作負(fù)載?!?當(dāng)然,這告訴我我需要知道什么。

不幸的是沒有。硬件利用率的問題是定義之一:數(shù)量完全取決于 NPU 供應(yīng)商選擇如何定義它。事實(shí)上,硬件利用率和 TOPS 的問題在于它們只告訴你硬件引擎理論上能夠?qū)崿F(xiàn)什么,而不是它實(shí)現(xiàn)的程度。

這可能會導(dǎo)致一些誤導(dǎo)性信息。下面的圖 1 顯示了我們在額定 4 TOPS 的 aiWare3P NPU 與另一個額定為 8 TOPS 的知名 NPU 之間進(jìn)行的比較。

poYBAGLKR_eAck4HAACgiX1heSI601.png

圖 1:兩個汽車推理 NPU 的利用率與效率比較

對于兩個不同的知名基準(zhǔn),競爭對手 X NPU 聲稱 8 TOPS 容量,而 aiWare3P 的 4 TOPS。這應(yīng)該意味著它將提供大約 2 倍于 aiWare3P 的 fps 性能。然而,實(shí)際上,情況正好相反:aiWare3P 的性能提高了 2 到 5 倍,盡管它只是聲稱的 TOPS 的一半!

結(jié)論:TOPS 是衡量 AI 硬件能力的一種非常糟糕的方法;硬件利用率幾乎與 TOPS 一樣具有誤導(dǎo)性。

NPU 效率和自主性:優(yōu)化 PPA 的關(guān)鍵

這就是為什么我認(rèn)為您必須根據(jù)執(zhí)行一組代表性工作負(fù)載時的效率而不是原始理論硬件容量來評估 NPU 能力。效率定義為為一幀執(zhí)行特定 CNN 需要多少操作,占聲稱的 TOPS 總數(shù)的百分比。該數(shù)字僅基于定義任何 CNN 的基礎(chǔ)數(shù)學(xué)算法計(jì)算得出,無論 NPU 實(shí)際如何評估它。它比較了實(shí)際與聲稱的性能,這才是真正重要的。

展示出高效率的 NPU 意味著它將充分利用用于實(shí)現(xiàn)它的每平方毫米硅片,這意味著更低的芯片成本和更低的功耗。效率可為汽車 SoC 或 ASIC 提供最佳 PPA(性能、功率和面積)。

NPU 的自治性是另一個重要因素。NPU 在主機(jī) CPU 上放置多少 CPU 負(fù)載才能達(dá)到最高性能?這與內(nèi)存子系統(tǒng)有什么關(guān)系?NPU 必須被視為任何 SoC 或 ASIC 中的大塊——它對芯片和子系統(tǒng)其余部分的影響不容忽視。

結(jié)論

在設(shè)計(jì)任何 SoC 或 ASIC 汽車時,AI 工程師必須專注于構(gòu)建能夠可靠執(zhí)行其算法的生產(chǎn)平臺,同時實(shí)現(xiàn)卓越的 PPA:最低功耗、最低成本、更高性能。他們還必須在設(shè)計(jì)周期的早期就選擇硬件平臺,通常是在開發(fā)最終算法之前。

效率是實(shí)現(xiàn)這一目標(biāo)的最佳方式;TOPS 和硬件利用率都不是好的衡量標(biāo)準(zhǔn)。如果要滿足苛刻的生產(chǎn)目標(biāo),評估 NPU 的自主性也至關(guān)重要。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    11294

    瀏覽量

    225345
  • soc
    soc
    +關(guān)注

    關(guān)注

    40

    文章

    4580

    瀏覽量

    229385
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    40160

    瀏覽量

    301776
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    使用NORDIC AI的好處

    × 在 CPU 上運(yùn)行時可快 10×、省電,平均模型體積 <5 KB。[Edge AI 軟件頁] Axon NPU 對同一 TensorFlow Lite 模型:* 推理速度最高可比
    發(fā)表于 01-31 23:16

    IBM Rhapsody AI 助手:讓系統(tǒng)工程智能

    IBM Rhapsody AI 能力的加入,標(biāo)志著系統(tǒng)工程正逐步邁入智能化新階段。它讓模型不再只是“被動表達(dá)設(shè)計(jì)意圖”的工具,而成為能理解、能推理、能生成的智能伙伴。在 AI 時代,系
    的頭像 發(fā)表于 01-06 11:34 ?336次閱讀
    IBM Rhapsody <b class='flag-5'>AI</b> 助手:讓系統(tǒng)工程<b class='flag-5'>更</b><b class='flag-5'>智能</b>

    聯(lián)想集團(tuán)想幫幫服務(wù)智能體榮膺2025 EDGE AWARDS最佳AI創(chuàng)新應(yīng)用

    2025年12月21日,鈦媒體2025 EDGE AWARDS全球創(chuàng)新評選正式收官,想幫幫服務(wù)智能體憑借其卓越的創(chuàng)新技術(shù)和應(yīng)用實(shí)力,成功入選年度創(chuàng)新AI榜,并榮膺「最佳AI創(chuàng)新應(yīng)用獎項(xiàng)
    的頭像 發(fā)表于 12-30 11:26 ?664次閱讀

    探索PSOC Edge E84 AI Kit:開啟下一代機(jī)器學(xué)習(xí)邊緣設(shè)備設(shè)計(jì)之旅

    Edge E84 AI Kit概述 PSOC Edge E84 AI Kit旨在助力機(jī)器學(xué)習(xí)(ML)和人工智能
    的頭像 發(fā)表于 12-18 14:45 ?685次閱讀

    AI賦能6G與衛(wèi)星通信:開啟智能天網(wǎng)新時代

    連接到6G網(wǎng)絡(luò),AI確保了即使在信號較弱的情況下,也能提供高質(zhì)量的通信服務(wù)。 AI讓\"天網(wǎng)\"智能 隨著技術(shù)的不斷進(jìn)步,AI在6G和衛(wèi)星
    發(fā)表于 10-11 16:01

    【今晚7點(diǎn)半】正點(diǎn)原子 x STM32:智能加速邊緣AI應(yīng)用開發(fā)!今晚正點(diǎn)原子B站直播間等你

    【聯(lián)合直播】正點(diǎn)原子 x STM32:智能加速邊緣AI應(yīng)用開發(fā)! 一、直播介紹 隨著人工智能技術(shù)在邊緣計(jì)算領(lǐng)域的快速發(fā)展,STM32系列芯片憑借其卓越的性能與豐富的生態(tài),成為眾多智能
    發(fā)表于 09-25 14:14

    最新人工智能硬件培訓(xùn)AI基礎(chǔ)入門學(xué)習(xí)課程參考2025版(離線AI語音視覺識別篇)

    端側(cè)離線 AI 智能硬件作為 AI 技術(shù)的重要載體之一,憑借其無需依賴網(wǎng)絡(luò)即可實(shí)現(xiàn)智能功能的特性,在一些網(wǎng)絡(luò)條件受限或?qū)?shù)據(jù)隱私有較高要求的場景中,發(fā)揮著不可或缺的作用。本章基于CSK
    發(fā)表于 07-04 11:14

    2.0.0版本的ST Edge AI Core在linux平臺上可以把量化后的onnx模型轉(zhuǎn)換為.nb,但是運(yùn)行報(bào)錯,缺少文件,為什么?

    2.0.0版本的ST Edge AI Core工具在linux平臺上應(yīng)該是可以把量化后的onnx模型轉(zhuǎn)換為.nb,但是運(yùn)行報(bào)錯,缺少文件。
    發(fā)表于 06-17 06:29

    AMD第二代Versal AI Edge和Versal Prime系列加速量產(chǎn) 為嵌入式系統(tǒng)實(shí)現(xiàn)單芯片智能

    我們推出了 AMD 第二代 Versal AI Edge 系列和第二代 Versal Prime 系列,這兩款產(chǎn)品是對 Versal 產(chǎn)品組合的擴(kuò)展,可為嵌入式系統(tǒng)實(shí)現(xiàn)單芯片智能
    的頭像 發(fā)表于 06-11 09:59 ?1913次閱讀

    2025研華嵌入式設(shè)計(jì)論壇上海站:聚焦Edge Computing &amp;amp; Edge AI,共探技術(shù)創(chuàng)新與生態(tài)融合

    Computing與Edge AI領(lǐng)域的最新技術(shù)進(jìn)展、創(chuàng)新應(yīng)用及生態(tài)構(gòu)建。 ? 一、引領(lǐng)前沿技術(shù),洞見未來趨勢 論壇在研華科技嵌入式物聯(lián)網(wǎng)事業(yè)群(中國)總經(jīng)理許杰弘先生的致辭中拉開序幕。他以“邊緣智能聚勢未來,生態(tài)鏈接驅(qū)動創(chuàng)新
    發(fā)表于 05-30 11:56 ?1215次閱讀
    2025研華嵌入式設(shè)計(jì)論壇上海站:聚焦<b class='flag-5'>Edge</b> Computing &amp;amp; <b class='flag-5'>Edge</b> <b class='flag-5'>AI</b>,共探技術(shù)創(chuàng)新與生態(tài)融合

    首創(chuàng)開源架構(gòu),天璣AI開發(fā)套件讓端側(cè)AI模型接入得心應(yīng)手

    正式提出“智能體化用戶體驗(yàn)”方向,并啟動“天璣智能體化體驗(yàn)領(lǐng)航計(jì)劃”。值得注意的是,其三大AI工具鏈的發(fā)布——天璣開發(fā)工具集、AI開發(fā)套件
    發(fā)表于 04-13 19:52

    面向AI與機(jī)器學(xué)習(xí)應(yīng)用的開發(fā)平臺 AMD/Xilinx Versal? AI Edge VEK280

    AMD/Xilinx Versal? AI Edge VEK280評估套件是一款面向AI與機(jī)器學(xué)習(xí)應(yīng)用的開發(fā)平臺,專為邊緣計(jì)算場景優(yōu)化設(shè)計(jì)。以下從核心配置、技術(shù)特性、應(yīng)用場景及開發(fā)支持等方面進(jìn)行詳細(xì)
    的頭像 發(fā)表于 04-11 18:33 ?2560次閱讀
    面向<b class='flag-5'>AI</b>與機(jī)器學(xué)習(xí)應(yīng)用的開發(fā)平臺 AMD/Xilinx Versal? <b class='flag-5'>AI</b> <b class='flag-5'>Edge</b> VEK280

    在線研討會 | 4/22 Microchip 助力AI智能

    隨著人工智能AI)技術(shù)向邊緣計(jì)算、實(shí)時響應(yīng)和低功耗場景加速滲透,高性能、高能效的方案成為推動AI創(chuàng)新的核心驅(qū)動力。本次研討會聚焦"Microchip如何賦能AI
    的頭像 發(fā)表于 04-08 16:33 ?675次閱讀
    在線研討會 | 4/22 Microchip 助力<b class='flag-5'>AI</b><b class='flag-5'>更</b><b class='flag-5'>智能</b>

    Edge AI+儲能——能源新方向 2025研華儲能合伙伙伴會議圓滿落幕!

    及合作伙伴參與,共同探討儲能技術(shù)創(chuàng)新與產(chǎn)業(yè)智能化升級路徑。 ? 聚焦前沿技術(shù),共話產(chǎn)業(yè)未來 會議開場,研華以《 Edge AI創(chuàng)新方案:加速光儲充產(chǎn)業(yè)智能化應(yīng)用與高效部署 》為題,分享
    發(fā)表于 04-02 11:32 ?406次閱讀
    <b class='flag-5'>Edge</b> <b class='flag-5'>AI</b>+儲能——能源新方向 2025研華儲能合伙伙伴會議圓滿落幕!

    研華科技全棧式Edge AI產(chǎn)品助力工業(yè)智能化升級

    在2025慕尼黑上海電子設(shè)備展上,研華展示了其全棧式Edge AI產(chǎn)品,助力工業(yè)智能化升級。通過邊緣計(jì)算與AI技術(shù)的深度融合,研華賦能智能
    的頭像 發(fā)表于 03-28 17:23 ?1462次閱讀