91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀(guān)看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

開(kāi)發(fā)嵌入式神經(jīng)網(wǎng)絡(luò)的現(xiàn)實(shí)

石飛鵬 ? 來(lái)源:CZM陳先生123 ? 作者:CZM陳先生123 ? 2022-07-15 16:50 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

關(guān)于將人工智能用于越來(lái)越智能的車(chē)輛的文章已經(jīng)很多。但是,您如何將在服務(wù)器場(chǎng)上開(kāi)發(fā)的神經(jīng)網(wǎng)絡(luò) (NN) 壓縮到量產(chǎn)汽車(chē)中資源受限的嵌入式硬件中呢?本文探討了我們應(yīng)該如何授權(quán)汽車(chē)生產(chǎn) AI 研發(fā)工程師在將 NN 從原型到生產(chǎn)的整個(gè)過(guò)程中改進(jìn) NN,而不是像今天過(guò)早地將 NN 移交給嵌入式軟件團(tuán)隊(duì)的過(guò)程。

“如果我們要充分利用嵌入式硬件資源,我們需要讓生產(chǎn) AI 團(tuán)隊(duì)在軟件移植過(guò)程中利用他們對(duì) NN 的知識(shí)”(來(lái)源:Marton Feher,SVP 硬件工程,AImotive)

嵌入式人工智能:嵌入式軟件——但不是我們所知道的

對(duì)于任何注定要在批量生產(chǎn)中部署的嵌入式軟件,一旦完成并驗(yàn)證了其核心功能的實(shí)現(xiàn),就會(huì)在代碼中投入大量精力。這個(gè)優(yōu)化階段是關(guān)于最小化所需的內(nèi)存、CPU 和其他資源,以便盡可能多地保留軟件功能,同時(shí)將執(zhí)行它所需的資源減少到絕對(duì)最低限度。

這種從基于實(shí)驗(yàn)室的算法創(chuàng)建嵌入式軟件的過(guò)程使生產(chǎn)工程師能夠?qū)④浖δ艹杀竟こ袒癁榭闪慨a(chǎn)的形式,與用于開(kāi)發(fā)它的海量計(jì)算數(shù)據(jù)中心相比,所需的芯片和硬件更便宜、功能更差。但是,它通常需要從一開(kāi)始就凍結(jié)功能,只進(jìn)行代碼修改以改進(jìn)算法本身的執(zhí)行方式。對(duì)于大多數(shù)軟件來(lái)說(shuō),這很好:確實(shí),它可以使用嚴(yán)格的驗(yàn)證方法來(lái)確保嵌入過(guò)程保留所需的所有功能。

然而,當(dāng)嵌入基于 NN 的 AI 算法時(shí),這可能是一個(gè)主要問(wèn)題。為什么?因?yàn)閺囊婚_(kāi)始就凍結(jié)功能,您正在刪除可以?xún)?yōu)化執(zhí)行的主要方法之一。

問(wèn)題是什么?

有兩種根本不同的方法可以解決將復(fù)雜的 NN 從實(shí)驗(yàn)室中不受約束、資源豐富的 NN 訓(xùn)練環(huán)境移植到受?chē)?yán)格約束的嵌入式硬件平臺(tái)的任務(wù):

優(yōu)化執(zhí)行NN的代碼

優(yōu)化神經(jīng)網(wǎng)絡(luò)本身

當(dāng)嵌入式軟件工程師發(fā)現(xiàn)性能問(wèn)題,例如內(nèi)存帶寬瓶頸或底層嵌入式硬件平臺(tái)利用率低下時(shí),傳統(tǒng)的嵌入式軟件技術(shù)會(huì)鼓勵(lì)您深入挖掘底層代碼并找出問(wèn)題所在。

這反映在當(dāng)今可用于嵌入式MCUDSP的許多先進(jìn)而復(fù)雜的工具中。它們使您能夠了解軟件中正在發(fā)生的事情的最低水平,并識(shí)別和改進(jìn)軟件本身的執(zhí)行——希望不會(huì)改變其功能。

對(duì)于神經(jīng)網(wǎng)絡(luò)來(lái)說(shuō),優(yōu)化與傳統(tǒng)的嵌入式軟件完全不同——至少如果你想用可用的硬件資源實(shí)現(xiàn)盡可能最佳的結(jié)果。對(duì)于神經(jīng)網(wǎng)絡(luò),通過(guò)改變拓?fù)渖窠?jīng)網(wǎng)絡(luò)本身(神經(jīng)網(wǎng)絡(luò)的各個(gè)層如何連接,以及每個(gè)層做什么)和使用更新的約束和輸入重新訓(xùn)練來(lái)實(shí)現(xiàn)改進(jìn)。這是因?yàn)楣δ懿皇怯缮窠?jīng)網(wǎng)絡(luò)“軟件”定義的,而是在訓(xùn)練期間應(yīng)用的目標(biāo)和約束,以創(chuàng)建定義神經(jīng)網(wǎng)絡(luò)最終行為的權(quán)重。

因此,在執(zhí)行神經(jīng)網(wǎng)絡(luò)的嵌入過(guò)程時(shí),需要凍結(jié)神經(jīng)網(wǎng)絡(luò)的目標(biāo)性能,而不是如何實(shí)現(xiàn)它。如果您從嵌入過(guò)程開(kāi)始就約束神經(jīng)網(wǎng)絡(luò)拓?fù)?,那么您就是在刪除生產(chǎn)工程師需要的提高性能的工具。

這意味著您需要新的不同工具來(lái)完成將NNs從實(shí)驗(yàn)室移植到嵌入式平臺(tái)的任務(wù)。低級(jí)軟件工程師無(wú)法完成這項(xiàng)工作——你需要人工智能工程師根據(jù)工具提供的性能信息來(lái)調(diào)整神經(jīng)網(wǎng)絡(luò)及其訓(xùn)練。這是新的:當(dāng)研發(fā)工程師將經(jīng)過(guò)培訓(xùn)的神經(jīng)網(wǎng)絡(luò)交給生產(chǎn)工程師時(shí),他們?cè)僖膊荒苷f(shuō)“工作完成了”!

不同的方法

通過(guò)采用將 AI 研發(fā)工程師置于嵌入式軟件移植任務(wù)中心的開(kāi)發(fā)工作流程,任何芯片都可以實(shí)現(xiàn)卓越的結(jié)果。使用以層為中心的分析,輔以從編譯改進(jìn)的卷積神經(jīng)網(wǎng)絡(luò) (CNN) 到查看目標(biāo)神經(jīng)處理器單元 (NPU) 的準(zhǔn)確性能結(jié)果的幾分鐘內(nèi)快速周轉(zhuǎn),開(kāi)發(fā)人員可以使用相同的底層硬件實(shí)現(xiàn) 100% 或更多的增益. 這是因?yàn)樾薷?CNN 本身,而不是只修改用于執(zhí)行相同 CNN 的代碼,為 AI 工程師提供了更大的靈活性來(lái)識(shí)別和實(shí)施性能改進(jìn)。

在開(kāi)發(fā)我們的 aiWare NPU 時(shí),AImotive 使用了我們自己的 AI 工程師將移植過(guò)程移植到具有廣泛 NPU 功能的多個(gè)不同芯片的經(jīng)驗(yàn)。我們希望找到更好的方法來(lái)幫助我們自己的 AI 工程師完成這項(xiàng)任務(wù),因此在開(kāi)發(fā)我們對(duì) aiWare NPU 本身和支持它的 aiWare Studio 工具的要求時(shí),我們確定了我們?cè)谶^(guò)去的:

高度確定性的 NPU 架構(gòu),使時(shí)序非??深A(yù)測(cè)

準(zhǔn)確的基于層(不是基于時(shí)序或低級(jí)代碼)的性能估計(jì),以便任何 AI 研發(fā)工程師都可以看到更改其訓(xùn)練標(biāo)準(zhǔn)(例如添加或更改使用的場(chǎng)景,或修改目標(biāo) KPI)的影響; / 或 NN 拓?fù)淇焖?/p>

準(zhǔn)確的離線(xiàn)性能估計(jì),以便在第一個(gè)硬件可用之前執(zhí)行所有 NN 優(yōu)化(因?yàn)榈谝粋€(gè)原型總是稀缺的?。?/p>

點(diǎn)擊查看完整大小的圖片

poYBAGG3EIKAVGprABB3v6LafIM851.png


圖 1:aiWare Studio 使用戶(hù)能夠優(yōu)化他們的 NN,而不是用于執(zhí)行它們的代碼。這為 AI 設(shè)計(jì)人員提供了更大的靈活性,可以更快地實(shí)現(xiàn)出色的結(jié)果。(來(lái)源:AImotive)

結(jié)果是一組工具使 AI 研發(fā)工程師能夠在實(shí)驗(yàn)室環(huán)境中對(duì)目標(biāo)硬件進(jìn)行幾乎所有優(yōu)化,并在最終目標(biāo)硬件的 5% 范圍內(nèi)展示性能——這一切都在任何人看到硬件之前完成。

最終檢查

當(dāng)然,在芯片和硬件原型可用時(shí)測(cè)量最終硬件至關(guān)重要。這種開(kāi)發(fā)環(huán)境中實(shí)時(shí)硬件分析功能的可用性使工程師能夠訪(fǎng)問(wèn)由此類(lèi)工具支持的 NPU 內(nèi)的一系列深度嵌入式硬件寄存器和計(jì)數(shù)器。雖然芯片開(kāi)銷(xiāo)很?。ㄒ?yàn)樵S多 NPU 主要由內(nèi)存而非邏輯控制),但這些功能可以在執(zhí)行期間實(shí)現(xiàn)前所未有的、非侵入式的實(shí)時(shí)性能測(cè)量。然后可以將其用于直接與離線(xiàn)性能估計(jì)器結(jié)果進(jìn)行比較,以確認(rèn)準(zhǔn)確性。

點(diǎn)擊查看完整大小的圖片

poYBAGG3EIWAUiOjABWWAeWEhuU271.png


圖 2:使用嵌入式寄存器和計(jì)數(shù)器,aiWare Studio 可以準(zhǔn)確測(cè)量最終芯片性能,與離線(xiàn)估計(jì)結(jié)果相比,通常在 1%-5% 以?xún)?nèi)。(來(lái)源:AImotive 和 Nextchip Co. Ltd)

結(jié)論

這種新方法為汽車(chē)行業(yè)提供了一種新的、更好的方式來(lái)開(kāi)發(fā)、優(yōu)化和在生產(chǎn)車(chē)輛中部署人工智能。使用協(xié)同 NPU 硬件和工具,人工智能工程師可以為汽車(chē)應(yīng)用設(shè)計(jì)、實(shí)施和優(yōu)化更好的 CNN。

審核編輯 黃昊宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀(guān)點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 嵌入式
    +關(guān)注

    關(guān)注

    5198

    文章

    20449

    瀏覽量

    334012
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4838

    瀏覽量

    107756
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    39791

    瀏覽量

    301381
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    面向嵌入式部署的神經(jīng)網(wǎng)絡(luò)優(yōu)化:模型壓縮深度解析

    1.為什么需要神經(jīng)網(wǎng)絡(luò)模型壓縮? 神經(jīng)網(wǎng)絡(luò)已經(jīng)成為解決復(fù)雜機(jī)器學(xué)習(xí)問(wèn)題的強(qiáng)大工具。然而,這種能力往往伴隨著模型規(guī)模和計(jì)算復(fù)雜度的增加。當(dāng)輸入維度較大(例如長(zhǎng)時(shí)序窗口、高分辨率特征空間)時(shí),模型需要
    的頭像 發(fā)表于 02-24 15:37 ?4683次閱讀
    面向<b class='flag-5'>嵌入式</b>部署的<b class='flag-5'>神經(jīng)網(wǎng)絡(luò)</b>優(yōu)化:模型壓縮深度解析

    什么是嵌入式應(yīng)用開(kāi)發(fā)?

    概述 所謂的嵌入式應(yīng)用開(kāi)發(fā)就是在嵌入式操作系統(tǒng)下進(jìn)行開(kāi)發(fā)、軟硬件綜合開(kāi)發(fā) ?嵌入式應(yīng)用
    發(fā)表于 01-12 16:13

    神經(jīng)網(wǎng)絡(luò)的初步認(rèn)識(shí)

    日常生活中的智能應(yīng)用都離不開(kāi)深度學(xué)習(xí),而深度學(xué)習(xí)則依賴(lài)于神經(jīng)網(wǎng)絡(luò)的實(shí)現(xiàn)。什么是神經(jīng)網(wǎng)絡(luò)?神經(jīng)網(wǎng)絡(luò)的核心思想是模仿生物神經(jīng)系統(tǒng)的結(jié)構(gòu),特別是大腦中神經(jīng)
    的頭像 發(fā)表于 12-17 15:05 ?323次閱讀
    <b class='flag-5'>神經(jīng)網(wǎng)絡(luò)</b>的初步認(rèn)識(shí)

    嵌入式開(kāi)發(fā)的關(guān)鍵點(diǎn)介紹

    設(shè)備和移動(dòng)設(shè)備。因此,嵌入式開(kāi)發(fā)需要考慮系統(tǒng)的功耗,并編寫(xiě)節(jié)能的代碼以延長(zhǎng)系統(tǒng)的使用壽命。 4. 軟件集成: 嵌入式系統(tǒng)通常需要與其他設(shè)備和系統(tǒng)進(jìn)行集成,例如傳感器、網(wǎng)絡(luò)和云服務(wù)。因此,嵌入式
    發(fā)表于 11-13 08:12

    NMSIS神經(jīng)網(wǎng)絡(luò)庫(kù)使用介紹

    NMSIS NN 軟件庫(kù)是一組高效的神經(jīng)網(wǎng)絡(luò)內(nèi)核,旨在最大限度地提高 Nuclei N 處理器內(nèi)核上的神經(jīng)網(wǎng)絡(luò)的性能并最??大限度地減少其內(nèi)存占用。 該庫(kù)分為多個(gè)功能,每個(gè)功能涵蓋特定類(lèi)別
    發(fā)表于 10-29 06:08

    在Ubuntu20.04系統(tǒng)中訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型的一些經(jīng)驗(yàn)

    本帖欲分享在Ubuntu20.04系統(tǒng)中訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型的一些經(jīng)驗(yàn)。我們采用jupyter notebook作為開(kāi)發(fā)IDE,以TensorFlow2為訓(xùn)練框架,目標(biāo)是訓(xùn)練一個(gè)手寫(xiě)數(shù)字識(shí)別的神經(jīng)網(wǎng)絡(luò)
    發(fā)表于 10-22 07:03

    液態(tài)神經(jīng)網(wǎng)絡(luò)(LNN):時(shí)間連續(xù)性與動(dòng)態(tài)適應(yīng)性的神經(jīng)網(wǎng)絡(luò)

    1.算法簡(jiǎn)介液態(tài)神經(jīng)網(wǎng)絡(luò)(LiquidNeuralNetworks,LNN)是一種新型的神經(jīng)網(wǎng)絡(luò)架構(gòu),其設(shè)計(jì)理念借鑒自生物神經(jīng)系統(tǒng),特別是秀麗隱桿線(xiàn)蟲(chóng)的神經(jīng)結(jié)構(gòu),盡管這種微生物的
    的頭像 發(fā)表于 09-28 10:03 ?1211次閱讀
    液態(tài)<b class='flag-5'>神經(jīng)網(wǎng)絡(luò)</b>(LNN):時(shí)間連續(xù)性與動(dòng)態(tài)適應(yīng)性的<b class='flag-5'>神經(jīng)網(wǎng)絡(luò)</b>

    神經(jīng)網(wǎng)絡(luò)的并行計(jì)算與加速技術(shù)

    隨著人工智能技術(shù)的飛速發(fā)展,神經(jīng)網(wǎng)絡(luò)在眾多領(lǐng)域展現(xiàn)出了巨大的潛力和廣泛的應(yīng)用前景。然而,神經(jīng)網(wǎng)絡(luò)模型的復(fù)雜度和規(guī)模也在不斷增加,這使得傳統(tǒng)的串行計(jì)算方式面臨著巨大的挑戰(zhàn),如計(jì)算速度慢、訓(xùn)練時(shí)間長(zhǎng)等
    的頭像 發(fā)表于 09-17 13:31 ?1125次閱讀
    <b class='flag-5'>神經(jīng)網(wǎng)絡(luò)</b>的并行計(jì)算與加速技術(shù)

    無(wú)刷電機(jī)小波神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)子位置檢測(cè)方法的研究

    摘要:論文通過(guò)對(duì)無(wú)刷電機(jī)數(shù)學(xué)模型的推導(dǎo),得出轉(zhuǎn)角:與三相相電壓之間存在映射關(guān)系,因此構(gòu)建了一個(gè)以三相相電壓為輸人,轉(zhuǎn)角為輸出的小波神經(jīng)網(wǎng)絡(luò)來(lái)實(shí)現(xiàn)轉(zhuǎn)角預(yù)測(cè),并采用改進(jìn)遺傳算法來(lái)訓(xùn)練網(wǎng)絡(luò)結(jié)構(gòu)與參數(shù),借助
    發(fā)表于 06-25 13:06

    神經(jīng)網(wǎng)絡(luò)專(zhuān)家系統(tǒng)在電機(jī)故障診斷中的應(yīng)用

    摘要:針對(duì)傳統(tǒng)專(zhuān)家系統(tǒng)不能進(jìn)行自學(xué)習(xí)、自適應(yīng)的問(wèn)題,本文提出了基于種經(jīng)網(wǎng)絡(luò)專(zhuān)家系統(tǒng)的并步電機(jī)故障診斷方法。本文將小波神經(jīng)網(wǎng)絡(luò)和專(zhuān)家系統(tǒng)相結(jié)合,充分發(fā)揮了二者故障診斷的優(yōu)點(diǎn),很大程度上降低了對(duì)電機(jī)
    發(fā)表于 06-16 22:09

    神經(jīng)網(wǎng)絡(luò)RAS在異步電機(jī)轉(zhuǎn)速估計(jì)中的仿真研究

    眾多方法中,由于其結(jié)構(gòu)簡(jiǎn)單,穩(wěn)定性好廣泛受到人們的重視,且已被用于產(chǎn)品開(kāi)發(fā)。但是MRAS仍存在在低速區(qū)速度估計(jì)精度下降和對(duì)電動(dòng)機(jī)參數(shù)變化非常敏感的問(wèn)題。本文利用神經(jīng)網(wǎng)絡(luò)的特點(diǎn),使估計(jì)更為簡(jiǎn)單、快速
    發(fā)表于 06-16 21:54

    基于FPGA搭建神經(jīng)網(wǎng)絡(luò)的步驟解析

    本文的目的是在一個(gè)神經(jīng)網(wǎng)絡(luò)已經(jīng)通過(guò)python或者M(jìn)ATLAB訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)模型,將訓(xùn)練好的模型的權(quán)重和偏置文件以TXT文件格式導(dǎo)出,然后通過(guò)python程序?qū)xt文件轉(zhuǎn)化為coe文件,(coe
    的頭像 發(fā)表于 06-03 15:51 ?1198次閱讀
    基于FPGA搭建<b class='flag-5'>神經(jīng)網(wǎng)絡(luò)</b>的步驟解析

    ETAS全新的嵌入式AI解決方案

    “將訓(xùn)練后的AI神經(jīng)網(wǎng)絡(luò)模型,自動(dòng)化生成安全且高效的C代碼,用于嵌入式系統(tǒng)” ,近日ETAS攜全新的智能化工具Embedded AI Coder亮相2025上海國(guó)際車(chē)展。
    的頭像 發(fā)表于 05-07 11:43 ?2039次閱讀
    ETAS全新的<b class='flag-5'>嵌入式</b>AI解決方案

    NVIDIA實(shí)現(xiàn)神經(jīng)網(wǎng)絡(luò)渲染技術(shù)的突破性增強(qiáng)功能

    近日,NVIDIA 宣布了 NVIDIA RTX 神經(jīng)網(wǎng)絡(luò)渲染技術(shù)的突破性增強(qiáng)功能。NVIDIA 與微軟合作,將在 4 月的 Microsoft DirectX 預(yù)覽版中增加神經(jīng)網(wǎng)絡(luò)著色技術(shù),讓開(kāi)發(fā)
    的頭像 發(fā)表于 04-07 11:33 ?1167次閱讀

    神經(jīng)網(wǎng)絡(luò)壓縮框架 (NNCF) 中的過(guò)濾器修剪統(tǒng)計(jì)數(shù)據(jù)怎么查看?

    無(wú)法觀(guān)察神經(jīng)網(wǎng)絡(luò)壓縮框架 (NNCF) 中的過(guò)濾器修剪統(tǒng)計(jì)數(shù)據(jù)
    發(fā)表于 03-06 07:10