91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

使用神經(jīng)處理單元集群轉換邊緣AI

星星科技指導員 ? 來源:嵌入式計算設計 ? 作者:Saumitra Jagdale ? 2022-10-19 10:57 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

隨著人工智能領域獲得牽引力,這些設備變得越來越計算和耗電。隨后,邊緣設備上的處理負載隨著系統(tǒng)架構的性能和復雜性而顯著增加。因此,在系統(tǒng)中灌輸了更高分辨率的圖像和更復雜的算法,隨著對AI處理的需求不斷增長,以實現(xiàn)高TOPS性能,這需要進一步優(yōu)化。

Synopsys 發(fā)布了神經(jīng)處理單元 (NPU)、知識產(chǎn)權 (IP) 內(nèi)核和工具鏈,以滿足 AI 片上系統(tǒng) (SoC) 中日益復雜的神經(jīng)網(wǎng)絡模型的性能需求。其新的設計軟件 ARC NPX6 和 NPX6FS NPU IP 可處理實時計算的需求,同時為 AI 應用消耗超低功耗。此外,該公司的新 MetaWare MX 開發(fā)工具提供了一個完整的編譯環(huán)境,具有自動化神經(jīng)網(wǎng)絡算法分區(qū),可最大限度地提高最新 NPU 上應用軟件開發(fā)的資源效率。

使用新的設計軟件 ARC NPX6 和 NPX6FS NPU IP 以及元軟件 MX 開發(fā)工具包,設計人員可以利用最新的神經(jīng)網(wǎng)絡模型,滿足不斷升級的性能期望,并加快其下一代智能 SoC 的上市時間。ARC NPX6 NPU IP 系列包括許多處理深度學習算法覆蓋的產(chǎn)品,包括對象識別、圖像質(zhì)量增強和場景分割等計算機視覺任務,以及音頻和自然語言處理等大型 AI 應用。設計中的單個內(nèi)核可以從 4K MAC 擴展到 96K MAC,以實現(xiàn)超過 250 TOPS 和超過 440 TOPS 的單個 AI 引擎性能,并且很少。

NPX6 NPU IP 包含對多達 8 個 NPU 的多 NPU 群集的硬件和軟件支持,稀疏性為 3500 TOPS。由于硬件和軟件中的高級帶寬功能以及內(nèi)存層次結構(每個內(nèi)核中包含L1內(nèi)存以及用于訪問常見L2內(nèi)存的高性能,低延遲連接),可以擴展到大量MAC數(shù)量。對于受益于神經(jīng)網(wǎng)絡內(nèi)部 BF16 或 FP16 的應用,提供了可選的張量浮點單元。

poYBAGNPZ7iAFPArAAGDfudyRsU033.png

MetaWare MX 開發(fā)工具包為應用軟件開發(fā)提供了軟件編程環(huán)境,包括神經(jīng)網(wǎng)絡軟件開發(fā)工具包 (NN SDK) 和虛擬模型支持。NN SDK 會自動將使用流行框架(如巨炬、張量流或 ONNX)訓練的神經(jīng)網(wǎng)絡轉換為 NPX 優(yōu)化的可執(zhí)行代碼。

這個概念是,NPX6 NPU處理器IP隨后可用于制造各種產(chǎn)品,從幾個TOPS到數(shù)千個TOPS,所有這些都可以使用單個工具鏈編寫。

NPX6 網(wǎng)絡輸出電源的主要特性:

可擴展的實時 AI/神經(jīng)處理器 IP,具有多達 3,500 個 TOPS 的性能,支持 CNN、RNN/LSTM、變壓器、推薦器網(wǎng)絡和其他神經(jīng)網(wǎng)絡。

功率效率(高達 30 TOPS/W)在業(yè)界無與倫比。

卷積加速器的 1-24 個內(nèi)核,增加了 4K MAC/內(nèi)核

張量加速器,支持張量運算符集體系結構并允許變量激活 (TOSA)

軟件開發(fā)套件

用于自動混合模式量化的工具

降低帶寬的架構和軟件工具特性

通過并行處理各個層來減少延遲。

設計軟件 ARC VPX 矢量 DSP 無縫集成。

生產(chǎn)力很高。張量流和巨炬框架,以及ONNX交換標準,由元軟件MX開發(fā)工具包支持。

此外,ARC NPX6FS NPU IP 符合 ISO 26262 ASIL D 標準,用于隨機硬件故障檢測和系統(tǒng)功能安全開發(fā)流程。這些處理器具有符合 ISO 26262 的特定安全機制,可處理下一代區(qū)域性設計的混合關鍵性和虛擬化需求,以及全面的安全文檔。

ARC 元軟件 MX 開發(fā)工具包包括神經(jīng)網(wǎng)絡軟件開發(fā)工具包 (SDK)、編譯器和調(diào)試器、虛擬平臺 SDK、運行時和庫以及高級仿真模型。它提供了一個統(tǒng)一的工具鏈環(huán)境來加速應用程序開發(fā),并在MAC資源之間智能地劃分算法以實現(xiàn)最佳處理。MetaWare MX 安全開發(fā)工具包包含安全手冊和安全指南,可幫助開發(fā)人員滿足 ISO 26262 標準,并為安全關鍵型汽車應用的 ISO 26262 合規(guī)性測試做準備。

利用 NPU 集群加速邊緣 AI 應用

為了滿足人工智能應用不斷增長的性能和復雜需求,恩智浦NPU IP核提供高性能、可擴展的實時人工智能和神經(jīng)處理IP,具有多達3500個TOPS,支持各種神經(jīng)網(wǎng)絡,如CNN、RNN/LSTM、變壓器和推薦器網(wǎng)絡。

此外,它通過并行處理各個層來減少延遲。此外,高生產(chǎn)力的元軟件 MX 開發(fā)工具包支持張量流和巨魔框架以及 ONNX 交換格式。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 處理器
    +關注

    關注

    68

    文章

    20304

    瀏覽量

    254012
  • 神經(jīng)網(wǎng)絡

    關注

    42

    文章

    4839

    瀏覽量

    108049
  • 人工智能
    +關注

    關注

    1819

    文章

    50213

    瀏覽量

    266494
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    邊緣 AI 加速的 Arm? Cortex??M0+ MCU 如何為電子產(chǎn)品注入更強智能

    關鍵要點 · 集成神經(jīng)處理單元 (NPU) 的德 TI 微控制器 (MCU) 可為邊緣 AI 提供硬件加速,幫助設計人員在功耗受限、成本敏感
    的頭像 發(fā)表于 03-25 09:22 ?197次閱讀
    <b class='flag-5'>邊緣</b> <b class='flag-5'>AI</b> 加速的 Arm? Cortex??M0+ MCU 如何為電子產(chǎn)品注入更強智能

    邊緣AI算力臨界點:深度解析176TOPS香橙派AI Station的產(chǎn)業(yè)價值

    調(diào)度與操作系統(tǒng)運行。 2、 10個AI Core (達芬奇架構,1.08GHz):專為高密度的矩陣運算設計,承擔神經(jīng)網(wǎng)絡推理。 3、 8個Vector Core (1GHz):輔助進行數(shù)據(jù)預處理和向量
    發(fā)表于 03-10 14:19

    如何利用NPU與模型壓縮技術優(yōu)化邊緣AI

    隨著人工智能模型從設計階段走向?qū)嶋H部署,工程師面臨著雙重挑戰(zhàn):在計算能力和內(nèi)存受限的嵌入式設備上實現(xiàn)實時性能。神經(jīng)處理單元(NPU)作為強大的硬件解決方案,擅長處理
    的頭像 發(fā)表于 11-07 15:26 ?1361次閱讀
    如何利用NPU與模型壓縮技術優(yōu)化<b class='flag-5'>邊緣</b><b class='flag-5'>AI</b>

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+神經(jīng)形態(tài)計算、類腦芯片

    AI芯片不僅包括深度學細AI加速器,還有另外一個主要列別:類腦芯片。類腦芯片是模擬人腦神經(jīng)網(wǎng)絡架構的芯片。它結合微電子技術和新型神經(jīng)形態(tài)器件,模仿人腦
    發(fā)表于 09-17 16:43

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+第二章 實現(xiàn)深度學習AI芯片的創(chuàng)新方法與架構

    Transformer和視覺Transformer模型。 ViTA是一種高效數(shù)據(jù)流AI加速器,用于在邊緣設備上部署計算密集型視覺Transformer模型。 2、射頻神經(jīng)網(wǎng)絡 2.1線性射頻模擬
    發(fā)表于 09-12 17:30

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI芯片的需求和挑戰(zhàn)

    邊緣AI的不同特點: 邊緣推理的優(yōu)勢:可以提供數(shù)據(jù)處理速度和響應速度,滿足實時需求;可以縮短網(wǎng)絡延遲,降低成本;可以提高安全性和隱私性,保護用戶數(shù)據(jù)。 前面說的都是好處,那面臨的
    發(fā)表于 09-12 16:07

    新思科技如何破解邊緣AI部署難題

    神經(jīng)處理單元(NPU)是一種專為人工智能(AI神經(jīng)網(wǎng)絡和深度學習任務設計的專用處理器,隨著技術
    的頭像 發(fā)表于 08-21 16:40 ?999次閱讀
    新思科技如何破解<b class='flag-5'>邊緣</b><b class='flag-5'>AI</b>部署難題

    DeepX DX-M1 強勢來襲,引爆邊緣 AI 運算新革命

    推理需求,專為神經(jīng)網(wǎng)絡運算設計的神經(jīng)網(wǎng)絡處理單元(NeuralProcessingUnit,簡稱NPU)應運而生,成為新一代邊緣
    的頭像 發(fā)表于 08-21 08:18 ?1317次閱讀
    DeepX DX-M1 強勢來襲,引爆<b class='flag-5'>邊緣</b> <b class='flag-5'>AI</b> 運算新革命

    AI 邊緣計算網(wǎng)關:開啟智能新時代的鑰匙?—龍興物聯(lián)

    智能化決策的關鍵。卷積神經(jīng)網(wǎng)絡在圖像識別方面表現(xiàn)卓越,在智能工廠產(chǎn)品質(zhì)量檢測中,能快速準確識別產(chǎn)品缺陷;循環(huán)神經(jīng)網(wǎng)絡擅長處理時間序列數(shù)據(jù),可對設備故障進行精準預測。 在通信技術與協(xié)議支持上,A
    發(fā)表于 08-09 16:40

    一文看懂AI算力集群

    最近這幾年,AI浪潮席卷全球,成為整個社會的關注焦點。大家在討論AI的時候,經(jīng)常會提到AI算力集群AI的三要素,是算力、算法和數(shù)據(jù)。而
    的頭像 發(fā)表于 07-23 12:18 ?1802次閱讀
    一文看懂<b class='flag-5'>AI</b>算力<b class='flag-5'>集群</b>

    大聯(lián)大世平推出基于恩智浦產(chǎn)品的邊緣AI加速方案

    大聯(lián)大世平 (WPI) 基于恩智浦i.MX 95系列應用處理器推出邊緣AI加速方案,該方案結合了多項核心技術,包括神經(jīng)處理
    的頭像 發(fā)表于 06-24 17:33 ?2377次閱讀
    大聯(lián)大世平推出基于恩智浦產(chǎn)品的<b class='flag-5'>邊緣</b><b class='flag-5'>AI</b>加速方案

    FPGA在邊緣AI中的應用

    從聊天機器人、內(nèi)容生成到高級數(shù)據(jù)分析,AI 已無處不在。過去,大多數(shù) AI 處理都在云端完成。然而,隨著模型功能日益強大以及對實時洞察的需求持續(xù)增長,AI 正在向
    的頭像 發(fā)表于 06-24 09:31 ?1858次閱讀

    STM32F769是否可以部署邊緣AI

    STM32F769是否可以部署邊緣AI
    發(fā)表于 06-17 06:44

    Deepseek海思SD3403邊緣計算AI產(chǎn)品系統(tǒng)

    海思SD3403邊緣計算AI框架,提供了一套開放式AI訓練產(chǎn)品工具包,解決客戶低成本AI系統(tǒng),針對差異化AI 應用場景,自己采集樣本數(shù)據(jù),進
    發(fā)表于 04-28 11:05

    Synaptics發(fā)布高性能AI MCU,推動邊緣計算新突破

    與Ethos-U55神經(jīng)處理單元,適配多模態(tài)計算需求。SR系列具備流式視覺、音頻處理及多攝像頭接口,廣泛應用于安防攝像頭、智能家電、POS機等設備,顯著降低系統(tǒng)成
    的頭像 發(fā)表于 04-23 10:00 ?926次閱讀
    Synaptics發(fā)布高性能<b class='flag-5'>AI</b> MCU,推動<b class='flag-5'>邊緣</b>計算新突破