91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

實現(xiàn)異構(gòu)多核十倍嵌入式內(nèi)存性能的三種方法

星星科技指導員 ? 來源:嵌入式計算設計 ? 作者:Brandon Lewis ? 2022-10-24 15:50 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

從理論上講,異構(gòu)多核設備可以配備針對給定用例可以拋出的任何類型的操作而優(yōu)化的計算塊。用于視頻處理的 GPU、用于對象識別的神經(jīng)網(wǎng)絡處理器、運行操作系統(tǒng)CPU 等。與同一級別的同類處理器相比,不同的適合用途的內(nèi)核為 SoC 提供了更大的靈活性,因此在更廣泛的工作負載范圍內(nèi)具有更高的性能和更低的功耗。

但是,當您開始考慮基于邊緣的AI,計算機視覺等應用程序的要求時,事實是I / O和內(nèi)存變得與原始處理性能一樣嚴格,如果不是更多的話。

“內(nèi)存速度只會上升得這么快,對吧?”,英偉達副總裁兼嵌入式與邊緣計算總經(jīng)理Deepu Talla說?!八鼪]有呈指數(shù)級增長。由于大小的原因,位寬大致相同:它是16位,32位,64位,128位,等等。大多數(shù)嵌入式處理器通常具有32位甚至16位接口,這也是由于成本和尺寸的原因。

“記憶的速度每一代只增長2倍,這通常每三年發(fā)生一次,”他繼續(xù)說道。“但是,SoC中的計算要求可能增加了10倍或20倍。

您如何協(xié)調(diào)計算性能的不成比例的提高與內(nèi)存技術(shù)相對較小的進步?特別是隨著處理器演變成獨特的邏輯集合,這些邏輯集合都需要自己訪問內(nèi)存等資源。

根據(jù)塔拉的說法,你把它給他們。以下是嵌入式存儲器架構(gòu)為滿足下一代異構(gòu)多核處理器的需求而不斷發(fā)展的三種方式。

#1.特定于內(nèi)核的靜態(tài)存儲器

“如果你看看很多這樣的嵌入式處理器,它們過去一直都有SRAM,”Talla說?!艾F(xiàn)在,對于每個特定的單元,我們有本地SRAM,它從DRAM獲取數(shù)據(jù),將其存儲在本地并進行處理,然后發(fā)回最終輸出。

特定于內(nèi)核的SRAM具有一些優(yōu)勢,首先是無需將臨時數(shù)據(jù)寫回片外DRAM所帶來的內(nèi)存性能提升。

這種架構(gòu)還具有降低功耗的額外好處,因為極低電壓的SRAM模塊位于SoC中相應的邏輯IP附近或附近。

“如果你去DRAM,那可能是一個數(shù)量級的功率,所以你實際上通過使用這些技術(shù)來節(jié)省功率,”Talla解釋說。

#2.增加系統(tǒng)內(nèi)存

如今,嵌入式處理器具有多達 4 MB 至 8 MB 的系統(tǒng)內(nèi)存。此系統(tǒng)內(nèi)存不專用于任何一個特定內(nèi)核,并且可以在 CPU、GPU 和加速器等元素之間共享。

與專用SRAM類似,更多共享系統(tǒng)內(nèi)存的主要好處是更少的DRAM訪問。例如,傳統(tǒng)的視頻編碼序列如下所示:

數(shù)字內(nèi)存 -》 視頻編碼器 -》 數(shù)字內(nèi)存 -》 附加計算 -》 DRAM

增加的系統(tǒng)緩存可實現(xiàn)以下功能:

DRAM -》 視頻編碼器 -》 系統(tǒng)內(nèi)存 -》 附加計算 -》 DRAM

如前所述,不同之處在于單獨的內(nèi)核不必不斷從片外DRAM獲取數(shù)據(jù),因為大型系統(tǒng)內(nèi)存消除了對中間步驟的需求。

#3.增加的緩存大小

最后,隨著較新的處理技術(shù)使更高容量的內(nèi)存更實惠,緩存大小將不可避免地增加。在異構(gòu) SoC 上為 CPU、GPU、DSP 和其他核心架構(gòu)提供更大的緩存也將減少 DRAM 流量。

將增加的緩存大小與前兩項改進相結(jié)合,開始產(chǎn)生一些重大收益。

Talla指出:“更多的SRAM,通用的系統(tǒng)內(nèi)存,以及更多的高容量緩存,可以讓你在未來三到五年內(nèi)將性能提高10倍到100倍,即使內(nèi)存帶寬可能只增加了一倍或四倍。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    20256

    瀏覽量

    252450
  • 嵌入式
    +關(guān)注

    關(guān)注

    5199

    文章

    20454

    瀏覽量

    334265
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5196

    瀏覽量

    135506
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    施耐德電氣揭秘弘昇實現(xiàn)業(yè)務規(guī)模十倍跨越的成長密碼

    作為系統(tǒng)集成商的優(yōu)秀代表,弘昇與施耐德電氣已攜手合作余年,從2014年簽約額僅三百萬人民幣的初創(chuàng)企業(yè),到2023年整體銷售額突破億元大關(guān),實現(xiàn)業(yè)務規(guī)模十倍跨越,2024年更保持營業(yè)額翻倍的強勁
    的頭像 發(fā)表于 01-24 16:51 ?2079次閱讀

    arm嵌入式主板優(yōu)缺點

    設備里面做控制、數(shù)據(jù)處理使用的CPU板。一般作為工控主板使用。   ARM處理器是一16/32位的嵌入式RISC微處理器,具有低成本、高性能、低功耗的特點。ARM9系列微處理器具有以下特點:支持
    發(fā)表于 01-08 07:08

    嵌入式中的浮點型數(shù)據(jù)轉(zhuǎn)換為字節(jié)類型的三種方法

    。double類型也是如此最多可以保存小數(shù)點后15位小數(shù)。 float 優(yōu)點:省內(nèi)存,運算速度快。 float 缺點:精度低。 double 優(yōu)點:精度高。 double 缺點:占內(nèi)存,運算速度慢。 在嵌入式編程
    發(fā)表于 01-07 06:28

    嵌入式系統(tǒng)中,動態(tài)分配內(nèi)存可能發(fā)生的問題是什么?

    盡管不像非嵌入式計算機那么常見,嵌入式系統(tǒng)還是有從堆(heap)中動態(tài)分配內(nèi)存的過程的。 那么嵌入式系統(tǒng)中,動態(tài)分配內(nèi)存可能發(fā)生的問題是什
    發(fā)表于 12-22 09:42

    嵌入式硬件設計解析

    設計是一個復雜而精細的過程,涉及需求分析、核心元件選擇、原理圖設計、PCB設計、硬件調(diào)試以及優(yōu)化與迭代等多個環(huán)節(jié)。通過科學的設計方法和嚴謹?shù)臏y試流程,可以設計出性能穩(wěn)定、功耗低、可靠性高的嵌入式系統(tǒng)硬件
    發(fā)表于 12-02 08:22

    嵌入式和FPGA的區(qū)別

    嵌入式系統(tǒng)與FPGA的核心差異:軟件定義功能VS硬件可重構(gòu)。嵌入式適合通用計算,開發(fā)門檻低;FPGA憑借并行處理實現(xiàn)納秒級響應,但成本高、開發(fā)難。二者融合的SoC器件正成為未來趨勢,平衡性能
    發(fā)表于 11-19 06:55

    【玩轉(zhuǎn)多核異構(gòu)】T153核心板RISC-V核的實時性應用解析

    飛凌嵌入式FET153-S核心板的異構(gòu)多核架構(gòu)展現(xiàn)出了卓越的通信性能,能夠為諸多應用提供高效可靠的核心支撐,特別適用于對實時性和穩(wěn)定性要求極高的智能應用場景。
    的頭像 發(fā)表于 11-14 09:40 ?8709次閱讀
    【玩轉(zhuǎn)<b class='flag-5'>多核</b><b class='flag-5'>異構(gòu)</b>】T153核心板RISC-V核的實時性應用解析

    嵌入式達到什么水平才能就業(yè)?

    、LoRa、NB-IoT,能實現(xiàn)嵌入式設備與云端平臺的數(shù)據(jù)交互了解 RTOS 實時操作系統(tǒng):如 FreeRTOS、RT-Thread,能進行任務創(chuàng)建、信號量管理、內(nèi)存分配
    發(fā)表于 09-15 10:20

    RK3506開發(fā)板:開啟嵌入式系統(tǒng)新時代

    系統(tǒng)的新時代。 性能卓越:創(chuàng)新架構(gòu)引領(lǐng)潮流 RK3506開發(fā)板采用的核A7+單核M0多核異構(gòu)架構(gòu),是其在性能
    的頭像 發(fā)表于 08-13 17:18 ?611次閱讀

    【老法師】多核異構(gòu)處理器中M核程序的啟動、編寫和仿真

    文章,小編就將以飛凌嵌入式的OKMX8MP-C開發(fā)板為例,為大家介紹多核異構(gòu)處理器M核程序的啟動配置、程序編寫和實時仿真的過程。
    的頭像 發(fā)表于 08-13 09:05 ?3997次閱讀
    【老法師】<b class='flag-5'>多核</b><b class='flag-5'>異構(gòu)</b>處理器中M核程序的啟動、編寫和仿真

    嵌入式芯片主流廠商、代表產(chǎn)品及特點

    嵌入式系統(tǒng)。部分嵌入式系統(tǒng)會搭載操作系統(tǒng),但大多數(shù)情況下,單一程序即可實現(xiàn)全部控制邏輯。 嵌入式芯片巨頭全景圖:核心技術(shù)路線與生態(tài)博弈 瑞薩電子(Renesas)——車規(guī)級MCU的全球
    的頭像 發(fā)表于 08-11 09:16 ?1777次閱讀
    <b class='flag-5'>嵌入式</b>芯片主流廠商、代表產(chǎn)品及特點

    嵌入式和單片機,是同一個東西嗎?

    ,嵌入式系統(tǒng)的設計和實現(xiàn)需要考慮功耗、尺寸、成本和性能以外的其他因素,如可靠性、安全性和實時性。此外,嵌入式系統(tǒng)通常不具備頻繁升級軟硬件的能力,一旦部署,它們需要在較長的時間內(nèi)穩(wěn)定運行
    發(fā)表于 07-09 10:20

    Linux嵌入式和單片機嵌入式的區(qū)別?

    Linux嵌入式與單片機嵌入式在多個方面存在顯著的區(qū)別,以下是詳細的比較和歸納: 一、基本概念 1. Linux嵌入式: 定義:將Linux操作系統(tǒng)運行在嵌入式設備上的一
    發(fā)表于 06-20 09:46

    嵌入式力矩電機的設計方法研究

    摘 要:介紹一用于機床直驅(qū)部件的嵌入式力短電機的設計和電磁結(jié)構(gòu)優(yōu)化方法。為了使嵌入式力矩電機滿足機床內(nèi)部結(jié)構(gòu)緊湊的要求,必須具有較高的磁密。通過計算分析,得到不同長徑比、不同磁極對數(shù)
    發(fā)表于 06-11 15:08

    精選好文!噪聲系數(shù)測量的三種方法

    本文介紹了測量噪聲系數(shù)的三種方法:增益法、Y系數(shù)法和噪聲系數(shù)測試儀法。這三種方法的比較以表格的形式給出。 在無線通信系統(tǒng)中,噪聲系數(shù)(NF)或者相對應的噪聲因數(shù)(F)定義了噪聲性能和對接
    發(fā)表于 05-07 10:18