91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

為異構多核實現(xiàn)十倍嵌入式內(nèi)存性能的三種方法

星星科技指導員 ? 來源:嵌入式計算設計 ? 作者:Brandon Lewis ? 2022-06-02 09:35 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

從理論上講,異構多核設備可以配備一個計算塊,該計算塊針對給定用例的任何類型的操作進行了優(yōu)化。用于視頻處理的 GPU、用于對象識別的神經(jīng)網(wǎng)絡處理器、運行操作系統(tǒng)CPU 等等。與同級別的同質(zhì)處理器相比,不同用途的內(nèi)核為 SoC 提供了更大的靈活性,因此在更廣泛的工作負載范圍內(nèi)具有更高的性能和更低的功耗。

但當您開始考慮基于邊緣的 AI、計算機視覺等應用程序的要求時,事實是 I/O 和內(nèi)存變得與原始處理性能一樣受到限制,甚至更多。

“內(nèi)存速度只會這么快,對吧?” 英偉達嵌入式與邊緣計算副總裁兼總經(jīng)理 Deepu Talla “它并沒有呈指數(shù)級增長。由于大小,位寬大致相同:它可以是 16 位、32 位、64 位、128 位,等等。大多數(shù)嵌入式處理器通常具有 32 位甚至 16 位接口,這也是出于成本和尺寸的原因。

“內(nèi)存的速度只是一代比一代增長 2 倍,而且這通常每三年發(fā)生一次,”他繼續(xù)說道。“然而,SoC 中的計算需求可能增加了 10 倍或 20 倍?!?/p>

您如何協(xié)調(diào)計算性能的這種不成比例的增長與內(nèi)存技術的相對較小的進步?特別是當處理器演變成獨特的邏輯集合時,它們都需要自己訪問內(nèi)存等資源。

根據(jù)塔拉的說法,你把它給了他們。以下是嵌入式存儲器架構為滿足下一代異構多核處理器的需求而發(fā)展的三種方式。

1、內(nèi)核專用 SRAM

“如果你看很多這些嵌入式處理器,它們過去一直都有 SRAM,”Talla 說?!艾F(xiàn)在,對于每個特定單元,我們都有本地 SRAM,它從 DRAM 獲取數(shù)據(jù),在本地存儲并處理它,然后發(fā)回最終輸出?!?/p>

特定于內(nèi)核的 SRAM 提供了幾個優(yōu)勢,首先是由于不必將臨時數(shù)據(jù)寫回片外 DRAM 所帶來的內(nèi)存性能提升。

這種架構還具有降低功耗的額外好處,因為超低電壓 SRAM 模塊位于 SoC 內(nèi)相應的邏輯 IP 附近或附近。

“如果你使用 DRAM,這可能是一個數(shù)量級的功率,所以你實際上是通過使用這些技術來節(jié)省功率,”Talla 解釋道。

2、增加系統(tǒng)內(nèi)存

今天的嵌入式處理器具有高達 4 MB 到 8 MB 的系統(tǒng)內(nèi)存。此系統(tǒng)內(nèi)存并非專用于任何特定內(nèi)核,并且可以在 CPU、GPU 和加速器等元素之間共享。

與專用 SRAM 類似,更多共享系統(tǒng)內(nèi)存的主要好處是更少的 DRAM 訪問。例如,傳統(tǒng)的視頻編碼序列如下所示:

DRAM -》 視頻編碼器 -》 DRAM -》 附加計算 -》 DRAM

增加的系統(tǒng)緩存可以實現(xiàn)這一點:

DRAM -》 視頻編碼器 -》 系統(tǒng)內(nèi)存 -》 附加計算 -》 DRAM

如前所述,不同之處在于單獨的內(nèi)核不必不斷地從片外 DRAM 中獲取數(shù)據(jù),因為大系統(tǒng)內(nèi)存消除了對中間步驟的需要。

3、增加緩存大小

最后,隨著更新的工藝技術使更高容量的內(nèi)存更便宜,緩存大小將不可避免地增加。在異構 SoC 上發(fā)現(xiàn)的用于 CPU、GPU、DSP 和其他核心架構的更大緩存也將減少 DRAM 流量。

并且將增加的緩存大小與前兩個進步配對開始產(chǎn)生一些重大收益。

“更多的 SRAM、通用的系統(tǒng)內(nèi)存以及更多的大容量緩存可以讓您在接下來的三到五年內(nèi)將性能提高 10 倍到 100 倍,即使內(nèi)存帶寬可能只增加了一倍或四倍,”Talla 指出出去。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 嵌入式
    +關注

    關注

    5200

    文章

    20505

    瀏覽量

    334866
  • DRAM
    +關注

    關注

    41

    文章

    2396

    瀏覽量

    189294
  • 編碼器
    +關注

    關注

    45

    文章

    3967

    瀏覽量

    142839
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    施耐德電氣揭秘弘昇實現(xiàn)業(yè)務規(guī)模十倍跨越的成長密碼

    作為系統(tǒng)集成商的優(yōu)秀代表,弘昇與施耐德電氣已攜手合作余年,從2014年簽約額僅三百萬人民幣的初創(chuàng)企業(yè),到2023年整體銷售額突破億元大關,實現(xiàn)業(yè)務規(guī)模十倍跨越,2024年更保持營業(yè)額翻倍的強勁
    的頭像 發(fā)表于 01-24 16:51 ?2120次閱讀

    arm嵌入式主板優(yōu)缺點

    設備里面做控制、數(shù)據(jù)處理使用的CPU板。一般作為工控主板使用。   ARM處理器是一16/32位的嵌入式RISC微處理器,具有低成本、高性能、低功耗的特點。ARM9系列微處理器具有以下特點:支持
    發(fā)表于 01-08 07:08

    嵌入式中的浮點型數(shù)據(jù)轉(zhuǎn)換為字節(jié)類型的三種方法

    。double類型也是如此最多可以保存小數(shù)點后15位小數(shù)。 float 優(yōu)點:省內(nèi)存,運算速度快。 float 缺點:精度低。 double 優(yōu)點:精度高。 double 缺點:占內(nèi)存,運算速度慢。 在嵌入式編程
    發(fā)表于 01-07 06:28

    性能與性價比兼得!迅RK3562開發(fā)板開啟嵌入式開發(fā)新選擇

    性能與性價比兼得!迅RK3562開發(fā)板開啟嵌入式開發(fā)新選擇
    的頭像 發(fā)表于 12-23 16:10 ?1378次閱讀
    <b class='flag-5'>性能</b>與性價比兼得!迅<b class='flag-5'>為</b>RK3562開發(fā)板開啟<b class='flag-5'>嵌入式</b>開發(fā)新選擇

    嵌入式系統(tǒng)中,動態(tài)分配內(nèi)存可能發(fā)生的問題是什么?

    盡管不像非嵌入式計算機那么常見,嵌入式系統(tǒng)還是有從堆(heap)中動態(tài)分配內(nèi)存的過程的。 那么嵌入式系統(tǒng)中,動態(tài)分配內(nèi)存可能發(fā)生的問題是什
    發(fā)表于 12-22 09:42

    嵌入式和FPGA的區(qū)別

    嵌入式系統(tǒng)與FPGA的核心差異:軟件定義功能VS硬件可重構。嵌入式適合通用計算,開發(fā)門檻低;FPGA憑借并行處理實現(xiàn)納秒級響應,但成本高、開發(fā)難。二者融合的SoC器件正成為未來趨勢,平衡性能
    發(fā)表于 11-19 06:55

    【玩轉(zhuǎn)多核異構】T153核心板RISC-V核的實時性應用解析

    飛凌嵌入式FET153-S核心板的異構多核架構展現(xiàn)出了卓越的通信性能,能夠為諸多應用提供高效可靠的核心支撐,特別適用于對實時性和穩(wěn)定性要求極高的智能應用場景。
    的頭像 發(fā)表于 11-14 09:40 ?8756次閱讀
    【玩轉(zhuǎn)<b class='flag-5'>多核</b><b class='flag-5'>異構</b>】T153核心板RISC-V核的實時性應用解析

    嵌入式達到什么水平才能就業(yè)?

    、LoRa、NB-IoT,能實現(xiàn)嵌入式設備與云端平臺的數(shù)據(jù)交互了解 RTOS 實時操作系統(tǒng):如 FreeRTOS、RT-Thread,能進行任務創(chuàng)建、信號量管理、內(nèi)存分配
    發(fā)表于 09-15 10:20

    RK3506開發(fā)板:開啟嵌入式系統(tǒng)新時代

    系統(tǒng)的新時代。 性能卓越:創(chuàng)新架構引領潮流 RK3506開發(fā)板采用的核A7+單核M0多核異構架構,是其在性能
    的頭像 發(fā)表于 08-13 17:18 ?637次閱讀

    【老法師】多核異構處理器中M核程序的啟動、編寫和仿真

    文章,小編就將以飛凌嵌入式的OKMX8MP-C開發(fā)板例,大家介紹多核異構處理器M核程序的啟動配置、程序編寫和實時仿真的過程。
    的頭像 發(fā)表于 08-13 09:05 ?4028次閱讀
    【老法師】<b class='flag-5'>多核</b><b class='flag-5'>異構</b>處理器中M核程序的啟動、編寫和仿真

    嵌入式和單片機,是同一個東西嗎?

    設計中,通常會使用特定的硬件和軟件技術來滿足其應用需求。例如,嵌入式處理器和微控制器(MCU)被設計在有限的資源下運行,包括有限的內(nèi)存和處理能力。為了優(yōu)化性能,
    發(fā)表于 07-09 10:20

    Linux嵌入式和單片機嵌入式的區(qū)別?

    Linux嵌入式與單片機嵌入式在多個方面存在顯著的區(qū)別,以下是詳細的比較和歸納: 一、基本概念 1. Linux嵌入式: 定義:將Linux操作系統(tǒng)運行在嵌入式設備上的一
    發(fā)表于 06-20 09:46

    嵌入式力矩電機的設計方法研究

    摘 要:介紹一用于機床直驅(qū)部件的嵌入式力短電機的設計和電磁結(jié)構優(yōu)化方法。為了使嵌入式力矩電機滿足機床內(nèi)部結(jié)構緊湊的要求,必須具有較高的磁密。通過計算分析,得到不同長徑比、不同磁極對數(shù)
    發(fā)表于 06-11 15:08

    精選好文!噪聲系數(shù)測量的三種方法

    本文介紹了測量噪聲系數(shù)的三種方法:增益法、Y系數(shù)法和噪聲系數(shù)測試儀法。這三種方法的比較以表格的形式給出。 在無線通信系統(tǒng)中,噪聲系數(shù)(NF)或者相對應的噪聲因數(shù)(F)定義了噪聲性能和對接
    發(fā)表于 05-07 10:18

    智能配電新紀元:基于飛凌嵌入式T536核心板的DTU解決方案

    嵌入式的A核+RISC-V核DTU解決方案憑借T536核心板的多核架構和卓越性能,配電自動化終端提供了強大的技術支持,這一方案不僅提升了供電可靠性和效率,還為配電系統(tǒng)的實時監(jiān)控和高
    發(fā)表于 03-31 14:26