91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

聊聊TDA4芯片異構芯片設計及工作原理

汽車ECU開發(fā) ? 來源:焉知智能汽車 ? 2023-03-27 18:07 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

超異構芯片最近是比較火的一個名詞,其集中特性是將各類不同的芯片內核進行融合,這種集成式芯片設計可以充分整合芯片資源,進一步提升數(shù)據計算效率。并且由于芯片在設計之初就打通了相互之間互通兼容性,其內部功能劃分和交互統(tǒng)一構建的邏輯優(yōu)化,相比單芯片功能方案而言,可以顯著降低彼此功能和交互的各種掣肘;并且很多設計原理圖上可以在芯片之間通過共享某些資源,融合型單芯片可以進一步降低成本。

另外,對于自動駕駛系統(tǒng)設計而言,(80%-90%)的輕量級場景+10%左右的挑戰(zhàn)場景+10%左右的極端場景需要提供高性能以行業(yè)領先的功率/性能比計算傳統(tǒng)和深度學習算法,這些完全可以通過超異構的不同芯片核進行覆蓋,充分降低復雜度和系統(tǒng)規(guī)模。

超異構芯片是具有高水平的系統(tǒng)集成,以實現(xiàn)先進汽車的可擴展性和更低成本的支持集中式 ECU。關鍵核心包括具有標量和矢量內核的下一代 DSP,專用深度學習的NN計算核和傳統(tǒng)算法加速器,用于通用計算的最新 ARMGPU 處理器,集成的下一代生成成像子系統(tǒng) (ISP),視頻編解碼器,以太網集線器和隔離的 MCU 功能安全島,所有受保護汽車級安全和安保硬件加速器等。

34020662-cb0b-11ed-bfe3-dac502259ad0.png ?

一般情況下,除了芯片選型外,設計超異構芯片時需還要滿足如下設計規(guī)則:

片上存儲器應設計 ECC 保護并互連

內置自檢 (BIST) 、故障注入CPU 和片上RAM

對于引腳錯誤設置故障信號模式

運行時安全診斷、電壓、溫度和時鐘監(jiān)控,窗口化看門狗定時器,用于存儲器的 CRC 引擎完整性檢查

可用于應用的功能安全需要滿足 ISO26262 要求的ASIL D

啟用需要大量數(shù)據的系統(tǒng)帶寬、PCIe 集線器和千兆以太網交換機以及 CSI-2 端口以支持許多傳感器輸入的吞吐量。

1.超異構芯片內核解析

對于超異構芯片而言,一般是基于異構、可擴展的架構開發(fā),多核異構的優(yōu)點是各核充分發(fā)揮其處理效能的優(yōu)點,再加上專用硬件加速器也可處理特定任務,從而在性能、功耗和成本上達到最佳平衡。 當前被各廠家廣泛使用比較成熟的超異構芯片當屬TI的Jacinto 7 家族的處理器了,當然這也只是初級超異構芯片。

不同廠家對其使用方式不完全一致,有將其完全作為SOC芯片使用的,充分使用了其上的AI算力,有些廠家在不太考慮其安全等級要求的情況下也可能將其當做MCU來使用。 本文將以TI的這塊TDA4的芯片為例進行詳細介紹,說明相應的內部架構。

3413b61e-cb0b-11ed-bfe3-dac502259ad0.png ?

其中主要的幾個異構模塊包括如下:

1)處理器及加速器

①MCU域:

相當于異構芯片域控的MCU芯片單元所起的作用,用于啟動底層硬件驅動、同步時間,啟動操作系統(tǒng)及頂層應用軟件中控制執(zhí)行類部分邏輯運算。

這里MCU域主要是指MCU Island中用于鎖步功能的Arm Cortex-R5F充當;TI這類超異構芯片而言,CPU模塊(Cortex R5F)用于對SOC域核周邊對應的模塊需要單獨進行電壓和時鐘設計,同時,采用專用內存和接口確保其能夠與更大的 SoC 隔離。

②SOC域:

此類模塊通常使用高度定制化的NN加速器來實現(xiàn)。在環(huán)境感知模塊中都會涉及大量的典型神經網絡(NN)的運算,過程中深度學習算力主要被消耗掉。包括常見的各類圖像、激光點云檢測算法,比如物體檢測、車道線檢測、紅綠燈識別等。

以TI為例設計的異構芯片中,微處理器系統(tǒng)端包括:Arm Cortex-A72和Arm Cortex-R5F、C71、C66幾大模塊。

其中,在各家域控Tier1開發(fā)過程中一般會考慮在A72上運行HLOS(如Linux或QNX),其余核則運行RTOS,整個運行核均可支持AutoSar。使用A72獨立雙核集群配置有助于多操作系統(tǒng)應用對軟件管理程序的最低需求。

R5F子系統(tǒng)支持低級時序關鍵處理任務,用于實時性要求比較高的硬件驅動。使用C71(MMA)進行深度學習神經網絡NN和模型運算,所以說MMA主要計算單位主要是以Tops為計算單位。

DSP處理器(C66)功能包含前端和后端視覺處理兩方面。前端視覺主要是NV12轉BGR、環(huán)視拼圖,后端進行浮點運算用以充當AI加速器的CNN后處理。

如上這種結構是一種典型的AI運算模塊(又稱為AI-DSA),適用于對AI運算性能要求高,算法相對穩(wěn)定的情況。由于AI-DSA模塊在整個智能駕駛場景運算上使用更為普遍,性能更加敏感,對于云端、邊緣計算及自動駕駛幾段場景的工程化落地更加具有可使用性。

③GPU域:

用于圖像處理加速單元,包含大量浮點運算和實現(xiàn)動態(tài) 3D 渲染以增強觀看效果應用程序。同時GPU域也可以認為是高效率的AI運算平臺,對于異形場景CornerCase的適配計算效率是最高的。

如上如果兼顧執(zhí)行效率和執(zhí)行性能上,可以做自適應的AI算力分配,普通場景的AI運算可以采用常規(guī)CPU+DSA方式進行,而特殊邊緣場景可以采用GPU加速核方式進行高效能計算。

④其他處理模塊:

VENC/ VDEC用于視頻編解碼單元,通常高性能的超異構芯片需要適配H.265/HEVC這類高清視頻編碼器。對于下一代自動駕駛系統(tǒng)來說可以提供更高清的視頻編碼能力,實現(xiàn)高清視頻壓縮傳輸。

VPAC(VisionProcessing Accelerator)用于對圖像進行去畸變、下裁剪(Crop)、重整型(Resides)。其目的是確保輸入給神經網絡單元進行處理的圖像已經被初步處理過了,這樣可以提升圖像網絡處理速度和性能。

如下圖是以簡單的圖像傳輸和處理可以講清楚在這一類超異構芯片上如何進行數(shù)據鏈路的傳輸和處理。

342df614-cb0b-11ed-bfe3-dac502259ad0.jpg ?

2)存儲單元

下圖是大多數(shù)開發(fā)板所有的一個存儲單元框架,接下來以此圖為基礎描述ARM芯片的上電啟動流程。

3445d6da-cb0b-11ed-bfe3-dac502259ad0.jpg ?

ROM芯片內部固化存儲代碼的存儲器,其中固化在芯片iROM中的啟動代碼為BL0。

RAM:在ROM啟動運行的時候,只有RAM是可用的,因此必須要自動從外擴存儲器(nand/sd/usb)中拷貝的uboot.bin二進制文件的頭最大16K(一般是4K或8K)代碼(BL1)。

SDROM:芯片外部的運行內存,由運行在RAM上的BL1進行初始化,用于運行BL2與應用程序。

Nand Flash :芯片外部非易失閃存技術的存儲器,沒有地址總線,不能直接運行代碼,需要將代碼加載到RAM上面才能運行。

就舉例的TDA4芯片而言,BL1 和 BL2 沒有被集成(Jacinto7集成 了 DMSC&MCU R5 取代了 BL1 和BL2 的功能), BL31 執(zhí)行 ATF,BL32 執(zhí)行 OP-TEE,BL33 是SPL/U-boot。

相應的存儲單元涉及Main域和MCU域的管理,且兩域分別單獨用于片上共享存儲單元,他們分別通過多核共享存儲控制器MSMC實現(xiàn)相應的存儲管理。TDA4內部還存在LPDDR4 w/ECC模塊,即使未使用 DDR 接口,其VDDS_DDR均需要使用 LPDDR4 電壓范圍進行供電。

2.超異構芯片的啟動說明

對于超異構芯片而言,由于采用了多核異構的架構,因系統(tǒng)需求的差異,其相應的啟動流程也有一定的差異性,并且由于集成多核制會導致其啟動流程比單核和多核同構的處理器會復雜些。

Bootloader 是在操作系統(tǒng)運行之前執(zhí)行的一段小程序。通過這段小程序,我們可以初始化硬件設備、建立內存空間的映射表,從而建立適當?shù)南到y(tǒng)軟硬件環(huán)境,為最終調用操作系統(tǒng)內核做好準備。

兩種bootloader 可以選擇 SPL(Secondary Program Loader)或 SBL(Secondary bootloader)兩種驅動加載。

SPL表示程序加載,分為兩級加載程序過程。第一級Bootloader是指從ROM 里面的程序中根據啟動方式的選擇引導并加載 SPL。第二級Bootloader是指對硬件的初始化過程,引導下一級的 bootloader 核或加載并運行應用程序。

SBL表示驅動加載。可以實現(xiàn)對外圍設備進行配置,比如 DDR,可以加載并啟動其它核。為了滿足快速啟動 MCU 執(zhí)行相關的應用,MCU可以先啟動,然后使用BOOT APP 進而引導其它應用程序。在 SBL 啟動流程中,SBL 可以直接加載 Linux內核和 DTB。

如下圖顯示了完整的異構芯片TDA4的程序加載過程。

34548130-cb0b-11ed-bfe3-dac502259ad0.png ?

對于如上超異構芯片而言,用的最廣的要數(shù)ARM Cortex-A72核了,因為其在整數(shù)、浮點、內存等性能皆有不同程度的提升,雖然還缺少一些細節(jié),不過IPC性能上相對于之前的產品提升了16-30%左右。如下圖表示了芯片A72的具體啟動原理。

347bc5a6-cb0b-11ed-bfe3-dac502259ad0.jpg ?

整個代碼啟動運行過程包括首先把BL1加載到RAM中運行,然后由BL1對SDRAM進行初始化。最后,代碼重定向完成后在內存中執(zhí)行的uboot的完整代碼BL2。

從應用層面的系統(tǒng)需求來講,不同的應用可以部署在不同的核,不同核的啟動時序影響著系統(tǒng)需求是否能實現(xiàn)??傮w來講,針對系統(tǒng)的應用需求,可能有如下的額外要求:提前Can信息響應、提前啟動畫面、提前啟動攝像頭、提前分配Linux使用空間、提前顯示視頻動畫等。我們應設計合理的 Soc 啟動流程來滿足系統(tǒng)的需求。

3.總結

超異構芯片Super SOC作為ADAS系統(tǒng)普遍應用的處理器,在面向 ADAS 和自動駕駛車輛 (AV) 應用過程中起著舉足輕重的作用。

智駕領域中,SOC需要深度學習算法中會比傳統(tǒng)芯片提供提供高性能計算能力,同時可以有效優(yōu)化其功耗和系統(tǒng)集成度。最終實現(xiàn)支持集中式ECU 或多種傳感器的高級汽車平臺實現(xiàn)可擴展性和更低的成本。





審核編輯:劉清

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 加速器
    +關注

    關注

    2

    文章

    839

    瀏覽量

    40111
  • 編解碼器
    +關注

    關注

    0

    文章

    286

    瀏覽量

    25405
  • ecu
    ecu
    +關注

    關注

    14

    文章

    984

    瀏覽量

    57289
  • adas
    +關注

    關注

    311

    文章

    2330

    瀏覽量

    211949
  • 異構芯片
    +關注

    關注

    0

    文章

    9

    瀏覽量

    2459

原文標題:聊聊TDA4芯片異構芯片設計、啟動及工作原理

文章出處:【微信號:eng2mot,微信公眾號:汽車ECU開發(fā)】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    DRAM芯片選型,DRAM工作原理

    DRAM(動態(tài)隨機存取存儲器)芯片作為計算機系統(tǒng)內存的核心組成部分,承擔著臨時存儲CPU運算所需數(shù)據和指令的關鍵任務。DRAM芯片憑借高存儲密度與成本優(yōu)勢,廣泛應用于個人電腦、服務器、智能手機及各類需要大容量緩存的電子設備中。
    的頭像 發(fā)表于 01-30 15:11 ?480次閱讀
    DRAM<b class='flag-5'>芯片</b>選型,DRAM<b class='flag-5'>工作原理</b>

    STP4CMP:低電壓4通道恒流LED驅動芯片的深度解析

    低電壓4通道恒流LED驅動芯片,看看它有哪些獨特的特性和優(yōu)勢。 文件下載: stp4cmp.pdf 一、芯片概述 STP4CMP是一款基于電
    的頭像 發(fā)表于 01-26 17:25 ?550次閱讀

    TDA4VH-Q1處理器技術文檔總結

    TDA4VH-Q1 TDA4AH-Q1 TDA4VP-Q1 TDA4AP-Q1 處理器系列基于進化的 Jacinto? 7 架構,面向 ADAS 和自動駕駛汽車 (AV) 應用,并建立
    的頭像 發(fā)表于 10-08 10:32 ?4169次閱讀
    <b class='flag-5'>TDA4</b>VH-Q1處理器技術文檔總結

    TDA4VP-Q1處理器技術文檔總結

    TDA4VH-Q1 TDA4AH-Q1 TDA4VP-Q1 TDA4AP-Q1 處理器系列基于進化的 Jacinto? 7 架構,面向 ADAS 和自動駕駛汽車 (AV) 應用,并建立
    的頭像 發(fā)表于 09-29 14:56 ?4920次閱讀
    <b class='flag-5'>TDA4</b>VP-Q1處理器技術文檔總結

    TDA4AP-Q1處理器技術文檔的核心內容總結

    TDA4VH-Q1 TDA4AH-Q1 TDA4VP-Q1 TDA4AP-Q1 處理器系列基于進化的 Jacinto? 7 架構,面向 ADAS 和自動駕駛汽車 (AV) 應用,并建立
    的頭像 發(fā)表于 09-29 14:48 ?4500次閱讀
    <b class='flag-5'>TDA4</b>AP-Q1處理器技術文檔的核心內容總結

    廣州唯創(chuàng)電子錄音語音芯片IC:工作原理與應用場景全解析

    錄放音芯片解決方案,廣泛應用于智能家居、醫(yī)療設備、工業(yè)控制等領域。本文將深入解析其工作原理和典型應用場景。01錄音芯片的核心作用與技術價值錄音芯片是一種可實現(xiàn)重復
    的頭像 發(fā)表于 09-24 09:39 ?802次閱讀
    廣州唯創(chuàng)電子錄音語音<b class='flag-5'>芯片</b>IC:<b class='flag-5'>工作原理</b>與應用場景全解析

    廣州唯創(chuàng)電子語音芯片工作原理與應用解析

    、車載導航、醫(yī)療器械等領域提供了高效的語音解決方案。本文將以唯創(chuàng)電子語音芯片為例,深入解析其工作原理及技術特點。一、語音芯片的核心工作原理語音芯片
    的頭像 發(fā)表于 08-28 08:33 ?663次閱讀
    廣州唯創(chuàng)電子語音<b class='flag-5'>芯片</b>的<b class='flag-5'>工作原理</b>與應用解析

    德州儀器TDA4VE/TDA4AL/TDA4VL Jacinto?處理器技術解析

    Texas Instruments TDA4VE-Q1/TDA4AL-Q1/TDA4VL-Q1 SoC處理器采用先進的Jacinto? 7架構,面向智能視覺相機應用。這些器件建立在TI在視覺處理領域
    的頭像 發(fā)表于 08-21 15:00 ?1296次閱讀
    德州儀器<b class='flag-5'>TDA4</b>VE/<b class='flag-5'>TDA4</b>AL/<b class='flag-5'>TDA4</b>VL Jacinto?處理器技術解析

    聊聊倒裝芯片凸點(Bump)制作的發(fā)展史

    凸點(Bump)是倒裝芯片的“神經末梢”,其從金凸點到Cu-Cu鍵合的演變,推動了芯片從平面互連向3D集成的跨越。未來,隨著間距縮小至亞微米級、材料與工藝的深度創(chuàng)新,凸點將成為支撐異構集成、高帶寬
    的頭像 發(fā)表于 08-12 09:17 ?5609次閱讀
    <b class='flag-5'>聊聊</b>倒裝<b class='flag-5'>芯片</b>凸點(Bump)制作的發(fā)展史

    語音控制模塊工作原理

    ,才能夠發(fā)出正確的指令。 語音芯片控制模塊是實現(xiàn) “語音指令 - 設備響應” 的核心組件,其工作原理可拆解為信號采集、處理、識別及指令執(zhí)行的完整鏈路,下面將以WTK69000為例給大家分享一下整個流程的工作原理。 一、語音信號采
    的頭像 發(fā)表于 06-17 11:49 ?1388次閱讀
    語音控制模塊<b class='flag-5'>工作原理</b>

    PD快充芯片U8722SP的工作原理

    耐壓值定義了芯片安全工作電壓上限,若輸入電壓超過該值(如動態(tài)波動或負載突變),可能引發(fā)擊穿或永久損壞,直接影響器件可靠性、性能表現(xiàn)及系統(tǒng)適配性。高耐壓芯片需更大厚度或更高電阻率的半導體材料,工藝制程
    的頭像 發(fā)表于 06-03 17:44 ?889次閱讀
    PD快充<b class='flag-5'>芯片</b>U8722SP的<b class='flag-5'>工作原理</b>

    Type-C PD Sink快充協(xié)議芯片XSP01E的特點及工作原理

    PDIC)的芯片。它內置了PD通訊模塊,通過與供電端(如PD充電器)的PD協(xié)議芯片握手通信,可以申請出需要的電壓給產品供電。 ? PD誘騙協(xié)議芯片工作原理及特點 PD誘騙
    的頭像 發(fā)表于 05-07 12:24 ?1407次閱讀
    Type-C PD Sink快充協(xié)議<b class='flag-5'>芯片</b>XSP01E的特點及<b class='flag-5'>工作原理</b>

    TDA4VEN-Q1 具有 AI、圖形和顯示屏功能的汽車 ADAS SoC,適用于入門級性能泊車輔助應用技術手冊

    TDA4VEN/TDA4AEN(又名 TDA4-Entry)處理器系列是 Jacinto? 7 汽車級異構 Arm? 處理器系列的擴展,面向高級駕駛輔助系統(tǒng) (ADAS) 應用。
    的頭像 發(fā)表于 04-14 16:23 ?1702次閱讀
    <b class='flag-5'>TDA4</b>VEN-Q1 具有 AI、圖形和顯示屏功能的汽車 ADAS SoC,適用于入門級性能泊車輔助應用技術手冊

    TDA4AEN-Q1 具有AI的汽車 ADAS SoC,適用于前置攝像頭和駕駛應用數(shù)據手冊

    TDA4VEN/TDA4AEN(又名 TDA4-Entry)處理器系列是 Jacinto? 7 汽車級異構 Arm? 處理器系列的擴展,面向高級駕駛輔助系統(tǒng) (ADAS) 應用。
    的頭像 發(fā)表于 04-14 14:32 ?1287次閱讀
    <b class='flag-5'>TDA4</b>AEN-Q1 具有AI的汽車 ADAS SoC,適用于前置攝像頭和駕駛應用數(shù)據手冊

    上揚軟件助力12英寸異構堆疊芯片企業(yè)建設MES系統(tǒng)項目

    近日,上揚軟件攜手國內某12英寸異構堆疊芯片企業(yè),正式啟動MES(制造執(zhí)行系統(tǒng))、EAP(設備自動化系統(tǒng))和RMS(配方管理系統(tǒng))系統(tǒng)的建設。該企業(yè)作為行業(yè)內的重要參與者,專注于異構堆疊芯片
    的頭像 發(fā)表于 03-26 17:01 ?1293次閱讀