91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

RapidIO針對低延遲處理器連接進行優(yōu)化

星星科技指導(dǎo)員 ? 來源:嵌入式計算設(shè)計 ? 作者:Sam Fuller ? 2022-06-14 11:23 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

隨著摩爾定律繼續(xù)推動處理器的性能和集成,對更高速互連的需求也在持續(xù)增長。今天的互連通常運動速度從 10 Gbps 到 80 Gbps 不等,并且具有達到每秒數(shù)百千兆位的路線圖。

在爭取越來越快的互連速度的競賽中,一些話題很少被討論,包括支持的事務(wù)類型、通信延遲和開銷,以及可以輕松支持的拓撲類型。設(shè)計人員傾向于認為所有互連都是平等的,并且具有僅基于峰值帶寬的品質(zhì)因數(shù)。

現(xiàn)實完全不同。正如針對通用、信號處理、圖形和通信應(yīng)用優(yōu)化的不同形式的處理器一樣,互連也針對不同的連接問題進行設(shè)計和優(yōu)化。互連通??梢越鉀Q其設(shè)計的問題,并且可以投入使用以解決其他應(yīng)用程序,但在這些應(yīng)用程序中效率會降低。

RapidIO 設(shè)計目標

在這種情況下查看 RapidIO 是有啟發(fā)性的。RapidIO 旨在用作低延遲處理器互連,用于需要高可靠性、低延遲和確定性操作的嵌入式系統(tǒng)。它旨在將來自不同制造商的不同類型的處理器連接到一個系統(tǒng)中。正因為如此,RapidIO 已在無線基礎(chǔ)設(shè)施設(shè)備中得到廣泛應(yīng)用,其中需要將通用、數(shù)字信號、FPGA 和通信處理器結(jié)合在一個緊密耦合的系統(tǒng)中,具有低延遲和高可靠性。

RapidIO 的使用模型需要提供對內(nèi)存到內(nèi)存事務(wù)的支持,包括原子讀取-修改-寫入操作。為滿足這些要求,RapidIO 提供了無需軟件干預(yù)即可實現(xiàn)的遠程直接內(nèi)存訪問 (RDMA)、消息傳遞和信令結(jié)構(gòu)。例如,在 RapidIO 系統(tǒng)中,處理器可以發(fā)出加載或存儲事務(wù),或者集成的 DMA 引擎可以在兩個內(nèi)存位置之間傳輸數(shù)據(jù)。這些操作在其源或目標地址所在的 RapidIO 結(jié)構(gòu)中執(zhí)行,并且通常無需任何軟件干預(yù)即可發(fā)生。從處理器看來,它們與普通的內(nèi)存事務(wù)沒有什么不同。

RapidIO 還旨在支持點對點交易。假設(shè)系統(tǒng)中有多個主機或主處理器,并且這些處理器需要通過共享內(nèi)存、中斷和消息相互通信。在 RapidIO 網(wǎng)絡(luò)中可以配置多個處理器(最高 16K),每個處理器都有自己的完整地址空間。

RapidIO 還在交換機和端點的功能之間提供了清晰的分界線。RapidIO 交換機僅根據(jù)明確的源/目標地址對和明確的優(yōu)先級做出切換決策。這允許 RapidIO 端點添加新的事務(wù)類型,而無需更改或增強交換設(shè)備。

比較互連

隨著越來越多的系統(tǒng)被集成到單個硅片上,PCI Express (PCIe) 和以太網(wǎng)正在集成到片上系統(tǒng) (SoC) 中。然而,這種集成并沒有改變這些互連提供的事務(wù)的性質(zhì)(參見圖 1)。

圖 1: RapidIO、PCI Express 和以太網(wǎng)為連接處理器、I/O 和系統(tǒng)提供了不同的選項。

poYBAGKn_y2Aa8ujAAPdDxSur_Q237.png

PCIe 本身并不支持點對點處理器連接。使用 PCIe 進行這種連接可能非常復(fù)雜,因為它被設(shè)計為外圍組件互連(因此是 PCI)。它旨在將外圍設(shè)備(通常是 I/O 和圖形芯片等從屬設(shè)備)連接到主主機處理器。它不是作為處理器互連設(shè)計的,而是作為 PCI 總線的串行版本。從 PCI 構(gòu)建多處理器互連需要超越基本 PCI 規(guī)范的步驟,以創(chuàng)建在多個主機或根處理器之間映射地址空間和設(shè)備標識符的新機制。迄今為止,執(zhí)行此操作的提議機制——高級交換 (AS)、非透明橋接 (NTB) 或多根 I/O 虛擬化 (MR-IOV)——都沒有在商業(yè)上取得成功。

對于有明確的單一主機設(shè)備且其他處理器和加速器作為從設(shè)備運行的系統(tǒng),PCIe 是連接的不錯選擇。然而,為了在更復(fù)雜的系統(tǒng)中將許多處理器連接在一起,PCIe 在拓撲結(jié)構(gòu)和對等連接的支持方面存在很大限制。

許多開發(fā)人員正在尋求利用以太網(wǎng)作為連接系統(tǒng)中處理器的解決方案。在過去的 35 年中,以太網(wǎng)取得了長足的發(fā)展。與計算機處理速度的提高類似,其峰值帶寬也在穩(wěn)步增長。目前可用的以太網(wǎng)網(wǎng)絡(luò)接口控制器 (NIC) 卡可以支持 40 Gbps 運行,通過四對 SERDES 和 10 Gbps 信號傳輸。這樣的 NIC 卡本身包含重要的處理,能夠以這些速度傳輸和接收數(shù)據(jù)包。

從解決方案到緊密耦合的處理器間通信,通過 NIC 發(fā)送和接收以太網(wǎng)數(shù)據(jù)包還有很長的路要走。與 PCIe 和以太網(wǎng)事務(wù)處理相關(guān)的開銷(兩個堆棧都必須在 NIC 中遍歷),加上相關(guān)的 SERDES 功能和以太網(wǎng)媒體訪問協(xié)議和交換增加了延遲、復(fù)雜性和更高的功耗以及系統(tǒng)成本可以使用更直接的連接方法(見表 1)。

表 1:以太網(wǎng)和 RapidIO 的比較顯示了更直接連接方法的優(yōu)勢。

poYBAGKn_zeALMnzAAFS211-jeY833.png

將以太網(wǎng)用作集成嵌入式處理器互連需要對以太網(wǎng)媒體訪問控制器 (MAC) 以及以太網(wǎng)交換機設(shè)備本身進行顯著的事務(wù)加速和增強。即使有了這些增強,RDMA 操作也應(yīng)該僅限于大塊交易,以分攤使用以太網(wǎng)的開銷。

已部署用于解決此問題的標準包括來自 Internet 工程任務(wù)組的 iWARP RDMA 協(xié)議和基于融合以太網(wǎng)的 RDMA (RoCE)。iWARP 和 RoCE 通常都是通過加速協(xié)處理器實現(xiàn)的。盡管有這種加速,但仍必須仔細管理 RDMA 事務(wù)以減少通信開銷。原因是盡管以太網(wǎng)提供了高帶寬,尤其是在 10 GbE 和 40 GbE 實施中,但它也具有通常以微秒為單位測量的高事務(wù)延遲。

當前的 RapidIO 應(yīng)用程序

多年來,RapidIO 的價值主張已在嵌入式市場中得到廣泛認可。同樣的價值主張現(xiàn)在可以擴展到更主流的數(shù)據(jù)處理市場,這些市場正在演變?yōu)樾枰?a href="http://m.makelele.cn/tongxin/" target="_blank">通信網(wǎng)絡(luò)長期以來需要的許多相同的系統(tǒng)屬性。

其中使用 RapidIO 的一種眾所周知的應(yīng)用是無線基站。該應(yīng)用程序結(jié)合了多種形式的處理(DSP、通信和控制),必須在很短的時間內(nèi)完成。處理設(shè)備之間的通信應(yīng)盡可能快速和確定,以確保實現(xiàn)實時約束。

例如,在 4G 長期演進 (LTE) 無線網(wǎng)絡(luò)中,每 10 毫秒發(fā)送一次幀。這些幀包含多個并發(fā)移動會話的數(shù)據(jù),分布在多個子載波上,由多個 DSP 設(shè)備支持。DSP 和通用處理設(shè)備之間的通信必須具有確定性和低延遲,以確保每 10 毫秒就有一個新幀準備好傳輸。同時,接收路徑必須支持來自連接到網(wǎng)絡(luò)的移動設(shè)備的數(shù)據(jù)。除了這種復(fù)雜性之外,系統(tǒng)還必須實時跟蹤移動設(shè)備的位置并管理設(shè)備的信號功率。

RapidIO 應(yīng)用的另一個例子是半導(dǎo)體晶圓加工。與無線基礎(chǔ)設(shè)施應(yīng)用類似,半導(dǎo)體晶圓加工具有實時限制,包括傳感器、處理和執(zhí)行器的控制回路。前沿系統(tǒng)通常有數(shù)百個傳感器收集信息,傳感器數(shù)據(jù)由數(shù)十到數(shù)百個處理節(jié)點處理。處理節(jié)點生成的命令發(fā)送到執(zhí)行器和交流和直流電機,以重新定位晶片和晶片成像子系統(tǒng)。這一切都是在頻率高達 100 kHz 或 10 微秒的循環(huán)控制循環(huán)中執(zhí)行的。像這樣的系統(tǒng)受益于設(shè)備之間可能的最低延遲通信。

高性能計算的未來

虛擬化、基于 ARM 的服務(wù)器和高度集成的 SoC 設(shè)備的引入正在為下一階段的高性能計算發(fā)展鋪平道路。這種演變正朝著更緊密耦合的處理器集群發(fā)展,這些集群代表為托管數(shù)百或數(shù)千臺虛擬機而構(gòu)建的處理場。這些處理器集群將由多達數(shù)千個通過高性能、低延遲處理器互連連接的多核 SoC 設(shè)備組成。這種互連的效率越高,系統(tǒng)的性能和經(jīng)濟性就越好。

PCIe 和 10 GbE 等技術(shù)不會很快消失,但它們不會成為這些未來緊密耦合計算系統(tǒng)的基礎(chǔ)。PCIe 不是一種結(jié)構(gòu),只能支持少量處理器和/或外圍設(shè)備的連接。它可以簡單地充當?shù)浇Y(jié)構(gòu)網(wǎng)關(guān)設(shè)備的橋梁。雖然 10 GbE 可用作結(jié)構(gòu),但它具有重要的硬件和軟件協(xié)議處理要求。其廣泛可變的幀大?。ň扌蛶瑸?46 B 到 9,000 B)推動了對快速處理邏輯的需求,以支持多個小數(shù)據(jù)包和大型內(nèi)存緩沖區(qū)以支持端點和交換機中的大數(shù)據(jù)包,從而提高了芯片成本。使用 PCIe 或 10 GbE 將限制可用的拓撲和連接,或者增加系統(tǒng)的成本和開銷。

實施集成的服務(wù)器、存儲和網(wǎng)絡(luò)系統(tǒng)為 OEM 提供了創(chuàng)新的機會。該創(chuàng)新的一個關(guān)鍵組成部分將是內(nèi)部系統(tǒng)連接。RapidIO 是一項成熟的、經(jīng)過充分驗證的技術(shù),具有在該市場取得成功所需的屬性。與無線基礎(chǔ)設(shè)施的情況一樣,RapidIO 從早期創(chuàng)新發(fā)展成為事實上的基站互連標準,RapidIO 在服務(wù)器、存儲和高性能計算方面的最大挑戰(zhàn)將是跨越當今創(chuàng)新者和早期采用者市場的鴻溝大眾市場的擴散。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    20282

    瀏覽量

    253092
  • soc
    soc
    +關(guān)注

    關(guān)注

    40

    文章

    4581

    瀏覽量

    229422
  • 服務(wù)器
    +關(guān)注

    關(guān)注

    14

    文章

    10292

    瀏覽量

    91583
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    LT1528:3A dropout 穩(wěn)壓,為微處理器應(yīng)用量身打造

    的 LT1528 就是這樣一款專為微處理器應(yīng)用優(yōu)化的 3A dropout 穩(wěn)壓。本文將詳細介紹 LT1528 的特點、應(yīng)用、電氣特性等方面,幫助電子工程師更好地了解和使用這款
    的頭像 發(fā)表于 03-20 09:15 ?382次閱讀

    瑞芯微SOC智能視覺AI處理器

    RK3568B2: 一款性能均衡、接口豐富的中高端AIoT應(yīng)用處理器,是RK3568的優(yōu)化版本,主打穩(wěn)定與可靠性。CPU/GPU: 延續(xù)RK3568的4核A55 + G52 GPU架構(gòu),性能可靠
    發(fā)表于 12-19 13:44

    RapidIO標準的串行物理層實現(xiàn)

    Serial RapidIO(SRIO) 特指 RapidIO 標準的串行物理層實現(xiàn)。
    的頭像 發(fā)表于 12-09 10:41 ?549次閱讀
    <b class='flag-5'>RapidIO</b>標準的串行物理層實現(xiàn)

    如何對蜂鳥e203內(nèi)核乘除法器進行優(yōu)化

    整個處理器性能的重要手段之一,本文介紹了乘法器和除法器的基本原理,以及針對乘除法器優(yōu)化的方案,希望能夠?qū)ψx者有所幫助。同時,在實際應(yīng)用中,需要根據(jù)具體應(yīng)用場景和需求,進行
    發(fā)表于 10-24 06:47

    【技術(shù)討論】智能戒指手勢交互:如何優(yōu)化PCBA成本與實現(xiàn)<20ms延遲

    元件的小批量貼片,如何有效控制加工損耗與成本? 延遲手勢識別:目標是將傳感數(shù)據(jù)采集、姿態(tài)解算到藍牙指令發(fā)出的端到端延遲控制在10ms以內(nèi)。在軟件層面,除
    發(fā)表于 10-18 13:04

    DRA821U-Q1/DRA821U處理器技術(shù)文檔總結(jié)

    Jacinto? DRA821x 處理器基于 Armv8 64 位架構(gòu),針對具有云連接的網(wǎng)關(guān)系統(tǒng)進行優(yōu)化。片上系統(tǒng) (SoC) 設(shè)計通過集
    的頭像 發(fā)表于 10-10 10:48 ?2219次閱讀
    DRA821U-Q1/DRA821U<b class='flag-5'>處理器</b>技術(shù)文檔總結(jié)

    DRA821U處理器技術(shù)文檔總結(jié)

    Jacinto? DRA821x 處理器基于 Armv8 64 位架構(gòu),針對具有云連接的網(wǎng)關(guān)系統(tǒng)進行優(yōu)化。片上系統(tǒng) (SoC) 設(shè)計通過集
    的頭像 發(fā)表于 09-30 17:14 ?4149次閱讀
    DRA821U<b class='flag-5'>處理器</b>技術(shù)文檔總結(jié)

    新唐科技推出延遲音頻編解碼NAU88L21C

    Audio CODEC (Audio Coder-Decoder) 是音頻“編解碼”,主要功能是進行音頻信號的編碼(壓縮)和解碼(解壓)。在音頻信號處理過程中,信號的采集處理,編碼,
    的頭像 發(fā)表于 09-30 09:25 ?6003次閱讀
    新唐科技推出<b class='flag-5'>低</b><b class='flag-5'>延遲</b>音頻編解碼<b class='flag-5'>器</b>NAU88L21C

    12 路延遲推流!米爾 RK3576 賦能智能安防 360° 環(huán)視

    需求。3. RTSP 延遲推流,端到端延遲至 120ms通過 “采集 - 編碼 - 傳輸 - 解碼” 全鏈路優(yōu)化,開發(fā)板實現(xiàn)極低的推流
    發(fā)表于 09-18 17:51

    AMD 推出 EPYC? 嵌入式 4005 處理器,助力時延邊緣應(yīng)用

    AMD宣布推出EPYC?(霄龍)嵌入式4005系列處理器,專為滿足對實時計算性能和成本效率日益增長的需求而設(shè)計,同時還優(yōu)化了系統(tǒng)成本并延長了網(wǎng)絡(luò)安全設(shè)備和入門級工業(yè)邊緣服務(wù)的部署生命周期
    的頭像 發(fā)表于 09-17 10:37 ?931次閱讀
    AMD 推出 EPYC? 嵌入式 4005 <b class='flag-5'>處理器</b>,助力<b class='flag-5'>低</b>時延邊緣應(yīng)用

    Texas Instruments DRA821x Jacinto? 64位處理器技術(shù)解析

    Texas Instruments DRA821x Jacinto? 64位處理器基于ARM?v8架構(gòu),并為帶有云連接性的網(wǎng)關(guān)系統(tǒng)進行優(yōu)化。片上系統(tǒng) (SoC) 設(shè)計通過集成降低了系
    的頭像 發(fā)表于 08-28 11:33 ?1156次閱讀
    Texas Instruments DRA821x Jacinto? 64位<b class='flag-5'>處理器</b>技術(shù)解析

    有哪些方法可以降低分布式光伏集群通信網(wǎng)絡(luò)中的延遲?

    微機小電流 降低分布式光伏集群通信網(wǎng)絡(luò)的延遲,需從 接入優(yōu)化、數(shù)據(jù)處理、協(xié)議適配、環(huán)境抗擾、邊緣 - 云端協(xié)同 等多維度入手,結(jié)合場景特點針對性解決瓶頸。以下是具體方法: 一、
    的頭像 發(fā)表于 08-22 09:54 ?780次閱讀
    有哪些方法可以降低分布式光伏集群通信網(wǎng)絡(luò)中的<b class='flag-5'>延遲</b>?

    高速總線接口的類型介紹

    串行RapidIO,高速串行通信協(xié)議,旨在鏈接DSP、FPGA、網(wǎng)絡(luò)處理器等芯片,具有延遲、高帶寬(支持25Gbps、2.5Gbps、3.125Gbps的數(shù)據(jù)傳輸速率)。而
    的頭像 發(fā)表于 08-06 14:50 ?1940次閱讀

    龍芯處理器支持WINDOWS嗎?

    )。 Windows的適配:微軟官方僅支持x86/x64和ARM架構(gòu)的處理器,未推出針對LoongArch或MIPS的Windows版本。 技術(shù)限制 指令集不兼容:Windows系統(tǒng)的內(nèi)核、驅(qū)動和應(yīng)用程序均依賴x86
    發(fā)表于 06-05 14:24

    如何使用帶有i.MX 93處理器的Segger J-link在VSCode中進行調(diào)試?

    我已經(jīng)閱讀了有關(guān)在 i.MX 8 處理器上使用 j-link 進行調(diào)試的指南。我已經(jīng)嘗試了本指南,但使用的是 iMX93。當我想連接到 J-link GDB 服務(wù)應(yīng)用程序時,我遇到了
    發(fā)表于 04-04 08:21