91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

基于時共享總線和分布式結構實現(xiàn)高性能通用并行彈載計算機的設計

電子設計 ? 來源:郭婷 ? 作者:電子設計 ? 2019-01-08 09:29 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

引 言

隨著技術的發(fā)展,在導彈控制和通信等領域,需要處理的任務規(guī)模越來越大。雖然隨著VLSI技術的發(fā)展,已產(chǎn)生了運算能力達每秒幾十億次的處理器,但還遠遠不能滿足這些領域的需求。而VLSI技術的發(fā)展已受到其開關速度的限制,進一步提高處理器主頻遇到的困難越來越大。為此,把用于大型計算機的并行處理技術應用到信號處理中來,在信號處理系統(tǒng)中引入并行多處理器技術是必然趨勢。傳統(tǒng)彈載計算機一般針對特定場合,先確定算法,再根據(jù)算法確定系統(tǒng)結構,由于系統(tǒng)結構與算法嚴格相關,因此通用性較差。隨著一些標準技術(標準板型、接口、互聯(lián)協(xié)議等)在彈上控制系統(tǒng)中的應用,設計標準化、模塊化的通用型計算機成為了可行。而且所設計的還要可擴展、可重構,進而根據(jù)不同的應用場合和算法構建各種彈載計算機系統(tǒng)。

1 并行彈載計算機處理結構模型

普遍的兩種并行處理結構如圖1所示,一種是共享總線結構,另一種是分布式并行結構。其中,P(Proces-sor):處理器;M(Memory):存儲器;MB(Memory Bus):存儲器總線;NIC(Network Interface Circuitry):網(wǎng)絡接口電路。共享總線結構中多個處理器P經(jīng)由高速總線連向共享存儲器,每個處理器等同地訪問共享存儲器、I/O設備和操作系統(tǒng)服務。分布式并行結構中多個處理節(jié)點通過高通信帶寬、低延遲的定制網(wǎng)絡互聯(lián),每個處理節(jié)點都有物理上的分布存儲器,節(jié)點間通過消息傳遞相互作用。

基于時共享總線和分布式結構實現(xiàn)高性能通用并行彈載計算機的設計

并行處理的目的是采用多個處理器同時對任務處理,從而減小任務執(zhí)行時間,它主要反映在加速比(S)和并行效率(E)上。加速比是指對于一個特定應用,并行算法的執(zhí)行速度相對串行算法加快了很多倍。效率則是針對每個處理器來衡量的。依據(jù)并行處理中可擴放性(Sealability)*測的等效率度量標準可從理論上*測這兩種結構。

首先考慮共享總線結構。分別是并行系統(tǒng)上第i個處理器的有用處理時間和額外開銷時間。設每個處理器上子任務的運算量和通信量之比為r,即平均r次運算中有一個數(shù)據(jù)需要交換??偩€被p個處理器輪流訪問,tio。是處理器完成一次總線存取所需的相對時間,等效為處理器運算能力和總線訪問能力之比。一般情況下,總的處理時間和額外開銷時間如下:

基于時共享總線和分布式結構實現(xiàn)高性能通用并行彈載計算機的設計

顯而易見,共享總線系統(tǒng)的并行效率隨著處理器數(shù)目p的增大而下降。

而在分布式并行系統(tǒng)中,理想情況下任一時刻都可有兩個處理器通過其通信口相互交換數(shù)據(jù),設一個通信口傳送一個數(shù)據(jù)的相對時間為tcomm,等效為處理器運算能力和通信口傳輸能力之比。同時,假設每次交換還需對本地存儲器訪問。這樣就有通信開銷:

基于時共享總線和分布式結構實現(xiàn)高性能通用并行彈載計算機的設計

和處理規(guī)模p成線性關系,并行效率與p無關。

以上討論的是假設任意兩個處理器之間可以直接進行數(shù)據(jù)交換,而在實際情況下,尤其是處理器數(shù)目p多于處理器的通信口數(shù)量時,兩個非直接相連的處理器之間的數(shù)據(jù)交換所需開銷與其經(jīng)過的路徑成正比關系。但這并不影響以上討論的公式。因為在規(guī)則網(wǎng)絡拓撲結構中最大或平均路徑是一個定值n,那么這時,分布式并行系統(tǒng)的加速比公式為:

基于時共享總線和分布式結構實現(xiàn)高性能通用并行彈載計算機的設計

可見,在這種情況下分布式并行系統(tǒng)同樣能獲得線性加速比。由以上理論分析可知,共享總線并行結構適合共享存儲編程模型,進行細粒度的并行處理,但其擴展性能較差,處理器的數(shù)目有限,單機處理性能有限;分布式并行結構采用消息傳遞的機制,適合進行粗粒度的并行處理,便于大規(guī)模的系統(tǒng)擴展,提供強大的整體性能。

2 彈載計算機的設計實現(xiàn)

由于彈上信號處理算法的復雜性,信號處理系統(tǒng)具有復雜多樣的并行處理模式,如基于空間的數(shù)據(jù)并行處理、基于時間的流水并行處理等。另外,彈上計算機系統(tǒng)具有多種類型的數(shù)據(jù)流,如原始數(shù)據(jù)流(A/D采集之后的數(shù)據(jù)流)、中間數(shù)據(jù)流(各處理節(jié)點之間傳遞的數(shù)據(jù)流)、定時同步信號以及控制數(shù)據(jù)流等。這些不同的數(shù)據(jù)流的傳輸帶寬不同,因此系統(tǒng)中要有與這些不同數(shù)據(jù)流相匹配的互聯(lián)網(wǎng)絡。

高性能通用并行彈載計算機是構建信號處理系統(tǒng)的基礎。它除了選用高性能的處理器外,為了具有通用性,還要具有標準化、模塊化、可擴展、可重構的特點,以便構建各類控制和信號處理系統(tǒng)。同時為了適應控制和信號處理系統(tǒng)復雜并行處理模式和多種數(shù)據(jù)流的特點,它要具有混合的并行模式和多層次的互聯(lián)網(wǎng)絡?;谶@些要求和上文中對并行處理結構模型的理論分析,筆者選用當前業(yè)界最高性能的浮點DSP芯片TS201和大規(guī)模FPGA,設計了一個標準化、模塊化、可擴展、可重構、混合并行模式、多層次互聯(lián)的高性能通用并行彈載計算機。圖2是其結構框圖。

基于時共享總線和分布式結構實現(xiàn)高性能通用并行彈載計算機的設計

該彈載計算機選用標準cPCI 6U板型,板內集成了兩個處理節(jié)點,同時可承載兩個PMC子板。

2.1 DSP+FPGA共享總線型處理節(jié)點

彈上控制和信號處理系統(tǒng)中,低層的信號處理算法處理的數(shù)據(jù)量大,對處理速度要求高,但運算結構相對簡單,適于用FPGA實現(xiàn),這樣能同時兼顧速度及靈活性。高層處理算法處理的數(shù)據(jù)量較低層算法少,但算法的控制結構復雜,適于用運算速度高,尋址方式靈活,通信機制強大的DSP來實現(xiàn)。

為此,筆者設計的彈載計算機主要包括DSP,F(xiàn)P-GA,SDRAMCPLD。DSP主要實現(xiàn)數(shù)據(jù)的高層算法處理和控制,F(xiàn)PGA實現(xiàn)對外的接口,并可對輸入輸出的數(shù)據(jù)進行低層算法預處理,SDRAM用來緩存數(shù)據(jù),CPLD用來實現(xiàn)一些輔助邏輯。選用的DSP芯片是ADI公司的TS201,單片處理能力3.6 GFLOPS,內核時鐘頻率600 MHz,片內內存24 Mb,125 MHz/64 b片外總線,具有1 GB的SDRAM訪問能力,還有4個Link口,每個Link口收發(fā)獨立,最高帶寬為1.2 GB/s。

所有特點都使得TS201適合多片擴展,構成一個大規(guī)模高性能的信號處理系統(tǒng)。選用的FPGA芯片為Xilinx公司的VirtexⅡpro系列XC2VP20,它的規(guī)模約200萬門,內部集成了1 584 Kb的RAM,88個18×18 b的乘法器,8個傳輸速率可達3.125 Gb/s的Rock-etIO高速通道,這些特點使得該FPGA適合實現(xiàn)數(shù)據(jù)的傳輸和預處理。而且它的管腳兼容XC2VP30/40,可實現(xiàn)FPGA規(guī)模的進一步擴展。每個處理節(jié)點包括兩片TS201,一片F(xiàn)PGA,最高4 GB的SDRAM,以及一片CPLD,并共享總線。之所以只用兩片TS201,是考慮到總線上設備太多,會使得總線時鐘頻率降低,帶寬變小,并行度和效率都不高。兩片TS201共享總線充分發(fā)揮了處理能力、傳輸能力、存儲能力的匹配性。TS201總線上的SDRAM最高支持1 GB的空間,通過CPLD進行邏輯控制,可使SDRAM擴展到4 GB,增加了存儲能力,適應大容量存儲應用的場合。

2.2 多層次互聯(lián)網(wǎng)絡

互聯(lián)網(wǎng)絡是構建一個并行處理和控制系統(tǒng)的關鍵。本彈載計算機利用系統(tǒng)PCI總線、TS201的Link口,基于FPGA的RocketIO物理通道實現(xiàn)的串行RapidIO協(xié)議,以及利用CPLD實現(xiàn)的同步定時總線,構成了不同層次的互聯(lián)網(wǎng)絡,以便適應信號處理系統(tǒng)中不同類型的數(shù)據(jù)流傳輸。cPCI標準通過J1,J2連接64 b系統(tǒng)PCI總線,PCI橋把系統(tǒng)PCI總線轉換為局部PCI總線。每個處理節(jié)點通過FPGA(FPGA 0和FPGA 1)實現(xiàn)PCI接口,兩個處理節(jié)點和兩個PMC子板共享局部PCI總線,并通過PCI橋與系統(tǒng)PCI總線連接在一起。這使得系統(tǒng)主控模塊可以通過PCI總線實現(xiàn)對每個處理節(jié)點以及PMC子板的控制。同時各個節(jié)點之間也可通過。PCI總線交換數(shù)據(jù)。但由于總線的限制,只能實現(xiàn)一些低速、非實時的數(shù)據(jù)交換。TS201具有4個高速Link口,可實現(xiàn)多片TS201之間的高速數(shù)據(jù)傳輸。對于板內的4片TS201,利用各自2個Link口構成1個環(huán)形Link連接,使得板內4片TS201緊密耦合在一起。另外,每片TS201的1個Link口共4個Link口連到FPGA 2(稱之為Link Switch)上,同時每個PMC的PJ4上也定義兩個Link口,板卡的J4上定義4個Link口,所有這些Link口都連到FPGA2上。通過FPGA2,可以靈活地配置板內、板內與PMC子板、板間不同節(jié)點構成不同的Link互聯(lián)網(wǎng)絡,并且可以利用。FPGA的動態(tài)加載功能,動態(tài)地配置不同的Link互聯(lián)網(wǎng)絡結構。FPGA2同時還與J5上的32 b自定義接口連接,可實現(xiàn)一些用戶自定義接口。同時每個處理節(jié)點內的2片TS201還有1個Link口都連到了節(jié)點內總線上的FPGA(FPGA0和FPGA1),與該FPGA對外的串行RapidIO接口相配合,實現(xiàn)外部串行RapidIO數(shù)據(jù)流與TS201內部數(shù)據(jù)的交換。Link口具有大帶寬、低延時的特點,因此適合用來傳輸原始數(shù)據(jù)流和一些帶寬大,實時性強的中間數(shù)據(jù)流。串行RapidIO是基于包交換的第三代互聯(lián)協(xié)議,相比TS201的Link協(xié)議,它具有更為完善的分層協(xié)議定義(包括邏輯層、傳輸層和物理層)。該協(xié)議使得模塊具有更強的通用性,不僅可以與同類型的各模塊互聯(lián),還可以與任何具有串行RapidIO接口的異構模塊互聯(lián)。利用FPGA的Rocke-tIO物理通道,通過FPGA編程可實現(xiàn)串行RapidIO協(xié)議。FPGA0和FPGA1通過4個RocketIO通道直接相連,可實現(xiàn)二者之間4個1×模式或1個4×模式的串行RapidIO接口。同時,F(xiàn)PGA0和FPGAl還各自通過4個RocketIO與J3相連,這樣通過J3,彈載計算機就可以以8個1×模式或2個4×模式的串行RapidIO接口與其他模塊互聯(lián),構成多個模塊之間的串行Ra-pidIO互聯(lián)網(wǎng)絡。串行RapidIO網(wǎng)絡也具有大帶寬的特性,而且相比Link口具有更為完善的協(xié)議控制,但正是由于復雜的協(xié)議控制,使它的傳輸延時相比Link口更大。因此,它可與Link網(wǎng)絡形成很好的互補,用來傳輸大帶寬,延時要求不高的數(shù)據(jù)流。在J3上定義了8 b同步定時信號,用來實現(xiàn)各個節(jié)點之間的同步定時控制。這些信號通過RS 245驅動后與每個節(jié)點內部的CPLD相連。每片TS201可通過中斷或讀寫寄存器等方式對節(jié)點內的CPLD進行操作,進而通過CPLD內部邏輯產(chǎn)生相應的同步定時信號進行各個節(jié)點之間的同步。RS 245的雙向性使得每個節(jié)點既可以發(fā)出同步信號,也可以接收同步信號,更加靈活。該模塊所有對外的互聯(lián)接口都是通過J1~J5接插件連接,這樣就可以在底板上把各個模塊之間的各個接口連接起來。而且既可以使用固定拓撲結構的無源底板,也可以使用帶有交換芯片的有源底板或專門的交換板,靈活構建各類互聯(lián)網(wǎng)絡。

3 應用驗證

該彈載計算機具有通用化、可擴展、可重構的特點??筛鶕?jù)不同的需求,通過增減彈載計算機來改變處理能力,通過改變各模塊之間的互聯(lián)形式來適應不同的算法。下面以基于該彈載計算機構建數(shù)據(jù)并行的相控陣雷達信號處理系統(tǒng)來驗證這些特點。圖3是以該彈載計算機構建的某相控陣雷達信號處理系統(tǒng)結構框圖。

基于時共享總線和分布式結構實現(xiàn)高性能通用并行彈載計算機的設計

該系統(tǒng)采用光纖與相控陣天線陣列之間傳輸數(shù)據(jù),把光纖接口板做成標準PMC板型,可以集成在彈載計算機中。每個彈載計算機集成兩個光纖接口板,一個光纖接口板接收一個子陣的回波數(shù)據(jù),并通過彈載計算機上每個PMC板卡的PJ4上定義的Link口,經(jīng)LinkSwitch把數(shù)據(jù)傳給每個處理節(jié)點。每個處理節(jié)點對數(shù)據(jù)進行波束形成,然后再把形成的子陣波束通過J3定義的串行RapidIO接口傳給進行子陣級波束形成的彈載計算機。該模塊進行子陣級波束的形成以及其他雷達信號的處理,并承載PMC板型同步定時模塊,由其產(chǎn)生系統(tǒng)中各個模塊的同步定時信號,使各個模塊同步工作。該處理系統(tǒng)采用數(shù)據(jù)并行的處理模式,每個節(jié)點處理一個子陣的回波,可以通過增減處理節(jié)點來靈活適應天線陣列的增減。

4 結 語

并行計算機是解決信號處理控制領域任務規(guī)模不斷增大、問題不斷復雜的關鍵技術。本文在分析了共享總線和分布式并行兩種并行模型優(yōu)缺點的基礎上,設計并實現(xiàn)了一種適應信號處理系統(tǒng)需求的混合并行、多層次互聯(lián)、標準化、模塊化、可擴展、可重構的高性能通用并行彈載計算機。實際中,使用該彈載計算機,配合相應的I/O模塊,構建了多個相控陣雷達、合成孔徑雷達、圖像處理等彈載計算機系統(tǒng),獲得了廣泛的應用,驗證了該彈載計算機的高性能、通用性。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 處理器
    +關注

    關注

    68

    文章

    20256

    瀏覽量

    252432
  • 存儲器
    +關注

    關注

    39

    文章

    7739

    瀏覽量

    171698
  • 計算機
    +關注

    關注

    19

    文章

    7809

    瀏覽量

    93219
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    計算機網(wǎng)絡協(xié)議:分散、集中式和分布式

    一、網(wǎng)絡通信模式和網(wǎng)絡協(xié)議 分散、集中式和分布式 在早期的計算機網(wǎng)絡中,為了有效的利用計算機,一般講數(shù)據(jù)通信模型分為分散(Decentr
    的頭像 發(fā)表于 10-27 14:44 ?1.6w次閱讀
    <b class='flag-5'>計算機</b>網(wǎng)絡協(xié)議:分散<b class='flag-5'>式</b>、集中式和<b class='flag-5'>分布式</b>

    分布式軟件系統(tǒng)

    計算機硬件的配置方式和相應的功能配置方式。它是一種多處理器的計算機系統(tǒng),各處理器通過互連網(wǎng)絡構成統(tǒng)一的系統(tǒng)。系統(tǒng)采用分布式計算結構,即把原來
    發(fā)表于 07-22 14:53

    分布式控制系統(tǒng)

    和集中控制的自動控制系統(tǒng)。分布式控制系統(tǒng)采用微處理機分別控制各個回路,而用中小型工業(yè)控制計算機高性能的微處理機實施上一級的控制。各回路之間和上下級之間通過高速數(shù)據(jù)通道交換信息。分布式
    發(fā)表于 03-01 22:19

    通用計算機總線儀器

    那樣需要研制專門的數(shù)據(jù)處理計算機系統(tǒng),在硬件設計上只要把精力集中在專用的 DAQ 板卡上,或者直接選用商用高性能數(shù)據(jù)采集板卡;在軟件設計上,基于通用計算機操作系統(tǒng),利用專業(yè)的測試軟件
    發(fā)表于 12-06 14:10

    利用NI VeriStand 2010特性創(chuàng)建分布式系統(tǒng)

    要素。通??梢允褂梅瓷鋬却娼涌?b class='flag-5'>實現(xiàn)?! 》瓷鋬却婢W(wǎng)絡是實時本地局域網(wǎng)(LAN),每個計算機總是擁有共享內存集合的最新本地復本。這些專用網(wǎng)絡是為了提供高確定性的數(shù)據(jù)通信而專門設計的??梢蕴峁┒喾N
    發(fā)表于 04-08 09:42

    高性能計算機的發(fā)展歷史是怎樣的?

    高性能計算機的發(fā)展史高性能計算機的內容高性能計算機的應用高性能計算機的現(xiàn)狀高性能計算機的應用領域高性能
    發(fā)表于 09-10 10:42

    基于FPGA+DSP的通用飛控計算機平臺該怎么設計?

      飛控計算機是現(xiàn)代導彈制導與控制系統(tǒng)的核心裝置,其性能的好壞直接關系到精確制導的精度和殺傷目標的概率。近年來舵機、導引頭、慣導等載設備日益向著數(shù)字化方向發(fā)展,因此設計一種能兼容多數(shù)字
    發(fā)表于 10-25 06:22

    分布式控制系統(tǒng)的組成是什么?

    由多臺計算機分別控制生產(chǎn)過程中多個控制回路,同時又可集中獲取數(shù)據(jù)、集中管理和集中控制的自動控制系統(tǒng) 。分布式控制系統(tǒng)采用微處理機分別控制各個回路,而用中小型工業(yè)控制計算機高性能的微處
    發(fā)表于 03-13 09:02

    分布式總線實現(xiàn)近場設備間統(tǒng)一的分布式通信管理能力如何?

    現(xiàn)實中多設備間通信方式多種多樣(WIFI、藍牙等),不同的通信方式使用差異大,導致通信問題多;同時還面臨設備間通信鏈路的融合共享和沖突無法處理等挑戰(zhàn)。那么分布式總線實現(xiàn)近場設備間統(tǒng)一
    發(fā)表于 03-16 11:03

    分布式多媒體計算機系統(tǒng)教程

    分布式多媒體計算機系統(tǒng)教程系統(tǒng)地論述了分布式多媒體計算機系統(tǒng)。首先從知識經(jīng)濟、信息革命入手,對分布式計算機系統(tǒng)的設計與實現(xiàn),特別是異構性及實現(xiàn)
    發(fā)表于 09-26 22:23 ?0次下載
    <b class='flag-5'>分布式多媒體計算機</b>系統(tǒng)教程

    基于J2EE的分布式計算機聯(lián)鎖控制系統(tǒng)

    本文提出了不僅僅在硬件上,而且在軟件上實現(xiàn)真正的分布式控制的基于J2EE 的計算機聯(lián)鎖控制系統(tǒng),闡述了如何用J2EE 構架來架構這種計算機聯(lián)鎖控制系統(tǒng)。 J2EE 不僅是一種
    發(fā)表于 09-07 10:13 ?15次下載

    分布式大氣數(shù)據(jù)計算機綜合測試系統(tǒng)設計

             為提高某型分布式大氣數(shù)據(jù)計算機的測試效率,研制了分布式大氣數(shù)據(jù)計算機綜合測試系統(tǒng)。系統(tǒng)
    發(fā)表于 09-14 10:32 ?36次下載

    什么是分布式計算機網(wǎng)絡

    什么是分布式計算機網(wǎng)絡 分布式計算機網(wǎng)絡由多個相互連接在一起的客戶機和服務器組成,并且其中的任一系統(tǒng)都可能與另一個系統(tǒng)進行通信。
    發(fā)表于 04-06 17:28 ?5228次閱讀

    并行計算分布式計算的區(qū)別和聯(lián)系

    并行計算或稱平行計算是相對于串行計算來說的。所謂并行計算可分為時間上的并行和空間上的并行。 時間
    發(fā)表于 12-08 09:59 ?3.8w次閱讀

    一種面向高性能計算分布式對象存儲系統(tǒng)

    高性能計算領域,隨著計算規(guī)模的不斷擴大,其配套存儲系統(tǒng)規(guī)模也在快速擴展,同時支撐的應用也從傳統(tǒng)的科學計算擴展到數(shù)據(jù)分析等領域,給目前高性能計算機
    發(fā)表于 01-29 16:08 ?0次下載
    一種面向<b class='flag-5'>高性能</b><b class='flag-5'>計算</b>的<b class='flag-5'>分布式</b>對象存儲系統(tǒng)