91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Speedster7t FPGA中可編程邏輯的架構(gòu)

Achronix ? 來(lái)源:Achronix ? 作者:Achronix ? 2022-07-05 15:37 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

概述

隨著數(shù)據(jù)中心、人工智能、自動(dòng)駕駛、5G、計(jì)算存儲(chǔ)和先進(jìn)測(cè)試等應(yīng)用的數(shù)據(jù)量和數(shù)據(jù)流量不斷增大,不僅需要引入高性能、高密度FPGA來(lái)發(fā)揮其并行計(jì)算和可編程硬件加速功能,而且還對(duì)大量數(shù)據(jù)在FPGA芯片內(nèi)外流動(dòng)提出了更高的要求。于是,在FPGA芯片中集成包括片上二維網(wǎng)絡(luò)(2D NoC)和各種最新高速接口的新品類FPGA芯片應(yīng)運(yùn)而生,成為FPGA產(chǎn)業(yè)和相關(guān)應(yīng)用的新熱點(diǎn)。

拉開(kāi)這場(chǎng)FPGA芯片創(chuàng)新大幕的是全球最大的獨(dú)立FPGA技術(shù)和產(chǎn)品提供商Achronix半導(dǎo)體公司,其采用7nm工藝打造的Achronix Speedster7t FPGA不僅擁有諸多高性能外圍Hard IP,而且是全球第首次在FPGA的邏輯陣列上集成了2D NoC,一經(jīng)推出就在市場(chǎng)得到了積極的響應(yīng),并引來(lái)競(jìng)爭(zhēng)對(duì)手的模仿和跟隨。

Speedster7t這款專門(mén)針對(duì)人工智能/機(jī)器學(xué)習(xí)AI / ML)和高帶寬應(yīng)用進(jìn)行優(yōu)化的高性能、高密度FPGA,包括了革命性的二維片上網(wǎng)絡(luò)(2D NoC)、新型機(jī)器學(xué)習(xí)處理器(MLP)、400G以太網(wǎng)和PCIe Gen5端口,以及高帶寬GDDR6和DDR4/5存儲(chǔ)控制器。Speedster7t FPGA架構(gòu)如圖1所示。

0e8f62bc-fc35-11ec-ba43-dac502259ad0.png

圖1 Speedster7t FPGA結(jié)構(gòu)圖

Achronix Speedster7t FPGA除了在外圍Hard IP上都采用目前業(yè)內(nèi)領(lǐng)先的大帶寬高速率IP,在內(nèi)部的可編程邏輯的架構(gòu)中也做了大量的優(yōu)化去進(jìn)一步提高內(nèi)部可編程邏輯的性能,從而適配外圍IP超高帶寬需求。本文首先談?wù)凷peedster7t FPGA的片上SRAM,也就是Block RAM針對(duì)傳統(tǒng)的結(jié)構(gòu)所做出的一些優(yōu)化。

Speedster7t FPGA中可編程邏輯的架構(gòu)

Speedster7t FPGA中內(nèi)部的可編程資源是按列排布,包括LUT、FF、ALU、MUX、MLP、Block RAM、Logic RAM。如圖2所示。

0ecf9238-fc35-11ec-ba43-dac502259ad0.png

圖2 Speedster7t FPGA可編程邏輯結(jié)構(gòu)

其中MLP、Block RAM、Logic RAM是集成在一起,他們之間的連接用的是專有的走線,不占用可編程邏輯走線資源,這樣做的目的主要是為了提高性能,同時(shí)也可以節(jié)省可編程邏輯走線資源,這個(gè)架構(gòu)對(duì)于AI,還有需要用到MLP的一些復(fù)雜算法的性能優(yōu)化是非常明顯的,在我們的MLP系列文章中會(huì)詳細(xì)講到,這里我們只重點(diǎn)說(shuō)一下Block RAM。 Speedster7t FPGA的Block RAM特點(diǎn) Speedster7t FPGA內(nèi)部的Block RAM是一個(gè)容量為72k bit的簡(jiǎn)單雙端口RAM,有一個(gè)讀端口,一個(gè)寫(xiě)端口。兩個(gè)端口的時(shí)鐘完全獨(dú)立,并且可以完全獨(dú)立的配置讀寫(xiě)位寬。它可以靈活的配置成簡(jiǎn)單雙端口RAM或者ROM

Block RAM的主要特性如表1所示。

表1 Block RAM的關(guān)鍵特性

0f142a56-fc35-11ec-ba43-dac502259ad0.png

Block RAM框圖如圖3所示。

0f340204-fc35-11ec-ba43-dac502259ad0.png

圖3 Block RAM內(nèi)部結(jié)構(gòu)

Speedster7t FPGA的Block RAM級(jí)聯(lián)結(jié)構(gòu)

Speedster7t FPGA的Block RAM最大的特點(diǎn)是增加了Block RAM間的級(jí)聯(lián)走線,級(jí)聯(lián)走線是BRAM間專有的連線,不占用可編程邏輯的走線資源,可以極大的提升多個(gè)Block RAM級(jí)聯(lián)的性能。圖4顯示了Block RAM間級(jí)聯(lián)走線的架構(gòu)。

0f5735da-fc35-11ec-ba43-dac502259ad0.png

圖4 Block RAM級(jí)聯(lián)結(jié)構(gòu)

由圖4可以看出,讀寫(xiě)地址線和數(shù)據(jù)線都有專有的級(jí)聯(lián)線連接。這樣的架構(gòu)在一些場(chǎng)景中都會(huì)有應(yīng)用,比如:需要從外部端口接收數(shù)據(jù)或者從GDDR6讀數(shù)據(jù)去初始化大量Block RAM的場(chǎng)景,AI的神經(jīng)網(wǎng)絡(luò)就是一個(gè)典型的應(yīng)用,在每一層的卷積算法中,系統(tǒng)都會(huì)從GDDR6讀出圖像數(shù)據(jù)和權(quán)重?cái)?shù)據(jù)放入每個(gè)引擎的Block RAM中,引擎計(jì)算完畢以后再存入到GDDR6中供下一次運(yùn)算使用。

有了這樣的級(jí)聯(lián)架構(gòu),我們?cè)趯?xiě)入數(shù)據(jù)去初始化大量Block RAM的時(shí)候不需要外部數(shù)據(jù)有很大的扇出,直接通過(guò)同一列Block RAM的級(jí)聯(lián)線就可以輕松完成,具體實(shí)現(xiàn)可以參考Achronix MLP_Conv2D參考設(shè)計(jì)。另外一個(gè)例子就是在需要多個(gè)Block RAM去構(gòu)成更大容量的RAM的時(shí)候,如果利用級(jí)聯(lián)線可以大大提升系統(tǒng)的性能。我們針對(duì)這個(gè)專門(mén)做了一個(gè)工程比較一下,生成一個(gè)位寬64bit,深度16384的一個(gè)簡(jiǎn)單雙端口RAM,需要用到16個(gè)Block RAM。我們分別用專有級(jí)聯(lián)線和內(nèi)部可編程邏輯去拼深度兩種方法來(lái)對(duì)比。可以看到用專有的級(jí)聯(lián)線資源更省,而且性能有了很大的提高。

使用專有的級(jí)聯(lián)線資源占用和性能:

0f7a5dda-fc35-11ec-ba43-dac502259ad0.png

使用可編程邏輯資源占用和性能:

0f9b4658-fc35-11ec-ba43-dac502259ad0.png

后面我們會(huì)繼續(xù)深入了解Speedster7t FPGA可編程邏輯的各種特性,并且會(huì)用一些例子來(lái)說(shuō)明如何更高效的利用這些特性,以將Speedster7t這款業(yè)界首創(chuàng)的高數(shù)據(jù)帶寬FPGA芯片與更多的創(chuàng)新智能化應(yīng)用結(jié)合起來(lái)。

此外,Achronix也提供Speedcore嵌入式FPGA硅知識(shí)產(chǎn)權(quán)(IP)產(chǎn)品,用來(lái)幫助用戶在應(yīng)用規(guī)模進(jìn)一步擴(kuò)大后,去開(kāi)發(fā)帶有eFPGA邏輯陣列的ASIC或者SoC產(chǎn)品,它們由Achronix的ACE FPGA開(kāi)發(fā)工具提供支持,從而可以重用FPGA開(kāi)發(fā)成果,這是Achronix在率先引入2D NoC和MLP之外,另一個(gè)層面上的創(chuàng)新。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • FPGA
    +關(guān)注

    關(guān)注

    1660

    文章

    22406

    瀏覽量

    636104
  • 芯片
    +關(guān)注

    關(guān)注

    463

    文章

    54004

    瀏覽量

    465797
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8553

    瀏覽量

    136916

原文標(biāo)題:超高數(shù)據(jù)流通量FPGA新品類中的Block RAM級(jí)聯(lián)架構(gòu)

文章出處:【微信號(hào):Achronix,微信公眾號(hào):Achronix】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    基于東芝產(chǎn)品的可編程邏輯控制器解決方案

    在工業(yè)自動(dòng)化浪潮,可編程邏輯控制器(PLC)如同設(shè)備的“大腦”,重要性不言而喻。
    的頭像 發(fā)表于 01-24 14:05 ?2326次閱讀
    基于東芝產(chǎn)品的<b class='flag-5'>可編程</b><b class='flag-5'>邏輯</b>控制器解決方案

    FPGA 入門(mén)必看:Verilog 與 VHDL 編程基礎(chǔ)解析!

    的基礎(chǔ)概念和實(shí)踐方法。一、FPGA與MCU/MPU的區(qū)別MCU/MPU:順序執(zhí)行程序,CPU負(fù)責(zé)所有邏輯FPGA可編程邏輯陣列,邏輯電路可
    的頭像 發(fā)表于 01-19 09:05 ?442次閱讀
    <b class='flag-5'>FPGA</b> 入門(mén)必看:Verilog 與 VHDL <b class='flag-5'>編程</b>基礎(chǔ)解析!

    基于六邊形波導(dǎo)網(wǎng)格架構(gòu)實(shí)現(xiàn)可編程光子技術(shù)

    硅基光電子技術(shù)的發(fā)展催生了可編程光電子集成芯片的誕生,這類芯片可以通過(guò)軟件重新配置來(lái)實(shí)現(xiàn)多種應(yīng)用功能,而無(wú)需重新流片制造。比利時(shí)根特大學(xué)和IMEC的研究人員展示了一種六邊形波導(dǎo)網(wǎng)格架構(gòu),在環(huán)形諧振器
    的頭像 發(fā)表于 01-14 17:02 ?658次閱讀
    基于六邊形波導(dǎo)網(wǎng)格<b class='flag-5'>架構(gòu)</b>實(shí)現(xiàn)<b class='flag-5'>可編程</b>光子技術(shù)

    Zynq全可編程片上系統(tǒng)詳解

    Zynq 是由賽靈思(Xilinx,現(xiàn)為 AMD 的一部分)推出的一系列全可編程片上系統(tǒng)。它的革命性創(chuàng)新在于,它不是傳統(tǒng)的 FPGA,也不是傳統(tǒng)的處理器,而是將高性能的 ARM Cortex-A 系列處理器與傳統(tǒng)的 FPGA
    的頭像 發(fā)表于 01-13 11:41 ?1822次閱讀
    Zynq全<b class='flag-5'>可編程</b>片上系統(tǒng)詳解

    ?TPLD801 可編程邏輯器件技術(shù)文檔摘要

    該TPLD801是 TI 可編程邏輯器件 (TPLD) 系列器件的一部分,該器件具有具有組合邏輯、順序邏輯和模擬模塊的多功能可編程邏輯 IC
    的頭像 發(fā)表于 09-28 14:36 ?1176次閱讀
    ?TPLD801 <b class='flag-5'>可編程邏輯</b>器件技術(shù)文檔摘要

    ?TPLD2001-Q1 汽車級(jí)可編程邏輯器件技術(shù)文檔摘要

    TPLD2001-Q1 是 TI 可編程邏輯器件 (TPLD) 系列器件的一部分,該器件具有具有組合邏輯、順序邏輯和模擬模塊的多功能可編程邏輯
    的頭像 發(fā)表于 09-28 10:42 ?822次閱讀
    ?TPLD2001-Q1 汽車級(jí)<b class='flag-5'>可編程邏輯</b>器件技術(shù)文檔摘要

    ?TPLD2001可編程邏輯器件技術(shù)文檔摘要

    該TPLD2001是 TI 可編程邏輯器件 (TPLD) 系列器件的一部分,該器件具有具有組合邏輯、順序邏輯和模擬模塊的多功能可編程邏輯 I
    的頭像 發(fā)表于 09-28 10:36 ?794次閱讀
    ?TPLD2001<b class='flag-5'>可編程邏輯</b>器件技術(shù)文檔摘要

    ?TPLD1201-Q1 可編程邏輯器件技術(shù)文檔摘要

    TPLD1201-Q1 是 TI 可編程邏輯器件 (TPLD) 系列器件的一部分,該器件具有具有組合邏輯、順序邏輯和模擬模塊的多功能可編程邏輯
    的頭像 發(fā)表于 09-28 10:06 ?703次閱讀
    ?TPLD1201-Q1 <b class='flag-5'>可編程邏輯</b>器件技術(shù)文檔摘要

    ?TPLD801-Q1 可編程邏輯器件技術(shù)文檔總結(jié)

    TPLD801-Q1 是 TI 可編程邏輯器件 (TPLD) 系列器件的一部分,該器件具有具有組合邏輯、順序邏輯和模擬模塊的多功能可編程邏輯
    的頭像 發(fā)表于 09-28 10:03 ?672次閱讀
    ?TPLD801-Q1 <b class='flag-5'>可編程邏輯</b>器件技術(shù)文檔總結(jié)

    Achronix亮相2025全球AI芯片峰會(huì)

    在近日舉行的2025全球AI芯片峰會(huì)上,Achronix Speedster7t FPGA的大模型推理平臺(tái)展示獲得眾多業(yè)界人士的積極反響。
    的頭像 發(fā)表于 09-23 18:01 ?1298次閱讀

    可編程邏輯控制器PLC是什么?如何實(shí)現(xiàn)上網(wǎng)通信?

    可編程邏輯控制器(PLC)是一種專為工業(yè)環(huán)境設(shè)計(jì)的數(shù)字運(yùn)算操作電子系統(tǒng),其核心是通過(guò)可編程存儲(chǔ)器存儲(chǔ)邏輯運(yùn)算、順序控制、定時(shí)、計(jì)數(shù)和算術(shù)運(yùn)算等指令,并通過(guò)數(shù)字或模擬輸入/輸出控制各類機(jī)
    的頭像 發(fā)表于 09-22 17:27 ?953次閱讀

    S7-200 可編程序控制器系統(tǒng)手冊(cè)

    電子發(fā)燒友網(wǎng)站提供《S7-200 可編程序控制器系統(tǒng)手冊(cè).pdf》資料免費(fèi)下載
    發(fā)表于 09-02 16:24 ?5次下載

    TIA 博途與SIMATIC S7-1500可編程控制器選型手冊(cè)

    電子發(fā)燒友網(wǎng)站提供《TIA 博途與SIMATIC S7-1500可編程控制器選型手冊(cè).pdf》資料免費(fèi)下載
    發(fā)表于 07-17 15:26 ?2次下載

    5CEBA4F23C8NQS現(xiàn)場(chǎng)可編程門(mén)陣列(FPGA)芯片

    5CEBA4F23C8NQS現(xiàn)場(chǎng)可編程門(mén)陣列(FPGA)芯片5CEBA4F23C8NQS是Intel-ALTERA(原 Altera)研發(fā)的Cyclone V系列性能卓越、低能耗的現(xiàn)場(chǎng)可編程門(mén)陣列
    發(fā)表于 06-11 09:01

    H5U系列可編程邏輯控制器指令手冊(cè)

    INOVANCE匯川-H5U系列可編程邏輯控制器指令手冊(cè)-中文
    發(fā)表于 04-30 16:38 ?7次下載