91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

為何CPU主頻比FPGA快還要說(shuō)可以幫助CPU加速?

FPGA開(kāi)源工作室 ? 來(lái)源:OpenIC ? 作者:溫戈 ? 2021-06-30 10:57 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

主頻只是影響計(jì)算速度的一個(gè)因素,并不是全部。在執(zhí)行一些計(jì)算密集型的任務(wù)場(chǎng)景中,FPGA的計(jì)算速度是更快的,目前FPGA作為CPU的協(xié)處理器已經(jīng)廣泛應(yīng)用在IntelAMD等公司的產(chǎn)品中。

CPU、GPU、和FPGA的比較

桌面端的CPU為馮諾依曼結(jié)構(gòu),從上圖可以看出,其基本組成為控制器,Cache,和ALU。而計(jì)算單元ALU在CPU中的占比不大,所以它的并行計(jì)算能力有限。

中間的為GPU,綠色的計(jì)算單元占了絕大部分,所以并行計(jì)算能力很強(qiáng)。

弱點(diǎn)是控制能力很弱,Cache小,為了保證計(jì)算能力,就需要大量的高速DDR保證數(shù)據(jù)吞吐率。

右側(cè)為FPGA,包含可編程的I/O、DSP、memory、PCIE等,因?yàn)榇罅看鎯?chǔ)單元的存在,F(xiàn)PGA在做計(jì)算的時(shí)候可以直接從內(nèi)部存儲(chǔ)單元讀取數(shù)據(jù)。

推薦一個(gè)國(guó)外的FPGA學(xué)習(xí)網(wǎng)站 -- fpga4fun,里邊有FPGA的介紹及26個(gè)實(shí)戰(zhàn)項(xiàng)目及實(shí)現(xiàn)代碼,非常適合入門學(xué)習(xí)!

https://www.fpga4fun.com/

正因?yàn)镃PU、GPU、和FPGA在結(jié)構(gòu)上的不同,也讓他們?cè)趯?shí)際應(yīng)用層面有所側(cè)重。

目前主流的方案是把CPU、GPU和FPGA都集成在一個(gè)SoC中,通過(guò)片內(nèi)總線互聯(lián)。在執(zhí)行并行計(jì)算的時(shí)候,比如進(jìn)行圖像處理,F(xiàn)PGA的優(yōu)勢(shì)就體現(xiàn)出來(lái)了,通過(guò)協(xié)作分工,使芯片的工作效率最大化。

目前的3D封裝以及chiplet等技術(shù)為這樣的組合提供了可實(shí)現(xiàn)性。

為什么FPGA計(jì)算速度會(huì)比CPU更快?

在執(zhí)行大量的運(yùn)算場(chǎng)景中,F(xiàn)PGA相比GPU的核心優(yōu)勢(shì)在于低延遲。FPGA比CPU延遲低,在本質(zhì)上是體系結(jié)構(gòu)的區(qū)別。FPGA同時(shí)擁有流水線并行和數(shù)據(jù)并行,而CPU幾乎只有數(shù)據(jù)并行,雖然也會(huì)才有流水線設(shè)計(jì),但深度受限。因此,F(xiàn)PGA 更適合做需要低延遲的流式處理,GPU 更適合做大批量同構(gòu)數(shù)據(jù)的處理。

舉個(gè)例子:

我們有四個(gè)全加器,每一個(gè)的進(jìn)為輸出連接到下一個(gè)的進(jìn)位輸入,這樣實(shí)現(xiàn)的加法器被稱作行波進(jìn)位加法器(Ripple-Carry Adder, RCA)。其特點(diǎn)為:

結(jié)構(gòu)特點(diǎn):低位全加器的Cout連接到高一位全加器Cin

優(yōu)點(diǎn):電路布局簡(jiǎn)單,設(shè)計(jì)方便

缺點(diǎn):高位的運(yùn)算必須等待低位的運(yùn)算完成

我們來(lái)看一下其關(guān)鍵路徑的延遲:

總延遲時(shí)間:(T + T)*4 + T = 9T,推廣到n位,總時(shí)間為(2n + 1)*T。

每一個(gè)全加器計(jì)算的時(shí)候必須等待它的進(jìn)位輸入產(chǎn)生后才能計(jì)算,所以四個(gè)全加器并不是同時(shí)進(jìn)行計(jì)算的,而是一個(gè)一個(gè)的串行計(jì)算。這樣會(huì)造成較大的延遲。

我們把這個(gè)電路改進(jìn)一下:提前計(jì)算出“進(jìn)位信號(hào)”,對(duì)進(jìn)位信號(hào)進(jìn)行分析。

這樣我們就得到了一個(gè):超前進(jìn)位加法器(Carry-Lookahead Adder, CLA)

其中,C1、C2、C3、C4都由下面的電路計(jì)算好,需要3級(jí)門延遲,然后在全加器中關(guān)鍵路徑上還有1級(jí)延遲

所以,總共有4級(jí)門延遲。

如果采用這種完全的超前進(jìn)位,理論上的門延遲都是4級(jí)門延遲。

實(shí)際電路過(guò)于復(fù)雜,難以實(shí)現(xiàn)(C31需要32位的與門和或門?。?/p>

通常的方法:采用多個(gè)小規(guī)模的超前進(jìn)位加法器拼接而成,例如,用4個(gè)8-bit的超前進(jìn)位加法器連接成32-bit加法器。

所以我們需要更多的計(jì)算位寬或者更大的數(shù)組,或者矩陣的運(yùn)算的時(shí)候,我們使用FPGA的優(yōu)勢(shì)就體現(xiàn)出來(lái)。再多的計(jì)算,也就是放置更多的硬件邏輯資源。

FPGA對(duì)CPU加速場(chǎng)景

在一些特定的應(yīng)用場(chǎng)景下,單獨(dú)使用CPU和CPU+FPGA兩種方案所需處理時(shí)間的對(duì)比,可見(jiàn)FPGA對(duì)CPU的加速效果非常明顯,甚至比單獨(dú)使用CPU高出1~2個(gè)數(shù)量級(jí)!

FPGA的缺點(diǎn)

FPGA也是有缺點(diǎn)的,其中之一便是開(kāi)發(fā)周期長(zhǎng)。其需要對(duì)特定的應(yīng)用編寫特定的FPGA。只要干的事情稍有不同,一般來(lái)說(shuō)FPGA代碼就要重新寫一遍或者是至少要修改很多東西。如果要做的事情復(fù)雜、重復(fù)性不強(qiáng),就會(huì)占用大量的邏輯資源,其中的大部分處于閑置狀態(tài)。

不過(guò),Chiplet的應(yīng)用對(duì)對(duì)FPGA的開(kāi)發(fā)周期有一定的優(yōu)化,以下是傳統(tǒng)FPGA開(kāi)發(fā)的周期和應(yīng)用chiplet的開(kāi)發(fā)周期對(duì)比:

未來(lái)的方向

在現(xiàn)在的SoC設(shè)計(jì)中,要充分考慮不同模塊的特點(diǎn),F(xiàn)PGA 和 CPU 協(xié)同工作,充分發(fā)揮各自的長(zhǎng)處,局部性和重復(fù)性強(qiáng)的歸 FPGA,復(fù)雜的歸 CPU。從而達(dá)到整個(gè)系統(tǒng)算力的最優(yōu)化。

在未來(lái),F(xiàn)PGA會(huì)作為協(xié)處理器和CPU、GPU共存一段時(shí)間,其主要提供以下三方面的能力:

能夠提供專門的硬件加速,實(shí)現(xiàn)各種應(yīng)用中需要的關(guān)鍵處理功能。

FPGA設(shè)計(jì)在性能上非常靈活,使用流水線和并行結(jié)構(gòu),適應(yīng)對(duì)性能的需求變化。

協(xié)處理器能為主處理器和系統(tǒng)存儲(chǔ)器提供寬帶,低延遲接口。

目前,英特爾,AMD,賽靈思等公司都把FPGA作為協(xié)處理器集成在SoC中作為實(shí)際應(yīng)用的硬件加速解決方案,這樣的設(shè)計(jì)也使得CPU和FPGA在未來(lái)的一段時(shí)間內(nèi)會(huì)共存,互相配合,賦能各種計(jì)算場(chǎng)景。

編輯:jq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • FPGA
    +關(guān)注

    關(guān)注

    1660

    文章

    22415

    瀏覽量

    636547
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    11281

    瀏覽量

    225095
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5196

    瀏覽量

    135507

原文標(biāo)題:為什么CPU主頻一般都比FPGA快,但是卻說(shuō)FPGA可以幫助CPU加速?

文章出處:【微信號(hào):leezym0317,微信公眾號(hào):FPGA開(kāi)源工作室】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    MangoTree新品劇透:全新PXI形態(tài)+最強(qiáng)CPU #PXI #PXIe #測(cè)控 #CPU

    cpu
    芒果樹(shù)數(shù)字
    發(fā)布于 :2026年01月30日 11:36:11

    那么龍芯CPU性能如何呢?

    龍芯系列CPU的最新動(dòng)態(tài) 以下是龍芯系列CPU的最新動(dòng)態(tài)(截至2025年10月): 龍芯CPU的性能如何? 以下是龍芯CPU性能的詳細(xì)分析,結(jié)合最新產(chǎn)品與技術(shù)動(dòng)態(tài): 一、桌面處理器性能
    的頭像 發(fā)表于 12-03 13:42 ?1045次閱讀

    CPU 到 GPU,渲染技術(shù)如何重塑游戲、影視與設(shè)計(jì)?

    渲染技術(shù)是計(jì)算機(jī)圖形學(xué)的核心內(nèi)容之一,它是將三維場(chǎng)景轉(zhuǎn)換為二維圖像的過(guò)程。渲染技術(shù)一直在不斷演進(jìn),從最初的CPU渲染到后來(lái)的GPU渲染,性能和質(zhì)量都有了顯著提升。從CPU到GPU:技術(shù)特點(diǎn)和優(yōu)缺點(diǎn)
    的頭像 發(fā)表于 09-01 12:16 ?994次閱讀
    從 <b class='flag-5'>CPU</b> 到 GPU,渲染技術(shù)如何重塑游戲、影視與設(shè)計(jì)?

    CPU里真的有黃金:看完秒懂

    在大家的印象中,黃金是珠寶、投資品和工業(yè)原料,但很少有人知道,我們每天使用的電腦CPU里竟然也隱藏著這種貴金屬。那為什么芯片會(huì)用到黃金,一顆CPU中能有多少純金呢?不依靠專業(yè)設(shè)備能提取出來(lái)嗎?
    的頭像 發(fā)表于 08-30 15:41 ?5598次閱讀

    開(kāi)源的e203rtl 可以FPGA板子(DDRt)跑50M主頻嗎?

    開(kāi)源的e203rtl 可以FPGA板子(DDRt)跑50M主頻嗎? 跑25M時(shí),可以通過(guò)spi打印出來(lái)數(shù)數(shù)據(jù),但是跑50M主頻時(shí)候,看似下
    發(fā)表于 07-11 07:58

    單核CPU網(wǎng)關(guān)和雙核CPU網(wǎng)關(guān)有什么區(qū)別

    單核CPU網(wǎng)關(guān)與雙核CPU網(wǎng)關(guān)的核心區(qū)別在于處理能力、多任務(wù)效率、性能表現(xiàn)及適用場(chǎng)景,雙核CPU網(wǎng)關(guān)在多任務(wù)處理、復(fù)雜計(jì)算和響應(yīng)速度上具有顯著優(yōu)勢(shì),而單核CPU網(wǎng)關(guān)則更適合輕量級(jí)、低負(fù)
    的頭像 發(fā)表于 07-05 14:37 ?1071次閱讀

    主控CPU全能選手,英特爾至強(qiáng)6助力AI系統(tǒng)高效運(yùn)轉(zhuǎn)

    有什么特殊之處呢? AI加速系統(tǒng)為何看重CPU主控能力? 作為造價(jià)極高的AI加速系統(tǒng),DGX B300可以不計(jì)成本地選任何
    的頭像 發(fā)表于 06-27 11:44 ?900次閱讀
    主控<b class='flag-5'>CPU</b>全能選手,英特爾至強(qiáng)6助力AI系統(tǒng)高效運(yùn)轉(zhuǎn)

    一片主板可以有多少路CPU?

    CPU是計(jì)算機(jī)的中央處理器,可以直接影響到服務(wù)器的并行處理能力。CPU路數(shù)越多,服務(wù)器可以同時(shí)處理的任務(wù)數(shù)量就越多,從而提高了整體的處理效率和性能,特別是在處理大量并發(fā)任務(wù)時(shí),多路服務(wù)
    的頭像 發(fā)表于 06-13 09:14 ?724次閱讀
    一片主板<b class='flag-5'>可以</b>有多少路<b class='flag-5'>CPU</b>?

    FPGA從0到1學(xué)習(xí)資料集錦

    FPGA 中實(shí)現(xiàn),使用非常靈活。而且在大容量的 FPGA 中還可以集成多個(gè)軟 core,實(shí)現(xiàn)多核并行處理。硬 core是在特定的 FPGA 內(nèi)部做好的
    發(fā)表于 05-13 15:41

    CPU Socket的基本結(jié)構(gòu)和工作原理

    CPU Socket是連接中央處理單元(CPU)與計(jì)算機(jī)主板之間的關(guān)鍵部件,它充當(dāng)著傳遞電信號(hào)、電源和散熱等多重功能的樞紐。在整個(gè)計(jì)算機(jī)系統(tǒng)中,CPU Socket的作用至關(guān)重要,尤其在高性能計(jì)算
    的頭像 發(fā)表于 05-08 17:14 ?2452次閱讀

    國(guó)產(chǎn)電腦CPU性能排行榜TOP7:CPU緩存/主頻/多核實(shí)測(cè)數(shù)據(jù)分析

    在科技飛速發(fā)展的今天,電腦CPU(中央處理器)無(wú)疑是計(jì)算機(jī)性能的核心部件。而長(zhǎng)久以來(lái),國(guó)際品牌在這一領(lǐng)域占據(jù)著主導(dǎo)地位,給人一種國(guó)產(chǎn)CPU性能不行的刻板印象。然而,隨著技術(shù)的不斷進(jìn)步和研發(fā)投入的加大,國(guó)產(chǎn)電腦CPU性能已經(jīng)取得了
    的頭像 發(fā)表于 04-29 10:38 ?3395次閱讀
    國(guó)產(chǎn)電腦<b class='flag-5'>CPU</b>性能排行榜TOP7:<b class='flag-5'>CPU</b>緩存/<b class='flag-5'>主頻</b>/多核實(shí)測(cè)數(shù)據(jù)分析

    信創(chuàng)國(guó)產(chǎn)CPU推薦

    cpu
    jf_10805031
    發(fā)布于 :2025年04月23日 17:20:43

    CPU的各種指令和執(zhí)行流程

    在集成電路設(shè)計(jì)中,CPU的指令是指計(jì)算機(jī)中央處理單元(CPU)用來(lái)執(zhí)行計(jì)算任務(wù)的基本操作指令集。這些指令是CPU能夠理解并執(zhí)行的二進(jìn)制代碼,它們?cè)谟?jì)算機(jī)內(nèi)部由硬件控制并按順序執(zhí)行,從而實(shí)現(xiàn)計(jì)算、控制
    的頭像 發(fā)表于 04-18 11:24 ?2646次閱讀

    【國(guó)產(chǎn)信創(chuàng)CPU全攻略】分享國(guó)產(chǎn)CPU品牌排行榜!從排名到避坑!

    最近收到不少粉絲留言:“想換國(guó)產(chǎn)電腦,但國(guó)產(chǎn)CPU品牌太多,完全不知道怎么選!”“信創(chuàng)CPU排名到底靠不靠譜?”今天咱們就來(lái)嘮嘮這個(gè)話題——國(guó)產(chǎn)CPU品牌有哪些?信創(chuàng)CPU怎么挑?附上
    的頭像 發(fā)表于 04-14 14:34 ?5541次閱讀
    【國(guó)產(chǎn)信創(chuàng)<b class='flag-5'>CPU</b>全攻略】分享國(guó)產(chǎn)<b class='flag-5'>CPU</b>品牌排行榜!從排名到避坑!

    Arm解讀Armv9 CPU為何是打造高性能、高能效移動(dòng)計(jì)算的關(guān)鍵

    作者:Arm 終端事業(yè)部產(chǎn)品管理高級(jí)總監(jiān) Stefan Rosinger 在之前有關(guān) Arm Cortex-X925 CPU 的文章中,Arm 技術(shù)專家曾探討了每時(shí)鐘周期指令數(shù) (IPC) 作為評(píng)估
    的頭像 發(fā)表于 03-14 15:51 ?1590次閱讀