91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

使用粗粒度可重構(gòu)陣列加速處理

星星科技指導(dǎo)員 ? 來(lái)源:嵌入式計(jì)算設(shè)計(jì) ? 作者:Monique DeVoe ? 2022-06-14 10:05 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

隨著性能需求的增加和對(duì)低功耗設(shè)計(jì)的推動(dòng),需要更有效的方法來(lái)執(zhí)行處理任務(wù),因?yàn)橛捎诠β氏拗?,將更?a target="_blank">處理器投入性能問(wèn)題不再可行。加速器旨在以更快的速度和更低的功耗進(jìn)行計(jì)算,但今天的加速器在功耗和性能方面存在缺陷。

加速器陣容

亞利桑那州立大學(xué)計(jì)算、信息學(xué)和決策系統(tǒng)工程學(xué)院副教授 Aviral Shrivastava 正在對(duì)可編程加速器進(jìn)行研究,以增強(qiáng)當(dāng)今的加速技術(shù)。Shrivastava 列出了當(dāng)今使用的三種常見(jiàn)類(lèi)型的加速器:硬件加速器、FPGAGPU。硬件加速器將特定的計(jì)算元素專(zhuān)用于處理計(jì)算,而不是在 CPU 上運(yùn)行它們。它們速度快、功耗低,但不適合當(dāng)今快速變化的技術(shù)迭代,因?yàn)樗鼈儾豢删幊?。FPGA 是可編程的——開(kāi)發(fā)人員可以在其上編寫(xiě)任何邏輯并且它們可以充當(dāng)加速器——但 Shrivastava 說(shuō)它們通常過(guò)于通用并且消耗太多功率。GPU 是當(dāng)今流行的加速器,

粗粒度可重構(gòu)陣列

Shrivastava 正在開(kāi)發(fā)粗??芍貥?gòu)陣列 (CGRA),它可以加速非并行循環(huán),并在 GPU 的并行循環(huán)優(yōu)勢(shì)之上實(shí)現(xiàn)更多加速功能。CGRA 由一個(gè)由算術(shù)邏輯單元 (ALU) 和寄存器組成的二維網(wǎng)格組成,這些單元接收輸入和指令,計(jì)算指令的算術(shù)或邏輯運(yùn)算,并將輸出發(fā)送給它的四個(gè)鄰居以計(jì)算下一個(gè)步驟(圖 1)。

圖 1:粗粒度可重構(gòu)陣列。

pYYBAGKn7RuAfDpEAATcUI-H07s228.png

CGRA 的潛力來(lái)自于他們能夠在消耗很少的電力的情況下執(zhí)行操作。在常規(guī)處理器中執(zhí)行加法運(yùn)算需要很大的功率:它必須經(jīng)過(guò) 20 多個(gè)流水線階段。在 CGRA 中,只需要從鄰居那里獲取操作數(shù)并執(zhí)行加法運(yùn)算。CGRA 可以通過(guò)流水線加速——循環(huán)的操作被布置在 CGRA 的 PE 上,數(shù)據(jù)在它們之間流動(dòng)。

CGRA 本身并不新鮮,但開(kāi)發(fā)人員對(duì)現(xiàn)有的 CGRA 進(jìn)行編程以僅執(zhí)行一種類(lèi)型的計(jì)算。Shrivastava 說(shuō),挑戰(zhàn)在于映射,因?yàn)檠h(huán)內(nèi)核需要映射到 CGRA,操作映射到節(jié)點(diǎn),數(shù)據(jù)依賴關(guān)系映射到 CGRA 的路徑。Shrivastava 的目標(biāo)是消除耗時(shí)的手動(dòng)編碼,并使任何類(lèi)型的循環(huán)或計(jì)算能夠通過(guò)編譯器映射到 CGRA,這是一種相對(duì)較新的方法。他正在開(kāi)發(fā)一個(gè)生成映射代碼的編譯器工具鏈。

Shrivastava 說(shuō) CGRA 的研究引起了 IBM 的興趣,IBM 希望將這種方法應(yīng)用于并行循環(huán)輕型服務(wù)器應(yīng)用程序。用于科學(xué)研究和多媒體擴(kuò)展的圖形和高性能計(jì)算也可以從使用 CGRA 中獲益。

解決分支分歧問(wèn)題

所有現(xiàn)有加速技術(shù)面臨的一個(gè)挑戰(zhàn)是“分支分歧”。當(dāng)執(zhí)行具有“if-then-else”結(jié)構(gòu)的循環(huán)時(shí),加速器分配資源以執(zhí)行來(lái)自分支的兩條路徑(真路徑和假路徑)的指令,然后丟棄假路徑指令的影響。FPGA 將兩個(gè)路徑的功能映射到計(jì)算資源上,GPU 執(zhí)行來(lái)自兩個(gè)分支路徑的指令并丟棄錯(cuò)誤路徑指令的結(jié)果。加速器必須這樣做,因?yàn)樵诜峙浞种窂劫Y源時(shí),分支的結(jié)果在編譯時(shí)是未知的(分支的結(jié)果是在運(yùn)行時(shí)計(jì)算的,當(dāng)執(zhí)行分支時(shí))。這種冗余執(zhí)行會(huì)導(dǎo)致分支花費(fèi)雙倍的性能時(shí)間和執(zhí)行能力。

Shrivastava 和他的團(tuán)隊(duì)提出了通過(guò)智能硬件-軟件協(xié)同設(shè)計(jì)解決分支分歧問(wèn)題的方法。不是為真路徑分配一些PE,而為假路徑分配一些PE,而是分配相同的PE來(lái)執(zhí)行來(lái)自兩條路徑的指令。來(lái)自真路徑和來(lái)自假路徑的指令都發(fā)給PE。在運(yùn)行時(shí),PE 只選擇正確的一個(gè)來(lái)執(zhí)行。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    20270

    瀏覽量

    252911
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5209

    瀏覽量

    135610
  • 編譯器
    +關(guān)注

    關(guān)注

    1

    文章

    1672

    瀏覽量

    51723
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    復(fù)合機(jī)器人重構(gòu)柔性裝配 賦能智能制造產(chǎn)線全面升級(jí)

    一、智能制造升級(jí)浪潮下 重構(gòu)柔性裝配成工業(yè)核心剛需 在工業(yè) 4.0 深度推進(jìn)與中國(guó)制造 2025國(guó)家戰(zhàn)略落地的背景下,制造業(yè)正從傳統(tǒng)規(guī)?;可a(chǎn)向多品種、小批量、定制化生產(chǎn)模式轉(zhuǎn)型,這一
    的頭像 發(fā)表于 03-05 17:58 ?1069次閱讀
    復(fù)合機(jī)器人<b class='flag-5'>可</b><b class='flag-5'>重構(gòu)</b>柔性裝配 賦能智能制造產(chǎn)線全面升級(jí)

    10AX022C3U19I2SG現(xiàn)場(chǎng)可編程門(mén)陣列(FPGA)芯片

    :13,752,320位,支持高速數(shù)據(jù)緩存與處理性能特點(diǎn)高性能邏輯處理能力l 基于220,000個(gè)邏輯單元,實(shí)現(xiàn)復(fù)雜數(shù)字信號(hào)處理(DSP)、算法
    發(fā)表于 02-27 09:31

    高壓放大器在激勵(lì)低頻重構(gòu)磁電天線中的應(yīng)用

    根據(jù)磁電天線的機(jī)械振蕩原理,本研究提出了一種基于機(jī)械調(diào)節(jié)方法的超低頻重構(gòu)磁電天線。該磁電天線的多維性能,如工作頻率、帶寬和品質(zhì)因數(shù)(Q),可以在不破壞天線結(jié)構(gòu)的情況下在很大的動(dòng)態(tài)范圍內(nèi)進(jìn)行調(diào)整
    的頭像 發(fā)表于 01-16 16:32 ?141次閱讀
    高壓放大器在激勵(lì)低頻<b class='flag-5'>可</b><b class='flag-5'>重構(gòu)</b>磁電天線中的應(yīng)用

    AMD利用重構(gòu)FPGA設(shè)備Moku實(shí)現(xiàn)自定義激光探測(cè)解決方案

    摘要本文介紹了AdvancedMicroDevices,AMD公司如何基于重構(gòu)FPGA設(shè)備自定義激光探測(cè)解決方案,替代傳統(tǒng)的儀器配置,通過(guò)靈活且定制的FPGA設(shè)備Moku提供更高效和靈活的激光
    的頭像 發(fā)表于 11-20 17:28 ?1753次閱讀
    AMD利用<b class='flag-5'>可</b><b class='flag-5'>重構(gòu)</b>FPGA設(shè)備Moku實(shí)現(xiàn)自定義激光探測(cè)解決方案

    AES和SM4算法的重構(gòu)分析

    一、AES和SM4算法特點(diǎn)分析 基于前面幾篇分享,我們對(duì)AES和SM4的算法流程有了較為清晰的認(rèn)識(shí),接下來(lái)對(duì)AES和SM4算法的共同點(diǎn)進(jìn)行分析,得出二者的重構(gòu)設(shè)計(jì)思路。 首先,這里把AES
    發(fā)表于 10-23 07:26

    瑞薩電子RZ/V系列微處理器助力邊緣AI開(kāi)發(fā)

    邊緣AI越來(lái)越多地應(yīng)用于諸如工業(yè)攝像頭和公共設(shè)施攝像頭等嵌入式設(shè)備中,并要求嵌入式產(chǎn)品小型化且具有低功耗。瑞薩電子RZ/V系列微處理器(MPU)內(nèi)置AI加速器,即動(dòng)態(tài)重構(gòu)
    的頭像 發(fā)表于 09-23 10:31 ?939次閱讀
    瑞薩電子RZ/V系列微<b class='flag-5'>處理</b>器助力邊緣AI開(kāi)發(fā)

    FlashDB 的TSDB不支持寫(xiě)粒度為128,是出于什么考慮有這樣的限制?

    FlashDB 的TSDB不支持寫(xiě)粒度為128,是出于什么考慮有這樣的限制? 如果我希望把這個(gè)數(shù)據(jù)庫(kù)移植到這樣的一個(gè)mcu上,我們應(yīng)該怎么做,有些建議嗎。 感謝各位大佬指點(diǎn)。
    發(fā)表于 09-23 08:19

    陣列式雷達(dá)流量監(jiān)測(cè)站-案例分享

    (水位)和水面流速,進(jìn)而計(jì)算出流量。一、工作原理陣列雷達(dá)技術(shù):采用多天線陣列,同時(shí)發(fā)射多個(gè)雷達(dá)波束,覆蓋更廣的水面區(qū)域。非接觸式測(cè)量:安裝在水面上方(如橋梁、支架)
    的頭像 發(fā)表于 09-11 16:31 ?1385次閱讀
    <b class='flag-5'>陣列</b>式雷達(dá)流量監(jiān)測(cè)站-案例分享

    ATA-7010高壓放大器:開(kāi)啟低頻重構(gòu)磁電天線激勵(lì)的新篇章

    根據(jù)磁電天線的機(jī)械振蕩原理,本研究提出了一種基于機(jī)械調(diào)節(jié)方法的超低頻重構(gòu)磁電天線。該磁電天線的多維性能,如工作頻率、帶寬和品質(zhì)因數(shù)(Q),可以在不破壞天線結(jié)構(gòu)的情況下在很大的動(dòng)態(tài)范圍內(nèi)進(jìn)行調(diào)整
    的頭像 發(fā)表于 08-30 10:43 ?656次閱讀
    ATA-7010高壓放大器:開(kāi)啟低頻<b class='flag-5'>可</b><b class='flag-5'>重構(gòu)</b>磁電天線激勵(lì)的新篇章

    AI 智能重構(gòu)測(cè)試測(cè)量平臺(tái),Moku:Delta集成業(yè)內(nèi)首創(chuàng)“生成式儀器”

    。基于“軟件定義+硬件重構(gòu)”的平臺(tái)架構(gòu),LiquidInstruments最新發(fā)布業(yè)內(nèi)首創(chuàng)的“生成式儀器技術(shù)(GenerativeInstrumentation)”集
    的頭像 發(fā)表于 07-15 11:34 ?627次閱讀
    AI 智能<b class='flag-5'>重構(gòu)</b>測(cè)試測(cè)量平臺(tái),Moku:Delta集成業(yè)內(nèi)首創(chuàng)“生成式儀器”

    重構(gòu)測(cè)試 智變升級(jí)|全新一代智能測(cè)控平臺(tái)Moku:Delta發(fā)布!

    LiquidInstruments推出第四代智能測(cè)控平臺(tái)#Moku:Delta,延續(xù)并升級(jí)了Moku系列一貫的“軟件定義+硬件重構(gòu)”設(shè)計(jì)理念,結(jié)合2GHz瞬時(shí)帶寬、超低噪聲和高分辨率前端設(shè)計(jì),實(shí)現(xiàn)
    的頭像 發(fā)表于 06-25 17:04 ?1055次閱讀
    <b class='flag-5'>重構(gòu)</b>測(cè)試 智變升級(jí)|全新一代智能測(cè)控平臺(tái)Moku:Delta發(fā)布!

    清微智能官宣:國(guó)產(chǎn)重構(gòu)芯片全球出貨量突破2000萬(wàn)顆

    近日,由北京智源人工智能研究院主辦的第7屆北京智源大會(huì)成功舉辦。作為國(guó)產(chǎn)原創(chuàng)重構(gòu)芯片架構(gòu)領(lǐng)導(dǎo)者,清微智能受邀出席,向大眾展示了前沿高階國(guó)產(chǎn)算力技術(shù)成果。 在本次大會(huì)上,清微智能首次官宣,公司
    的頭像 發(fā)表于 06-12 17:15 ?1689次閱讀
    清微智能官宣:國(guó)產(chǎn)<b class='flag-5'>可</b><b class='flag-5'>重構(gòu)</b>芯片全球出貨量突破2000萬(wàn)顆

    ?數(shù)字孿生熱管理:NTC熱敏電阻陣列與熱場(chǎng)重構(gòu)算法的動(dòng)態(tài)適配

    本文以東莞市平尚電子科技有限公司(平尚科技)的NTC熱敏電阻陣列與熱場(chǎng)重構(gòu)算法為核心,探討其在車(chē)載數(shù)字孿生熱管理系統(tǒng)中的動(dòng)態(tài)適配技術(shù)。通過(guò)高精度NTC陣列、多物理場(chǎng)耦合模型及實(shí)時(shí)反饋控制算法,實(shí)現(xiàn)熱
    的頭像 發(fā)表于 06-06 17:59 ?871次閱讀
    ?數(shù)字孿生熱管理:NTC熱敏電阻<b class='flag-5'>陣列</b>與熱場(chǎng)<b class='flag-5'>重構(gòu)</b>算法的動(dòng)態(tài)適配

    鋁線鍵合強(qiáng)度測(cè)試:如何選擇合適的推拉力測(cè)試機(jī)?

    近期,越來(lái)越多的半導(dǎo)體行業(yè)客戶向小編咨詢,關(guān)于鋁線鍵合強(qiáng)度測(cè)試的設(shè)備選擇問(wèn)題。在電子封裝領(lǐng)域,鋁線鍵合技術(shù)是實(shí)現(xiàn)芯片與外部電路連接的核心工藝,其鍵合質(zhì)量的高低直接決定了器件的可靠性和性能表現(xiàn)
    的頭像 發(fā)表于 03-21 11:10 ?1018次閱讀
    <b class='flag-5'>粗</b>鋁線鍵合強(qiáng)度測(cè)試:如何選擇合適的推拉力測(cè)試機(jī)?

    支持實(shí)時(shí)物體識(shí)別的視覺(jué)人工智能微處理器RZ/V2MA數(shù)據(jù)手冊(cè)

    DRP-AI 采用了一種由動(dòng)態(tài)重構(gòu)處理器(DRP)和 AI-MAC組成的人工智能加速器,該加速器可加速
    的頭像 發(fā)表于 03-18 18:12 ?949次閱讀
    支持實(shí)時(shí)物體識(shí)別的視覺(jué)人工智能微<b class='flag-5'>處理</b>器RZ/V2MA數(shù)據(jù)手冊(cè)