91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一種讓AI更快的可重構(gòu)處理器

芯長(zhǎng)征科技 ? 來源:半導(dǎo)體行業(yè)觀察 ? 作者:半導(dǎo)體行業(yè)觀察 ? 2022-12-09 10:27 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

深度學(xué)習(xí)是一種關(guān)鍵的計(jì)算方法,它正在推動(dòng)技術(shù)的發(fā)展——處理海量數(shù)據(jù)并發(fā)現(xiàn)人類永遠(yuǎn)無法自行辨別的微妙模式。但為了獲得最佳性能,深度學(xué)習(xí)算法需要得到正確的軟件編譯器和硬件組合的支持。特別是,允許根據(jù)需要靈活使用硬件資源進(jìn)行計(jì)算的可重構(gòu)處理器是關(guān)鍵。

在最近的一項(xiàng)研究中,香港的研究人員報(bào)告了一種名為 ReAAP 的新型可重構(gòu)處理器,其性能優(yōu)于幾種常用于支持深度神經(jīng)網(wǎng)絡(luò) (DNN) 的計(jì)算平臺(tái),深度學(xué)習(xí)是一種有用的形式,通常涉及具有許多計(jì)算密集型的大型數(shù)據(jù)集數(shù)據(jù)層。他們?cè)?10 月 10 日發(fā)表在IEEE Transactions on Computers上的一篇論文中對(duì)其進(jìn)行了描述。

在他們的研究中,研究人員將他們?cè)?ReAAP 中提出的軟件編譯器與 Nvidia GPUARM CPU 上的其他三個(gè)基線軟件編譯器進(jìn)行了比較。結(jié)果表明,它的執(zhí)行速度是運(yùn)行在GPU并且是運(yùn)行相同軟件編譯器的 1.6 到 3.3 倍在中央處理器上.

此外,Zheng 指出,ReAAP 為各種不同的計(jì)算密集層實(shí)現(xiàn)了硬件資源的持續(xù)高利用率。

雖然 ReAAP 擅長(zhǎng)處理具有典型數(shù)據(jù)密集型工作負(fù)載的 DNN,但它目前不太適合在數(shù)據(jù)稀疏時(shí)支持 DNN。鄭說他的團(tuán)隊(duì)希望在未來解決這個(gè)問題。更重要的是,研究人員希望以 ReAAP 為基礎(chǔ),使其能夠更好地處理量化數(shù)據(jù)(處理的數(shù)據(jù)以一種顯著降低神經(jīng)網(wǎng)絡(luò)的內(nèi)存需求和計(jì)算成本的方式)。

“在 [ReAAP 更好地處理量化數(shù)據(jù)] 的擴(kuò)展完成和評(píng)估后,我們將考慮將其與其他幾個(gè)人工智能計(jì)算加速解決方案一起商業(yè)化,”鄭說,并指出這將使 ReAAP 在資源方面更有效率受限平臺(tái),例如各種物聯(lián)網(wǎng) (IoT) 設(shè)備。

而普通處理器通常允許數(shù)據(jù)使用特定的硬件路徑進(jìn)行處理,可重構(gòu)處理器提供了一種更具適應(yīng)性的選擇:重新配置最有效的硬件資源以根據(jù)需要處理數(shù)據(jù)。

“可重構(gòu)處理器結(jié)合了軟件靈活性和硬件并行性的優(yōu)勢(shì),”參與該研究的香港科技大學(xué)電子與計(jì)算機(jī)工程系博士后研究員鄭建偉解釋道。

這些優(yōu)勢(shì)促使他的團(tuán)隊(duì)創(chuàng)建了 ReAAP,這是一個(gè)集成的軟硬件系統(tǒng)。它的軟件編譯器負(fù)責(zé)評(píng)估和優(yōu)化各種深度學(xué)習(xí)工作負(fù)載。一旦確定了并行處理數(shù)據(jù)的最佳解決方案,它就會(huì)發(fā)送指令重新配置硬件協(xié)處理器,從而分配適當(dāng)?shù)挠布Y源來進(jìn)行并行計(jì)算?!白鳛槎说蕉讼到y(tǒng),ReAAP 可以部署以加速各種深度學(xué)習(xí)應(yīng)用程序,只需在 [the] 軟件中為每個(gè)應(yīng)用程序定制一個(gè) Python 腳本,”Zheng 解釋說。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    20255

    瀏覽量

    252325
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    39793

    瀏覽量

    301443
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1236

    瀏覽量

    26201

原文標(biāo)題:一種讓AI更快的可重構(gòu)處理器

文章出處:【微信號(hào):芯長(zhǎng)征科技,微信公眾號(hào):芯長(zhǎng)征科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    NVIDIA BlueField-4數(shù)據(jù)處理器重塑新型AI原生存儲(chǔ)基礎(chǔ)設(shè)施

    NVIDIA 宣布,NVIDIA BlueField?-4 數(shù)據(jù)處理器作為全棧 NVIDIA BlueField 平臺(tái)的部分,為 NVIDIA 推理上下文記憶存儲(chǔ)平臺(tái)提供支持,這是一種新型
    的頭像 發(fā)表于 01-09 10:33 ?475次閱讀

    瑞芯微SOC智能視覺AI處理器

    需要連接多種外設(shè)的產(chǎn)品。顯示: 支持雙屏異顯,最高4K@60fps輸出。 RK1126B: 款集成自研NPU的智能視覺AI處理器,專注于視頻輸入端的AI分析與
    發(fā)表于 12-19 13:44

    重磅合作!Quintauris 聯(lián)手 SiFive,加速 RISC-V 在嵌入式與 AI 領(lǐng)域落地

    之后,要打造的是高可靠性、高能效還支持擴(kuò)展的 RISC-V 設(shè)計(jì)方案。而且合作的核心目標(biāo)特別明確: RISC-V 處理器在嵌入式、物聯(lián)網(wǎng)、AI 系統(tǒng)里
    發(fā)表于 12-18 12:01

    AES和SM4算法的重構(gòu)分析

    相似的實(shí)現(xiàn)過程,可以進(jìn)行重構(gòu)設(shè)計(jì)。同時(shí),這兩算法在加解密過程中會(huì)頻繁使用寄存來存儲(chǔ)數(shù)據(jù) 二、
    發(fā)表于 10-23 07:26

    Cortex-M0+處理器的HardFault錯(cuò)誤介紹

    在ARM處理器中,如果個(gè)程序產(chǎn)生了錯(cuò)誤并且被處理器檢測(cè)到,就會(huì)產(chǎn)生錯(cuò)誤異常。Cortex-M0+處理器只有一種異常用以
    的頭像 發(fā)表于 10-14 10:50 ?3389次閱讀
    Cortex-M0+<b class='flag-5'>處理器</b>的HardFault錯(cuò)誤介紹

    瑞薩電子RZ/V系列微處理器助力邊緣AI開發(fā)

    邊緣AI越來越多地應(yīng)用于諸如工業(yè)攝像頭和公共設(shè)施攝像頭等嵌入式設(shè)備中,并要求嵌入式產(chǎn)品小型化且具有低功耗。瑞薩電子RZ/V系列微處理器(MPU)內(nèi)置AI加速,即動(dòng)態(tài)
    的頭像 發(fā)表于 09-23 10:31 ?895次閱讀
    瑞薩電子RZ/V系列微<b class='flag-5'>處理器</b>助力邊緣<b class='flag-5'>AI</b>開發(fā)

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI芯片到AGI芯片

    建立的基礎(chǔ): ①算力支柱②數(shù)據(jù)支柱③計(jì)算支柱 1)算力 與AI算力有關(guān)的因素: ①晶體管數(shù)量②晶體管速度③芯片架構(gòu)④芯片面積⑤制造工藝⑥芯片內(nèi)部擴(kuò)展⑦內(nèi)存帶寬、存儲(chǔ)容量等⑧處理器利用率⑨芯片之間的互連
    發(fā)表于 09-18 15:31

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+第二章 實(shí)現(xiàn)深度學(xué)習(xí)AI芯片的創(chuàng)新方法與架構(gòu)

    Transformer和視覺Transformer模型。 ViTA是一種高效數(shù)據(jù)流AI加速,用于在邊緣設(shè)備上部署計(jì)算密集型視覺Transformer模型。 2、射頻神經(jīng)網(wǎng)絡(luò) 2.1線性射頻模擬
    發(fā)表于 09-12 17:30

    Nordic收購(gòu) Neuton.AI 關(guān)于產(chǎn)品技術(shù)的分析

    Nordic Semiconductor 于 2025 年收購(gòu)了 Neuton.AI,這是家專注于超小型機(jī)器學(xué)習(xí)(TinyML)解決方案的公司。 Neuton 開發(fā)了一種獨(dú)特的神經(jīng)網(wǎng)絡(luò)框架,能夠
    發(fā)表于 06-28 14:18

    Cadence推出Tensilica NeuroEdge 130 AI協(xié)處理器

    楷登電子(美國(guó) Cadence 公司,Nasdaq:CDNS)近日宣布推出 Cadence Tensilica NeuroEdge 130 AI 協(xié)處理器(AICP)。這是款新型處理器
    的頭像 發(fā)表于 05-17 09:38 ?1399次閱讀

    一種低翹曲扇出重構(gòu)方案

    翹曲(Warpage)是結(jié)構(gòu)固有的缺陷之。晶圓級(jí)扇出封裝(FOWLP)工藝過程中,由于硅芯片需通過環(huán)氧樹脂(EMC)進(jìn)行模塑重構(gòu)成為新的晶圓,使其新的晶圓變成非均質(zhì)材料,不同材料間的熱膨脹和收縮程度不平衡則非常容易使重構(gòu)晶圓發(fā)
    的頭像 發(fā)表于 05-14 11:02 ?1397次閱讀
    <b class='flag-5'>一種</b>低翹曲扇出<b class='flag-5'>重構(gòu)</b>方案

    RAKsmart服務(wù)如何重構(gòu)企業(yè)AI轉(zhuǎn)型的算力成本邏輯

    傳統(tǒng)服務(wù)架構(gòu)的“堆硬件”模式,許多企業(yè)在GPU采購(gòu)、跨國(guó)部署和混合負(fù)載管理上陷入“高投入、低效能”的惡性循環(huán)。RAKsmart通過技術(shù)創(chuàng)新與架構(gòu)重構(gòu),正在為企業(yè)提供一種全新的算力成
    的頭像 發(fā)表于 04-22 09:58 ?545次閱讀

    光子 AI 處理器的核心原理及突破性進(jìn)展

    電子發(fā)燒友網(wǎng)(文 / 李彎彎)光子 AI 處理器,作為一種借助光子執(zhí)行信息處理與人工智能(AI)計(jì)算的新型硬件設(shè)備,正逐漸嶄露頭角。與傳統(tǒng)基
    的頭像 發(fā)表于 04-19 00:40 ?4173次閱讀

    支持實(shí)時(shí)物體識(shí)別的視覺人工智能微處理器RZ/V2MA數(shù)據(jù)手冊(cè)

    DRP-AI 采用了一種由動(dòng)態(tài)重構(gòu)處理器(DRP)和 AI-MAC組成的人工智能加速
    的頭像 發(fā)表于 03-18 18:12 ?921次閱讀
    支持實(shí)時(shí)物體識(shí)別的視覺人工智能微<b class='flag-5'>處理器</b>RZ/V2MA數(shù)據(jù)手冊(cè)

    AI MPU# 瑞薩RZ/V2H 四核視覺 ,采用 DRP-AI3 加速和高性能實(shí)時(shí)處理器

    RZ/V2H 高端 AI MPU 采用瑞薩電子專有的AI 加速-動(dòng)態(tài)重配置處理器 (DRP-AI
    的頭像 發(fā)表于 03-15 11:50 ?2242次閱讀
    <b class='flag-5'>AI</b> MPU# 瑞薩RZ/V2H 四核視覺 ,采用 DRP-<b class='flag-5'>AI</b>3 加速<b class='flag-5'>器</b>和高性能實(shí)時(shí)<b class='flag-5'>處理器</b>