91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

龍架構(gòu)向量創(chuàng)新賦能AI圖像識別計算,促進NCNN神經(jīng)網(wǎng)絡(luò)前向計算框架性能翻倍

龍芯中科 ? 來源:龍芯中科 ? 作者:龍芯中科 ? 2022-11-25 17:11 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近期,經(jīng)過龍芯中科與NCNN社區(qū)的共同努力,在NCNN中使用龍架構(gòu)(LoongArch)向量優(yōu)化實現(xiàn)了大部分算子,得益于龍架構(gòu)向量的高效實現(xiàn),優(yōu)化后NCNN在平臺上各項性能測試比通用實現(xiàn)普遍提升一倍以上。

40d1d064-6c9e-11ed-8abf-dac502259ad0.png

基于龍架構(gòu)向量優(yōu)化開啟前后的NCNN各項性能對比

(豎軸為耗時高度,越高耗時越久,性能越低)

NCNN作為業(yè)界首個為移動端優(yōu)化的神經(jīng)網(wǎng)絡(luò)前向計算框架,在2017年首次開源,是騰訊優(yōu)圖實驗室第一次對外公開深度學習的研究成果。目前多應(yīng)用在圖像方面,例如人像自動美顏,照片風格化,超分辨率,物體識別等等。NCNN計算框架,因其高性能、無第三方依賴、跨平臺支持大部分常見CNN網(wǎng)絡(luò)的特點,是許多開發(fā)者在移動端、嵌入式設(shè)備上部署深度學習算法的首選框架。

40e4711a-6c9e-11ed-8abf-dac502259ad0.png

龍架構(gòu)向量優(yōu)化加入NCNN生態(tài)社區(qū)

本次優(yōu)化共產(chǎn)出3萬多行代碼,成果將應(yīng)用于龍芯AI邊緣計算場景,完成基于龍架構(gòu)平臺的特征識別、圖像處理、人臉識別等模型的部署和推理,如門禁系統(tǒng)、手勢識別、口罩檢測等等。依托于NCNN計算框架優(yōu)秀的低耦結(jié)構(gòu),開發(fā)者只需關(guān)注算子在龍架構(gòu)平臺上的高效實現(xiàn),無需考慮整個系統(tǒng)結(jié)構(gòu)問題,實現(xiàn)更高效的開發(fā)與部署工作。前期,NCNN與龍芯CPU進行了較為全面的適配和性能優(yōu)化,共同打通了AI應(yīng)用和國產(chǎn)CPU硬件間的壁壘。

可搭載NCNN框架的龍芯AI邊緣計算場景

龍芯中科將與NCNN社區(qū)保持密切合作,繼續(xù)根據(jù)龍架構(gòu)平臺向量特點不斷優(yōu)化算子,推進龍架構(gòu)生態(tài)成果落地更多場景、服務(wù)更多領(lǐng)域、歡迎社區(qū)廣大開發(fā)者與龍芯中科一道共建自主開放的龍架構(gòu)生態(tài)體系。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4839

    瀏覽量

    108052
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    40642

    瀏覽量

    302301
  • 龍芯中科
    +關(guān)注

    關(guān)注

    0

    文章

    374

    瀏覽量

    8592

原文標題:龍架構(gòu)向量創(chuàng)新賦能AI圖像識別計算,促進NCNN神經(jīng)網(wǎng)絡(luò)前向計算框架性能翻倍

文章出處:【微信號:gh_53fadbdbd4d4,微信公眾號:龍芯中科】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    【CIE全國RISC-V創(chuàng)新應(yīng)用大賽】MUSE Pi Pro開發(fā)板ROS系統(tǒng)

    1.8GHz,兼顧多任務(wù)處理能力與效比。支持向量擴展(V 擴展),天然適配 AI 計算、邊緣推理等場景,指令集靈活性和開源特性顯著優(yōu)于傳統(tǒng)閉源
    發(fā)表于 11-16 22:34

    NMSIS神經(jīng)網(wǎng)絡(luò)庫使用介紹

    NMSIS NN 軟件庫是一組高效的神經(jīng)網(wǎng)絡(luò)內(nèi)核,旨在最大限度地提高 Nuclei N 處理器內(nèi)核上的神經(jīng)網(wǎng)絡(luò)性能并最??大限度地減少其內(nèi)存占用。 該庫分為多個功能,每個功能涵蓋特定類別
    發(fā)表于 10-29 06:08

    在Ubuntu20.04系統(tǒng)中訓練神經(jīng)網(wǎng)絡(luò)模型的一些經(jīng)驗

    本帖欲分享在Ubuntu20.04系統(tǒng)中訓練神經(jīng)網(wǎng)絡(luò)模型的一些經(jīng)驗。我們采用jupyter notebook作為開發(fā)IDE,以TensorFlow2為訓練框架,目標是訓練一個手寫數(shù)字識別神經(jīng)
    發(fā)表于 10-22 07:03

    基于蜂鳥E203架構(gòu)的指令集K擴展

    ,加速神經(jīng)網(wǎng)絡(luò)算法中的矩陣計算。 這些指令可以用于許多應(yīng)用程序,例如數(shù)字信號處理、圖像處理、機器學習等。同時,這些指令也可以通過軟件編譯器進行自動向量化,從而提高程序
    發(fā)表于 10-21 09:38

    CICC2033神經(jīng)網(wǎng)絡(luò)部署相關(guān)操作

    在完成神經(jīng)網(wǎng)絡(luò)量化后,需要將神經(jīng)網(wǎng)絡(luò)部署到硬件加速器上。首先需要將所有權(quán)重數(shù)據(jù)以及輸入數(shù)據(jù)導入到存儲器內(nèi)。 在仿真環(huán)境下,可將其存于一個文件,并在 Verilog 代碼中通過 readmemh 函數(shù)
    發(fā)表于 10-20 08:00

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+神經(jīng)形態(tài)計算、類腦芯片

    AI芯片不僅包括深度學細AI加速器,還有另外一個主要列別:類腦芯片。類腦芯片是模擬人腦神經(jīng)網(wǎng)絡(luò)架構(gòu)的芯片。它結(jié)合微電子技術(shù)和新型神經(jīng)形態(tài)器件
    發(fā)表于 09-17 16:43

    神經(jīng)網(wǎng)絡(luò)的并行計算與加速技術(shù)

    問題。因此,并行計算與加速技術(shù)在神經(jīng)網(wǎng)絡(luò)研究和應(yīng)用中變得至關(guān)重要,它們能夠顯著提升神經(jīng)網(wǎng)絡(luò)性能和效率,滿足實際應(yīng)用中對快速響應(yīng)和大規(guī)模數(shù)據(jù)處理的需求。
    的頭像 發(fā)表于 09-17 13:31 ?1245次閱讀
    <b class='flag-5'>神經(jīng)網(wǎng)絡(luò)</b>的并行<b class='flag-5'>計算</b>與加速技術(shù)

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI的未來:提升算力還是智力

    結(jié)果。 耦合振蕩計算與傳統(tǒng)的計算的區(qū)別: 3、神經(jīng)符號計算 神經(jīng)符號極端是指將基于神經(jīng)網(wǎng)絡(luò)的方法
    發(fā)表于 09-14 14:04

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+第二章 實現(xiàn)深度學習AI芯片的創(chuàng)新方法與架構(gòu)

    Transformer和視覺Transformer模型。 ViTA是一種高效數(shù)據(jù)流AI加速器,用于在邊緣設(shè)備上部署計算密集型視覺Transformer模型。 2、射頻神經(jīng)網(wǎng)絡(luò) 2.1線性射頻模擬處理器的原理 2.2 線性
    發(fā)表于 09-12 17:30

    【Milk-V Duo S 開發(fā)板免費體驗】RISC-V核心NCNN基準測試

    ncnn是騰訊優(yōu)圖實驗室推出的一個為移動端極致優(yōu)化的高性能神經(jīng)網(wǎng)絡(luò)計算
    發(fā)表于 08-24 23:46

    AI 邊緣計算網(wǎng)關(guān):開啟智能新時代的鑰匙?—興物聯(lián)

    智能化決策的關(guān)鍵。卷積神經(jīng)網(wǎng)絡(luò)圖像識別方面表現(xiàn)卓越,在智能工廠產(chǎn)品質(zhì)量檢測中,快速準確識別產(chǎn)品缺陷;循環(huán)神經(jīng)網(wǎng)絡(luò)擅長處理時間序列數(shù)據(jù),可
    發(fā)表于 08-09 16:40

    【書籍評測活動NO.64】AI芯片,從過去走向未來:《AI芯片:科技探索與AGI愿景》

    神經(jīng)網(wǎng)絡(luò)。 材料創(chuàng)新 這部分將視角投向化學與生物領(lǐng)域,探索 “濕件”的可能性,重新定義AI芯片的形態(tài)。 化學計算開辟了全新路徑,通過酸堿反應(yīng)構(gòu)建邏輯門與
    發(fā)表于 07-28 13:54

    【「DeepSeek 核心技術(shù)揭秘」閱讀體驗】第三章:探索 DeepSeek - V3 技術(shù)架構(gòu)的奧秘

    一、模型架構(gòu) 在閱讀第三章關(guān)于 DeepSeek 的模型架構(gòu)部分時,我仿佛打開了一扇通往人工智能核心構(gòu)造的大門。從架構(gòu)圖中,清晰看到 Transformer 塊、
    發(fā)表于 07-20 15:07

    【嘉楠堪智K230開發(fā)板試用體驗】01 Studio K230開發(fā)板Test2——手掌,手勢檢測,字符檢測

    CanMV K230 的核心計算單元,專門用于處理需要高計算量的復(fù)雜圖像識別任務(wù)。其作用類似于電腦中的 GPU,專注于提供強大的視覺處理算力。 KPU 的核心優(yōu)勢在于: 神經(jīng)網(wǎng)絡(luò)處理
    發(fā)表于 07-10 09:45

    基于RV1126開發(fā)板移植NCNN部署庫方法

    神經(jīng)網(wǎng)絡(luò)計算框架。并在2017年7月正式開源。NCNN做為騰訊優(yōu)圖最“火”的開源項目之一,是
    的頭像 發(fā)表于 04-16 15:24 ?719次閱讀
    基于RV1126開發(fā)板移植<b class='flag-5'>NCNN</b>部署庫方法