前言背景
近期,經(jīng)過龍芯中科與NCNN社區(qū)的共同努力,在NCNN中使用龍架構(gòu)(LoongArch)向量優(yōu)化實現(xiàn)了大部分算子,得益于龍架構(gòu)向量的高效實現(xiàn),優(yōu)化后NCNN在平臺上各項性能測試比通用實現(xiàn)普遍提升一倍以上。

基于龍架構(gòu)向量優(yōu)化開啟前后的NCNN各項性能對比
(豎軸為耗時高度,越高耗時越久,性能越低)
NCNN作為業(yè)界首個為移動端優(yōu)化的神經(jīng)網(wǎng)絡(luò)前向計算框架,在2017年首次開源,是騰訊優(yōu)圖實驗室第一次對外公開深度學習的研究成果。目前多應(yīng)用在圖像方面,例如人像自動美顏,照片風格化,超分辨率,物體識別等等。NCNN計算框架,因其高性能、無第三方依賴、跨平臺支持大部分常見CNN網(wǎng)絡(luò)的特點,是許多開發(fā)者在移動端、嵌入式設(shè)備上部署深度學習算法的首選框架。

龍架構(gòu)向量優(yōu)化加入NCNN生態(tài)社區(qū)
本次優(yōu)化共產(chǎn)出3萬多行代碼,成果將應(yīng)用于龍芯AI邊緣計算場景,完成基于龍架構(gòu)平臺的特征識別、圖像處理、人臉識別等模型的部署和推理,如門禁系統(tǒng)、手勢識別、口罩檢測等等。依托于NCNN計算框架優(yōu)秀的低耦結(jié)構(gòu),開發(fā)者只需關(guān)注算子在龍架構(gòu)平臺上的高效實現(xiàn),無需考慮整個系統(tǒng)結(jié)構(gòu)問題,實現(xiàn)更高效的開發(fā)與部署工作。前期,NCNN與龍芯CPU進行了較為全面的適配和性能優(yōu)化,共同打通了AI應(yīng)用和國產(chǎn)CPU硬件間的壁壘。
可搭載NCNN框架的龍芯AI邊緣計算場景
龍芯中科將與NCNN社區(qū)保持密切合作,繼續(xù)根據(jù)龍架構(gòu)平臺向量特點不斷優(yōu)化算子,推進龍架構(gòu)生態(tài)成果落地更多場景、服務(wù)更多領(lǐng)域、歡迎社區(qū)廣大開發(fā)者與龍芯中科一道共建自主開放的龍架構(gòu)生態(tài)體系。
審核編輯:湯梓紅
-
神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
42文章
4839瀏覽量
108052 -
AI
+關(guān)注
關(guān)注
91文章
40642瀏覽量
302301 -
龍芯中科
+關(guān)注
關(guān)注
0文章
374瀏覽量
8592
原文標題:龍架構(gòu)向量創(chuàng)新賦能AI圖像識別計算,促進NCNN神經(jīng)網(wǎng)絡(luò)前向計算框架性能翻倍
文章出處:【微信號:gh_53fadbdbd4d4,微信公眾號:龍芯中科】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
【CIE全國RISC-V創(chuàng)新應(yīng)用大賽】MUSE Pi Pro開發(fā)板ROS系統(tǒng)
NMSIS神經(jīng)網(wǎng)絡(luò)庫使用介紹
在Ubuntu20.04系統(tǒng)中訓練神經(jīng)網(wǎng)絡(luò)模型的一些經(jīng)驗
基于蜂鳥E203架構(gòu)的指令集K擴展
CICC2033神經(jīng)網(wǎng)絡(luò)部署相關(guān)操作
【「AI芯片:科技探索與AGI愿景」閱讀體驗】+神經(jīng)形態(tài)計算、類腦芯片
神經(jīng)網(wǎng)絡(luò)的并行計算與加速技術(shù)
龍架構(gòu)向量創(chuàng)新賦能AI圖像識別計算,促進NCNN神經(jīng)網(wǎng)絡(luò)前向計算框架性能翻倍
評論