91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

電子發(fā)燒友App

硬聲App

掃碼添加小助手

加入工程師交流群

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示
創(chuàng)作
電子發(fā)燒友網(wǎng)>電子資料下載>電子資料>EMLL高性能端側(cè)機(jī)器學(xué)習(xí)計(jì)算庫(kù)

EMLL高性能端側(cè)機(jī)器學(xué)習(xí)計(jì)算庫(kù)

2022-06-17 | zip | 0.39 MB | 次下載 | 2積分

資料介紹

授權(quán)協(xié)議 Apache
開(kāi)發(fā)語(yǔ)言 C/C++
軟件類型 開(kāi)源軟件

軟件簡(jiǎn)介

EMLL(Edge ML Library)為加速終端側(cè)設(shè)備上機(jī)器學(xué)習(xí)的推理而設(shè)計(jì),提供基于端側(cè)處理器的高性能機(jī)器學(xué)習(xí)計(jì)算函數(shù)庫(kù)。EMLL支持fp32、fp16、int8等數(shù)據(jù)類型,已在有道詞典筆、翻譯王和超級(jí)詞典等硬件產(chǎn)品的機(jī)器翻譯和語(yǔ)音識(shí)別引擎中應(yīng)用,大幅降低了推理延遲。

特點(diǎn)

高性能

EMLL實(shí)現(xiàn)的矩陣乘法函數(shù),為端側(cè)人工智能中常見(jiàn)的扁平矩陣作了專門的優(yōu)化,為各常見(jiàn)ARM處理器作了特定的優(yōu)化。對(duì)于cortex-A35/A53/A55處理器,本庫(kù)針對(duì)它們的流水線特點(diǎn),使用了匯編級(jí)別的優(yōu)化。

下面是單精度矩陣乘法的測(cè)試結(jié)果:

pYYBAGKn_kyADgnxAAHOehhaBFM978.png

矩陣乘法的通式為 C[MxN] = A[MxK] B[KxN];所列數(shù)據(jù)為全行主序和全列主序的最好性能。

易用性

EMLL使用的函數(shù)接口在參數(shù)設(shè)計(jì)上力求簡(jiǎn)潔直接,矩陣乘法去掉了不常用的LD*參數(shù),矩陣和向量的傳遞通過(guò)指針和整數(shù)維度分別傳遞。本庫(kù)的構(gòu)建和運(yùn)行不依賴第三方計(jì)算庫(kù)。

擴(kuò)展性

對(duì)于矩陣乘法和量化函數(shù),EMLL 庫(kù)提取了它們和架構(gòu)無(wú)關(guān)的代碼作為通用的宏,這些宏可以在支持新的CPU架構(gòu)時(shí)大大節(jié)省所需的代碼量。

EMLL 應(yīng)用接口

EMLL提供基于 C 的接口,詳情請(qǐng)見(jiàn)?Usage_ZH.md。

函數(shù)類型 函數(shù)名稱 函數(shù)參數(shù)
矩陣乘法 data_type + "gemm" 源矩陣排列順序,各矩陣地址,M,N,K,beta,并行線程數(shù)
全連接層(單精度) "fc" src/weight/bias/output的地址,M,K,N,源矩陣排列順序,(并行線程數(shù))
量化 "quantize_" + "symmetric"/"asymmetric" + input_type + output_type 輸入數(shù)組,輸出數(shù)組,(輸出零點(diǎn)值),縮放值,數(shù)組大小,輸入范圍
重量化 "requantize_" + "symmetric/asymmetric" + "_XtoY" 輸入數(shù)組,輸出數(shù)組,(輸出零點(diǎn)值),輸出縮放值,數(shù)組大小,輸入范圍
偏置 "bias" + data_type 被偏置的矩陣,標(biāo)量偏置,平行于主方向的向量偏置,平行于次方向的向量偏置,矩陣大小

各函數(shù)支持的數(shù)據(jù)類型

處理器 矩陣乘法 偏置 量化 重量化
ARMv7a 32-bit fp32,(u)int8 fp32,int32 fp32 -> (u)int16/(u)int8 int32 -> (u)int16/(u)int8,int16 -> (u)int8
ARMv8a 64-bit fp32,fp16,(u)int8 fp32,int32 fp32 -> (u)int16/(u)int8 int32 -> (u)int16/(u)int8,int16 -> (u)int8

EMLL 支持在 Linux 和安卓系統(tǒng)上運(yùn)行。

EMLL 支持用 GCC 和 Clang 編譯。

?

處理器 機(jī)器學(xué)習(xí)
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

下載該資料的人也在下載 下載該資料的人還在閱讀
更多 >

評(píng)論

查看更多

下載排行

本周

  1. 1新一代網(wǎng)絡(luò)可視化(NPB 2.0)
  2. 3.40 MB  |  1次下載  |  免費(fèi)
  3. 2冷柜-電氣控制系統(tǒng)講解
  4. 13.68 MB   |  1次下載  |  10 積分
  5. 3MDD品牌三極管MMBT3906數(shù)據(jù)手冊(cè)
  6. 2.33 MB  |  次下載  |  免費(fèi)
  7. 4MDD品牌三極管S9012數(shù)據(jù)手冊(cè)
  8. 2.62 MB  |  次下載  |  免費(fèi)
  9. 5LAT1218 如何選擇和設(shè)置外部晶體適配 BlueNRG-X
  10. 0.60 MB   |  次下載  |  3 積分
  11. 6LAT1216 Blue NRG-1/2 系列芯片 Flash 操作與 BLE 事件的互斥處理
  12. 0.89 MB   |  次下載  |  3 積分
  13. 7收音環(huán)繞擴(kuò)音機(jī) AVR-1507手冊(cè)
  14. 2.50 MB   |  次下載  |  免費(fèi)
  15. 8MS1000TA 超聲波測(cè)量模擬前端芯片技術(shù)手冊(cè)
  16. 0.60 MB   |  次下載  |  免費(fèi)

本月

  1. 1愛(ài)華AIWA HS-J202維修手冊(cè)
  2. 3.34 MB   |  37次下載  |  免費(fèi)
  3. 2PC5502負(fù)載均流控制電路數(shù)據(jù)手冊(cè)
  4. 1.63 MB   |  23次下載  |  免費(fèi)
  5. 3NB-IoT芯片廠商的資料說(shuō)明
  6. 0.31 MB   |  22次下載  |  1 積分
  7. 4UWB653Pro USB口測(cè)距通信定位模塊規(guī)格書
  8. 838.47 KB  |  5次下載  |  免費(fèi)
  9. 5蘇泊爾DCL6907(即CHK-S007)單芯片電磁爐原理圖資料
  10. 0.04 MB   |  4次下載  |  1 積分
  11. 6蘇泊爾DCL6909(即CHK-S009)單芯片電磁爐原理圖資料
  12. 0.08 MB   |  2次下載  |  1 積分
  13. 7100W準(zhǔn)諧振反激式恒流電源電路圖資料
  14. 0.09 MB   |  2次下載  |  1 積分
  15. 8FS8025B USB的PD和OC快充協(xié)議電壓誘騙控制器IC技術(shù)手冊(cè)
  16. 1.81 MB   |  1次下載  |  免費(fèi)

總榜

  1. 1matlab軟件下載入口
  2. 未知  |  935137次下載  |  10 積分
  3. 2開(kāi)源硬件-PMP21529.1-4 開(kāi)關(guān)降壓/升壓雙向直流/直流轉(zhuǎn)換器 PCB layout 設(shè)計(jì)
  4. 1.48MB  |  420064次下載  |  10 積分
  5. 3Altium DXP2002下載入口
  6. 未知  |  233089次下載  |  10 積分
  7. 4電路仿真軟件multisim 10.0免費(fèi)下載
  8. 340992  |  191439次下載  |  10 積分
  9. 5十天學(xué)會(huì)AVR單片機(jī)與C語(yǔ)言視頻教程 下載
  10. 158M  |  183353次下載  |  10 積分
  11. 6labview8.5下載
  12. 未知  |  81602次下載  |  10 積分
  13. 7Keil工具M(jìn)DK-Arm免費(fèi)下載
  14. 0.02 MB  |  73822次下載  |  10 積分
  15. 8LabVIEW 8.6下載
  16. 未知  |  65991次下載  |  10 積分