資料介紹
軟件簡介
EMLL(Edge ML Library)為加速終端側設備上機器學習的推理而設計,提供基于端側處理器的高性能機器學習計算函數庫。EMLL支持fp32、fp16、int8等數據類型,已在有道詞典筆、翻譯王和超級詞典等硬件產品的機器翻譯和語音識別引擎中應用,大幅降低了推理延遲。
特點
高性能
EMLL實現的矩陣乘法函數,為端側人工智能中常見的扁平矩陣作了專門的優化,為各常見ARM處理器作了特定的優化。對于cortex-A35/A53/A55處理器,本庫針對它們的流水線特點,使用了匯編級別的優化。
下面是單精度矩陣乘法的測試結果:
矩陣乘法的通式為 C[MxN] = A[MxK] B[KxN];所列數據為全行主序和全列主序的最好性能。
易用性
EMLL使用的函數接口在參數設計上力求簡潔直接,矩陣乘法去掉了不常用的LD*參數,矩陣和向量的傳遞通過指針和整數維度分別傳遞。本庫的構建和運行不依賴第三方計算庫。
擴展性
對于矩陣乘法和量化函數,EMLL 庫提取了它們和架構無關的代碼作為通用的宏,這些宏可以在支持新的CPU架構時大大節省所需的代碼量。
EMLL 應用接口
EMLL提供基于 C 的接口,詳情請見?Usage_ZH.md。
函數類型 | 函數名稱 | 函數參數 |
---|---|---|
矩陣乘法 | data_type + "gemm" | 源矩陣排列順序,各矩陣地址,M,N,K,beta,并行線程數 |
全連接層(單精度) | "fc" | src/weight/bias/output的地址,M,K,N,源矩陣排列順序,(并行線程數) |
量化 | "quantize_" + "symmetric"/"asymmetric" + input_type + output_type | 輸入數組,輸出數組,(輸出零點值),縮放值,數組大小,輸入范圍 |
重量化 | "requantize_" + "symmetric/asymmetric" + "_XtoY" | 輸入數組,輸出數組,(輸出零點值),輸出縮放值,數組大小,輸入范圍 |
偏置 | "bias" + data_type | 被偏置的矩陣,標量偏置,平行于主方向的向量偏置,平行于次方向的向量偏置,矩陣大小 |
各函數支持的數據類型
處理器 | 矩陣乘法 | 偏置 | 量化 | 重量化 |
---|---|---|---|---|
ARMv7a 32-bit | fp32,(u)int8 | fp32,int32 | fp32 -> (u)int16/(u)int8 | int32 -> (u)int16/(u)int8,int16 -> (u)int8 |
ARMv8a 64-bit | fp32,fp16,(u)int8 | fp32,int32 | fp32 -> (u)int16/(u)int8 | int32 -> (u)int16/(u)int8,int16 -> (u)int8 |
EMLL 支持在 Linux 和安卓系統上運行。
EMLL 支持用 GCC 和 Clang 編譯。
- 面向機器學習的高可用、高并發數據庫:OpenMLDB 0次下載
- MindSpore量子機器學習庫MindQuantum
- 庫卡堆垛機器人在伊利的應用 0次下載
- 庫卡機器人有限公司培訓資料之庫卡機器人教程C2系統編程 9次下載
- 庫卡機器人有限公司培訓資料之庫卡機器人編程C4教程 9次下載
- 機器學習必學的Python代碼示例集 14次下載
- 高性能單片機器件在高校中的應用及選型 10次下載
- 高性能.單端.無RSENSE控制器,用于負輸出電源 4次下載
- 基于深度學習的手語計算的發展趨勢及研究分析 3次下載
- 高性能計算到底是什么?使用了哪些技術和知識 0次下載
- 機器學習教程之機器學習的十三個經典課件資料免費下載 34次下載
- 機器學習教程之使用matlab研究機器學習的資料概述 32次下載
- 機器學習入門資料之機器學習的詳細資料介紹 9次下載
- 高性能計算發展與應用 0次下載
- GPRS端到端測試辦法及系統側性能統計指標
- 澎峰科技高性能計算庫PerfIPP介紹 235次閱讀
- 帶你了解什么是高性能計算(HPC) 277次閱讀
- 機器學習算法原理詳解 376次閱讀
- 高性能計算的原理與實踐:從基本概念到架構解析 309次閱讀
- 高性能芯片有哪些特征? 753次閱讀
- 高性能數學計算庫的現狀 1323次閱讀
- 關于HPC的高性能計算測試方法 2112次閱讀
- 一個高性能異步計算框架介紹 710次閱讀
- 機器學習適合云計算運維嗎 503次閱讀
- 計算機視覺開源庫集錦 5084次閱讀
- 機器學習教程之機器學習概念的深度解析 3740次閱讀
- 量子計算與量子機器學習的解析 5787次閱讀
- 機器學習與數據挖掘的關系 4186次閱讀
- 機器學習綜述——機器學習理論基礎與發展脈絡 7813次閱讀
- 如何區分深度學習與機器學習 1891次閱讀
下載排行
本周
- 1山景DSP芯片AP8248A2數據手冊
- 1.06 MB | 532次下載 | 免費
- 2RK3399完整板原理圖(支持平板,盒子VR)
- 3.28 MB | 339次下載 | 免費
- 3TC358743XBG評估板參考手冊
- 1.36 MB | 330次下載 | 免費
- 4DFM軟件使用教程
- 0.84 MB | 295次下載 | 免費
- 5元宇宙深度解析—未來的未來-風口還是泡沫
- 6.40 MB | 227次下載 | 免費
- 6迪文DGUS開發指南
- 31.67 MB | 194次下載 | 免費
- 7元宇宙底層硬件系列報告
- 13.42 MB | 182次下載 | 免費
- 8FP5207XR-G1中文應用手冊
- 1.09 MB | 178次下載 | 免費
本月
- 1OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234315次下載 | 免費
- 2555集成電路應用800例(新編版)
- 0.00 MB | 33566次下載 | 免費
- 3接口電路圖大全
- 未知 | 30323次下載 | 免費
- 4開關電源設計實例指南
- 未知 | 21549次下載 | 免費
- 5電氣工程師手冊免費下載(新編第二版pdf電子書)
- 0.00 MB | 15349次下載 | 免費
- 6數字電路基礎pdf(下載)
- 未知 | 13750次下載 | 免費
- 7電子制作實例集錦 下載
- 未知 | 8113次下載 | 免費
- 8《LED驅動電路設計》 溫德爾著
- 0.00 MB | 6656次下載 | 免費
總榜
- 1matlab軟件下載入口
- 未知 | 935054次下載 | 免費
- 2protel99se軟件下載(可英文版轉中文版)
- 78.1 MB | 537798次下載 | 免費
- 3MATLAB 7.1 下載 (含軟件介紹)
- 未知 | 420027次下載 | 免費
- 4OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234315次下載 | 免費
- 5Altium DXP2002下載入口
- 未知 | 233046次下載 | 免費
- 6電路仿真軟件multisim 10.0免費下載
- 340992 | 191187次下載 | 免費
- 7十天學會AVR單片機與C語言視頻教程 下載
- 158M | 183279次下載 | 免費
- 8proe5.0野火版下載(中文版免費下載)
- 未知 | 138040次下載 | 免費
評論
查看更多