資料介紹
軟件簡介
TNN是一個移動端高性能、輕量級推理框架,同時擁有跨平臺、高性能、模型壓縮、代碼裁剪等眾多突出優勢。TNN框架在原有Rapidnet、ncnn框架的基礎上進一步加強了移動端設備的支持以及性能優化,同時也借鑒了業界主流開源框架高性能和良好拓展性的優點。目前TNN已經在手Q、微視、P圖等應用中落地,歡迎大家參與協同共建,促進TNN推理框架進一步完善。
快速開始
使用 TNN 非常簡單,如果你有一個已經訓練好的模型, 那么一般而言通過以下三個步驟就能完成模型在目標平臺上的部署。
-
第一步是把訓練好的模型轉換成TNN的模型,為此我們提供了豐富的工具來幫助你完成這一步,無論你使用的是 TensorFlow、PyTorch、或者 Caffe,都可以輕松完成轉換。
-
當你完成了模型的轉換,第二步就是編譯目標平臺的 TNN 引擎了,你可以根據自己的目標平臺的硬件支持情況,選擇 CPU/ARM/OpenCL/Metal 等加速方案。 對于這些平臺,TNN 都提供了一鍵編譯的腳本,使用非常方便。
-
最后一步就是使用編譯好的 TNN 引擎進行推理,你可以在自己的應用程序中嵌入對 TNN 的調用,這方面我們提供了豐富而詳實的 demo 來幫助你完成。
技術方案
目前TNN已經在手Q、微視、P圖等應用中落地:
-
計算優化
-
低精度優化
- 支持 INT8, FP16 低精度計算,減少模型大小、內存消耗,同時利用硬件低精度計算指令加速計算
- 支持 INT8 Winograd 算法,(輸入6bit), 在精度滿足要求的情況下,進一步降低模型計算復雜度
- 支持單模型多種精度混合計算,加速計算同時保證模型精度
-
內存優化
- 高效”內存池”實現:通過 DAG 網絡計算圖分析,實現無計算依賴的節點間復用內存,降低 90% 內存資源消耗
- 跨模型內存復用:支持外部實時指定用于網絡內存,實現“多個模型,單份內存”。
-
主流模型實測性能:v0.1 2020.05.29
-
model cpu time(單線程,ms) gpu time(ms) Mobilenet_v1 88 12 Mobilenet_v1_int8 55 ? Mobilenet_v2 58 11 Mobilenet_v2_int8 41 ? squeezenet_v1.0 127 20 squeezenet_v1.0_int8 82 ? -
驍龍835:
model cpu time(單線程,ms) gpu time(ms) Mobilenet_v1 94 16 Mobilenet_v1_int8 62 ? Mobilenet_v2 61 14 Mobilenet_v2_int8 47 ? squeezenet_v1.0 122 28 squeezenet_v1.0_int8 93 ? -
model cpu time(單線程,ms) gpu time(ms) Mobilenet_v1 60 10 Mobilenet_v1_int8 37 ? Mobilenet_v2 39 8 Mobilenet_v2_int8 28 ? squeezenet_v1.0 74 14 squeezenet_v1.0_int8 56 ?
-
-
TNN架構圖:
?
-
通過 ONNX 支持 TensorFlow, PyTorch, MXNet, Caffe 等多種訓練框架,充分利用和融入不斷完善的 ONNX 開源生態。當前支持 ONNX 算子55個,近期會完善到約80個,覆蓋主流CNN網絡
-
支持主流安卓、iOS、Embedded Linux 操作系統,支持 ARM CPU, GPU 硬件平臺(近期還會加入達芬奇 NPU 支持)
-
模塊化設計,將模型解析、計算圖構建、優化、底層硬件適配、高性能 kernel 實現各部分抽象隔離,通過 Factory Mode 注冊、構建設備,方便接入更多的底層硬件、加速方案。
-
Runtime 無任何第三方庫依賴,CPU 動態庫尺寸僅約 400KB,并提供基礎圖像變換操作,調用簡單便捷。跨平臺模型統一、調用接口統一,通過單個配置參數快速切換。
- 納米框架Esp32開源分享
- 開源霧計算軟件框架FogLAMP介紹(二):FogLAMP介紹
- 開源霧計算軟件框架FogLAMP介紹(三):FogLAMP架構分析
- 移動端基于GPU推理的神經網絡推理框架
- 端側softmax推理的數學等價優化
- 開源網絡協議分析器WireShark軟件下載 15次下載
- 跨媒體數據分析與推理技術綜述 15次下載
- 一種基于框架特征的共指消解方法 7次下載
- 如何使用物聯網操作系統Zephyr實現“連續集成”開源軟件的詳細說明
- 基于改進模糊熵和證據推理的多屬性決策方法 1次下載
- 網絡資源分配框架的軟件設計和應用 10次下載
- 移動機器人軟件框架構思詳細資料免費下載 11次下載
- AN1292與電機控制應用程序框架對比 2次下載
- 達芬奇軟件框架技術融入共享內存技術進行數據交換的改進中文概述 4次下載
- 從ResearchKit應用探討移動醫療的發展 0次下載
- SemiDrive X9 AI 開發環境搭建 175次閱讀
- Torch TensorRT是一個優化PyTorch模型推理性能的工具 1018次閱讀
- 介紹一款基于昆侖芯AI加速卡的高效模型推理部署框架 1460次閱讀
- 全平臺系統開源免費抓包軟件ProxyPin概述 1724次閱讀
- 三種主流模型部署框架YOLOv8推理演示 2365次閱讀
- 騰訊開源的前端框架介紹 1813次閱讀
- PyTorch開源深度學習框架簡介 4235次閱讀
- 編寫機智云安卓開源框架的UI界面 1626次閱讀
- 移植開源Gui框架GuiLite到STM32F4OLED屏幕 3334次閱讀
- 谷歌重新定義開源軟件漏洞治理框架 2657次閱讀
- Facebook與CMU聯手打造開源框架PyRobot 3746次閱讀
- NASA的開源軟件是什么?NASA的開源軟件的詳細分析 7186次閱讀
- TensorFlow的框架結構解析 7032次閱讀
- 將TVM用于移動端常見的ARM GPU,提高移動設備對深度學習的支持能力 1w次閱讀
- 紅帽推出Ansible 2.2 :為開源自動化框架奠定牢靠的基礎 984次閱讀
下載排行
本周
- 1山景DSP芯片AP8248A2數據手冊
- 1.06 MB | 532次下載 | 免費
- 2RK3399完整板原理圖(支持平板,盒子VR)
- 3.28 MB | 339次下載 | 免費
- 3TC358743XBG評估板參考手冊
- 1.36 MB | 330次下載 | 免費
- 4DFM軟件使用教程
- 0.84 MB | 295次下載 | 免費
- 5元宇宙深度解析—未來的未來-風口還是泡沫
- 6.40 MB | 227次下載 | 免費
- 6迪文DGUS開發指南
- 31.67 MB | 194次下載 | 免費
- 7元宇宙底層硬件系列報告
- 13.42 MB | 182次下載 | 免費
- 8FP5207XR-G1中文應用手冊
- 1.09 MB | 178次下載 | 免費
本月
- 1OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234315次下載 | 免費
- 2555集成電路應用800例(新編版)
- 0.00 MB | 33566次下載 | 免費
- 3接口電路圖大全
- 未知 | 30323次下載 | 免費
- 4開關電源設計實例指南
- 未知 | 21549次下載 | 免費
- 5電氣工程師手冊免費下載(新編第二版pdf電子書)
- 0.00 MB | 15349次下載 | 免費
- 6數字電路基礎pdf(下載)
- 未知 | 13750次下載 | 免費
- 7電子制作實例集錦 下載
- 未知 | 8113次下載 | 免費
- 8《LED驅動電路設計》 溫德爾著
- 0.00 MB | 6656次下載 | 免費
總榜
- 1matlab軟件下載入口
- 未知 | 935054次下載 | 免費
- 2protel99se軟件下載(可英文版轉中文版)
- 78.1 MB | 537798次下載 | 免費
- 3MATLAB 7.1 下載 (含軟件介紹)
- 未知 | 420027次下載 | 免費
- 4OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234315次下載 | 免費
- 5Altium DXP2002下載入口
- 未知 | 233046次下載 | 免費
- 6電路仿真軟件multisim 10.0免費下載
- 340992 | 191187次下載 | 免費
- 7十天學會AVR單片機與C語言視頻教程 下載
- 158M | 183279次下載 | 免費
- 8proe5.0野火版下載(中文版免費下載)
- 未知 | 138040次下載 | 免費
評論
查看更多