在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

使用開源Glow編譯器優化神經網絡加速邊緣計算的機器學習能力

電子設計 ? 來源:賢集網 ? 作者:IOT感應者 ? 2021-03-01 14:31 ? 次閱讀

機器學習深度學習技術如何快速發展,這為需要尋求方法來優化運行在具有功耗,處理和內存限制的微型邊緣設備上,進行ML應用程序的開發人員帶來了新的挑戰。

易于使用的開源開發工具,將簡化在嵌入式平臺上創建ML /深度學習項目的過程。

正文:

物聯網IoT)已將數十億臺互聯設備帶入到我們的家庭、汽車、辦公室、醫院、工廠和城市中。物聯網先驅者設想了龐大的無線傳感器節點網絡,這些網絡將數萬億字節的數據傳輸到云中進行聚合、分析和決策。但是,近年來,基于物聯網的,基于云的智能愿景正在被一種新的模式所取代:邊緣智能。

利用機器學習(ML)技術的最新進展,嵌入式開發人員正在將人工智能AI)的功能擴展到更靠近網絡邊緣的地方。當今的低功耗IoT設備現在能夠在本地運行復雜的ML和深度學習算法,而無需云連接,從而最大程度地減少了對延遲,性能,安全性和隱私性的擔憂。新興的ML /神經網絡邊緣應用包括智能個人助理、工廠機器人、聯網汽車中的語音和面部識別、支持AI的家庭安全攝像頭以及對白色家電和工業設備的預測性維護。

機器學習市場正在迅速擴展,智能邊緣應用的用例正在呈指數增長。根據TIRIAS Research的調查,到2025年,將有98%的邊緣設備使用某種形式的機器學習。根據這些市場預測,到那時,預計將有18-25億的設備包括ML和深度學習功能。2021年初,隨著越來越多的嵌入式開發人員可以訪問精簡ML項目所需的低功耗設備、開發框架和軟件工具,ML /深度學習應用程序將成為主流。

適應主流開發人員需求的ML Dev環境

直到最近,ML開發環境仍主要用于支持在ML和深度學習應用程序方面具有豐富專業知識的開發人員。但是,為了大規模地加速ML應用程序的開發,必須使ML支持變得更易于使用,并且對于主流的嵌入式開發人員來說,其支持范圍越來越廣。

與經典的基于云的AI系統相比,ML的出現相對較新,具有獨特的需求。嵌入式設計的IC,電源和系統級資源受到更多限制,需要新的和不同的軟件工具。ML開發人員還為智能邊緣應用程序設計了全新的開發流程,包括模型訓練,目標設備上的推理引擎部署以及系統集成的其他方面。

在對ML模型進行訓練,優化和量化之后,下一階段的開發涉及將模型部署在目標設備(例如MCU或應用處理器)上,并允許其執行推理功能。

在進一步介紹之前,讓我們仔細研究一下用于ML應用程序的新型目標設備:跨界微控制器(MCU)。術語“分頻器(Crossover)”是指結合了基于應用處理器的性能、功能,但具有易用性,低功耗和實時操作且具有MCU的中斷和低延遲等特點。典型的Crossover MCU,例如NXP的i.MX RT系列設備,包含一個Arm Cortex-M內核,其運行速度為300 MHz至1 GHz。這些MCU具有足夠的處理性能以支持ML推理引擎,從而無需額外的ML加速,以及功耗受限的邊緣應用所需的低功耗。

理想情況下,嵌入式開發人員可以使用全面的ML開發環境(包括軟件工具,應用程序示例和用戶指南)在目標設備上部署開源推論引擎。例如,恩智浦的eIQ環境為Arm NN,ONNX運行引擎,TensorFlow Lite和Glow神經網絡編譯器提供推理支持。開發人員可以遵循簡單的“自帶模型”(BYOM)流程,使他們能夠使用基于公共或私有云的工具來構建經過訓練的模型,然后將模型轉移到eIQ環境中,以為適當的芯片優化推理引擎。

如今,許多開發人員當前及將來的嵌入式項目都需要ML和深度學習工具和技術。同樣,對于這些開發人員中的大多數,ML必須變得更加全面并且易于使用。全面的支持包括端到端的工作流程,使開發人員能夠導入他們的訓練數據,為他們的應用選擇最佳模型,訓練模型,執行優化和量化,完成目標配置文件,然后進行最終生產。

對于大多數主流開發人員來說,易用性意味著可以訪問簡化的,優化的用戶界面,這些界面隱藏了底層細節并管理ML開發過程的復雜性。理想的用戶界面允許開發人員勾選一些選項,然后輕松導入訓練數據并將模型部署在目標設備上。

可用于幫助開發人員構建和部署ML應用程序和神經網絡模型的處理平臺,框架,工具和其他資源的數量正在不斷增加。讓我們研究幾種開發工具和框架,以及它們如何幫助開發人員簡化ML開發項目。

使用機器學習工具套件簡化工作流程

Au-Zone Technologies的DeepView ML工具套件是直觀的圖形用戶界面(GUI)和工作流程的一個很好的示例。它使從嵌入式設計人員到數據科學家再到ML專家的所有技能水平的開發人員,都可以導入數據集和神經網絡模型,然后在各種目標設備上訓練和部署這些模型和工作負載。



恩智浦最近增強了其eIQ開發環境,使其包括DeepView工具套件,以幫助開發人員簡化其ML項目(圖1)。新的eIQ ML工作流程工具為開發人員提供了高級功能,可以在NXP器件上進行修剪,量化,驗證和部署公共或專有神經網絡模型。目標上的圖形級概要分析功能為開發人員提供了運行時見解,以優化神經網絡模型架構,系統參數和運行時性能。

2. Glow編譯器使用計算圖為ML應用程序生成優化的機器代碼。

像Glow編譯器這樣的ML工具可以簡化ML /神經網絡開發,并增強低功耗MCU的邊緣處理性能。 GitHub上的Glow的現成標準版本與設備無關,使開發人員可以靈活地為領先的處理器架構(包括基于Arm Cortex-A和Cortex-M內核的架構)編譯神經網絡模型。

為了幫助簡化ML項目,恩智浦將Glow與eIQ開發環境及其MCUXpresso SDK集成在一起。它將Glow編譯器和量化工具組合到易于使用的安裝程序中,并附有詳細的文檔以幫助開發人員快速運行其模型。這種經過優化的Glow實施針對Arm Cortex-M內核和Cadence Tensilica HiFi 4 DSP,并為i.MX RT系列MCU提供了特定于平臺的優化。

恩智浦使用CIFAR-10數據集作為神經網絡模型基準,最近測試了i.MX RT1060 MCU,以評估不同Glow編譯器版本之間的性能差異。恩智浦還在i.MX RT685 MCU上進行了測試,i.MX RT685 MCU是目前唯一具有針對處理神經網絡操作員進行了優化的集成DSP的i.MX RT系列設備。

i.MX RT1060包含600 MHz Arm Cortex-M7、1 MB SRAM,以及針對實時應用優化的功能,例如高速GPIO,CAN-FD和同步并行NAND / NOR / PSRAM控制器。 i.MX RT685包含一個600 MHz的Cadence Tensilica HiFi 4 DSP內核,一個300 MHz的Arm Cortex-M33內核和4.5 MB的片上SRAM,以及與安全相關的功能。

恩智浦的Glow實施與Cadence的神經網絡庫NNLib緊密結合。盡管RT685 MCU的HiFi 4 DSP內核旨在增強語音處理能力,但與NNLib庫一起用作Glow的LLVM后端時,它也能夠加速各種神經網絡。盡管NNLib與CMSIS-NN類似,但它提供了一組針對HiFi4 DSP優化的更全面的手動調諧運算符。基于相同的CIFAR-10基準示例,與標準的Glow編譯器實現相比,HiFi4 DSP將神經網絡操作的性能提高了25倍。

使用PyTorch進行基于MCU的ML開發

PyTorch是一個開放源代碼的機器學習框架,主要由Facebook的AI研究實驗室開發,并基于Torch庫,已被開發人員廣泛用于創建ML /深度學習項目和產品。PyTorch是MCU目標的不錯選擇,因為它對處理平臺的限制極小,并且能夠生成ONNX模型,該模型可以由Glow進行編譯。

由于開發人員可以通過PyTorch直接訪問Glow,因此他們可以在同一開發環境中構建和編譯模型,從而省去了步驟并簡化了編譯過程。開發人員還可以直接從Python腳本生成捆綁包,而無需先生成ONNX模型。

直到最近,ONNX和Caffe2還是Glow支持的唯一輸入模型格式。 PyTorch現在可以將模型直接導出為ONNX格式以供使用。由于以其他格式(例如TensorFlow)創建了許多知名模型,因此可以使用

開源模型轉換工具將其轉換為ONNX格式。流行的格式轉換工具包括MMdnn和tf2onnx,MMdnn是Microsoft支持的工具集,可幫助用戶在不同的深度學習框架之間進行互操作;tf2onnx用于將TensorFlow模型轉換為ONNX。

結論

機器學習和深度學習技術繼續快速發展。同時,我們看到能夠運行ML /深度學習算法并無需云干預就能做出自主決策的IoT和其他邊緣設備的強勁市場勢頭。盡管將信息從云遷移到網絡邊緣是不可阻擋的趨勢,但隨著開發人員尋求優化ML應用程序以使其在具有功耗,處理和內存約束的微型邊緣設備上運行的方法,挑戰也隨之而來。

正如建筑師和建筑商需要專門的工具來建造未來的房屋和城市一樣,主流開發商也需要優化,易于使用的軟件工具和框架,以簡化在嵌入式平臺上創建ML /深度學習項目的過程。 DeepView ML工具套件,Glow ML編譯器和PyTorch框架例證了不斷增長的開發資源浪潮,這些資源將幫助嵌入式開發人員創建下一代智能邊緣應用程序。

編輯:hfy

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 神經網絡
    +關注

    關注

    42

    文章

    4776

    瀏覽量

    100952
  • 物聯網
    +關注

    關注

    2911

    文章

    44826

    瀏覽量

    375146
  • 機器學習
    +關注

    關注

    66

    文章

    8428

    瀏覽量

    132837
  • 深度學習
    +關注

    關注

    73

    文章

    5510

    瀏覽量

    121338
  • pytorch
    +關注

    關注

    2

    文章

    808

    瀏覽量

    13283
收藏 人收藏

    評論

    相關推薦

    FPGA芯片用于神經網絡算法優化的設計實現方案

    前言 AI芯片(這里只談FPGA芯片用于神經網絡加速)的優化主要有三個方面:算法優化,編譯器優化
    的頭像 發表于 09-29 11:36 ?4954次閱讀
    FPGA芯片用于<b class='flag-5'>神經網絡</b>算法<b class='flag-5'>優化</b>的設計實現方案

    使用稀疏計算和Facebook Glow進行神經網絡優化

      修剪神經網絡正迅速成為神經網絡開發人員的一種常見做法,因為他們試圖在不犧牲準確性的情況下提高性能。與此同時,Facebook Glow 正在解決處理碎片化問題,以免阻礙人工智能的
    發表于 07-06 14:37 ?957次閱讀
    使用稀疏<b class='flag-5'>計算</b>和Facebook <b class='flag-5'>Glow</b>進行<b class='flag-5'>神經網絡</b><b class='flag-5'>優化</b>

    Glow神經網絡編譯器首次應用于MCU,面向邊緣機器學習

    率先開發PyTorch的Facebook推出了開源社區項目Glow(Graph Lowering神經網絡編譯器),其目的是提供優化,提高一系
    發表于 08-05 14:32 ?1632次閱讀

    粒子群優化模糊神經網絡在語音識別中的應用

    一定的早熟收斂問題,引入一種自適應動態改變慣性因子的PSO算法,使算法具有較強的全局搜索能力.將此算法訓練的模糊神經網絡應用于語音識別中,結果表明,與BP算法相比,粒子群優化的模糊神經網絡
    發表于 05-06 09:05

    超低功耗FPGA解決方案助力機器學習

    IoT應用。通過提供結合了靈活、超低功耗FPGA硬件和軟件解決方案、功能全面的機器學習推理技術,Lattice sensAI將加速網絡邊緣
    發表于 05-23 15:31

    發布MCU上跑的輕量神經網絡包 NNoM, 讓MCU也神經一把

    神經網絡包。AIoT那么火,為何大家卻止步于科普文?因為現成的機器學習框架都太復雜太難用。NNoM從一開始就被設計成提供給嵌入式大佬們的一個簡單易用的神經網絡框架。你不需要會Tens
    發表于 05-01 19:03

    機器學習神經網絡參數的代價函數

    吳恩達機器學習筆記之神經網絡參數的反向傳播算法
    發表于 05-22 15:11

    ETPU-Z2全可編程神經網絡開發平臺

    )EEP-TPU算法編譯神經網絡算法的開發工作通常在X86架構的服務上完成,而EEP-TPU則是一種與X86完全不同的計算架構。因此,上述訓練所得的神經網絡結構和權重參數文件,需要按
    發表于 05-18 17:13

    基于帶NNIE神經網絡海思3559A方案邊緣計算主板開發及接口定義

    (4GB/8GB可選) ,eMMC(8GB/16GB/32GB/64GB/128GB可選)-雙核NNIE@840MHz 神經網絡加速引擎-四核 DSP@700MHz,32K I-Cache /32K
    發表于 06-20 11:32

    如何構建神經網絡?

    原文鏈接:http://tecdat.cn/?p=5725 神經網絡是一種基于現有數據創建預測的計算系統。如何構建神經網絡?神經網絡包括:輸入層:根據現有數據獲取輸入的層隱藏層:使用反
    發表于 07-12 08:02

    邊緣計算的相關資料推薦

    面向邊緣計算的嵌入式FPGA平臺卷積神經網絡的構建 通過設計卷積神經網絡函數中的網絡層間可復用的加速器
    發表于 12-23 07:26

    恩智浦eIQ? Neutron神經處理單元

    的支持。將恩智浦開發的硬件加速和軟件支持相結合,用戶能夠利用恩智浦邊緣處理產品組合的優勢,并保證即使在部署了設備并投入實地使用之后,也能更高效地支持新興機器學習
    發表于 02-17 13:51

    卷積神經網絡簡介:什么是機器學習

    抽象人工智能 (AI) 的世界正在迅速發展,人工智能越來越多地支持以前無法實現或非常難以實現的應用程序。本系列文章解釋了卷積神經網絡 (CNN) 及其在 AI 系統中機器學習中的重要性。CNN 是從
    發表于 02-23 20:11

    基于神經網絡優化計算實驗

    掌握連續Hopfield神經網絡的結構和運行機制,理解連續Hopfield神經網絡用于優化計算的基本原理,掌握連續Hopfield神經網絡
    發表于 05-31 17:02 ?43次下載

    什么是神經網絡加速器?它有哪些特點?

    神經網絡加速器是一種專門設計用于提高神經網絡計算效率的硬件設備。隨著深度學習技術的快速發展和廣泛應用,
    的頭像 發表于 07-11 10:40 ?540次閱讀
    主站蜘蛛池模板: 狠狠色噜噜狠狠狠狠| 欧美性极品xxxxx| 四虎影院网址大全| 亚洲欧美在线一区| 亚洲综合在线一区| www.av免费| 亚洲天堂不卡| 美女视频黄a全部免费看小说 | 欧美日韩生活片| 亚欧成人乱码一区二区| 激情久久婷婷| 69日本xxxxxxxxx19| 性满足久久久久久久久| 插久久| 精品亚洲大全| 婷婷 色天使| 正在播放欧美| 一区二区三区高清不卡| 久久国产精品免费看| 亚洲成人毛片| 伊人啪啪| 亚洲va久久久久综合| 四虎影院在线免费观看| 你懂得福利| 久久夜色精品国产噜噜小说| 欧美三级日韩三级| 韩剧天堂| 天天操天天射天天操| 天天色综合3| 天天爱天天做色综合| 国产精品久久久久久久午夜片| 分分精品| 亚洲国产成人久久| 婷婷综合激情| 四虎影院美女| 精品国产乱码一区二区三区| 经典三级第一页| 天天曰天天爽| 久久久黄色片| 深点再深一点好爽好多水| 黄网站免费视频|