在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

【全志R329-NPU助力】Maix-Speech為嵌入式環境設計的離線語音庫

深圳全志在線有限公司 ? 2022-03-28 10:11 ? 次閱讀

Maix-Speech是專為嵌入式環境設計的離線語音庫,設計目標包括:ASR/TTS/CHAT

作者的設計初衷是完成一個低至Cortex-A7 1.0GHz 單核下可以實時運行的ASR庫。

目前市面上的離線語音庫非常稀缺,即使有也對主控要求很高,Maix-Speech 針對語音識別算法進行了深度優化,在內存占用上達到了數量級上的領先,并且保持了優良的WER。

基本情況

Maix-Speech剛發布了一個面向嵌入式設備的離線語音識別庫,可以在低至Coretx-A7 1.0GHz, 64MB系統內存的嵌入式設備上實時運行(RTF<1.0)

最低內存占用25MB,磁盤占用35MB(含語言模型);最優aishell wer約5.4%;支持流式識別,支持連續數字識別,關鍵詞識別,連續大詞表語音識別等

支持:x86_64, armv7, aarch64, riscv64 等多種硬件平臺,支持 AWNN, Zhouyi AIPU 加速。

感興趣的可以跳轉githuib來點個贊。

鏈接:https://github.com/sipeed/Maix-Speech

Maix-Speech 的優勢

  • 多平臺支持

Maix-Speech 支持多種嵌入式平臺

poYBAGJBEv-AAn0RAAA5SHaXm9M760.png
  • 極低的內存要求和優良的正確率

Maix-Speech的內存占用相對于市面上的其他語音識別框架有數量級上的領先優勢,并且保持良好的WER水平。

Maix-Speech最低可以實時運行(RTF<1)于典型的 1.0GHz Cortex-A7 內核的芯片上,并且最低僅占用25MB左右內存, 也就意味著它可以實時運行在典型的內封64MB內存的A7芯片上。

pYYBAGJBEv-AawkPAABEpQ_rkGQ552.png常見離線語音識別工具對比

  • 細節優化

優化了openfst及wfst解碼,使得整個解碼圖無需載入內存即可實時讀取解碼。

可選載入內存的LG.fst解碼圖,壓縮為lg.sfst, 尺寸為原始fst的1/3左右,占用內存為kaldi載入相同fst的內存占用的 1/20左右(kaldi需要6.5倍左右內存載入fst文件)。

使用新的sMBR等效的方式(無需修改loss)進行鑒別性訓練,提升流式識別的準確率

效果展示

在全志 R329 上的運行效果,視頻中板卡為 MaixSense

pYYBAGJBEwCAd8D9AAB3m7HpMZI612.jpg連續大詞匯量語音識別(LVCSR)

poYBAGJBEwCAHls7AABssf99_54766.jpg連續中文數字識別 (DIGIT)

poYBAGJBEv-ALtHhAABtclcQc4Q595.jpg關鍵詞識別(KWS)

Maix-Speech 工程結構

├── assets
│   └── test_files                # 提供的測試文件,方便上手測試
├── components                     # 組件
│   ├── asr_lib                   # 組件 asr_lib
│   │   ├── CMakeLists.txt       # 組件配置文件
│   │   ├── include              # 頭文件
│   │   ├── Kconfig              # 組件 menuconfig 配置文件
│   │   ├── lib                  # 各個平臺的庫文件
│   │   └── src                  # 源文件
│   └── utils                     # 工具類組件,包括了跑分、字體等
├── Kconfig                       # 最頂級的 menuconfig 配置文件
├── LICENSE                       # 開源協議(證書)
├── projects                      # 工程
│   └── maix_asr                 # ASR 工程
│       ├── CMakeLists.txt       # 工程配置文件
│       ├── main                 # 工程里面的主組件
│       └── project.py           # 構建腳本,方便輸入命令
├── README.md                     # 項目首頁英文文檔
├── README_ZH.md                  # 項目首頁中文文檔
├── tools                         # 項目構建相關代碼,一般不用看
└── usage_zh.md                   # 使用方法

構建代碼

項目支持多平臺, 不同的平臺使用的工具鏈和庫可能有差異,注意區別。

PC環境的推薦系統為 Ubuntu 18.04 以上,gcc 7.5 以上,CMake 3.20以上,失能conda虛擬環境。其他環境可能有部分軟件需要額外設置,不建議新手使用。

其他嵌入式環境的交叉編譯方式可能存在一些細節使用問題,商業用戶可以聯系support@sipeed.com 獲取支持。

  • 環境準備

首先電腦安裝工具鏈和庫(Ubuntu 為例)

sudo apt update

sudo apt install git python3 cmake

python 只是用在編譯腳本上的,方便簡單地輸入編譯命令, 如果你電腦里有任何一個版本的 python 都是可以的, 為確保不出問題最好是Python3。如果實在不想裝 python , 也可以手動使用 cmake 命令進行編譯。

x86 (Linux) 或 在跑在其它架構的系統里編譯,比如在R329或樹莓派的系統里使用GCC編譯 安裝工具鏈和庫(Ubuntu為例)。

sudo apt install build-essential libasound2-dev

交叉編譯 下載工具鏈,并解壓到指定文件夾 比如R329, 從 realease 下載 r329_toolchain.tar.gz, 并解壓到一個路徑,比如 /opt/r329_toolchain 比如 v83x, 在這里找到工具鏈下載鏈接并下載工具鏈,解壓到一個文件夾,比如/opt/toolchain-sunxi-musl

poYBAGJBEwCAL0MfAAAtpxZ8oRY466.png
  • 克隆代碼

git clone https://github.com/sipeed/Maix-Speech

  • 編譯

x86(Linux)或在跑在其它架構的系統里編譯,比如在R329或 樹莓派 的系統里使用GCC編譯

注意,conda 環境下工具鏈可能有問題,如果出現錯誤可以先嘗試 退出conda環境使用原生環境編譯。


cd projects/maix_asr
python project.py clean_conf    # 清除工具鏈配置
python project.py menuconfig    # 配置選擇芯片架構(ARCH),默認是 x86
python project.py build#python project.py rebuild          # 如果有新建文件需要使用 rebuild
# python project.py build --verbose # 打印詳細構建過程

./build/maix_asr                # 測試下運行可執行文件,可以執行即可

python project.py clean         # 清除構建內容
python project.py distclean     # 徹底清除構建內容, 包括 menuconfig 內容
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 語音識別
    +關注

    關注

    38

    文章

    1742

    瀏覽量

    112700
  • 全志
    +關注

    關注

    24

    文章

    249

    瀏覽量

    53162
收藏 人收藏

    評論

    相關推薦

    HAL嵌入式系統中的應用

    HAL(Hardware Abstraction Layer Library,硬件抽象層)在嵌入式系統中扮演著至關重要的角色。以下是HAL
    的頭像 發表于 12-02 11:32 ?645次閱讀

    科技亮相飛凌嵌入式技術創新日

    近日,工業領域板卡廠商“飛凌嵌入式”在上海舉行技術創新日。科技工業車載事業部副總經理皮杰勇和工業產品總監劉海軍受邀出席,并進行了主題為《志在工業領域的解決方案與技術應用》的分享。
    的頭像 發表于 11-05 14:11 ?304次閱讀

    如何在低成本ARM平臺部署LVGL免費圖形,基于T113-i

    ,適合資源受限的嵌入式系統,即使在低性能硬件上也能流暢運行復雜的圖形界面,用戶可以根據需要定制界面風格和布局。 LVGL案例演示 本文主要介紹創龍科技TLT113-EVM工業評估板(基于
    發表于 10-29 09:55

    T507-H國產平臺Ubuntu系統正式發布,讓您的應用開發更便捷!

    系統上,可以方便地安裝Qt、Qt Creator以及相關的嵌入式開發工具,進行嵌入式GUI應用的開發。 圖 2 T507-H典型應用領域 圖 3 T507-H典型應用領域 Ubuntu系統啟動演示
    發表于 10-29 09:39

    基于T113-i多核異構處理器的全國產嵌入式核心板簡介

    一、嵌入式核心板產品介紹 基于公司的T113-i處理器精心設計的多核異構處理器、工業級ECK30-T13IA系列嵌入式核心板,采用郵票孔連接的低成本、低功耗、高性價比、高可靠性的全
    的頭像 發表于 10-25 13:40 ?370次閱讀

    目前深圳嵌入式單片機就業環境如何?

    深圳作為中國的科技創新中心之一,在嵌入式單片機領域的就業環境相對較好,以下是對該就業環境的詳細分析:
    的頭像 發表于 10-09 11:51 ?506次閱讀
    目前深圳<b class='flag-5'>嵌入式</b>單片機就業<b class='flag-5'>環境</b>如何?

    嵌入式系統的未來趨勢有哪些?

    智能家居領域,嵌入式系統可以集成語音識別和自然語言處理技術,去實現智能家電的語音控制。 2. 更強大的處理能力 在未來的嵌入式系統將具備更加強大的處理能力,以滿足日益變得復雜的計算需求
    發表于 09-12 15:42

    一種常用嵌入式開發代碼

    使用開源協議:GPL-2.0varch簡介varch(we-architecture,意為我們的框架)是嵌入式C語言常用代碼模塊,包含了嵌入式中常用的算法庫,數據結構(容器)
    的頭像 發表于 09-04 08:06 ?490次閱讀
    一種常用<b class='flag-5'>嵌入式</b>開發代碼<b class='flag-5'>庫</b>

    七大嵌入式GUI盤點

    嵌入式圖形用戶界面(GUI)是一種嵌入式系統設計的用戶界面,它可以讓用戶通過圖形化的方式與設備進行交互。以下是對七種嵌入式 GUI 的盤點。 emWin 由德國SEGGER公司
    發表于 09-02 10:58

    ARMxy ARM嵌入式計算機搭載 1 TOPS NPU支持深度學習

    ARMxy ARM嵌入式計算機BL410系列內置了1TOPS算力 NPU,它每秒可以執行高達一萬億次的浮點運算,這復雜的圖像處理和深度學習任務提供了充足的計算資源。在產品缺陷檢測領域,ARMxy ARM
    的頭像 發表于 08-20 11:53 ?376次閱讀
    ARMxy ARM<b class='flag-5'>嵌入式</b>計算機搭載 1 TOPS <b class='flag-5'>NPU</b>支持深度學習

    EVASH Ultra EEPROM:助力ChatGPT等AI應用的嵌入式存儲解決方案

    EVASH Ultra EEPROM:助力ChatGPT等AI應用的嵌入式存儲解決方案
    的頭像 發表于 06-26 18:13 ?925次閱讀

    現場直擊 | 飛凌嵌入式亮相2024上海國際嵌入式

    6月12日,2024上海國際嵌入式展(embedded world China 2024)在上海世博展覽館開幕。飛凌嵌入式不僅展出了基于NXP、TI和瑞薩等國際廠商芯片打造的嵌入式核心板及開發板產品,還帶來了依托瑞芯微、
    的頭像 發表于 06-13 14:13 ?1017次閱讀
    現場直擊 | 飛凌<b class='flag-5'>嵌入式</b>亮相2024上海國際<b class='flag-5'>嵌入式</b>展

    R329開發板點燈教程

    timer > sunxi_led0r/trigger 如果你看到燈亮了,那么恭喜你,它將照亮你嵌入式開發學習的路。 LED燈陣列操作、模塊配置、源碼結構、內外部接口等進階操作請見開發
    發表于 02-19 10:22

    恩智浦發布新一代智能語音技術組合的語音識別引擎

    恩智浦發布新一代智能語音技術組合的語音識別引擎。本文將探討開發人員在嵌入式語音控制設計中面臨的挑戰、恩智浦新的Speech to Inten
    的頭像 發表于 01-26 09:15 ?776次閱讀
    恩智浦發布新一代智能<b class='flag-5'>語音</b>技術組合的<b class='flag-5'>語音</b>識別引擎

    V853 NPU開發之工具安裝

    V853支持最高1T NPU算力,在進行NPU相關開發前,需要先配置NPU開發環境。 Linux系統準備NPU開發
    發表于 01-08 09:50
    主站蜘蛛池模板: 免费福利片2022潦草影视午夜| 特黄特级高清免费视频毛片| 丁香九月婷婷| 色视视频| 色噜噜狠狠成人中文小说| 色综合视频在线观看| 一级爱片| 色偷偷91久久综合噜噜噜噜| 欧洲人体超大胆露私视频| 四虎.com| 亚洲成人网在线观看| 97色噜噜| 久久国产精品免费看| 91大神在线观看精品一区| 国产综合在线视频| 欧美成人26uuu欧美毛片| 亚洲午夜精品久久久久久成年| 国产欧美日韩综合精品无毒| bt天堂网www连接| 天天做天天爽爽快快| 91桃色国产线观看免费| 丁香婷婷综合五月综合色啪| 国模伊人| 狠狠色狠色综合曰曰| 一区二区三区午夜| 人人干干人人| 美女操网站| 亚洲国产片| 91激情网| 簧片视频在线观看| www操com| 操欧洲美女| 亚洲网站免费观看| 亚洲video| 久久综合五月婷婷| 国产亚洲人成网站天堂岛| 亚州怡红院| 不卡的毛片| 在线观看精品国产福利片100 | 国产成人精品亚洲日本在线| 天天干天天爱天天操|