資料介紹
描述
2020 年 6 月更新:DeepSpeech 0.7.* .Screenshots 的更新命令,除了 Raspberry Pi 4 保持不變。直到最近的問(wèn)題是缺乏用于該任務(wù)的簡(jiǎn)單、快速和準(zhǔn)確的引擎。大約一年前,當(dāng)我研究這個(gè)主題時(shí),當(dāng)你必須在樹(shù)莓派 3 上運(yùn)行 ASR(不僅僅是熱詞檢測(cè),還有大詞匯量轉(zhuǎn)錄)時(shí),有幾個(gè)選擇是:
- CMUS獅身人面像
- 卡爾迪
- 碧玉
鏈接:
還有其他幾個(gè)。它們都不容易設(shè)置,也不特別適合在資源受限的環(huán)境中運(yùn)行。因此,幾周前,我再次開(kāi)始研究這個(gè)領(lǐng)域,并在一些搜索中偶然發(fā)現(xiàn)了 Mozilla 的 DeepSpeech 引擎。它已經(jīng)存在了一段時(shí)間,但直到最近(2019 年 12 月)他們才發(fā)布了 0.6.0 版本的 ASR 引擎,其中包含 .tflite 模型以及其他重大改進(jìn)。它已將英文模型的大小從 188 MB 減少到 47 MB??。“帶有 TensorFlow Lite 的 DeepSpeech v0.6 在 Raspberry Pi 4 的單核上運(yùn)行速度比實(shí)時(shí)速度更快。”Mozilla 的 Reuben Morais 在新聞公告中聲稱(chēng). 所以我決定親自驗(yàn)證這一說(shuō)法,在不同的硬件上運(yùn)行一些基準(zhǔn)測(cè)試,并制作我自己的帶有熱詞檢測(cè)的音頻轉(zhuǎn)錄應(yīng)用程序。讓我們看看結(jié)果如何。
提示:我沒(méi)有失望。
。
?
curl -LO https://github.com/mozilla/STT/releases/download/v0.7.1/deepspeech-0.7.1-models.tflite
curl -LO https://github.com/mozilla/STT/releases/download/v0.7.1/deepspeech-0.7.1-models.pbmm
curl -LO https://github.com/mozilla/STT/releases/download/v0.7.1/deepspeech-0.7.1-models.scorer
下載示例音頻文件
curl -LO https://github.com/mozilla/STT/releases/download/v0.7.1/audio-0.7.1.tar.gz
tar xvf audio-0.7.1.tar.gz
樹(shù)莓派 4 運(yùn)行:
deepspeech --model deepspeech-0.7.*-models.tflite --scorer deepspeech-0.7.*-models.scorer --audio audio/2830-3980-0043.wav
如果成功,您應(yīng)該看到以下輸出
不錯(cuò)!1.975 秒的聲音文件為 1.529 秒。它比實(shí)時(shí)更快。
Nvidia Jetson Nano 運(yùn)行:
deepspeech --model deepspeech-0.7.*-models.tflite --scorer deepspeech-0.7.*-models.scorer --audio audio/2830-3980-0043.wav
嗯..比樹(shù)莓派慢一點(diǎn)。這是意料之中的,因?yàn)?Nvidia Jetson CPU 不如 Raspberry Pi 4 強(qiáng)大。到目前為止,還沒(méi)有用于 arm64 架構(gòu)的預(yù)構(gòu)建二進(jìn)制文件支持 GPU,因此我們無(wú)法利用 Nvidia Jetson Nano 的 GPU 進(jìn)行推理加速。我認(rèn)為這個(gè)任務(wù)不在 DeepSpeech 團(tuán)隊(duì)的路線圖上,所以在不久的將來(lái)我會(huì)在這里自己做一些研究,并嘗試編譯該二進(jìn)制文件,看看使用 GPU 可以實(shí)現(xiàn)哪些速度提升。但幾秒鐘的速度仍然相當(dāng)不錯(cuò),根據(jù)您的項(xiàng)目,您可能希望選擇在 CPU 上運(yùn)行 DeepSpeech 并讓 GPU 用于其他深度學(xué)習(xí)任務(wù)。
視窗 10/Linux
deepspeech --model deepspeech-0.7.*-models.tflite --scorer deepspeech-0.7.*-models.scorer --audio audio/2830-3980-0043.wav
或者如果使用啟用 GPU 的版本:
deepspeech --model deepspeech-0.7.*-models.pbmm --scorer deepspeech-0.7.*-models.scorer --audio audio/2830-3980-0043.wav
如您所見(jiàn),.tflite 模型在現(xiàn)代 CPU 系統(tǒng)上實(shí)現(xiàn)了亞實(shí)時(shí),這對(duì)于創(chuàng)建離線 ASR 應(yīng)用程序的人們來(lái)說(shuō)是個(gè)好消息。
以下是對(duì)比結(jié)果表:
好吧,我們對(duì)預(yù)先錄制的聲音樣本進(jìn)行了基準(zhǔn)測(cè)試,但我們真的想做一些實(shí)時(shí)轉(zhuǎn)錄。讓我們這樣做吧!
從https://github.com/mozilla/DeepSpeech-examples下載 DeepSpeech 示例
導(dǎo)航到 mic_vad_streaming 并安裝依賴(lài)項(xiàng)
pip3 install -r requirements.txt
sudo apt install portaudio19-dev
將麥克風(fēng)連接到您的系統(tǒng)(我使用的是 Raspberry Pi 4 1 GB)。對(duì)于麥克風(fēng),盡管您可以使用任何麥克風(fēng),包括筆記本電腦的內(nèi)置麥克風(fēng),但聲音的質(zhì)量確實(shí)對(duì)結(jié)果有很大影響。對(duì)于這個(gè)演示,我使用的是 Seeed Studio 的ReSpeaker USB 麥克風(fēng)陣列。它支持 5m 遠(yuǎn)場(chǎng)拾音和 360° 拾音模式,并實(shí)現(xiàn)以下聲學(xué)算法:DOA(到達(dá)方向)、AEC(自動(dòng)回聲消除)、AGC(自動(dòng)增益控制)、NS (噪音抑制)。
python3 ../DeepSpeech-examples/mic_vad_streaming/mic_vad_streaming.py --model deepspeech-0.7.*-models.tflite --scorer deepspeech-0.7.*-models.scorer
從包含模型的文件夾中執(zhí)行此命令。-v 參數(shù)允許您調(diào)整 VAD(語(yǔ)音活動(dòng)檢測(cè))的閾值。這是演示的結(jié)果。
好,太棒了!我們可以改進(jìn)嗎?是的。我們真的不希望我們的設(shè)備一直在轉(zhuǎn)錄對(duì)話(huà)。談?wù)撾[私噩夢(mèng)和浪費(fèi)電力。
。
- Raspberry Pi支持電視上的視頻通話(huà)
- 使用Google Coral和Raspberry Pi進(jìn)行ML鳥(niǎo)類(lèi)識(shí)別
- Raspberry Pi 4B+ IoT板上的并行計(jì)算變得簡(jiǎn)單
- Raspberry Pi Pico上的ADC采樣和FFT
- 使用Bittle和Raspberry Pi 4的ROS SLAM
- 用Raspberry Pi的視覺(jué)識(shí)別事物
- 帶Raspberry PI的紅外遙控器
- 使用Raspberry Pi 4和RFID模塊的考勤系統(tǒng)
- Raspberry Pi 0 W帶溫度傳感器和LCD
- Raspberry Pi和Arduino上的手寫(xiě)數(shù)字識(shí)別
- 適用于Raspberry Pi 4的Raspberry Pi Pico開(kāi)發(fā)板
- NRK330X語(yǔ)音識(shí)別芯片離線語(yǔ)音喚醒模塊資料說(shuō)明書(shū)!
- 樹(shù)莓派Raspberry Pi 4 Model B的電路原理圖免費(fèi)下載 409次下載
- 《愛(ài)上Raspberry Pi》中譯版-電子書(shū)籍.pdf 0次下載
- raspberry_pi各版本差別 0次下載
- 離線語(yǔ)音控制技術(shù)特點(diǎn) 230次閱讀
- 基于Raspberry Pi 5的蜂窩物聯(lián)網(wǎng)項(xiàng)目 1027次閱讀
- 使用Raspberry Pi Pico W和MicroPython開(kāi)發(fā)物聯(lián)網(wǎng)應(yīng)用 1673次閱讀
- 用于測(cè)試項(xiàng)目的4個(gè)最佳樹(shù)莓派Raspberry Pi模擬器 5985次閱讀
- 基于樹(shù)莓派產(chǎn)品 Raspberry Pi微控制器板的優(yōu)缺點(diǎn) 2710次閱讀
- 如何從Raspberry Pi Pico的模數(shù)轉(zhuǎn)換器捕獲數(shù)據(jù)計(jì)算? 2580次閱讀
- 基于Raspberry Pi Pico開(kāi)發(fā)先進(jìn)的家庭自動(dòng)化系統(tǒng) 2850次閱讀
- 基于FONA通過(guò)UART與Raspberry Pi進(jìn)行通訊的方案介紹 2122次閱讀
- 基于在Raspberry Pi Zero W的基礎(chǔ)上實(shí)現(xiàn)設(shè)計(jì)微型機(jī)器人 2106次閱讀
- 微雪電子ZeroW| Raspberry Pi ZeroW主板簡(jiǎn)介 2429次閱讀
- 微雪電子Raspberry Pi 3 Model主板簡(jiǎn)介 2873次閱讀
- 微雪電子Raspberry Pi 3 Model擴(kuò)展板簡(jiǎn)介 1512次閱讀
- 微雪電子樹(shù)莓派4代B|Raspberry Pi主板介紹 6116次閱讀
- 利用Raspberry Pi構(gòu)建存儲(chǔ)和虛擬化時(shí)間序列數(shù)據(jù) 884次閱讀
- 一文了解Raspberry Pi 4各項(xiàng)性能跑分 2.9w次閱讀
下載排行
本周
- 1山景DSP芯片AP8248A2數(shù)據(jù)手冊(cè)
- 1.06 MB | 532次下載 | 免費(fèi)
- 2RK3399完整板原理圖(支持平板,盒子VR)
- 3.28 MB | 339次下載 | 免費(fèi)
- 3TC358743XBG評(píng)估板參考手冊(cè)
- 1.36 MB | 330次下載 | 免費(fèi)
- 4DFM軟件使用教程
- 0.84 MB | 295次下載 | 免費(fèi)
- 5元宇宙深度解析—未來(lái)的未來(lái)-風(fēng)口還是泡沫
- 6.40 MB | 227次下載 | 免費(fèi)
- 6迪文DGUS開(kāi)發(fā)指南
- 31.67 MB | 194次下載 | 免費(fèi)
- 7元宇宙底層硬件系列報(bào)告
- 13.42 MB | 182次下載 | 免費(fèi)
- 8FP5207XR-G1中文應(yīng)用手冊(cè)
- 1.09 MB | 178次下載 | 免費(fèi)
本月
- 1OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234315次下載 | 免費(fèi)
- 2555集成電路應(yīng)用800例(新編版)
- 0.00 MB | 33566次下載 | 免費(fèi)
- 3接口電路圖大全
- 未知 | 30323次下載 | 免費(fèi)
- 4開(kāi)關(guān)電源設(shè)計(jì)實(shí)例指南
- 未知 | 21549次下載 | 免費(fèi)
- 5電氣工程師手冊(cè)免費(fèi)下載(新編第二版pdf電子書(shū))
- 0.00 MB | 15349次下載 | 免費(fèi)
- 6數(shù)字電路基礎(chǔ)pdf(下載)
- 未知 | 13750次下載 | 免費(fèi)
- 7電子制作實(shí)例集錦 下載
- 未知 | 8113次下載 | 免費(fèi)
- 8《LED驅(qū)動(dòng)電路設(shè)計(jì)》 溫德?tīng)栔?/a>
- 0.00 MB | 6656次下載 | 免費(fèi)
總榜
- 1matlab軟件下載入口
- 未知 | 935054次下載 | 免費(fèi)
- 2protel99se軟件下載(可英文版轉(zhuǎn)中文版)
- 78.1 MB | 537798次下載 | 免費(fèi)
- 3MATLAB 7.1 下載 (含軟件介紹)
- 未知 | 420027次下載 | 免費(fèi)
- 4OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234315次下載 | 免費(fèi)
- 5Altium DXP2002下載入口
- 未知 | 233046次下載 | 免費(fèi)
- 6電路仿真軟件multisim 10.0免費(fèi)下載
- 340992 | 191187次下載 | 免費(fèi)
- 7十天學(xué)會(huì)AVR單片機(jī)與C語(yǔ)言視頻教程 下載
- 158M | 183279次下載 | 免費(fèi)
- 8proe5.0野火版下載(中文版免費(fèi)下載)
- 未知 | 138040次下載 | 免費(fèi)
評(píng)論
查看更多