百度大腦遠場語音開發套件評測—快速上手，超贊語音交互體驗

作者:讓天涯

近年來,人工智能話題越來越熱,受到了更多人的關注。我也是大概在18年末開始接觸到百度AI社區,通過使用文字識別、圖像識別等百度AI技術,逐步感受到了AI技術的強大,同時也感覺到了百度AI技術的進步:AI技術領域范圍越來越廣泛,識別速度越來越快,識別準確度越來越高。這次,有幸收到百度遠場語音開發套件的測評邀請,作為一個非測試專業人員,這里我就自己的百度遠場語音開發套件使用過程及在使用過程中遇到的問題和大家分享一下,如有錯誤,請多多指教。

一、開箱

整個包裝很簡潔,就是一個白色的長方形盒子,正上方印著“百度大腦”標識。

打開盒子后,首先映入眼球的是一份“百度語音遠場開發套件說明書”,里面介紹了硬件購成、開發資料等信息。

拿出說明書,看到的是一個長方形的盒子,里面放著電源適配器、USB線。

拿出盒子后,便看到了百度遠場語音開發板主體了,被白色泡沫保護的很好。

接下來,一起具體看看遠場開發板的一些細節:

最后,看看百度遠場語音開發套件全家福:

百度大腦遠場語音開發套件,基于 RK3308 開發平臺打造,提供的麥克風選型適用于智能音箱、智能家電、車載設備場景,整個開發套件包含麥克風陣列板、開發板、喇叭以及符合聲學要求的腔體, 支持聲源定位、噪聲消除等信號處理算法,5 米內有效拾音,支持遠場喚醒、遠場識別、語音合成能力,使語音開發評估更簡便、更高效。

RK3308 開發平臺,采用 64 位 4 核 ARMCortex-A35 處理器 RK3308 系列,整合了高性能 CODEC(8 通道 ADC + 2 通道 DAC),直接支持最大 8 通道數字 MIC 陣列+回采,實現高精度聲音采集及分析,是一款集多種功能為一體針對音頻類應用的 AI+IoT 開發平臺。豐富的操作系統/服務支持,助力方便快速進行 AIOT 開發和產品應用。

關于百度遠場語音開發套件的更多介紹,可以到百度AI市場了解詳情,我在這里就不在做贅述。

二、開發測試

本次測試環境為Ubuntu 16.04 64ibt 虛擬機,開發平臺是RK3308。

登陸開發板后,可以進入/oem 目錄,里面有開發相關說明以及一些測試示例。

(一)連接設備

1、安置在 adb 環境:sudo apt install adb

snow@snow-machine:～$ sudo apt install adb

正在讀取軟件包列表... 完成

正在分析軟件包的依賴關系樹

正在讀取狀態信息... 完成

下列軟件包是自動安裝的并且現在不需要了:

snapd-login-service xdg-desktop-portal xdg-desktop-portal-gtk

使用'sudo apt autoremove'來卸載它(它們)。

將會同時安裝下列軟件:

android-libadb android-libbase android-libcutils android-liblog

下列【新】軟件包將被安裝:

adb android-libadb android-libbase android-libcutils android-liblog

升級了 0 個軟件包,新安裝了 5 個軟件包,要卸載 0 個軟件包,有 6 個軟件包未被升級。

需要下載 141 kB 的歸檔。

解壓縮后會消耗 428 kB 的額外空間。

您希望繼續執行嗎? [Y/n] y

獲取:1 http://cn.archive.ubuntu.com/ubuntu xenial/universe amd64 android-liblog amd64 1:6.0.1+r16-3 [16.6 kB]

獲取:2 http://cn.archive.ubuntu.com/ubuntu xenial/universe amd64 android-libbase amd64 1:6.0.1+r16-3 [9,014 B]

獲取:3 http://cn.archive.ubuntu.com/ubuntu xenial/universe amd64 android-libcutils amd64 1:6.0.1+r16-3 [18.7 kB]

獲取:4 http://cn.archive.ubuntu.com/ubuntu xenial/universe amd64 android-libadb amd64 1:6.0.1+r16-3 [53.2 kB]

獲取:5 http://cn.archive.ubuntu.com/ubuntu xenial/universe amd64 adb amd64 1:6.0.1+r16-3 [44.0 kB]

已下載 141 kB,耗時 2秒 (48.3 kB/s)

正在選中未選擇的軟件包 android-liblog。

(正在讀取數據庫 ... 系統當前共安裝有 215288 個文件和目錄。)

正準備解包 .../android-liblog_1%3a6.0.1+r16-3_amd64.deb ?...

正在解包 android-liblog (1:6.0.1+r16-3) ...

正在選中未選擇的軟件包 android-libbase。

正準備解包 .../android-libbase_1%3a6.0.1+r16-3_amd64.deb ?...

正在解包 android-libbase (1:6.0.1+r16-3) ...

正在選中未選擇的軟件包 android-libcutils。

正準備解包 .../android-libcutils_1%3a6.0.1+r16-3_amd64.deb ?...

正在解包 android-libcutils (1:6.0.1+r16-3) ...

正在選中未選擇的軟件包 android-libadb。

正準備解包 .../android-libadb_1%3a6.0.1+r16-3_amd64.deb ?...

正在解包 android-libadb (1:6.0.1+r16-3) ...

正在選中未選擇的軟件包 adb。

正準備解包 .../adb_1%3a6.0.1+r16-3_amd64.deb ?...

正在解包 adb (1:6.0.1+r16-3) ...

正在處理用于 libc-bin (2.23-0ubuntu11) 的觸發器 ...

正在處理用于 man-db (2.7.5-1) 的觸發器 ...

正在設置 android-liblog (1:6.0.1+r16-3) ...

正在設置 android-libbase (1:6.0.1+r16-3) ...

正在設置 android-libcutils (1:6.0.1+r16-3) ...

正在設置 android-libadb (1:6.0.1+r16-3) ...

正在設置 adb (1:6.0.1+r16-3) ...

正在處理用于 libc-bin (2.23-0ubuntu11) 的觸發器 ...

2、查看安裝結果:adb version

3、查看硬件是否連接:adb devices

4、連接硬件:adb shell

(二)WIFI連接

1、進入/data/cfg 進行wifi配置:cd /data/cfg

使用 vi 編輯 wpa_supplicant.conf:vi wpa_supplicant.conf

在設置好 wpa_supplicant.conf 后,可以通過如下命令來重新聯網:

注意:第一次操作,調用 wpa_cli reconfigure 命令出錯:

切換聯網命令:wpa_supplicant -B -i wlan0 -c

雖然顯示操作成功,但是查看網絡連接,發現還是未成功連接(可以看到wlan0并未顯示IP地址):

重啟系統(如果一次不行,可以進行多次重啟),最后成功了(可以看到wlan0顯示了分配的IP地址-192.168.1.110):

(三)運行語音識別示例

進入/oem目錄,查看語音能力相關文件: cd oem

查看文檔說明:cat readme.txt

根據文檔,相關文件應該在data目錄下,但是實際操作發現,相關文件在oem目錄下,故進入oem目錄,執行操作:

主要是運行以下四個命令(該命令是修改權限,啟動 alsa_audio_main_service服務,根據說明書,使用語音識別功能需要先啟動alsa服務):

執行上述命令后,可使用ps命令檢測alsa服務是否正確啟動:ps –A|grep alsa

根據說明書,BDSpeechSDK 目錄下的sample目錄中包含語音識別示例,由于語音識別運行時依賴lib、resources、extern目錄中的庫及資源文件,所以我們需要在啟動時共享庫。

進入目錄,運行語音識別示例:

喊“小度小度,今天天氣怎么樣”的識別結果:

可以發現,本開發套件采用了流式識別,附帶中間結果!

(四)語音識別效果測試

通過距離遠近,語速快慢,中間是否有隔離物(隔離物為電腦桌,顯示屏)等方式,對本開發套件進行了一次粗略的測試:

一米處:

有隔離:“一米一次喚醒測試”

有隔離,語速較快:“一米二次喚醒測試”

有隔離,語速較快:“今天天氣怎么樣”

無隔離,正常語速:“一米三次喚醒測試”

無隔離,語速較快:“今天天氣怎么樣”

2米處:(無隔離,正常語速)

“兩米一次喚醒測試"

“兩米二次喚醒測試”

“天天氣比較涼爽”

3米處:(無隔離,正常語速)

“三米一次喚醒測試”

“三米二次喚醒測試”

“聽說明天有臺風”

5米處:(無隔離,正常語速)

“五米一次喚醒”

“五米二次喚醒”

“臺風來了怎么辦”

6米處:(無隔離,正常語速)

注:首先需要較大聲喚醒小度,喚醒后,可識別正常音量的聲音:

“六米一次喚醒”

“六米二次喚醒”

“今天天氣好晴朗”

測試結果:

經過上述的語音識別測試,可以發現,本套件在5米內可以達到比較良好的喚醒、識別效果,超過5米后,喚醒、識別效果下降比較明顯。

另外,對于一般性的用語,識別相當準確(即使達到6米,也能比較準確的識別),但是對于讀音相近的詞語(“一米”-“玉米”,“兩米”-“楊冪”等),識別準確性就有點差了(也可能跟發音有關)。

發音源跟套件之間是否有隔離物(非完全隔離),對識別的影響不是很大(沒有讀音的影響大)。

語速不是很快的情況下,一般也能正常識別。

總體而言,對識別結果影響較大的,除了距離外,就是讀音相近的詞語(發音)了。

(五)藍牙連接

輸入命令 :bt_realtek_start?即可啟動藍牙:

打開電腦的藍牙,可以發現名為realtek_bt的藍牙設備,嘗試進行配對:

配對成功:

配對成功后,就可以用藍牙進行音樂播放等操作了。斷開藍牙連接:

測試發現的問題:

1、初次打開藍牙播放音頻時,聲音過大,調整聲音后,又發現最大聲音音量有的小了。

2、雖然本套件藍牙可以一次性連接多個藍牙(我嘗試了連接兩個藍牙設備),但是,兩個連接成功后,當用一個藍牙設備播放音樂,然后停止,再用另一個藍牙設備播放音樂時,發現播放失敗,只能用之前的那個藍牙設備播放音樂。

(六)錄音、播放音頻測試

查看tmp目錄內容:cd tmp

進行錄音:arecord -D hw:2,0 -c 8 -r 16000 -f S16_LE ?/tmp/test.wav

結束錄音后,查看目錄文件信息:

使用 aplay 命令就可以播放錄音文件:aplay test.wav

錄音效果還是不錯的。

(七)語音合成測試

示例程序會將文本“456hello你好今天天氣不錯”傳送給服務器,由服務器生成對應的語音,保存為pcm文件,用戶可以進行播放體驗。進入語音合成示例目錄:cd /oem/BDSpeechSDK/sample/tts

執行語音合成操作:LD_LIBRARY_PATH=/oem ./online-test:

運行結束后,會在當前目錄下生成一個xxx.pcm,其中xxx是一個測試時的時間戳.在終端執行如下命令體驗語音合成效果:aplay -t raw -c 1 -f S16_LE -r 16000 xxx.pcm

(八)交叉編譯

1、下載SDK

將rk3308板子內的oem內的BDSpeechSDK目錄復制到虛擬機內。可以進行adb pull /oem/BDSpeechSDK指令download下來,隨后將sdk放到虛擬機。

我這里就直接將整個/oem?目錄下載放到了“下載”目錄。

2、交叉工具鏈:

rk3308的編譯在標準linux上是編不出來的。我們這里需要用到交叉編譯工具鏈,這是一個特殊的編譯器,可以認為是在A平臺編譯出B平臺才能運行的工具包。

我這里將交叉編譯鏈復制到虛擬機的桌面上了。

3、按要求構建項目工程目錄結構

創建如下的目錄結構:

編寫(copy) sample代碼

目錄sample/wakeup/src中的e2e_wp_asr_test.cpp中有相應的demo代碼,這里我就直接將wakeup/src中的sample代碼拷貝到這里替換main.cpp

這里先不做任何改動,就照搬就行。目前的第一目的是盡快正確交叉編譯并成功在板子上跑起來。

編寫(copy) Makefile代碼

makefile可以幫助工程快速連接編譯,它能省掉很多功夫。由于本人不是純正的c++開發工程師,所以這里copy了 sample/wakeup/ 中的Makefile代碼:

嘗試編譯:

配置完成后,需要在Makefile所在的目錄執行:

上述語句中的?/home/snow/桌面1/rk3308_arm_tool_chain?代表著工具鏈rk3308_arm_tool_chain的根目錄/bin,如果路徑填寫錯誤,會出現如下錯誤:

make: arm-rockchip-linux-gnueabihf-g++:命令未找到

可以進入rk3308_arm_tool_chain 目錄 ,使用pwd命令獲取rk3308_arm_tool_chain 的路徑:

使用正確的路徑,重新編譯:

如果出現上述錯誤,說明缺少alsa的so庫,我們可以從oem目錄中pull一個文件下來。他在/oem目錄下,名為libbd_alsa_audio_client.so。將它復制到BDSpeechSDK/lib下,這個目錄專門放外部依賴的庫文件,這個也放這里吧。

然后再次嘗試編譯,沒有任何錯誤提示了,編譯通過。

編譯成功,發現工程目錄下多了一個main文件,這就是我們編譯好的可執行程序了。

將main可執行程序復制到/tmp目錄(tmp目錄在斷電后會清空)下:adb push ./main /tmp

運行程序:

LD_LIBRARY_PATH=/oem:/oem/BDSpeechSDK/lib:/oem/BDSpeechSDK/extern/lib ./main

出現錯誤:

error:5, domain:38, desc:Wakeup: dat file invalid., sn:

這里意思是沒成功載入dat文件。我們看一下代碼。在wakeup_config函數中,可以看到它配置dat文件的路徑,是../../resources/asr_resource/esis_resource.pkg只要把這個層級改成絕對路徑,或者把路徑改短 ./esis_resource.pkg,并把pkg文件拷貝過來即可。

然后重新編譯,adb push到tmp下,

還是這個錯誤,那是因為雖然改了文件路徑,但是我們還沒有把 esis_resource.pkg 也push到tmp文件夾里,進入 /home/snow/下載/oem/BDSpeechSDK/resources/asr_resource 文件夾,執行 adb push ./esis_resource.pkg /tmp:

再次執行,出現錯誤:error:-1, domain:10, desc:alsa_audio_client_open failed, sn: ,

因為我們的main也依賴于alsa的服務,所以需要開啟alsa服務:

或者可以將上述語句寫入 /oem/Rklunch.sh 文件,這個文件是rk3308板子開機后會跑的一個執行文件,我們可以把所有需要在開機時啟動的東西,都寫在這個文件里,這樣板子下次就會幫我們自動啟動alsa了。

執行成功后,再次運行main程序:

cd /tmpLD_LIBRARY_PATH=/oem:/oem/BDSpeechSDK/lib:/oem/BDSpeechSDK/extern/lib ./main

執行成功。

(九)交叉編譯-語音合成

按照上面的方法,我們可以編譯一下語音合成示例(可以把合成的文字改為自己喜歡的,我這里就改成了“Hello World,今天時七夕情人節,中國的傳統節日!”,有條件的,可以嘗試輸入文本,再合成語音)。

編譯程序:

上述警告可以忽略。把編譯完成的可執行文件下載到開發板并運行:

出現錯誤,仔細查看源代碼,發現main 函數中需要引用配置文件speech_sdk_log.conf,但路徑為 ../../resources/speech_sdk_log.conf:

并將speech_sdk_log.conf文件push到/tmp路徑下:

重新執行:

LD_LIBRARY_PATH=/oem:/oem/BDSpeechSDK/lib:/oem/BDSpeechSDK/extern/lib ./main

執行成功,可以看到/tmp目錄多了一個6832.pcm文件,運行命令 aplay -t raw -c 1 -f S16_LE -r 16000 6832.pcm,執行后,就能播放女生版的語音內容了。

三、產品建議

經過一個星期的測試,發現百度遠場語音開發套件在語音喚醒、語音識別方面比較出色,識別率整體上準確很高,如果在發音相似的詞語方面多加訓練,效果會更好。此外根據個人的使用感受在產品的功能上提一些建議:

1、提升音質,語音多樣化

未來提供更多不同風格的發音人,并可以讓用戶自主選擇,分別在進行購物、查詢信息、播放音頻資源等不同場景下有更多的音色供選擇適配。讓“小度”逐漸人性化、個性化。

2、完善語音交互功能

提供更高質量的語音交互功能,加強對話理解和對話管理技術以及只是建設能力。通過不斷的練習,讓音箱能夠更加“理解”用戶的話語意思, 給用戶提供更加準確的結果,輕松定制專業、可控、穩定的完整語音交互能力。

3、音色識別

在語音交互中,通過聲紋識別不同用戶音色,根據音色判斷交互內容并理解,可以將此功能利用在聲紋解鎖以及語音交互理解中,包括多人說話時執行命令的優先級。

語音交互未來可發揮的空間很大,但是現在的語音交互功能還不那么廣泛的,不過相信只要堅持發展,保持數據收集、場景優化,未來一定會在各個領域有更深度的拓展。

閱讀全文

KIT0126

語音控制項目套件

2024-03-14 21:13:28

598-2471-KIT

Raspberry Pi 3 語音交互 Raspberry Pi HAT（40 引腳）初級入門套件

2024-03-14 21:04:20

為什么Sensortile開發套件在STM32CUbeMX搜不到，怎么配置？

Sensortile開發套件在STM32CUbeMX搜不到，怎么配置？

2024-03-13 08:02:06

【LicheeRV-Nano開發套件試用連載體驗】+ 實現三麥克納姆輪小車自主導航

。 4.如未按要求完成評測的相應內容，開發套件將被收回，并取消活動參與資格，并降低下一次試用資格。 5.試用主題帖被認定為優秀可免費獲得開發板（需退回的除外），也會獲得社區的額外獎勵，后續試用概率也會增大

2024-03-03 14:20:58

Intel Agilex? F系列FPGA開發套件

Intel Agilex? F系列FPGA開發套件Intel Agilex? F系列FPGA開發套件設計用于使用兼容PCI-SIG的開發板開發和測試PCIe 4.0設計。該開發套件還可通過硬核處理器

2024-02-27 11:51:58

DA1453x Pro開發套件硬件說明

電子發燒友網站提供《DA1453x Pro開發套件硬件說明.pdf》資料免費下載

2024-02-21 10:07:21

貿澤開售 Qorvo QPG6105DK Matter和藍牙開發套件進一步簡化IoT設備開發

?和藍牙開發套件。借助QPG6105DK 開發套件，開發人員能夠快速、輕松地將物聯網 (IoT) 設備推向市場。該IoT開發套件是Matter和低能耗產品開發人員構建智能家居傳感器和執行器、智能照明

2024-02-20 13:57:02

301

英飛凌推出CYUSBS236 USB轉串行通信(雙通道)開發套件

英飛凌科技（Infineon Technologies）近日宣布推出全新的CYUSBS236 USB 轉串行通信（雙通道）開發套件。該開發套件基于英飛凌的CY7C65215 USB 串行橋控制器，為開發者提供了快速、簡便地實現USB與串行通信（UART/I2C/SPI）之間的轉換功能。

2024-01-24 17:12:58

376

語音數據集在智能語音搜索中的應用與挑戰

一、引言隨著互聯網的普及和移動設備的興起，智能語音搜索已經成為人們獲取信息的重要方式之一。智能語音搜索通過語音交互的方式，為用戶提供更加便捷、高效的信息查詢服務。語音數據集在智能語音搜索中發

2024-01-18 15:09:47

169

如何基于EsDA開發套件快速使用射頻讀卡器模塊

無線射頻讀寫卡技術在門禁系統，電子支付領域和物聯網等領域中具有越來越廣泛的應用。本文將基于EsDA開發套件講解如何快速上手并開發射頻讀卡器模塊的相關業務，為開發者大大縮短了學習和開發時間成本。項目

2024-01-11 08:24:31

357

讓設備更聰明 |啟英泰倫離線自然說，開啟智能語音交互新體驗！

啟英泰倫新推出「離線自然說」——一種輕量級的離線NLP技術。通過該技術，語音芯片可支持數萬條離線詞條，泛化能力強，幾乎可涵蓋用戶日常所有說話習慣，可以為用戶提供更自然、更豐富、更靈活的離線語音交互新體驗。

2024-01-04 11:24:42

181

思必馳語音算法與芯片的完美結合人機交互

TH1520芯片解決方案AISpeech思必馳深圳羲頓科技有限公司TH1520是深聰智能（思必馳旗下的芯片設計企業）根據語音交互市場及算法的需求及發展方向，自主定義開發的“芯片＋算法”的人

2023-12-29 11:43:11

154

語音數據集：智能語音技術的基石與挑戰

隨著人工智能技術的飛速發展，語音技術已成為人機交互領域的重要突破口。語音數據集作為支撐語音技術研發的核心資源，對于提高語音識別、合成及自然語言處理等技術的性能具有至關重要的作用。本文將對語音數據

2023-12-28 11:28:03

251

DshanMCU-R128s2 R128 EVT 開發套件

針對 R128 模組，百問科技推出了 R128 EVT 開發套件作為快速開發評估工具。

2023-12-22 15:16:06

278

語音數據集：AI語音技術的靈魂

一、引言在人工智能領域，語音技術被譽為“未來人機交互的入口”，而語音數據集則是AI語音技術的靈魂。本文將深入探討語音數據集的重要性、構建方法、面臨的挑戰以及未來的發展趨勢。二、語音數據集的重要性

2023-12-14 14:33:51

289

離線語音識別技術：掌控未來的語音交互

離線語音識別技術的核心優勢在于其獨立性和實時性。在沒有網絡連接的情況下，設備依然能夠迅速識別用戶的語音指令，實現各種功能。這使得語音交互更加自然、流暢，讓用戶隨時隨地享受智能科技帶來的便利。

2023-12-13 11:12:16

242

語音數據集：推動AI語音技術的核心力量

一、引言隨著人工智能的快速發展，語音技術作為人機交互的重要手段，正發揮著越來越重要的作用。而語音數據集則是推動AI語音技術的核心力量。本文將詳細介紹語音數據集的重要性、構建方法、面臨的挑戰以及未來

2023-12-12 11:32:03

249

離線語音識別及控制是怎樣的技術？

可以在沒有網絡連接的情況下進行使用，適用于一些特殊場景，如旅行、戶外等無法連接網絡的環境。　6. 開發周期短：在客戶的產品已經完善的情況下，可以快速接入離線語音識別。使用深圳雷龍發展有限公司的推出的LSYT201B模組，最快一天即可根據客戶要求完成自定義產品。

2023-11-24 17:41:39

單片機語音芯片開發要解決的問題

單片機語音芯片開發中，需考慮功耗、語音識別準確率、尺寸和可靠性問題。通過優化功耗、采用先進語音處理技術、創新電路設計和提高芯片的可靠性和穩定性，可提升開發效果和用戶體驗。

2023-11-23 15:19:03

220

情感語音識別技術在人機交互中的應用與展望

一、引言隨著人工智能技術的不斷發展，人機交互已經滲透到日常生活的方方面面。情感語音識別作為人機交互中的關鍵技術之一，能夠通過分析人類語音中的情感信息實現更加智能化和個性化的人機交互。本文將探討

2023-11-22 10:40:59

274

方言離線語音控制場景解決方案

選擇合適的設備。選擇的設備應該具有語音識別功能且支持方言識別，以確保他們能夠順利地控制設備。此外，為了讓老人或小孩更快地上手操作，可以提供簡單的操作指南或者語音引導。　　總之，離線語音模塊為老人或小孩

2023-11-17 17:57:18

解決方案丨三相全橋PRCP開發套件實驗系統方案

一、三相全橋PRCP開發套件概覽為解決教學內容復雜、理論與實際脫節等問題，森木磊石EasyGo半實物仿真事業部推出了三相全橋PRCP (功率級快速控制原型系統) 開發套件。該套件是一種電力電子

2023-11-16 16:26:22

情感語音識別在人機交互中的應用與挑戰

一、引言情感語音識別是近年來人工智能領域的研究熱點之一，它能夠通過分析人類語音中的情感信息實現更加智能化和個性化的人機交互。本文將探討情感語音識別在人機交互中的應用、面臨的挑戰以及未來的發展趨勢

2023-11-15 15:42:05

198

情感語音識別技術在人機交互中的應用與挑戰

?一、引言隨著人工智能技術的不斷發展，人機交互已經成為了研究的熱點之一。情感語音識別技術作為人機交互中的重要組成部分，能夠通過識別人的語音情感，實現更加智能化和個性化的交互體驗。本文將探討情感語音

2023-11-09 15:27:27

330

Global GNSS LTE CAT 1開發套件

。以下是本周新品情報，請及時查收：便捷蜂窩集成 DIGI XBee 3 Global GNSS LTE CAT 1開發套件貿澤電子即日起開售Digi 的 XBee 3全球GNSS LTE CAT 1開發套件。該套件預裝了三個月的蜂窩數據服務，已提前激活并可隨時使用。利用Digi XBee 3全球

2023-10-25 16:15:03

157

TTS技術賦能對講機，迎來智能語音革新

隨著語音合成技術的快速發展，對講機的智能語音升級已經到來。作為文本轉語音的核心技術，TTS（文本到語音合成）為對講機帶來了革新機遇。它能夠自動、快速地將文本轉化為連貫自然的語音，并支持輸出

2023-10-20 14:53:55

239

AISpeech 思必馳思必馳語音算法與芯片的完美結合人機交互

TH1520是深聰智能（思必馳旗下的芯片設計企業）根據語音交互市場及算法的需求及發展方向，自主定義開發的 “芯片＋算法” 的人工智能人機語音交互解決方案，具有高性能、低功耗等特點。

2023-10-18 14:43:57

1089

新手學習哪些語音模塊比較快上手？

新手學習哪些語音模塊比較快上手

2023-10-16 07:24:31

平頭哥Lichee D1 DocK Pro開發板上手評測

2023-09-28 16:15:19

571

SynSense時識科技發布Xylo?IMU開發套件

SynSense時識科技今日正式發布全新XyloIMU類腦開發套件。這款新的HDK使用戶能夠開發基于IMU的運動處理應用，例如人體運動分析、人機互動及工業檢測等應用開發。

2023-09-28 15:25:47

2291

基于英特爾開發套件的AI字幕生成器設計

市面上有很多自然語言處理模型，本文旨在幫助開發者快速將 OpenAI* 的熱門 NLP 模型 Whisper 部署至英特爾 開發套件愛克斯開發板上，由于開發板內存有限，所以我們選擇較輕

2023-09-27 16:59:12

463

紫光同創PGC1KG-LPG100 / PGC2KG-LPG100開發套件|盤古1K/2K開發套件

盤古1K/2K 開發套件是基于紫光同創 FPGA 開發平臺的開發套件，以紫光同創 Compa系列PGC1KG-LPG100 / PGC2KG-LPG100 器件為核心，預留豐富的擴展 IO

2023-09-22 15:03:53

語音識別技術：未來人機交互的重要接口

隨著科技的快速發展，人類對機器的操控方式也在不斷尋求創新。其中，語音識別技術作為人機交互的重要接口，正在越來越多地被應用于各個領域。本文將深入探討語音識別技術的發展歷程、技術原理以及未來的應用前景

2023-09-19 18:13:12

458

S2-LP開發套件入門

本文檔介紹了 S2-LP 器件的開發套件以及相關硬件和軟件組件。S2-LP 是超低功耗、低數據速率、低于 1 GHz 的射頻收發器。以下是基于 S2-LP 的開發套件

2023-09-12 09:32:16

智能座艙HMI自動化測試之語音交互專項測試

隨著人工智能和物聯網技術的迅猛發展，智能座艙已經成為現代汽車中的重要組成部分。語音交互作為智能座艙的核心功能之一，正日益受到用戶和汽車制造商的關注。車載語音交互具備的獨特優勢：降低駕駛者對車內

2023-09-04 16:58:58

1501

鴻蒙升級3.0.0，百度導著航，系統中途會關閉我的定位

然后百度顯示沒有定位了，就自動開啟智能導航。系統決定我的定位開關設置在哪里，我記得以前開定位是手動開關的。升級后，下拉菜單打開定位，百度導航開著一會系統定位就被關閉了。害得我跑錯了好多路。現在就是我的百度導航根本沒法用

2023-09-03 23:34:47

紫光同創PGC1KG-LPG100 / PGC2KG-LPG100開發套件|盤古1K/2K開發套件

盤古1K/2K 開發套件是基于紫光同創 FPGA 開發平臺的開發套件，以紫光同創 Compa系列PGC1KG-LPG100 / PGC2KG-LPG100 器件為核心，預留豐富的擴展 IO 及數碼管

2023-08-22 16:26:46

免配置，速上手！?安信可TurMass P2P 開發套件來啦~

，快速實現對 TurMass?芯片各項功能和指標的測試，并根據套件提供的 SDK 和示例代碼，快速開發上手

2023-08-21 15:16:17

298

智能語音開放平臺選哪家，啟英泰倫提供硬件、軟件一體化開發服務

簡單、更快速。平臺推出了多個產品領域的標準語音固件，涵蓋照明、取暖器、風扇、浴霸、窗簾、油煙機、晾衣桿等。開發者通過選擇產品類型，芯片型號、語言類型、配置SDK、播報音和命令詞，5分鐘即可生成自定義

2023-08-17 14:00:44

奧比中光正式發布與英偉達合作開發的3D開發套件Orbbec Persee N1

? 8月3日，奧比中光正式發布與英偉達合作開發的3D開發套件Orbbec Persee N1 。新品融合奧比中光雙目結構光相機Orbbec Gemini 2和支持海量開源項目的NVIDIA

2023-08-07 11:40:49

797

紫光同創PGC1KG-LPG100 / PGC2KG-LPG100開發套件|盤古1K/2K開發套件

盤古1K/2K 開發套件是基于紫光同創 FPGA 開發平臺的開發套件，以紫光同創 Compa系列PGC1KG-LPG100 / PGC2KG-LPG100 器件為核心，預留豐富的擴展 IO 及數碼管

2023-08-02 14:20:11

如何使用Alexa語音服務集成在受約束的物聯網設備上設置語音命令

本指南供硬件和軟件架構師學習如何使用Alexa語音服務集成在受約束的物聯網設備上設置語音命令。AWS物聯網核心的Alexa語音服務集成（AIA）將與Alexa Voice Services集成所需

2023-08-02 12:53:08

智能座艙的語音交互系統技術應用

從用戶發出語音指令到實現與智能設備的交互，其過程并不像其名詞描述的那么簡單，要實現通過語音來完成人機交互，要解決解決三個關鍵問題，如何讓機器聽清用戶的語音內容？如何機器理解用戶的意圖？

2023-07-28 10:17:45

317

掃地機語音提示芯片，智能家居語音交互首選方案，WT588F02B-8S

智能家居已經成為現代家庭不可或缺的一部分，而語音交互技術正是智能家居的核心。在智能家居設備中，掃地機無疑是最受歡迎的產品之一。然而，要實現一個更智能的掃地機，需要一顆語音提示芯片，以提供高質量的語音交互體驗。在眾多的選擇中，它能為智能掃地機帶來全新的語音提示體驗。

2023-07-26 17:38:30

500

開始使用TI SK-TDA4VM開發套件

電子發燒友網站提供《開始使用TI SK-TDA4VM開發套件.zip》資料免費下載

2023-07-13 09:26:35

拖地機語音播放芯片，低功耗語音交互方案，WT588F02B-8S語音ic

在現代科技的快速發展中，語音交互已成為眾多智能設備的重要功能之一。為了滿足市場需求，我們推出了一款創新的拖地機語音播放芯片——WT588F02B-8S，該芯片不僅具備低功耗的特性，而且提供了卓越的語音交互體驗。

2023-07-11 09:13:47

296

語音識別喚醒詞-開啟智能化的語音交互時代

語音識別喚醒詞是指在語音交互系統中使用的特定詞語或短語，用于喚醒系統并啟動語音識別功能。這項技術的出現為智能化的語音交互帶來了革命性的改變，使得我們能夠更便捷、自然地與智能設備進行交流。在傳統

2023-07-09 00:53:53

765

開發套件 S124(DK-S124) 快速入門指南

開發套件 S124 (DK-S124) 快速入門指南

2023-07-07 19:16:15

開發套件 S128(DK-S128) 快速入門指南

開發套件 S128 (DK-S128) 快速入門指南

2023-07-07 18:44:15

開發套件 S7G2(DK-S7G2) 快速入門指南

開發套件 S7G2 (DK-S7G2) 快速入門指南

2023-07-06 19:49:13

DA1469x Pro 開發套件主板原理圖

DA1469x Pro 開發套件主板原理圖

2023-07-06 19:12:46

DA14695 Pro 開發套件子板原理圖

DA14695 Pro 開發套件子板原理圖

2023-07-06 19:07:25

DA14699 Pro 開發套件子板原理圖

DA14699 Pro 開發套件子板原理圖

2023-07-06 19:07:11

DA1468x Pro 開發套件主板原理圖

DA1468x Pro 開發套件主板原理圖

2023-07-06 18:51:05

DA14683 USB 開發套件原理圖

DA14683 USB 開發套件原理圖

2023-07-06 18:50:54

GC：具有語音交互能力的機器人

電子發燒友網站提供《GC：具有語音交互能力的機器人.zip》資料免費下載

2023-07-06 10:02:13

SmartBond DA14585 物聯網多傳感器開發套件快速入門指南

SmartBond DA14585 物聯網多傳感器開發套件快速入門指南

2023-07-05 21:00:16

DA14683 Pro 開發套件子板原理圖(AQFN)

DA14683 Pro 開發套件子板原理圖 (AQFN)

2023-07-05 20:58:33

DA1468x 開發套件入門

DA1468x 開發套件入門

2023-07-05 20:35:49

5x1503 系列開發套件用戶指南

5x1503 系列開發套件用戶指南

2023-07-05 20:25:59

DA14531 USB 開發套件原理圖

DA14531 USB 開發套件原理圖

2023-07-04 19:52:02

UM-PM-039 電量計開發套件

UM-PM-039 電量計開發套件

2023-07-04 19:24:02

高級開發套件快速入門指南

高級開發套件快速入門指南

2023-07-03 20:20:43

DA14531 Pro 開發套件主板原理圖

DA14531 Pro 開發套件主板原理圖

2023-07-03 19:42:46

DA1470x Pro 開發套件顯示板原理圖

DA1470x Pro 開發套件顯示板原理圖

2023-06-30 20:52:43

DA14706 Pro 開發套件子板原理圖

DA14706 Pro 開發套件子板原理圖

2023-06-30 20:50:34

DA1470x Pro 開發套件主板原理圖

DA1470x Pro 開發套件主板原理圖

2023-06-30 19:24:44

Renesas ASSP EASY 語音 HMI 套件原理圖

2023-06-29 19:31:38

Renesas ASSP EASY 語音 HMI 套件用戶手冊

2023-06-29 19:24:47

【EASY EAI Nano人工智能開發套件試用體驗】EASY EAI Nano人工智能開發套件開箱及最快上手教程

/ 執行命令，啟動門禁機程序： ./qSolu-facialGate 運行效果：好了，至此已經完成了開發環境的搭建，并跑通了第一個Demo，恭喜你順利上手了EASY EAI Nano人工智能開發套件的開發，接下來可以探索其他Demo，部署自己的AI模型了！

2023-06-11 13:34:26

WT2003H4-16S語音芯片按鍵錄音及播放應用解析

隨著智能電子產品語音交互需求的增強及快速發展，語音芯片已深入運用到各行各業。如何賦予電子產品的生命力，使產品發揮本身的功能的同時，實現語音交互。

2023-06-09 11:46:40

743

【EASY EAI Nano人工智能開發套件試用體驗】EASY EAI Nano人工智能開發套件開箱及硬件初體驗

今天收到了EASY EAI Nano人工智能開發套件，為大家做個開箱及硬件評測。打開快遞包裝，引入眼簾的是一個設計精美藍色的大盒子，在盒子里有EASY EAI Nano人工智能開發板、天線、喇叭

2023-05-31 19:18:39

如何開發智能家居語音控制方案

語音AI平臺，支持5分鐘產生固件資源，支持3天完成功能對接，3天完成PCB設計和驗證，從而極大降低客戶開發門檻，促進智能語音產品快速落地；另外通過該平臺可實現客戶零代碼開發，并提供多功能，多場景，全鏈路

2023-05-31 09:50:06

語音識別技術的概念及應用前景

交互的自然性，已經越來越成為人與終端交互的主要入口路徑。 ? 啟英泰倫目前已推出離在線語音方案，可以實現離線控制和在線音樂、視頻、社交、新聞、百科、股票、菜譜、兒童教育等高頻生活場景在內的數百種服務

2023-05-27 09:41:03

輕語音，智生活

語音交互的優點不僅在于快速、便捷，更在于它可以幫助我們更好地管理時間和提高效率。無論是工作還是生活，語音交互都可以大大減少我們的時間成本。

2023-05-26 09:59:00

182

智能座艙進入大模型時代，語音遙控器的交互即將成為過去式

百度Apollo展示了其最新已量產的語音產品體驗，小度車載語音SDK基于大模型本地化，持續推動座艙極致交互體驗。流暢的免喚醒多路同時交互、全頁面所見所說、全域毫秒級響應，讓用戶像是擁有了一個隨時待命的私人助理，能靠說的絕不動手，坐在主副駕和后排的每一個人都可以同時進行暢快的交互體驗。

2023-05-24 09:43:43

607

離線語音控制模塊，智能家居開發#物聯網 #語音控制 #語音模塊 #語音識別

語音模塊

輕生活科技語音模塊發布于 2023-05-20 15:01:42

Renesas ASSP EASY 語音 HMI 套件原理圖

2023-05-19 18:38:55

Renesas ASSP EASY 語音 HMI 套件用戶手冊

2023-05-12 19:32:36

語音識別芯片or語音提示芯片哪款更貼近生活

在智能器件中IC芯片是不可或缺的一部分，在這些語音終端產品開發中語音芯片（語音提示芯片）與語音識別芯片都有著不同的應用，不同的場景適用不同的芯片，識別OR提示真的有別樣的應用，這兩者之間對比下來各自

2023-05-10 16:23:23

289

音諾恒科技人臉識別開發套件

人臉識別開發套件是一款集攝像頭、開發板、高清屏幕、SDK為一體的人臉套件，以幫助產品商、開發者加速軟硬件方案驗證及選型，縮短產品開發周期，提升產品更新效率助力人臉識別應用產品快速落地的產品。

2023-04-24 15:05:00

431

車企提“智”升級，車載語音識別技術成就語音交互新體驗

、個性化的用戶體驗，車企提“智”升級，對車載語音交互系統的功能和性能提出了更高的要求。在此背景下，車載語音識別等技術逐漸成為了車載語音交互系統的重要組成部分。車載語音識別技術是車載語音交互系統中的另一個重

2023-04-23 18:13:41

421

車企提“智”升級，車載語音識別技術成就語音交互新體驗

2023-04-23 15:15:38

379

制作一款本地語音控制音箱有多難，有市場么

一、存在的問題：現在的類似小愛音箱，小度音箱都是接入的qq音樂資源，但是歌曲庫有限，經常聽到“該歌曲僅支持試聽”，而且音源不咋地，開會員也不會把所有想聽的歌曲集合全。二、理想方案：制作一款本地語音

2023-04-23 10:32:36

16位 78K0R ZigBee PRO 高級開發套件

16 位 78K0R ZigBee PRO 高級開發套件

2023-04-20 19:30:55

帶有MCU算法的多功能語音交互芯片，OTA升級語音ic，WTV380-32N

幾年來，隨著智能家居、安防報警、醫療器械等領域的快速發展，語音交互技術越來越受到人們的關注和青睞。作為智能硬件的重要組成部分，語音芯片的發展也變得越來越重要，針對這一市場需求，我們推出了一款多功能的語音芯片——WTV380-32N。

2023-04-20 14:58:56

460

助力打造更加便捷、清晰的車載語音交互新體驗

、個性化的用戶體驗，車企提“智”升級，對車載語音交互系統的功能和性能提出了更高的要求。在此背景下，車載語音識別等技術逐漸成為了車載語音交互系統的重要組成部分。 ? 車載語音識別技術是車載語音交互系統中的另一個

2023-04-17 09:31:08

479

用一個Hercules LaunchPad開發套件控制GaN功率級

與LMG5200評估模塊 (EVM) 一同提供的還有一塊驅動GaN集成電路 (IC) 的電路。你需要將其斷開，并且連接你的LaunchPad開發套件。

2023-04-14 10:06:17

424

機器人市場化的人機語音交互

的主要功能之一。盡管國內的科大訊飛，百度以及目前最為火爆的國外ChatGPT已經在人機語音交互技術上不斷地進行突破，特別是ChatGPT給人的體驗感。相信人機語音交

2023-04-03 11:33:18

471

已全部加載完成

搜索歷史

百度大腦遠場語音開發套件評測—快速上手，超贊語音交互體驗

評論