1 概述?
隨著人們生活水平的提高,都追求舒適的體驗感,特別是對操控性的要求越來越高。目前帶功能的茶吧機產品的控制方式有以下幾類:
- 按鍵控制:傳統控制方式,每次要走到茶吧機邊才行,操作麻煩;
- 遙控控制:采用紅外遙控或者藍牙遙控,方便遠距離控制,但遙控器容易丟,放置也麻煩。且遙控器上按鍵較少,當茶吧機功能多的時候無法用單次按鍵控制全部的功能,組合按鍵不符合人們使用習慣;
- 手機APP控制:每次控制需要打開手機APP,需要聯網,同時需配網,操作繁瑣;
- 智能音箱控制:通過如天貓精靈等智能音箱直接控制,相對方便,但音箱需聯網狀態下才可使用,識別時有隱私安全問題,網絡延時大時控制的實時性不好。
為了解決以上痛點,可以采用純離線語音識別進行控制,在成本增加不大的情況下,為產品帶來更多的亮點和競爭力。啟英泰倫針對該產品領域,已開發了整套離線語音茶吧機方案,下面對該方案進行介紹。
2 方案優勢?
啟英泰倫離線語音茶吧機相對傳統茶吧機方案,可讓用戶通過語音控制茶吧機設備,替換傳統遙控器或按鈕控制的方式,該方案有以下優勢:
- 可以直接使用語音控制茶吧機,且無需聯網,自然方便,識別率可達95%以上;
- 語音控制響應快,一般在0.2~0.8s內完成;
- 可遠場識別,安靜情況下可達10米;
- 方案功耗低,工作功耗僅為0.2W左右;
- 可靠性好,芯片方案已通過雙85測試,滿足格力、美的等家電巨頭要求;
- 整套產品技術已成熟,具有完整的軟件、硬件、結構設計方案,節省開發周期,降低開發難度;
- 配合我司語音AI平臺開發,可靈活定制喚醒詞和命令詞,不需要再專門收集語料訓練。
3 應用描述?
啟英泰倫離線語音茶吧機方案適用于各類需控制的茶吧機。 語音茶吧機產品的使用場景為普通家居環境,在安靜和中低噪音下可以達到良好的識別率。其中安靜環境的環境底噪在35dB ~ 45dB之間,屬于中低噪音環境;開啟茶吧機后環境噪音可達45dB ~ 65dB之間。該噪音環境下可以直接選用我司單麥克風語音模塊,如CI-B0XGS01S或CI-B0XGS01S-H模塊,以達到比較好的性價比。
特別注意,不同的茶吧機運行過程中,因為齒輪位置、進出水口等差異,運行產生的噪聲大小也有不小的差異,為了達到最好的語音識別效果,在設計茶吧機整機結構時,因注意控制麥克風噪音小于65dB、具體參照下面結麥克風結構設計。
4 產品設計流程?
一個基于我司芯片的標準語音產品設計流程如下圖所示:
該流程主要針對我司新用戶開發產品使用,包含了前期購買樣品Demo進行驗證,硬件選型,語音對話邏輯、軟硬件方案和結構設計,設計完成后的測試,以及生產測試準備和后續批量采購等步驟。如果是已經熟悉我司方案的老用戶,可以直接從中間步驟開始,不用再重復進行Demo測試等工作。
下面針對新用戶的開發,對上述流程中的各個步驟逐一描述。
4.1 DEMO測試?
針對新用戶,可以先從我司授權的經銷商或直接從我司官網 ?樣品購買 處購買對應的模塊或開發板套件,進行識別效果測試,相關的軟硬件技術文檔可以從本文檔中心處獲取。用戶測試滿意后,可以進行硬件選型。
4.2 選型指南?
用戶硬件選型可以直接參考 ?硬件選型 ,如果用戶想快速產品化,推薦直接使用我司已設計好的標準模塊;如果現有標準模塊無法滿足產品的結構需求,也可以選用合適的芯片進行硬件板的設計。
4.3 方案設計?
選擇好合適的芯片或模塊后,可根據產品的功能進行下述設計:
- 語音UI(喚醒詞和命令詞)設計:設計方法可參考 ?語音UI設計參考;
- 硬件設計:設計方法可參考 ?硬件設計參考;
- 結構設計:設計方法可參考 ?產品結構設計;
- 軟件開發:設計方法可參考 ?軟件開發。
如用戶為首次進行語音方案開發,建議到 ?啟英泰倫語音AI平臺 上獲取基于相關芯片的語音產品方案設計Checklist文檔,進行逐一檢查以確保設計效果。如有技術支持需求請聯系我司技術支持人員。
4.4 測試驗收?
產品方案設計完成形成樣品后,建議對該樣品進行相關的識別測試,相關測試方法和標準可參考 ?識別效果測試。同時,還建議根據產品質量的要求進行各類硬件測試,靜電測試、防水測試等。為了保證最終的識別效果,還建議進行硬件底噪的測試及產品裝機后的整機功能測試。
4.5 生產測試?
樣機測試完成后,會轉入后續產線批量生產階段。我司為產品的批量生產做了完善的解決方案,用戶可以參考 ?生產測試 獲取更多信息。用戶如需要生產測試的相關技術支持,請聯系我司技術人員。
4.6 下單采購?
用戶如果要采購我司產品,請點擊 ?樣品和批量采購 獲取更多信息。
5 茶吧機設計方案介紹?
5.1 方案特點?
用戶可以用我司的芯片設計語音控制板,和原產品的電控板通過串口進行通訊,可以實現語音茶吧機的產品設計。該方式開發相對簡單,可以快速對接完成產品,但成本略高,適用于需快速出產品的的方案或者第一次接觸語音識別的方案。
該方案的設計框圖如下,語音模塊與電控模塊需要4根線的串口連接,語音模塊進行語音識別及根據茶吧機的狀態進行信息播放,控制由電控模塊完成。
5.2 硬件設計參考?
用戶可以使用我司芯片設計需要要求的語音模塊,但為快速開發,推薦直接使用我司的以下標準模塊:
- CI-B02GS03T:適合空間比較高,縱深長的結構,串口接口電平為3.3V;
- CI-B02GS01S:適合空間比較矮的結構,串口接口電平為3.3V;
- CI-B02GS01J:適合有空間放置固定語音模塊的結構,原來的茶吧機硬件改動較小,串口接口電平為5V。
用戶直接使用我司標準語音模塊時,有以下注意事項:
- 將語音模塊板的串口跟電控串口對接,注意電控的供電需要大于500mA;
- 注意串口的電平要匹配,CI-B02GS01J支持5V電平,其他的模塊支持3.3V,如果電控板使用5V電平,CI-B02GS01J可以對接直接串口,其它模塊需要增加電平轉換電路,如下圖所示:
5.3 串口通訊方式?
語音模塊與電控模塊通過串口進行信息交互,主要有兩種方式,一種為語音模塊主動播放,同時將信息發電控模塊;另一種為語音模塊被動播放,其分別描述如下:
語音模塊主動播放模式
主動播放方式主要執行以下動作:
- 識別到詞條;
- 主動播放反饋聲音;
- 將此條信息串口告知電控模塊;
- 電控模塊執行動作。
該方式的優點在于控制方式簡單,由語音模塊單線輸出信息給電控模塊。但缺點在于無法根據茶吧機的情況及按鍵情況進行語音反饋。
語音模塊被動播放模式
被動播放方式主要執行以下動作:
- 語音模塊識別到詞條;
- 將詞條信息串口告知電控模塊;
- 電控模塊執行相關動作;
- 告知語音模塊需要播放的內容;
- 語音模塊根據電控模塊反饋進行播放。
該方式的優點在于語音模塊根據電控模塊的狀態進行播放對應內容,可以進行最合適的反饋,體驗感好;同時如果電控模塊通過按鍵或者遙控進行控制,語音模塊也可以進行狀態播放。缺點在于會多一次串口通信的過程。
5.4 SDK包說明和模塊串口通訊協議?
我司為用戶提供了串口通訊方案完整的SDK包,用戶可以到 ?啟英泰倫語音AI平臺 上獲取相關SDK開發包。
模塊的串口通訊建議使用我司標準協議,具體格式請參考 ?串口協議 。
注意:
- ASR語言模型中文建議選擇SE159,其他語種請使用對應語種的模型。茶吧機產品自帶運行噪音,如果茶吧機本身噪音大于60db,建議打開降噪功能。
-
串口設置:
- 波特率:9600
- 停止位:1
- 數據位:8
- 奇偶校驗:無
- 代碼中通過判斷 “命令+語音ID”獲取是什么指令和功能。
- 發送的串口信息建議要檢查完整性,可以用以下的checksum參考代碼來實現。
6 產品結構相關注意事項?
6.1 麥克風結構設計?
茶吧機產品在設計結構時,針對麥克風應當注意以下事項:
- 麥克風布局盡量遠離茶吧機的電機,進出水管等噪音處;
- 麥克風需要防水防塵處理,至少選擇IP65規格的;
- 麥克風放在茶吧機的正面的位置,避免遮擋,保證拾音最大范圍;
- 分貝儀測試運行時,麥克風處的穩態噪聲需小于65dB;
- 麥克風連線較長可選擇帶屏蔽的線;
- 麥克風線扎捆遠離電機或電控線。
下圖以常用智能茶吧機為例,講述麥克風結構開孔及位置的建議方式,固定麥克風的結構件也需要考慮麥克風線方便引出導線和避免干擾。
6.2 喇叭結構設計?
茶吧機產品在設計結構時,針對喇叭應當注意以下事項:
- 考慮到音質,喇叭功率不能太小,建議選用1W以上喇叭,帶音腔的喇叭效果會更好一點,同時注意硬件板上的功放驅動能力要匹配喇叭型號;
- 喇叭放置位置以美觀及結構布局方便為主,但注意盡量避免和麥克風放在同一位置;
- 不帶音腔喇叭可以在結構上做一個音腔密封后能增大音量輸出。
下圖是一個喇叭規格及開孔的建議。
6.3 其它注意事項?
- 建議選擇-32dB±3dB,信噪比大于70dB以上,性價比高的全向模擬麥克風;
- 若茶吧機電機震動比較大,選擇較厚的麥克風膠套減緩震動,可減小對識別效果的影響;
- 茶吧機處理潮濕環境,最好板子刷三防漆,推薦選擇IP65防水防塵的麥克風,;
- 特別注意禁止直接點熱溶膠用于固定麥克風頭;
- 將麥克風完全插入固定孔內部,避免歪斜,拾音孔中心孔對準麥克風的中心;
- 茶吧機內部接線多容易扯松,插頭配插座帶卡扣會更牢固;
- 選擇符合環保RoHS要求的RTV硅膠,推薦常用的硅膠有703/704/737等,或其它有機材料、單組分室溫固化硅膠等;
- 多數硅橡膠灌膠厚度小于3mm以內實溫完全固化時間為8 ~ 12小時,灌膠厚度 > 3mm以上完全固化時間更長,可分層多次澆灌,確保完全固化穩定密封;
- 生產工藝可把固定麥克風工序提前,另外特別注意麥克風接線在重力拉扯下,未完全固化前容易導致麥克風扯歪,也需注意將麥克風插線固定好。
7 相關參考資料列表?
編號 | 參考資料描述 | 獲取方式 |
---|---|---|
1 |
標準離線SDK CI110X_SDK_ASR_Offline |
請到 ?啟英泰倫語音AI平臺 上獲取 |
2 |
茶吧機SDK Demo: 串口通訊方案SDK |
請到 ?啟英泰倫語音AI平臺 上獲取 |
3 | 測試固件 | 到 ?啟英泰倫語音AI平臺 上獲取 |
4 | 我司芯片和模塊的選型指南 | 請點擊 ?硬件選型指南 查看 |
5 | 我司芯片硬件設計方法參考 | 請點擊 ?硬件設計參考 查看 |
6 | 麥克風和喇叭器件選型 | 請點擊 ?外圍器件兼容列表 查看 |
7 | 產品結構設計 | 請點擊 ?產品結構設計 查看 |
8 | 軟件開發方法和標準SDK說明 | 請點擊 ?軟件開發 查看各部分內容 |
9 | 產品識別性能測試方法 | 請點擊 ?識別效果測試 查看 |
10 | 生產測試的方法 | 請點擊 ?生產測試 查看 |
用戶如遇到使用問題,請到啟英泰倫語音AI平臺上提交技術工單,或直接聯系我司技術人員獲取協助。
審核編輯:符乾江
評論
查看更多