AUTUMN前言
當下打印機使用越來越廣泛,品種也日益增多,從企業到商家到用戶,不同的客戶群體都有不同的需求。就拿語音播報來說,早先的打印機只做簡單的文本打印功能,不帶語音播報提示,后來逐步加上語音提示,如開機音效:歡迎使用xx品牌、提示語打印機缺紙等,及隨著網絡的發展,加入4G或WIFI的功能,通過TTS技術,進行實時文本播報。
本文則對打印機引入在線TTS+AI對話方案及唯創其他語音方案做了綜合介紹。
AUTUMN方案介紹
以下將介紹唯創語音IC在打印機行業的方案運用:
01方案一
普通語音播報系列打印機,WTN6/WT588F02B型號,語音提前放到芯片內置空間,指令控制播報提示。應用框圖如下:
方案優勢:
性價比高,應用簡單;可擦寫版本,提供配套工具方便更新語音,快速調試
原理及技術特點:
唯創標準一線/二線控制協議,支持音量、播放、停止、循環模式指令設置
02方案二
普通語音播報系列打印機,WT2003H系列,支持掛載TF卡或者U盤播放,除提示音外,可存放更多音樂文件,支持MP3/WAV格式,支持USB連接電腦更換音頻。應用框圖如下:
方案優勢:
MP3音質效果,支持8-44.1KHz/8-320kbps音頻碼率播放,支持USB接口快速更換音頻
原理及技術特點:
唯創標準UART串口控制協議,支持掛載SPI Flash、TF卡、U盤播放,支持音量、播放暫停、循環模式、插播等指令設置
03方案三
支持語音更新系列打印機,WT3000A,BLE透傳更新本地音頻及自定義音效,無需接線,配合手機app或微信小程序,無線更新音頻到WT3000A外置存儲中。APP SDK可打包外發,嵌入到用戶APP中或開發微信小程序應用。應用框圖如下:
方案優勢:
· 解決多語種需求,設備本地無需預存多國音頻,減少了本地儲存成本,解決本地音頻更換難,文本合成音頻繁等問題
· 支持語種:全球 16 個語種,包括中文、英文、中英混合、法語、泰語、意大利語、韓語、日語、印尼語、德語、西班牙語、俄語、越南語、馬來語、菲律賓語;同時還支持 6 個國內方言,即粵語、東北話、天津話、臺灣話、四川話、湖南話
原理及技術特點:
· 音頻格式:MP3,8-44KHz,8-320Kbps,上傳后APP端都會壓縮16KHz/18Kbps單聲道MP3音頻下發到本地;
· 傳輸速率:10KByte/秒左右;
· TTS合成:支持16 國語種 6 種國內方言,可配置選擇,支持文本+背景音樂合成;支持語速、語調、音量等參數調節;
· APP錄音:限制時長1分鐘,錄完點擊設備寫入,自動下發;
· 本地音頻上傳:數量無限制,取決于外置SPI Flash容量,最大可外掛128Mbit;
· APP開發:SDK可打包外發,可定制開發;
· 微信小程序開發:支持定制;
04方案四
支持離線文本合成播報打印機,針對帶WIFI類打印機,打印時可根據打印狀態,實時提示播報,語音內容無需再固化內置,WT3000T離線TTS系列配合客戶MCU即可實現該功能。應用框圖如下:
05方案五
支持離在線文本合成播報打印機,針對帶WIFI類打印機,或者不帶WIFI打印機,配套WT3000A M系列模組,上面自帶WIFI+語音芯片,可實現文本合成超擬人的音色,還支持自定義添加背景音樂及效果,可帶來生動有趣、富有感染力的聽覺體驗。應用框圖如下:
方案四和五對比優勢:
參數對比 | 傳統離線TTS | 離在線TTS |
語種 | 中文、中英文 | 支持16國語種,6種國內方言 |
音質 | 音色相對偏機械點 | 音色更豐富,支持超擬人音色 |
實時性 | MCU下發UART文本合成指令,離線速度相比在線更快點 | 合成速度會存在1-2秒的延時,與WIFI網絡穩定性及緩存有關 |
本地音頻播放 | 以WT3000T為例,除TTS合成文本播放外,A版本可內置30秒固定音播放,D版本可內置500秒固定音播放 | WT3000A本地本地音頻播放,時長與掛載存儲器容量有關,如32Mbit flash可內置16kbps的音頻約34分鐘 |
AI擴展 | 不支持 | 可引入AI對話,服務器部署產品知識庫,在文本合成的基礎上,增加產品的售前問答,趣味性對話等,更具個性化服務 |
開發調試工具 | 配套樣片/協議/Demo板,開發快 | 提供服務器部署支持、手機app demo、測試板、樣片/IC控制協議 |
項目成本優勢 | 唯創離線版TTS,同級別效果,價格有優勢 | WT3000A離在線TTS方案對比市面上在線TTS方案,價格更具吸引力,可擴展定制自定義功能 |
離在線TTS原理及技術特點:
· 主要組成為MCU+語音IC、WIFI芯片+服務器這幾大核心部分,分為上下位機來做描述:
-上位機:主要由兩部分組成,APP(配合Demo板操作演示)、服務器
· APP:一鍵藍牙配網,文本合成下發,設置語種、音色、音調、音量;
· 服務器:文本音頻合成下發、可接入AI大模型對話;
-下位機:主要由三部分組成,MCU、WT3000A+功放、WIFI芯片
· MCU:客戶自有主控部分,驅動外設(實現本身產品的功能、交互)、通過UART接口下發文本信息(文本格式支持GB2312、UTF-8等格式)、控制本地音頻播放、發起配網請求等;
· WT3000A+功放:與MCU/WIFI模組通訊、解碼播放;
· WIFI芯片:聯網、音頻數據傳輸,當前傳輸采用MQTT協議,本司私有協議,建立訂閱后,根據不同的主題,發布相關內容,詳情請參考本司相關資料。
AUTUMN總結
基于打印機方案,唯創可提供多種語音播報類方案,如簡單語音播報、語音更新方案(USB/UART/藍牙更新....)、離在線TTS方案等。如需要IC樣品或Demo板測試體驗,及更多技術交流,可聯系本司業務人員,或官網留言,歡迎交流分享!
-
語音合成
+關注
關注
2文章
90瀏覽量
16178 -
語音播報
+關注
關注
1文章
28瀏覽量
14562 -
TTS
+關注
關注
0文章
42瀏覽量
10811 -
語音方案
+關注
關注
1文章
14瀏覽量
2719
發布評論請先 登錄
相關推薦
評論