伴隨高科技技能在軍事范疇的廣泛運用,武器裝備也逐步向高、精、尖方向發(fā)展。傳統(tǒng)的軍事練習時間長,訓練費用高,訓練場地狹小,訓練效果往往達不到預想的效果,對現代軍事訓練的要求已經不適應。為解決上述問題,模仿練習應運而生。為了進一步提高練習效果,本文利用智能語音交互芯片設計了一個模擬練習器的示教回放系統(tǒng)。教學演示系統(tǒng)通過給操作者生動的演示來規(guī)范操作者的操作流程和相應的操作表現,大大縮短了操作者的練習時間,提高了練習效果。回放系統(tǒng)記錄操作練習過程中每一位操作者的口令、聲音強度、動作、瞬間、動作表象等,待操作練習結束后再重復練習過程,以便操作者及時糾正自己的錯誤。示教系統(tǒng)也可理解為對規(guī)范操作練習進程的回放。該系統(tǒng)不需求虛擬現實技能的撐持,在小型的嵌入式系統(tǒng)上就能夠完結。
1系統(tǒng)原理
該模仿練習器由一臺測控計算機和多臺從設備構成。如圖1所示。在此僅對一臺從設備進行介紹,其硬件系統(tǒng)主要由測控計算機、Arduinomega2560操控器、語音辨認單元、聲強檢測單元、語音組成單元、面板操控單元、儀器面板等構成。面板操控單元較為復雜,包含多種操控電路,在模仿練習中擔任該從設備在Arduinomega2560操控器的操控下完結整個練習進程,在示教與回放系統(tǒng)中完結對方才操作練習操作表象的重演,其詳細電路規(guī)劃在此不做介紹。
語音辨認單元擔任辨認操作人員的操作口令;聲強檢測單元擔任檢測聲強巨細并以此作為判別是哪臺從設備操作人員口令的依據;Arduinomega2560操控器擔任監(jiān)督儀器面板各元件的狀況來辨認操作人員的動作,然后完結對操作練習進程的記載。各儀器的操作表象依據操作動作事前編制無需記載。在操作回放進程中,測控計算機依據所記載的數據,經過操控相應從設備的Arduinomega2560操控器重現所記載的操作進程。
2單元系統(tǒng)規(guī)劃
2.1語音辨認單元規(guī)劃
當時,語音辨認技能的開展十分迅速,依照辨認目標的類型能夠分為特定人和非特定人語音辨認。特定人是指辨認目標為專門的人,非特定人是指辨認目標是針對大多數用戶,通常需求收集多自己的語音進行錄音和練習,經過學習,然后到達較高的辨認率。
這篇文章選用的LD3320語音辨認芯片是一顆依據非特定人語音辨認(SpeakerIndependentAutomaticSpeechRecognition,SIASR)技能的芯片。該芯片上集成了高精度的A/D和D/A接口,不再需求外接輔佐的FLASH和RAM,即能夠完結語音辨認、聲控、人機對話功用,供給了真實的單芯片語音辨認解決方案。而且,辨認的要害詞語列表是能夠動態(tài)編輯的。其語音識別過程如圖2所示。
語音辨認單元選用ATmega168作為MCU,擔任操控LD3320完結一切和語音辨認有關的作業(yè),并將辨認成果經過串口上載至Arduinomega2560操控器。對LD3320芯片的各種操作,都必須經過寄存器的操作來完結,寄存器讀寫操作有2種方法(規(guī)范并行方法和串行SPI方法)。在此選用并行方法,將LD3320的數據端口與MCU的I/O口相連。
語音辨認流程選用中止方法作業(yè),其作業(yè)流程分為初始化、寫入要害詞、開端辨認和呼應中止等。MCU的程序選用ARDUINOIDE編寫,調試完結后經過串口進行燒錄,操控LD3320完結語音辨認,并將辨認成果上載至Arduinomega2560操控器。其硬件連接圖如圖3所示。
2.2聲強檢測單元規(guī)劃
在進行語音辨認時需求判別是某一臺從設備操作人員的口令,為此規(guī)劃聲強檢測單元電路,該電路僅需能夠判別出相對聲強的巨細,無需檢測聲級,對檢測精度需求較低。
電容式MIC聲響傳感器將外部聲響信號變換成電信號,經NE5532擴大電路進行擴大,將輸入的微弱音頻信號變換為具有一定幅值的電壓信號,該電壓信號經AC/DC有效值變換電路進行裝換后進行再次擴大,最終由Arduinomega2560操控器的A/D進行采樣。其間D1端接Arduinomega2560操控器的A/D,INT1端接Arduinomega2560操控器的外部中止1.當外界聲響信號大于預設的閾值時,三極管導通INT1端由高電平變?yōu)榈碗娖桨l(fā)作外部中止,操控器呼應中止并進行A/D采樣,采樣數據經均值濾波后保留,待測控計算機查詢時上載該聲強數據。
2.3語音組成單元規(guī)劃
TTS(TextToSpeech)文本轉語音技能是人機智能對話開展的趨勢。依據TTS技能的語音系統(tǒng)無需事前錄音就能夠隨時依據查詢條件查出并組成語音進行播報,然后大大減少了系統(tǒng)維護的作業(yè)量。利用此技能,經過MCU或許PC機就能操控語音芯片發(fā)音。
這篇文章選用SYN6658中文語音組成芯片進行語音組成。SYN6658經過UART接口或SPI接口通訊方法,接納待組成的文本數據,完結文本到語音(或TTS語音)的變換。操控器和SYN6658語音組成芯片之間經過UART接口銜接,操控器經過串口通訊向SYN6658語音組成芯片發(fā)送操控指令和文本,SYN6658語音組成芯片把接納到的文本組成為語音信號輸出,輸出的信號經LM386功率擴大器進行擴大后銜接到喇叭進行播映。
SYN6658語音組成電路選用芯片硬件數據手冊供給的典型使用電路進行規(guī)劃,在此不做介紹,功率擴大電路選用美國國家半導體出產的音頻功率擴大器LM386進行擴大。
在進行語音組成時首要進行初始化,包含發(fā)音人挑選、數字處理策略、語速調理、語調調理、音量調理等。
因為該系統(tǒng)要模仿多人發(fā)音,所以不一樣的從設備設置不一樣的發(fā)音人及語調與語速以便于區(qū)別。初始化后等待測控計算機的語音組成指令,待收到指令后芯片會向上位機發(fā)送1字節(jié)的狀況回傳,上位機可依據這個回傳來判別芯片當時的作業(yè)狀況。
3系統(tǒng)軟件規(guī)劃
示教與回放系統(tǒng)的軟件規(guī)劃包含測控計算機的軟件規(guī)劃和各從設備Arduinomega260操控器的軟件規(guī)劃。
測控計算機是整個系統(tǒng)的操控中心,其軟件選用C#進行編寫,在示教與回放系統(tǒng)中主要是對操作數據的記載以便依據所記載的數據對操作進程進行準確回放,需求記載的數據包含:各從設備操作人員的操作口令,操作動作,口令及動作時刻,各操作對應的操作表象。為簡化記載數據,事前編制好各事情代碼,記載進程只記載代碼,大大提高程序效率。建立結構體如下:
在操作練習進程中測控計算機每隔50ms對下位機進行操控及輪詢,并記載反應數據,在數據記載時以50ms為一個單位。選用定時器對時刻進行操控。在回放進程中首要比對當時時刻和所記載的時刻,當所記載的時刻與當時時刻吻合時測控計算機操控下位機履行該事情,完結事情回放。
Arduinomega2560操控器擔任接納測控計算機的操控指令并履行指令,讀取語音辨認成果,對聲強數據收集和處理,操控語音組成單元進行語音組成等。Arduinomega2560操控器選用串口中止的方法進行指令接納。
測控計算機一旦正確接收到指令,就會執(zhí)行并傳回結果。如果測控計算機在限定的時間內沒有得到回傳結果,就會顯示出故障,測控計算機就需要重新發(fā)送指令。下面顯示了數據接收的流程。本文運用智能語音芯片對模擬練習器的示教與播放系統(tǒng)進行了設計,該系統(tǒng)目前還不能支持當前流行的虛擬現實技術,僅能支持MCU操作。本系統(tǒng)還可用于小型便攜設備,具有出色的使用前景。
-
語音交互
+關注
關注
3文章
286瀏覽量
28015 -
智能語音芯片
+關注
關注
0文章
19瀏覽量
6901 -
智能語音交互
+關注
關注
0文章
21瀏覽量
2814
發(fā)布評論請先 登錄
相關推薦
評論