玄幻小说完本,完美世界txt下载,已完本玄幻小说排行榜

一、概述

作為最自然的人機交互方式 ——語音，正在改變?nèi)藗兊纳睿S富多媒體技術(shù)的應(yīng)用。語音識別技術(shù)是語音信號處理的一個重要分支，也是近年來很火的一個研究領(lǐng)域。隨著科技的飛速發(fā)展，語音識別不僅在桌面PC和大型工作站得到了廣泛應(yīng)用，而且在嵌入式系統(tǒng)領(lǐng)域也占有一席之地，如智能家居、語音助手、車載語音識別系統(tǒng)等。相信在不久的將來，語音識別技術(shù)必定會滲透在人們生活的每個角落。

二、語音識別系統(tǒng)的分類

語音識別按照說話人的說話方式可以分為孤立詞（IsolatedWord）識別、連接詞（Connected Word）識別和連續(xù)語音（Continuous Speech）識別。孤立詞識別是指說話人每次只說一個詞或短語，每個詞或短語在詞匯表中都算作一個詞條，一般用在語音電話撥號系統(tǒng)中；連接詞語音識別支持一個小的語法網(wǎng)絡(luò)，其內(nèi)部形成一個狀態(tài)機，可以實現(xiàn)簡單的家用電器的控制，而復(fù)雜的連接詞語音識別系統(tǒng)可以用于電話語音查詢、航空訂票等系統(tǒng)；連續(xù)語音識別是指對說話人以日常自然的方式發(fā)音，通常特指用于語音錄入的聽寫機。

從識別對象的類型來看，語音識別可以分為特定人（SpeakerDependent）語音識別和非特定人（Speaker Independent）語音識別。特定人是指只針對一個用戶的語音識別，非特定人則可用于不同的用戶。

從識別的詞匯量大小可以分為小詞匯量（詞數(shù)少于100）、中等詞匯量（詞數(shù)100~500）和大詞匯量（詞數(shù)多于500）。

非特定人大詞匯量連續(xù)語音識別是近幾年研究的重點，也是研究的難點。目前的連續(xù)語音識別大多是基于HMM（隱馬爾科夫模型）框架，并將聲學(xué)、語言學(xué)的知識統(tǒng)一引入來改善這個框架，其硬件平臺通常是功能強大的工作站或PC機。

三、語音識別的原理

語音識別就是對麥克風(fēng)輸入的語音信號進行解析和理解，并將其轉(zhuǎn)化為相應(yīng)的文本或命令。

一個完整的語音識別系統(tǒng)主要包括三個部分：

語音特征提取（前端處理部分）：目的是濾除各種干擾成分，從語音波形中提取出隨時間變化的能表現(xiàn)語音內(nèi)容的特征矢量序列。

聲學(xué)模型和模式匹配（識別算法）：聲學(xué)模型通常由獲得的語音特征通過訓(xùn)練產(chǎn)生，目的是為每個發(fā)音建立發(fā)音模板。在識別時將輸入的語音特征同聲學(xué)模型進行匹配與比較，得到最佳識別結(jié)果。

語義理解（后處理）：計算機對識別結(jié)果進行語義、語法分析，明白語音的意義以便做出相應(yīng)的反應(yīng)，通常通過語言模型來實現(xiàn)。

語音識別原理如下圖所示：

待識別語音經(jīng)話筒轉(zhuǎn)化為電信號后加在識別系統(tǒng)的輸入端，經(jīng)過預(yù)處理，接著進行語音特征提取，用反映語音信號特征的若干參數(shù)來代表原始語音。常用的語音特征包括：線性預(yù)測系數(shù)（LPC）、線性預(yù)測倒譜系數(shù)（LPCC）、Mel頻譜系數(shù)（MFCC）等。

接下來分為兩個階段：：訓(xùn)練階段和識別階段。

在訓(xùn)練階段，對用特征參數(shù)形式表示的語音信號進行相應(yīng)處理，獲得表示識別基本單元共性特點的標(biāo)準(zhǔn)數(shù)據(jù)，以此構(gòu)成參考模板，將所有能識別的基本單元的參考模板結(jié)合在一起，形成參考模式庫；

在識別階段，將待識別的語音信號經(jīng)特征提取后逐一與參考模式庫中的各個模板按某種原則進行匹配，找出最相似的參考模板所對應(yīng)的發(fā)音，即為識別結(jié)果。

最后進行語音處理，涉及語法分析、語音理解、語義網(wǎng)絡(luò)等。

語音識別過程要根據(jù)模式匹配原則，計算未知語音模式與語音模板庫中的每一個模板的距離測度，從而得到最佳的匹配模式。語音識別所應(yīng)用的模式匹配方法主要有動態(tài)時間規(guī)整（Dynamic Time Warping，DTW），隱馬爾科夫模型（Hidden Markov Model，HMM）和人工神經(jīng)元網(wǎng)絡(luò)（Artificial Neural Networks，ANN）。

四、難題

識別率是衡量語音識別系統(tǒng)性能好壞的一個重要指標(biāo)，在實際應(yīng)用中，識別率主要受到以下幾個因素的影響：

對于漢語語音識別，方言或口音會降低識別率；

背景噪聲。公共場所的強噪聲對識別效果影響甚大，即使是在實驗室環(huán)境下，敲擊鍵盤、移動麥克風(fēng)都會成為背景噪聲；

“口語”問題。它既涉及到自然語言理解，又與聲學(xué)有關(guān)。語音識別技術(shù)的最終目的是要讓用戶在“人機對話”時，能夠像進行“人與人對話”一樣自然，而一旦用戶以跟人交談的方式進行語音輸入時，口語的語法不規(guī)范和語序不正常的特點會給語義的分析和理解帶來困難。

此外，識別率還與說話人的性別、說話時間長短等有關(guān)。

實時性是衡量語音識別系統(tǒng)性能好壞的另一指標(biāo)。對于具有高速運算能力的CPU和大容量存儲器的PC而言，基本上能夠滿足實時性的要求；而對于資源有限的嵌入式系統(tǒng)來說，實時性幾乎得不到保證。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

存儲器

存儲器

+關(guān)注

關(guān)注
38

文章
7521

瀏覽量
164087
智能家居

智能家居

+關(guān)注

關(guān)注
1928

文章
9590

瀏覽量
185786
語音識別

語音識別

+關(guān)注

關(guān)注
38

文章
1742

瀏覽量
112747

原文標(biāo)題：語音識別之初體驗

文章出處：【微信號：Imgtec，微信公眾號：Imagination Tech】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

音頻信息識別與檢索技術(shù)

隨著互聯(lián)網(wǎng)（Internet）和電信網(wǎng)等信息網(wǎng)絡(luò)的蓬勃發(fā)展，人們的信息交互變得越來越方便，除了文字信息，語音、音樂、圖像等多媒體信息也越來越多地進入了人們的日常生活中。例如，

發(fā)表于 03-05 22:53

優(yōu)秀移動應(yīng)用對人們生活的影響

互聯(lián)“指尖時代” 隨著移動互聯(lián)網(wǎng)市場規(guī)模的不斷擴增，移動應(yīng)用開始變得越來越多樣化，服務(wù)越來越精細化，幾乎已滲透到與人們生活息息相關(guān)的各個領(lǐng)域，每天人們只需輕輕的觸碰指尖，就能夠隨時隨地

發(fā)表于 07-22 16:41

基于labview的語音識別

`1系統(tǒng)概述語音識別技術(shù)是二十世紀(jì)信息技術(shù)領(lǐng)域十大重要的科技發(fā)展技術(shù)之一。語音

發(fā)表于 03-10 22:00

LWIP數(shù)據(jù)量大時傳輸必定會終止但又能ping通是怎么回事？

; failed at line 650 in ..\LWIP\lwip-1.4.1\src\core\pbuf.c出現(xiàn)上面這些錯誤必定會丟數(shù)據(jù)；Assertion "pbuf_take

發(fā)表于 08-29 00:50

模式識別的關(guān)鍵技術(shù)

領(lǐng)域中，聲紋識別技術(shù)以其獨特的方便性、經(jīng)濟性和準(zhǔn)確性等優(yōu)勢受到世人矚目，并日益成為人們日常生活和工作中重要且普及的安驗證方式。而且利用基因算法訓(xùn)練連續(xù)隱馬爾柯夫模型的

發(fā)表于 12-11 14:17

語音識別技術(shù)的概念及應(yīng)用前景

解決的問題，就是使得設(shè)備可以用聽覺感知周圍的世界，用聲音和人做最自然的交互，讓操控和生活更為便捷。智能語音的基礎(chǔ)在于通過神經(jīng)網(wǎng)絡(luò)技術(shù)，提升語音識別

發(fā)表于 05-27 09:41

2010年必定會成為pcb市場復(fù)蘇的一年

2010年必定會成為pcb市場復(fù)蘇的一年在經(jīng)歷了2009年的衰退之后，無論是全球市場還是中國市場，2010年必定會成為pcb市場復(fù)蘇的一年。

發(fā)表于 01-25 09:02 ?886次閱讀

國內(nèi)語音識別技術(shù)上市公司匯總_語音識別技術(shù)現(xiàn)狀_語音識別原理及應(yīng)用

語音識別技術(shù)的發(fā)展已經(jīng)普遍的存在了我們生活當(dāng)中，本文主要詳細介紹了語音識別

發(fā)表于 12-13 18:04 ?9935次閱讀

AI語音識別技術(shù)將改變我們的生活

在互聯(lián)網(wǎng)人工智能的時代，各種各樣的語音識別技術(shù)越來越智能成熟，生活中手機我們也常常都在使用語音

發(fā)表于 08-29 16:27 ?1330次閱讀

聲紋識別具備怎樣的優(yōu)勢

隨著5G的商用進一步的推進了物聯(lián)網(wǎng)的構(gòu)建，萬物互聯(lián)作為發(fā)展目標(biāo)，非接觸式識別技術(shù)聲紋識別必定會有非常大的應(yīng)用場景。

發(fā)表于 09-30 10:38 ?2205次閱讀

聲紋識別具備怎樣的優(yōu)勢

隨著5G的商用進一步的推進了物聯(lián)網(wǎng)的構(gòu)建，萬物互聯(lián)作為發(fā)展目標(biāo)，非接觸式識別技術(shù)聲紋識別必定會有非常大的應(yīng)用場景。

發(fā)表于 04-22 16:24 ?3369次閱讀

美國發(fā)展EDA,華為業(yè)務(wù)必定會受到影響

美國商務(wù)部針對華為進行制裁升級，除了祭出致命的晶圓代工外，另一大利器就是EDA，兩大招一齊使出，華為輪值董事長郭平?也不得不承認(rèn)華為業(yè)務(wù)必定會受到影響。

發(fā)表于 07-14 08:54 ?966次閱讀

語音識別技術(shù)的行業(yè)應(yīng)用與發(fā)展趨勢

一、引言隨著科技的不斷發(fā)展，語音識別技術(shù)已經(jīng)滲透到各個行業(yè)中，并逐漸改變著人們的生活方式。本文

發(fā)表于 10-18 16:10 ?975次閱讀

語音識別技術(shù)在智能家居領(lǐng)域的應(yīng)用與前景

一、引言隨著人工智能和物聯(lián)網(wǎng)技術(shù)的快速發(fā)展，智能家居成為了人們日常生活的重要部分。語音識別技術(shù)

發(fā)表于 10-26 14:27 ?1364次閱讀

語音識別技術(shù)在智能家居領(lǐng)域的創(chuàng)新應(yīng)用與挑戰(zhàn)

隨著人工智能和物聯(lián)網(wǎng)技術(shù)的快速發(fā)展，智能家居成為了人們日常生活的重要部分。語音識別技術(shù)作為智能家

發(fā)表于 11-01 17:11 ?890次閱讀

在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

搜索歷史

語音識別技術(shù)必定會滲透在人們生活的每個角落

評論

音頻信息識別與檢索技術(shù)

優(yōu)秀移動應(yīng)用對人們生活的影響

基于labview的語音識別

LWIP數(shù)據(jù)量大時傳輸必定會終止但又能ping通是怎么回事？

模式識別的關(guān)鍵技術(shù)

語音識別技術(shù)的概念及應(yīng)用前景

2010年必定會成為pcb市場復(fù)蘇的一年

國內(nèi)語音識別技術(shù)上市公司匯總_語音識別技術(shù)現(xiàn)狀_語音識別原理及應(yīng)用

AI語音識別技術(shù)將改變我們的生活

聲紋識別具備怎樣的優(yōu)勢

聲紋識別具備怎樣的優(yōu)勢

美國發(fā)展EDA,華為業(yè)務(wù)必定會受到影響

語音識別技術(shù)的行業(yè)應(yīng)用與發(fā)展趨勢

語音識別技術(shù)在智能家居領(lǐng)域的應(yīng)用與前景

語音識別技術(shù)在智能家居領(lǐng)域的創(chuàng)新應(yīng)用與挑戰(zhàn)