應用展望 - 語音識別系統中增加圖像識別技術的設計應用

　　3 應用展望

　　語音識別是一種賦能技術，現有的很多人機交互界面都可能通過補充語音識別功能而得到改善。語音識別技術可以把費腦、費力、費時的機器操作變成一件很容易且有趣味性的事情，在許多“手忙”、“手不能用”、“手所不能及”、“懶得動手”的場景中，包括像駕駛室、一些危險的工業場合、家電控制等方面，高識別率的語音識別系統將會更加方便人的工作和生活。

　　由于知識層次和知識領域的差異，現實生活中有相當一部分人很難享受到現代化生活帶來的便利，包括信息服務和其他各類先進設備可提供的幫助。高識別率語音識別技術有助于改善這種情況，使社會各個階層更多的人享受到更多的社會信息資源和現代化服務，提高整個社會的信息化程度和現代化速度。

　　高識別率語音識別技術還將推出機器人智能技術的發展，由于機器人本來就要配置視覺系統，本方案很容易實現，提高了人與機器交互的能力。另外高識別率語音識別技術在語音錄入系統、會議實時記錄及同聲翻譯、記者采訪設備等方向有著廣闊的應用前景。

　　語音識別技術關系到多學科的研究領域，不同領域中的研究成果都對語音識別的發展作出了貢獻。讓機器識別語音的困難在某種程度上就像一個外語不好的人聽外國人講話一樣，它與說話人、說話速度、說話內容、環境條件有關。語音信號本身的特點造成了語音識別的困難。

　　這些特點包括多變性、動態性、瞬時性和連續性等。

　　計算機語音識別的過程與人對語音識別處理過程基本上是一致的。目前主流的語音識別技術是基于統計模式識別的基本理論。一個芫整的語音識別系統可大致分為三部分：語音特征提取其目的是從語音波形中提取出隨時間變化的語音特征序列。

　　聲學模型與模式匹配（識別算法）：聲學模型通常將獲取的語音特征通過學習算法產生。在識別時將輸入的語音特征與聲學模型（模式）進行匹配、比較，得到最佳的識別結果。

　　語言模型與語言處理語言模型包括由識別語音命令構成的語法網緒或由統計方法構成的語言模型，語言處理可以進行語法、語義分析。對小詞表語音識別系統，通常不需要語言處理部分。

　　聲學模型是識別系統的底層模型，并且是語音識別系統中最關鍵的一部分。聲學模型的目的是提供一種有效的方法，計算語音的特征矢量序列和每個發音模板之間的距離。聲學模型的設計與語言發音特點密切相關。

　　聲學模型單元大?。ㄗ职l音模型、半音節模型或音素模型）對語音訓練數據量大小、系統識別率以及靈活性有較大的影響。必須根據不同語言的特點、識別系統詞匯量的大小決定識別單元的大小。

　　語言模型對中、大詞匯量的語音識別系統特別重要。當分類發生錯誤時可以根據語言學模型、語法結構、語義學進行判斷糾正，特別是一些同音字則必須通過上下文結構才能確定詞義。語言學理論包括語義結構、語法規則、語言的數學描述模型等有關方面。目前比較成功的語言模型通常是采用統計語法的語言模型與基于規則語法結構命令的語言模型。語法結構可以限定不同詞之間的相互連接關系，減少了識別系統的搜索空間，這有利于提高系統的識別。

　　語音識別過程實際上是一種認識過程。就像人們聽語音時，并不把語音和語言的語法結構、語義結構分開。

　　因為當語音發音模糊時人們可以用這些知識來指導對語言的理解過程，但是對機器來說，識別系統也要利用這些知識，只是如何有效地描述這些語法和語義還有困難：小詞匯量語音識別系統包括幾十個詞的語音識別系統。

　　中等詞匯量的語音識別系統通常包括幾百個詞至上干個詞的識別系統。

　　大詞匯量語音識別系統通常包括幾干至幾萬個詞的語音識別系統。

　　這些不同的限制也確定了語音識別系統的困難度。

　　由于有了種種困難，語音識別技術通常根據使用中的限制性要求，構建成不同類型的系統，通常包括三類。

　　其一為限制用戶的說話方式，這又可以分為孤立詞語音音識別系統（connected-wordsspeechrecognitionsystem）、連續語音識別系統（continuespeechrecognitionsystem）和即興口語語音識別系統（spontaneousspeechrecognitionsystem）。其二為限制用戶的用詞范圍。第三種為限制系統的用戶對象。

　　1增加圖像識別設計的目的如今的語音識別技術正在逐漸成熟，許多語音識別技術都已經能夠達到很高的識別率了，不過當識別率到了一定的程度后，再提高就很困難，此時需要采用其他技術來協助語音的識別。

　　目前的語音識別系統由于采用單一傳感器（聲音傳感器）進行工作，在進行語音識別時，不可能對捕獲的語音信息進行細分，只能采用定速率跟蹤識別，將語音信息與系統庫中的模板進行匹配判斷。如果捕獲信息的速率與存儲在系統庫中的模板相差不多，則能正常工作，否則將會出現誤判。然而現實生活中，人們說話不可能總保持相同的速率，而是不斷變化的，這勢必造成了語音識別系統的誤差增多，以致降低語音識別系統的實用性。

　　人們在進行語言交流時，在捕獲語音信息的同時，也在獲取其他的信息以幫助理解，例如表情、神態等信息。如果得不到相關信息，人們相互之間也會產生誤解，例如當兩個人在相隔較遠距離時，由于不能清楚對方的表情、神態，經常會出現理解錯誤的情況發生?？梢娛褂脝我坏男畔⑶赖拇_會增加理解難度，因此有必要考慮增加信息渠道來解決這個問題。這就是增加圖像識別功能的原因。

　　對于語音識別系統，如果能像人一樣判斷語言對象的喜、怒、哀、樂，當然是最好的，但這勢必大大增加圖像識別的工作量，甚至超過語音識別的成本，不太合理。

　　并且，由于技術的原因，還不能使機器有像人一樣的視覺能力，要讓機器能夠準確識別出人的各種表情還達不到，所以此種方案是不可取的。進一步分析知道，語音識別系統受語速的影響是很大的。人在正常講話時，嘴的開合狀態都是大同小異的，如果讓機器只對嘴的開合兩種情況進行判斷和實時跟蹤，得出講話人的語速信息，是能夠做到的。所以僅僅需要機器識別出人說話的速度，以此來調整語音識別的匹配速度，從而適合語音韻律，自然有利于系統的語音識別能力，提高識別的準確性。通過語速對語音識別系統的幫助，將為語音系統提供另一條實用的信息渠道。

　　采用語速作為系統的第二信息渠道，一旦系統跟蹤到了目標的語速，在協助語音識別的同時還能夠有效地排除與語音信息不同步的外界噪聲，因此系統能夠獲得更好的識別性能。

　　2實現的技術及方法2.1系統總體設計概述語音系統采集說話人（語言對象）的兩路信息，一路由聲音傳感器取得，一路由攝像設備取得。攝像設備取得人的嘴型變化后，將之轉化為語速信息送到語音識別器與采集到的語音進行匹配識別，自動調節識別速度，更好地芫成語音識別工作。系統的工作流程如。

　　2.2輔助圖像識別設計捕獲語言對象的說話速率是保證整個系統良好工作的關鍵。為了實現此目的，使用基于機器視覺的人嘴部狀態檢測方法來設計。由于對圖像的識別精度要求不高，可以選擇灰度圖像以提高運算速度。在速度允許的情況下，彩色圖像的識別精度會更高。

　　流程分析整個輔助圖像識別設計的目的就是通過機器視覺進行圖像采集、圖像處理，提取出說話人的語速信息供語音系統使用。

　　以灰度圖像為例，其圖像處理過程如。

　　采樣（像索mxn）*》量化（處理灰度G）*完成圖像數字化y進一步抽象及描述 |分類、識別及理解圖特征*田像的特征提取特征空間圄2灰度圄像的處理流程對于彩色圖像，特征量會更多一些，也就更復雜一些，但其基本步驟都是先芫成圖像數字化，再進行圖像特征提取，最后進行圖像識別和理解。

　　當芫成圖像處理后，比較模塊將這一幀圖像與上一幀圖像的數據進行對比，判斷出變化，從而統計出語速信息，最后輸出給語音識別器進行匹配工作。

　　圖像處理算法設計經過對人臉RGB像素的分析，發現人臉圖像中的R、G兩分量符合二維高斯分布。因此，可通過這兩個分量確定人臉的位置。在人臉定位的基礎上，根據人的嘴部處于人臉下半部分的特征，比較容易確定出嘴部的大致位置，它為嘴部精確定位提供了基本條件，如所示。

　　根據系統要求，灰度圖像可以滿足需要，但由于嘴唇與皮膚的灰度差別不大，而且灰度信息更容易受到光照條件、人臉的運動和旋轉變化等影響，使人臉圖像中嘴唇區域邊緣不明顯，特別是當嘴唇內部的陰影區域與牙齒交替出現時，嘴唇的邊緣變得更加模糊。所以利用唇色和膚色的灰度及邊緣信息分割不能達到很高的準確度。若要提高對嘴部狀況的識別準確度，可以利用彩色信息來對人嘴的形狀、位置進行確定。

　　研究發現，嘴唇的主要顏色特征是唇色相對膚色顏色較紅，而且歸一化RGB顏色對光照、人臉運動和旋轉具有不變性。因此利用顏色信息，采用模式分類技術分割嘴唇區域，可以克服灰度圖像本身固有的缺點。由于Fisher線性分類器能夠最大限度地分開兩類，且其學習是離線處理，減少了計算量，因此可采用Fisher線性分類器進行嘴唇區域分割。

　　人嘴在說話與正常情況下的外形有明顯的區別。說話時嘴部張開較大，而正常情況下，嘴部基本閉合（）。因此，可以利用這些特征進行嘴部狀態的檢測。研究中發現，嘴部區域的最大寬度WU、最大高度Hmx能夠表征嘴部的張開程度，應取為特征值；上嘴唇與下嘴唇之間的高度H在說話和不說話時也有明顯不同，應取為特征值。將以上三個特征值組成一組向量，即可描述出不同狀態下的嘴部幾何特征，如所示。

　　將獲得的能夠描述人的嘴部區域幾何形狀特征參數組成一個特征向量Zu，即可作為下一步判別分類的在進行識別時只要確定兩個狀態“開”、“合”即可。

　　在實際中由于發音時不同的語音會導致嘴的開合程度不一，所以對“開”（氏》0）的區分會很多種情況，必然會極大地增加運算存儲量。相對而言，嘴的“閉合”狀態一般只有一種模式（HmO），因此可以只確定說話人嘴的“閉合”狀態，其他狀態都判為“開”，這樣將方便處理。

　　由于對識別精度要求不高，既可以采用傳統的統計模式識別方法，也可以采用較熱門的神經網緒識別方法；但由于系統對實時要求較高，而神經網緒識別方法運行速度成問題，因此不建議采用神經網緒識別方法。

　　2.3語速信息的提取選用合適的捕獲頻率不斷采集說話人的圖像，用當前幀的數據與上一幀數據進行比較，根據其變化的頻率就可以推算出語速信息。實際情況中，所求的語速信息不需要太精確就能夠達到一般要求。

　　3應用展望語音識別是一種賦能技術，現有的很多人機交互界面都可能通過補充語音識別功能而得到改善。語音識別技術可以把費腦、費力、費時的機器操作變成一件很容易且有趣味性的事情，在許多“手忙”、“手不能用”、“手所不能及”、“懶得動手”的場景中，包括像駕駛室、一些危險的工業場合、家電控制等方面，高識別率的語音識別系統將會更加方便人的工作和生活。

　　高識別率語音識別技術還將推動機器人智能化技術的發展。由于機器人本來就要配置視覺系統，本方案很容易實現，提高了人與機器交互的能力。另外高識別率語音識別技術在語音錄入系統、會議實時記錄及同聲翻譯、記者采訪設備等方向有著廣闊的應用前景。

閱讀全文

上一頁 1 23全文

本文導航

圖像識別(37828) 圖像識別(37828)
語音識別(111781) 語音識別(111781)

智能家庭應用之語音識別系統

開發基于自然語言的語音識別系統面臨許多技術挑戰，包括使用精確的語音識別引擎將機器聽到的內容翻譯成文字—以及一個綜合的自然語言處理器

2015-10-20 09:31:10

3998

1小時玩轉AI語音識別

`報名鏈接：http://t.elecfans.com/live/563.html直播主題及亮點本次直播講解AI語音識別核心技術知識以及語音識別系統架構，現場實操寫代碼實現語音采集、語音傳輸與解析

2018-09-19 13:40:42

圖像識別技術在印刷線路板精密測試中的應用

結果如圖5。經分析，該導線實際寬度為L0=286.2μm，測試數值為最大寬度Lmax=286.8μm，最小寬度Lmin=285.8μm，則測量系統的誤差為：　　將圖像識別技術應用于印制線路板的精密測量，試驗結果表明該系統具有較高的測試精度(0.6μm)，可滿足印制線路板的高精度測量。:

2018-11-22 11:01:25

語音識別的現狀如何？

語音識別技術的最重大突破是隱含馬爾科夫模型Hidden Markov Model的應用。從Baum提出相關數學推理，經過Labiner等人的研究，卡內基梅隆大學的李開復最終實現了第一個基于隱馬爾科夫模型的大詞匯量語音識別系統Sphinx。此后嚴格來說語音識別技術并沒有脫離HMM框架。

2019-10-08 14:29:52

語音識別系統在智能家庭系統中的應用是什么？

語音識別系統在智能家庭系統中的應用是什么？

2021-05-31 06:54:34

FPGA和Nios_軟核的語音識別系統的研究

FPGA和Nios_軟核的語音識別系統的研究引言語音識別的過程是一個模式匹配的過程在這個過程中，首先根據說話人的語音特點建立語音模型，對輸入的語音信號進行分析，并提取所需的語音特征，在此基礎上建立

2012-08-11 11:47:15

arduino哪個開發板可以做圖像識別？

arduino哪個開發板可以做圖像識別

2023-09-22 06:49:27

【HarmonyOS HiSpark AI Camera】基于本平臺開源圖像識別與應用

項目名稱：基于本平臺開源圖像識別與應用試用計劃：申請理由本人有多年的學習和開發經驗，曾參與國內開源軟件的開發，對計算機圖像標定技術，圖像識別，基于標識的跟蹤注冊技術有過深入的學習和探索。想借助發燒友

2020-11-19 09:45:40

【NUCLEO-F412ZG申請】圖像識別

申請理由：項目描述：到手后將主要研究個關于圖像識別方面的功能，攝像頭采集圖像數據然后對圖像進行處理，最終的目的是識別出圖像中的文字符號內容（主要是字母數字的識別），以便于測試STM32的運算性能。

2016-11-07 16:34:55

使用緊急呼叫和DSP的語音識別系統

開發并測試了安裝在汽車內、使用簡單離散字的特定發音人語音識別系統。

2019-11-04 07:23:41

幾類汽車識別系統的經典設計方案

車牌識別技術是計算機視頻圖像識別技術在車輛牌照識別中的一種應用。車牌識別技術要求能夠將運動中的汽車牌照從復雜背景中提取并識別出來，通過車牌提取、圖像預處理、特征提取、車牌字符識別等技術，識別車輛牌號

2019-06-28 08:29:44

基于ATMEGAl28的語音識別系統設計

量大，一般在計算機上實現，即使是嵌入式方面，多數方案也需要運算能力強的ARM或DSP，并且外擴RAM、FLASH等資源，增加了硬件成本，這些特點無疑限制了語音識別技術的應用，尤其是嵌入式領域。本系統

2014-03-17 13:31:40

基于AVR單片機的語音識別系統設計

通過簡單的修改，可以很方便地將LD3320驅動程序移植到各種嵌入式系統中。隨著人們對人工智能功能的需求，語音識別技術將越來越受到人們的關注，相信不久的將來，語音識別將會擁有更廣闊的應用。

2021-01-13 15:54:14

基于DSP的快速紙幣圖像識別技術研究

本課題通過對現有圖像識別技術進行研究和分析，針對當前DSP(數字信號處理)技術的新發展，提出了基于DSP的快速圖像識別概念。快速圖像識別技術以嵌入式系統為算法的實現平臺，它結合了當前最新的數信號處理

2014-11-05 14:43:48

基于DSP的漢字語音識別系統如何實現

基于DSP的漢字語音識別系統如何實現

2021-03-12 06:33:15

基于FPGA的車輛牌照識別系統的設計

基于FPGA的車輛牌照識別系統的設計介紹了一種以FPGA 芯片為核心，基于SoPC技術實現的車輛牌照識別系統。系統通過CCD攝像頭完成含車牌圖像的采集，經過系統的存儲、處理來實現車牌識別的目的。系統具有良好的便攜性、靈活性和通用性。詳細的論述了該系統硬件結構和軟件設計思想，并分析了系統具有的優點。

2012-08-11 15:35:45

基于HMM的語音識別系統是怎么訓練的

基于HMM的語音識別系統是怎么訓練的？有哪些步驟？

2021-12-23 06:16:50

基于LabVIEW的語音識別系統

基于LabVIEW的語音識別系統

2020-03-07 16:41:15

基于LabVIEW的語音識別系統

請大家幫幫忙，基于LabVIEW的語音識別系統，要求先錄幾個人的聲音做樣板，然后再讓其中一個人說話，能辨別出是誰說的

2013-05-16 11:16:15

基于STM32嵌入式的孤立詞語音識別系統設計

語音識別是機器通過識別和理解過程把人類的語音信號轉變為相應文本或命令的技術，其根本目的是研究出一種具有聽覺功能的機器。本設計研究孤立詞語音識別系統及其在STM32嵌入式平臺上的實現。識別流程是：預

2021-08-06 08:32:00

基于labview的語音識別

處理過程基本上是一致的。目前主流的語音識別技術是基于統計模式識別的基本理論。一個完整的語音識別系統可大致分為三部分：（1）語音特征提?。浩淠康氖菑?b class="flag-6" style="color: red">語音波形中提取出隨時間變化的語音特征序列。（2）聲學模型

2019-03-10 22:00:15

基于vuforia的圖像識別Jar的使用

Jar包整合入安卓程序中。首先，新建一個安卓應用程序。將提供的Jar包和so庫復制粘貼到程序的libs文件夾中（若無此文件夾則新建）。然后，在需要調用圖像識別Activity的時候，只需要新建一個

2018-09-20 11:58:15

如何去實現一種特定人語音識別系統？

特定人語音識別的方法有哪些？特定人語音識別系統是由哪些部分組成的？如何去實現一種特定人語音識別系統？

2021-05-19 06:44:14

如何構建基于圖像識別的印制線路板精密測試系統？

如何構建基于圖像識別的印制線路板精密測試系統？圖像識別技術在印刷線路板精密測試中的應用

2021-04-27 06:25:52

如何用單片機實現圖像識別？

如何用單片機實現圖像識別

2023-10-25 06:43:45

嵌入式語音識別系統中的電路設計是如何的

調高點或者調低點，空調就會做相應的反應，那到底是如何來實現這些語音交互的呢，那就得說嵌入式語音識別系統了，今天我們先來看一下嵌入式語音識別系統中的電路設計是如何的，是如何實現這些語音交互的。語音識別在現...

2021-12-20 07:52:03

嵌入式語音識別系統在生活中的應用有哪些呢

嵌入式語音識別系統是什么？嵌入式語音識別系統在生活中的應用有哪些呢？

2021-12-23 08:27:03

微軟語音識別系統錯誤率僅為5.1%，達成新的精準里程碑！

　　導讀：微軟今天宣布，其會話語音識別系統的誤率達到了5.1%，是目前為止最低的。 [img][/img] 　　這一數據超過了微軟人工智能和研究團隊去年5.9%的誤差率，并將其準確性與專業的人

2017-08-23 09:18:35

怎么做圖像識別？

怎么做圖像識別

2015-07-22 23:23:16

怎么實現基于STM32F103單片機的車牌識別圖像處理識別系統的設計？

STM32的主要優點是什么？怎么實現基于STM32F103單片機的車牌識別圖像處理識別系統的設計？

2021-09-29 06:29:46

怎么實現基于射頻技術的無線識別系統設計？

本文給出一種實現簡單射頻識別系統的方式。閱讀器和應答器均包含在單片機控制系統中，利用ASK調制與解調電路以及匹配網絡電路，使整個系統的可識別有效距離約為8．3cm，有一定的使用價值。

2021-06-03 06:33:01

怎么設計基于嵌入式系統的語音口令識別系統？

隨著計算機技術和信息技術的迅速發展，語音口令識別已經成為了人機交互的一個重要方式之一。語音口令識別系統將根據人發出的聲音、音節或短語給出響應，如通過語音口令控制一些執行機構、控制家用電器的運行或做出

2019-09-03 08:27:23

怎樣去搭建一個基于kaldi的在線語音識別系統

(GMM+HMM+NGRAM)概述）。一段時間后老板就布置了具體任務：在我們公司自己的ARM芯片上基于kaldi搭建一個在線語音識別系統，三個人花三個月左右的時間完成。由于我們都是語音識別領域的小白，要求...

2021-07-29 08:59:19

怎樣去搭建一個基于kaldi的嵌入式語音識別系統呢

怎樣去搭建一個基于kaldi的嵌入式語音識別系統呢？

2021-12-23 09:30:05

怎樣去搭建一個基于kaldi的嵌入式在線語音識別系統

怎樣去搭建一個基于kaldi的嵌入式在線語音識別系統？分為哪幾個階段呢？

2021-10-28 08:37:01

怎樣去設計一種基于LD3320芯片的嵌入式語音識別系統呢

LD3320語音識別芯片的工作原理是什么？LD3320語音識別芯片有何應用？怎樣去設計一種基于LD3320芯片的嵌入式語音識別系統呢？

2021-12-23 09:50:11

怎樣去設計基于嵌入式Linux的語音識別系統

、超聲波測距和云臺的控制，并將語音識別技術應用于多角度超聲波測距系統中。通過測試，系統可以通過識別語音指令控制測量方向，無需手動干預，最后將測量結果通過語音播放出來。1.引言語言是人類傳播信息的重要手段，語音...

2021-11-04 09:03:09

怎樣去設計并制作出基于STM32的孤立詞語音識別系統呢

語音識別是什么？怎樣去設計并制作出基于STM32的孤立詞語音識別系統呢？

2021-11-08 07:04:19

求一種基于TMS320VC5402的嵌入式音樂語音識別系統設計方案

音樂語音識別系統的硬件電路該如何去設計？音樂語音識別系統的軟件該如何去實現？

2021-12-23 08:50:56

汽車Vin碼識別系統，就用OCR識別技術

案例，全程技術支持，集成簡單、快捷。產品組成----------汽車VIN碼識別系統的優勢——識別率高、識別速度快識別率高達99%，識別速度小于1秒------------——汽車VIN碼識別系統覆蓋

2019-06-28 13:40:19

淺談人臉識別系統在智慧社區方面的應用

` 隨著科學技術的發展與進步，信息技術已經邁入了一個全新的領域。作為人工智能領域的典型分支技術，人臉識別通過比較人臉的視覺特征信息從而進行身份鑒別，既屬于圖像識別，也屬于生物特征識別。而在智慧城市

2017-09-26 14:03:09

給予labview的圖像識別系統，，各位高手能指點一下唄

本帖最后由 wangzhihangxing 于 2012-4-28 10:14 編輯本人要做個圖像識別系統，，Vision里的模塊不夠缺少processing怎么辦

2012-04-25 22:34:05

貼片機中的現代視覺與圖像識別技術

元件和IC封裝中QFP引腳細間距化，以及BGA，CSP，COB，FlipChip和MCM的應用都對貼裝精度的要求進一步提高，對視覺與圖像識別技術要求也越來越高。貼片機中現代視覺與圖像識別技術主要有

2018-09-03 10:25:54

車輛牌照識別系統的原理及算法研究

車輛牌照識別系統的原理及算法研究本文對車輛牌照自動識別系統中圖象預處理、特征提取和字符識別等環節涉及的新算法、新技術以及系統整體設計做了一個比較全面的論述，同時針對目前的研究現狀，對一些關鍵

2009-12-02 12:59:27

圖像識別模組(包括PCB圖、圖像識別模組源代碼)

圖像識別模組電路原理圖、圖像識別模組PCB圖、圖像識別模組源代碼、圖像識別模組用戶使用手冊

2009-01-02 19:14:59

120

基于SPCE061A的語音識別系統的設計

系統采用凌陽SPCE061A 單片機作為語音識別系統的主控芯片。通過硬件電路設計和軟件代碼部分成功的設計并實現了一種具有語音識別功能、語音提示(語音合成)及語音回放(語音編

2009-05-26 10:54:08

基于貝葉斯理論的超聲肝圖像識別系統研究

超聲肝圖像識別是醫學圖像圖像處理的重要分支，也是計算機輔助診斷中的一個重要應用，在醫院常規檢查和遠程醫療中有廣泛的實際意義和應用價值。本系統對獲取的圖像進行處

2009-05-26 16:31:52

車號圖像處理與識別系統的研制

文章介紹了用于火車貨車的車皮號及自重數字圖像識別的計算機圖像處理與識別系統的實踐。使用濾波和非線性灰度擴展，使顯示圖像獲得改善，采用非線性路徑搜索法分割圖像，

2009-06-19 08:36:08

基于ARM的語音識別系統的設計與實現

語音識別技術是語音處理領域的一個關鍵技術。在研究了語音識別技術原理的基礎上，本文提出了一種基于ARM 處理器的孤立詞語音識別系統的設計方案，包括系統硬件設計、軟件

2009-09-03 10:52:49

語音識別系統中增加圖像識別技術的設計

采用機器視覺對語音對象進行跟蹤，利用說話人正常發音時，嘴部的開合狀況提取語速信息，實時調整語音識別的工作速度，匹配語音韻律，將有效提高語音識別準確性。討論了系

2010-07-16 14:53:59

EAN一13碼的圖像識別系統設計與實現

EAN一13碼的圖像識別系統設計與實現 0 引言　　自動化數據采集技術是信息采集和處理的關鍵技術，條碼技術在自動化數據采集中占重要地位，得到了廣泛的應

2009-12-28 10:58:30

3696

圖像識別技術在銀行ATM監控的應用

文中介紹了圖像識別技術在ATM監控系統中的應用，以及在ATM監控中所起到的各項功能。并對由于設備能力、現場環境等客觀因素所造成的圖像識別技術，在相關應用上的不足和需要克服

2011-09-05 09:51:06

2740

基于DSP的快速紙幣圖像識別技術研究

本課題通過對現有圖像識別技術進行研究和分析，針對當前DSP(數字信號處理)技術的新發展，提出了基于DSP的快速圖像識別概念。快速圖像識別技術以嵌入式系統為算法的實現平臺，它

2011-09-14 15:07:55

158

SPCA563B實現圖像識別系統

詳細介紹基于SPCA563B芯片的 圖像識別 系統的設計思想和硬件電路，給出具體應用實倒。對CMOS采集的圖像數據進行預處理，然后對其進行分割和提取特征.并利用一定的算法進行圖像識別

2011-09-27 14:09:22

3695

基于STM32的語音識別系統的設計與實現

基于STM32的語音識別系統的設計與實現

2015-11-09 18:03:00

科大訊飛新一代語音識別系統解讀

今天，我們就為大家從技術上揭秘科大訊飛的新一代語音識別系統。

2016-08-17 14:31:02

3245

基于圖像融合技術的運動目標圖像識別研究

基于圖像融合技術的運動目標圖像識別研究_王佳欣

2017-01-07 20:32:20

基于語音特征聚類的HMM語音識別系統研究姚敏鋒

基于語音特征聚類的HMM語音識別系統研究_姚敏鋒

2017-03-15 08:00:00

語音識別系統硬軟件方案分析

該設計運用三星公司的S3C2440，結合ICRoute公司的高性能語音識別芯片LD3320，進行了語音識別系統的硬件和軟件設計。在嵌入式Linux操作系統下，運用多進程機制完成了對語音識別芯片

2017-10-15 10:53:42

基于嵌入式系統的語音口令識別系統的實現

引言隨著計算機技術和信息技術的迅速發展，語音口令識別已經成為了人機交互的一個重要方式之一。語音口令識別系統將根據人發出的聲音、音節或短語給出響應，如通過語音口令控制一些執行機構、控制家用電器的運行

2017-12-02 09:09:01

706

對于圖像識別的引入、原理、過程、應用前景的深度剖析

圖像識別技術是信息時代的一門重要的技術，其產生目的是為了讓計算機代替人類去處理大量的物理信息。隨著計算機技術的發展，人類對圖像識別技術的認識越來越深刻。圖像識別技術的過程分為信息的獲取、預處理、特征

2017-12-21 15:01:16

6110

簡單介紹圖像識別技術在各類行業的應用

其實對于圖像識別技術，大家已經不陌生，人臉識別、虹膜識別、指紋識別等都屬于這個范疇，但是圖像識別遠不只如此，它涵蓋了生物識別、物體與場景識別、視頻識別三大類。發展至今，盡管與理想還相距甚遠，但日漸成熟的圖像識別技術已開始探索在各類行業的應用。

2018-01-23 11:26:47

34007

一文讀懂圖像識別，真的前景不可限量？

圖像識別技術人工智能 圖像識別技術是人工智能的一個重要領域。它是指對圖像進行對象識別，以識別各種不同模式的目標和對像的技術。 圖像識別發展的三階段 圖像識別的發展經歷了三個階段：文字識別、數字圖像

2018-08-21 17:25:02

614

如何實現圖像識別？為什么要入局圖像識別？

圖像識別技術能讓機器像人一樣看到世界，甚至看到人類都看不到醫療保?。?b class="flag-6" style="color: red">圖像識別最突出的能力之一是協助創建增強現實（AR）——一種“將計算機生成的圖像疊加在用戶對現實世界的視角之上”的技術。如果給人

2018-08-29 10:46:56

7695

淺析圖像識別背后的發展歷程

圖像識別，是指利用計算機對圖像進行處理、分析和理解，以識別各種不同模式的目標和對像的技術。

2018-09-30 09:47:01

23410

如何使用科優先策略進行的植物圖像識別系統介紹

植物識別領域的研究包括單一背景和自然環境植物圖像識別，由于背景噪聲的存在，自然環境植物圖像識別難度更大。針對如何降低卷積神經網絡（CNN）的權重大小、如何改善過擬合、如何提高模型對自然環境植物

2018-11-23 17:35:05

一種基于嵌入式系統的語音口令識別系統的設計

2019-04-23 15:52:53

863

嵌入式語音識別系統是什么

嵌入式語音識別系統分為封閉域識別和開放域識別，封閉域識別范圍圍繞指定的字/詞語集合，也就是說在開發系統的時候會設定好應識別的字或詞語，對范圍外的詞語語音系統不會識別。

2019-06-12 11:38:09

2859

LabVIEW圖像識別系統汽車領域的應用

詳解如何利用LabVIEW實現汽車儀表圖像識別

2019-07-31 10:23:47

6823

語音識別系統功能_語音識別系統的應用

對比語音識別技術的兩個發展方向，由于基于不同的運算平臺，因此具有不同的特點。大詞匯量連續語音識別系統一般都是基于PC機平臺，而語音識別專用芯片的中心運算處理器則只是一片低功耗、低價位的智能芯片

2019-10-01 09:21:00

5253

醫療智能語音識別系統的研發與應用

結合語音識別技術構建醫療智能語音識別系統，達到減輕醫護人員日常工作負擔，減少重復性勞動，提高診療質量的目的?；?b class="flag-6" style="color: red">語音識別的關鍵技術和海量的醫療數據，開發電子病歷與檢查報告智能語音錄入、移動護理智能語音錄入、非接觸式智能語音數據交互系統。

2019-10-21 16:46:27

3262