在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

聲紋識別到底是怎么回事呢?

qm9W_gridthink ? 來源:電網智囊團 ? 作者:電網智囊團 ? 2021-03-02 10:16 ? 次閱讀

國家電網公司人工智能方向上研究攻關一直是重點投入,設備運維管理是人工智能應用的核心領域之一,涉及圖像識別、視頻分析、聲紋識別、知識圖譜、數據智能等多個方面。

聲紋識別可以解決那些方面的問題呢?變電設備異常工況的診斷檢測,如:變壓器、電抗器、斷路器、隔離開關等主設備內部不可見缺陷的準確診斷識別,此外繞組變形、偏磁異常、內部放電等方面的診斷也在探索研究。

那聲紋識別到底是怎么回事呢?

同屬于生物識別技術,與火爆的人臉識別相比,聲紋識別表現得很低調,然而這并不影響這一黑科技魅力的散發,本文將帶你認識一下聲音黑科技-聲紋識別,讓你了解真正的“聞聲識人”。

本文將從如下方面為你一一解讀:

什么是聲紋?

聲紋識別的原理

聲紋識別算法的技術指標

影響聲紋識別水平的因素

聲紋識別的應用流程

聲紋識別的應用場景

一、什么是聲紋?

聲紋(Voiceprint),是用電聲學儀器顯示的攜帶言語信息的聲波頻譜,是由波長、頻率以及強度等百余種特征維度組成的生物特征,具有穩定性、可測量性、唯一性等特點。

人類語言的產生是人體語言中樞與發音器官之間一個復雜的生理物理過程,發聲器官--舌、牙齒、喉頭、肺、鼻腔在尺寸和形態方面每個人的差異很大,所以任何兩個人的聲紋圖譜都有差異。

每個人的語音聲學特征既有相對穩定性,又有變異性,不是一成不變的。這種變異可來自生理、病理、心理、模擬、偽裝,也與環境干擾有關。

盡管如此,由于每個人的發音器官都不盡相同,因此在一般情況下,人們仍能區別不同的人的聲音或判斷是否是同一人的聲音。

聲紋不如圖像那樣直觀展現,在實際分析中,可通過波形圖和語譜圖進行展現,如下所示:

二、聲紋識別的原理

人在講話時使用的發聲器官在尺寸和形態方面每個人的差異很大,所以任何兩個人的聲紋圖譜都有差異,主要體現在如下方面:

共鳴方式特征:咽腔共鳴、鼻腔共鳴和口腔共鳴

嗓音純度特征:不同人的嗓音,純度一般是不一樣的,粗略地可分為高純度(明亮)、低純度(沙啞)和中等純度三個等級

平均音高特征:平均音高的高低就是一般所說的嗓音是高亢還是低沉

音域特征:音域的高低就是通常所說的聲音飽滿還是干癟

不同人的聲音在語譜圖中共振峰的分布情況不同,聲紋識別正是通過比對兩段語音的說話人在相同音素上的發聲來判斷是否為同一個人,從而實現“聞聲識人”的功能。

三、聲紋識別算法的技術指標

聲紋識別在算法層面可通過如下基本的技術指標來判斷其性能,除此之外還有其它的一些指標,如:信道魯棒性、時變魯棒性、假冒攻擊魯棒性、群體普適性等指標,這部分后續于詳細展開講解。

錯誤拒絕率(False Rejection Rate, FRR) :分類問題中,若兩個樣本為同類(同一個人),卻被系統誤認為異類(非同一個人),則為錯誤拒絕案例。錯誤拒絕率為錯誤拒絕案例在所有同類匹配案例的比例。

錯誤接受率(False Acceptance Rate, FAR) :分類問題中,若兩個樣本為異類(非同一個人),卻被系統誤認為同類(同一個人),則為錯誤接受案例。錯誤接受率為錯誤接受案例在所有異類匹配案例的比例。

等錯誤率(Equal Error Rate,EER):調整閾值,使得誤拒絕率(False Rejection Rate,FRR)等于誤接受率 (False Acceptance Rate,FAR),此時的FAR與FRR的值稱為等錯誤率。

準確率(Accuracy,ACC):調整閾值,使得FAR+FRR最小,1減去這個值即為識別準確率,即ACC=1 - min(FAR+FRR)

速度:(提取速度:提取聲紋速度與音頻時長有關、驗證比對速度):Real Time Factor 實時比(衡量提取時間跟音頻時長的關系,比如:1秒能夠處理80s的音頻,那么實時比就是1:80)。驗證比對速度是指平均每秒鐘能進行的聲紋比對次數。

ROC曲線:描述FAR與FRR之間相互變化關系的曲線,X軸為FAR的值,Y軸為FRR的值。從左到右,當閾值增長期間,每一個時刻都有一對FAR和FRR的值,將這些值在圖上描點連成一條曲線,就是ROC曲線。

閾值:在接受/拒絕二元分類系統中,通常會設定一個閾值,分數超過該值時才做出接受決定。調節閾值可以根據業務需求平衡FAR與FRR。當設定高閾值時,系統做出接受決定的得分要求較為嚴格,FAR降低,FRR升高;當設定低閾值時,系統做出接受決定的得分要求較為寬松,FAR升高,FRR降低。在不同應用場景下,調整不同的閾值,則可在安全性和方便性間平平衡,如下圖所示:

四、影響聲紋識別水平的因素

訓練數據和算法是影響聲紋識別水平的兩個重要因素,在應用落地過程中,還會受很多因素的影響。

聲源采樣率

人類語音的頻段集中于50Hz ~ 8KHz之間,尤其在4KHz以下頻段

離散信號覆蓋頻段為信號采樣率的一半(奈奎斯特采樣定理)

采樣率越高,信息量越大

常用采樣率:8KHz(即0 ~ 4KHz頻段),16KHz(即0 ~ 8KHz頻段)

信噪比(SNR)

信噪比衡量一段音頻中語音信號與噪聲的能量比,即語音的干凈程度

15dB以上(基本干凈),6dB(嘈雜),0dB(非常吵)

信道

不同的采集設備,以及通信過程會引入不同的失真

聲紋識別算法與模型需要覆蓋盡可能多的信道

手機麥克風、桌面麥克風、固話、移動通信(CDMA, TD-LTE等)、微信……

語音時長

語音時長(包括注冊語音條數)會影響聲紋識別的精度

有效語音時長越長,算法得到的數據越多,精度也會越高

短語音(1~3s)

長語音(20s+)

文本內容

通俗地說,聲紋識別系統通過比對兩段語音的說話人在相同音素上的發聲來判斷是否為同一個人

固定文本:注冊與驗證內容相同

半固定文本:內容一樣但順序不同;文本屬于固定集合

自由文本

五、聲紋識別的應用流程

聲紋識別(VPR) ,生物識別技術的一種,也稱為說話人識別 ,是從說話人發出的語音信號中提取聲紋信息,從應用上看,可分為:

說話人辨認(Speaker Identification):用以判斷某段語音是若干人中的哪一個所說的,是“多選一”問題;

說話人確認(Speaker Verification):用以確認某段語音是否是指定的某個人所說的,是“一對一判別”問題。

聲紋識別在應用中分注冊和驗證兩個主流程,根據不同的應用中,部分處理流程會存在差異,一般的聲紋識別應用流程如下圖所示:

六、聲紋識別的應用場景

聲紋識別作為生物識別技術的一種,有非常多好的應用場景,根據聲音的特性,下面從公共安全、金融、社保、智能硬件四個領域介紹聲紋識別的應用。

1、安防

聲紋作為一種生物特征,最早在刑偵和鑒識領域成功應用。

近年來,由于互聯網的發展,語音案件也呈現出井噴的趨勢,在這些語音案件中,聲紋識別成了唯一一種有效的技術偵破手段,通過的聲紋識別和聲紋大數據技術進行重點人員監管、反電信詐騙、反恐、刑事案件偵破、身份查詢與核驗,助力公安有效遏制與打擊犯罪,構建和強化安全的社會公眾環境。

2、金融

針對銀行、互聯網金融等各類金融及服務機構,通過聲紋識別技術,提供了用戶注冊、遠程驗證、金融生物識別解決方案,大幅提高金融機構的風險防范系統安全性,強化風控能力,增加用戶的安全性,防范身份欺詐。

另外在電話客服系統中,通過聲紋識別技術,可實時識別出用戶的身份,從而提供個性化的客戶服務。

3、社保

我國針對離退休人員,每年至少需要進行一次生存狀態驗證,并以此為依據進行養老金的發放,目前可通過到指定社保大廳或自助終端進行生存驗證,對于一些行動不便的老人家,這種方式也是非常不便利。聲紋識別技術在遠程身份驗證中有著天然的優勢,只需要一個電話(手機或固話都可以),即可完成生存驗證,為參保人員提供了便利,同時也為國家節省大量成本,避免養老金流失。

4、智能硬件

在智能硬件產品中,聲紋識別解決了當前智能產品只能識別用戶所說的內容,而不能區分說話人身份的問題,讓智能產品能夠區分不同的角色,實現“聽聲識人”。

讓系統針對性對每個人提供不同的內容與服務,讓人機交互更加簡單,讓用戶享受更輕松、更具個性化、更安全的產品體驗。

七、總結

聲紋識別作為最前沿的生物識別技術,隨著技術的成熟,將會在越來越多的應用場景下落地,我們相信在不久的將來,在第三代身份證上,聲紋將成為繼指紋、人像后又一個新增的公民身份ID。聲音將在我們未來的科技生活中扮演眼越來越重要的角色。

責任編輯:lq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 生物識別
    +關注

    關注

    3

    文章

    1210

    瀏覽量

    52523
  • 人工智能
    +關注

    關注

    1791

    文章

    47336

    瀏覽量

    238696
  • 聲紋識別
    +關注

    關注

    3

    文章

    141

    瀏覽量

    21526

原文標題:設備運維管理的人工智能黑科技:聲紋識別

文章出處:【微信號:gridthink,微信公眾號:電網智囊團】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    LDC1101EVM GUI不能識別串口是怎么回事

    請問一下,LDC1101EVM GUI不能識別我的串口是怎么回事,在電腦設備管理器上顯示EVM串口,但是在GUI的窗口只顯示一個刷新,但是怎么也刷新不了。換了WIN7、WIN8、WIN10都不行。
    發表于 12-09 08:14

    使用C5515 EVM調試程序,CCS不能識別到DEMO板的仿真器是怎么回事

    在使用C5515 EVM開始調試程序的時候,遇到一個問題: 即 CCS不能識別到DEMO板的仿真器,電腦的設備管理器到是可以正常識別。請幫忙分析下是怎么回事。謝謝 參考截圖: PC識別
    發表于 10-21 07:00

    請問PCM2903C的溫度范圍到底是多少

    如下圖,PCM2903C的溫度范圍到底是多少? 如果用在-25~85℃,是否會出問題?
    發表于 10-14 07:14

    功放和運放到底是什么區別?

    想請問一下功放和運放到底是什么區別,感覺只要接一個小負載,運放的輸出電流也可以很大啊?到底有什么區別啊
    發表于 09-10 07:00

    運放的輸入電容到底是什么?

    我想請問一下運放的輸入電容到底是什么?
    發表于 09-04 06:52

    大帶寬服務器推流延遲怎么回事

    大帶寬服務器推流延遲怎么回事
    的頭像 發表于 09-03 14:52 ?324次閱讀

    運放旁路電容必須靠近芯片引腳的原因到底是什么

    運放旁路電容必須靠近芯片引腳的原因到底是什么?有的說是怕走線的電感與旁路電容形成諧振,旁路電容靠近運放的時候走線的電感不應該更大了嗎(走線越長,走線的寄生電感也就越大)
    發表于 08-01 06:56

    NI MAX里面識別到Keysight的GPIB卡

    NI MAX里面識別到Keysight的GPIB卡
    的頭像 發表于 07-27 10:14 ?1024次閱讀
    NI MAX里面<b class='flag-5'>識別到</b>Keysight的GPIB卡

    EMC與EMI測試整改:從問題識別到效果驗證

    深圳比創達電子|EMC與EMI測試整改:從問題識別到效果驗證
    的頭像 發表于 06-27 10:37 ?510次閱讀
    EMC與EMI測試整改:從問題<b class='flag-5'>識別到</b>效果驗證

    晶振的誤差是怎么回事?如何有效控制晶振誤差的出現?

    不是所有的東西都完美無瑕疵,就像電子產品都會出現一定的誤差一個道理。今天小編將要說的就是晶振誤差的相關問題,晶振的誤差是怎么回事
    的頭像 發表于 05-09 14:33 ?998次閱讀

    EMI測試整改:從問題識別到有效優化

    深圳比創達電子EMC|EMI測試整改:從問題識別到有效優化
    的頭像 發表于 05-06 14:02 ?602次閱讀
    EMI測試整改:從問題<b class='flag-5'>識別到</b>有效優化

    如何運用Retiming優化Block RAM的使用

    對于邏輯級數較大的路徑,常用的時序收斂的方法之一就是采用Retiming(中文翻譯為重定時)。Retiming到底是怎么回事
    的頭像 發表于 04-18 10:05 ?1054次閱讀
    如何運用Retiming優化Block RAM的使用

    共享單車到底是什么通信原理?

    我們經常騎的共享單車到底是什么通信原理,有人了解過嗎?下面寶藍小編就帶大家了解下。
    的頭像 發表于 02-25 10:32 ?1425次閱讀
    共享單車<b class='flag-5'>到底是</b>什么通信原理?

    CY7C65215-32LTXI插入USB查到PC上無法識別到USB端口是怎么回事

    目前的現象就是板子通過USB查到PC上無法識別到USB端口,沒有任何反應,電源都是正常的.幫看下電路圖設計是否有問題,謝謝!
    發表于 02-23 08:33

    補償電容器溫度升高怎么回事

    隨著科技的發展,電子設備在我們生活中扮演著越來越重要的角色。而補償電容器作為電子設備中的重要組件之一,其性能和穩定性對整個系統的運行起著至關重要的作用。然而,有時候我們可能會遇到補償電容器溫度升高的現象,那么這到底是怎么回事
    的頭像 發表于 01-08 15:49 ?760次閱讀
    主站蜘蛛池模板: 亚洲a级毛片| 视频一区二区不卡| 国产免费久久精品99久久| 久久久久久久久国产| 丁香花五月天婷婷| 美女视频黄a全部| 五月综合激情| 色中色资源| 狠狠色噜噜狠狠狠狠五月婷| 2021精品国产综合久久| 天天综合天天| 成人综合色站| 最新eeuss影院第256页| 黄色一级视频网| 欧美日韩一区视频| 四虎4545www国产精品| 99久热| 午夜免费网址| 中文字幕一区二区三区四区| 国语对白老女人8av| 国产色综合一区二区三区| 日本高清午夜色wwwσ| 五月婷婷综合基地| 日本特黄特色特爽大片老鸭| 四虎影院最新网址| 五夜婷婷| 亚洲高清色| 亚洲国产人成在线观看| 色视网站| 色婷婷综合在线视频最新| 亚洲国产综合久久精品| 日本在线黄| 国产资源网站| 狠狠躁夜夜躁人人爽天天3| 美女性色| 99久久伊人| 一级片免费在线观看| hs网站免费| 亚洲精品网站日本xxxxxxx| 6月婷婷| 久久99精品国产麻豆宅宅|