在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

聲紋識別進入落地階段,技術仍有發展空間

ss ? 來源:億歐網 ? 作者:張晟寧 ? 2020-12-31 15:49 ? 次閱讀

2020年受疫情影響,消費者需求向線上傾斜,智能客服需求量也隨之增加。因此,盡管疫情影響下中國經濟下行,但人工智能尤其智能語音行業市場整體利好。激增的市場消費者群體,一方面帶來了多元化的市場需求,另一方面,促使技術服務商不斷探索新的產品功能和應用場景。近年來,許多智能語音技術服務商開始布局聲紋識別領域。隨著技術成熟與商業化落地,聲紋識別逐漸進入大眾視野。

一、聲紋識別技術

聲紋識別是生物識別技術的一種,也是語音技術的分支,也被稱為說話人識別,包含聲紋注冊和聲紋認證兩道程序。所謂聲紋識別就是把聲信號轉換成電信號,提取特征、搭建模型,根據匹配度進行識別判斷。

聲紋識別VS語音識別

聲紋識別相比于語音識別,近年來才逐漸進入大眾視野,兩者同為語音前端信號處理,經常被放在一起比較。而談及兩者的共性及區別時,快商通聯合創始人李稀敏博士在接受億歐智庫采訪時表示:“聲紋的載體是語音,而所謂語音就是指人說的話。在人類正常的語音交互中,我們可以識別語音主體的意圖、情緒、性別、身份以及內容等信息。而利用人工智能技術完成這一識別,則需要依靠語音及聲紋的提取與處理。語音識別和聲紋識別雖然在智能語音技術流程中都屬于對語音信號的處理,但實際的技術方向及應用卻截然相反。”

“語音識別追求的是聲音的共性”,李稀敏博士表示。也就是針對不同個體對于同一句話的不同聲音、口音、語速表達,可以翻譯成同樣的文字。比如在使用智能音箱時,對于同樣的指令,無論發出這個指令的個體是男是女,南方抑或是北方口音,智能音箱都需要能夠對語音輸入提取共性,并作出準確的一致的應答。

與之相比,“聲紋識別則追求聲音的個性”,即針對同一個體在不同情境下的不同表達,可以認證聲源來自同一個體。比如微信的語音登陸系統,有時因外部環境,身體狀態等因素,說話人的語音輸入會出現語速,音高等變化,而一個完善的聲紋識別系統,則需要能夠提取不同情境下語音輸入信號的個性,并準確認證說話人的身份以完成登陸。

聲紋辨認VS聲紋確認

聲紋識別主要有兩大應用場景,聲紋辨認和聲紋確認,其中:

聲紋辨認,也被稱作1:N識別,主要應用于在語音庫范圍內的語音篩查,即在海量聲紋數據庫中找到說話人的過程。比如,金融語音銷售場景下,可以迅速根據來訪者聲紋信息與自身聲紋數據庫對比,判斷客戶是否為初次購買,抑或是否在征信黑名單中,從而調整銷售策略。

聲紋確認,也稱1:1驗證,主要應用于安全訪問驗證及身份認證等場景,系統對說話人進行語音認證,完成”你是不是你”的身份判斷。相比起聲紋辨認,聲紋確認對于語音輸入信息的質量要求更為嚴苛,比如微信的語音登錄功能會要求使用者在無嘈雜環境中對固定文本進行語音輸入。

聲紋識別進入落地階段,技術仍有發展空間

談及聲紋識別技術成熟度,李稀敏博士表示:“聲紋識別擁有數十年的研究歷史,但由于技術的局限,近年來才逐漸進入應用落地階段,技術成熟度相當于3年前的語音識別。”

因此語音識別所面臨的絕大部分技術痛點,也同樣影響著聲紋的發展。因聲源采樣率、信噪比、信道、語音時長、文本內容等因素變化而造成的準確率變化明顯。因此提升聲紋識別系統的魯棒性是聲紋識別大規模落地應用的前提條件。

深入金融安防領域,多元語音技術融合助力場景落地

由于聲紋識別系統的特殊性,在進行識別前,需要進行聲紋注冊,因而聲紋識別的應用對于數據庫有著較強的依賴。另一方面,前文提到的聲紋識別技術的不成熟,也導致其使用體驗無法達到預期效果。因此數據的缺乏以及技術的痛點導致聲紋識別與行業融合程度較淺,也成為聲紋識別落地傳統行業的主要障礙。

李稀敏博士表示,現階段聲紋識別主要應用在公安、司法以及金融領域。主要是因為聲紋識別直接的解決了這些行業的痛點,應用價值大,因而在行業的資本投入下,聲紋識別的行業落地獲得了快速發展。

除金融安防領域外,現階段聲紋識別在民生場景中的應用還處于初期試水階段,如家居車載中聲紋判定系統,硬件中的聲紋門禁等等。

智能語音技術的全面發展,以及智能設備的爆發式增長,為聲紋識別提供了更多的應用端口,而與多元語音技術的融合也成為聲紋識別落地更多行業場景提供了技術保障。在未來聲紋識別將向著聲紋+智能,以及多模態識別的方向發展。

二、聲紋識別市場

應用前景廣闊

相比為人所熟知的指紋識別、人臉識別,聲紋識別作為生物識別的另一個主要的分支,雖然剛剛從實驗室走出進入大眾視野,但卻擁有較強的適用性和較大的應用空間。根據快商通提供的信息整理,首先,聲紋識別具有更高的采集便捷性,用戶接受度更高,被采集者無需接觸傳感器或面對鏡頭,即可完成識別。在疫情所帶來的新需求下,聲紋識別擁有極大的落地空間。

與此同時,聲紋識別在1:1驗證應用下的準確率高,并因聲紋的穩定性,造假難度較高,是理想的生物識別模式。此外聲紋傳感器相對低廉的造價及部署成本也使得聲紋識別擁有可被廣泛應用的優勢。

聲紋技術難盈利,技術服務商何去何從?

現階段聲紋識別賽道的服務商普遍處于虧損狀態,而剖析這一現象,需要從利潤和成本兩個方向進行考慮。

聲紋技術和行業早期磨合階段,滲透率較低

聲智科技戰略合伙人&COO李智勇首先表示:“聲紋識別作為一種新的技術,雖然提供了更多的可能性,但是必須要和行業進行進一步的深度結合。然而在技術落地早期階段的磨合試探過程中,通常不會很通暢,這也導致了現階段的聲紋識別應用勢必無法深度滲透行業。”

李稀敏博士也有類似的觀點,他認為在聲紋產品在沒有深度結合產業的情況下,產品過于單一,盈利的可能性很小。而另一方面聲紋技術仍不成熟,在無法達到預期使用期望的情況下,簽單量及簽單價都不理想。

技術紅利下,企業不斷增加研發成本

在投入成本方面,李智勇表示:“目前國內企業正第一次主要進行原創的技術研發,技術研發本身所投入的成本相比于產品公司更高。此外,在技術紅利驅使下,企業也紛紛將大量的人力物力投入到科研研發中,以期望技術所帶來的未來的巨大利潤空間。”

據億歐智庫調查統計,現階段大部分聲紋技術服務商的研發人員占比均在50%以上,與此同時,國內相關專利公開數量也不斷提升,技術研發已然成為了服務商的發展重點。

厚積薄發,多年沉淀等待破繭成蝶

綜合論述,較低的滲透率,及尚未成熟的技術體系導致聲紋識別營收并不理想,另一方面技術紅利下,企業不斷加大自身研發成本。收支兩方面的因素導致現階段聲紋技術服務商的盈利十分艱難。然而這是一項新技術發展所需要經歷的必然階段,新的技術勢必會引發新的產品和新的模式,而當我們回顧2000年左右的互聯網市場,會發現和現階段的語音市場相差無幾。整個語音市場是否會像互聯網市場一樣,成為一個時代的標志,我們尚未可知,不過可以相信的是,在不久的將來,待語音技術成熟,和行業深度融合的那一天,聲紋識別業務一定會迎來屬于他們的春天。

聲紋市場風口何時到來?

2017年,6月《中華人民共和國網絡安全法》正式施行,明確將個人生物識別信息納入個人信息范疇管理。同年12月,工信部引發《促進新一代人工智能產業發展三年行動計劃(2018-2020年)》 ,智能身份識別系統、智能語音交互系統被率先列入重點發展8大領域。直至2020年,相關政策紛紛出臺,尤其是受年初疫情影響,無接觸,無感知的聲紋識別系統需求隨之增加。

市場方向,近年來全球生物識別產業規模不斷擴大,聲紋識別的市場占比也逐年上升。而隨著技術的成熟以及在產業內的不斷滲透,這一規模仍會繼續增加。市場參與者方向,綜合語音廠商,聲紋專業廠商,人工智能初創公司以及互聯網巨頭紛紛入駐聲紋賽道,并在各自細分領域不斷進行行業融合,整體市場處于良性競爭狀態。2016-2020年期間,聲紋識別賽道資本投資進入加速階段,哪怕在2020年,資本市場整體遇冷情況下,賽道仍獲得多筆融資。

技術方向,李稀敏博士表示:“當前聲紋學術領域,已經在廣泛地使用最前沿的神經網絡技術,用于解決聲紋技術所存在的問題,比如人聲分離、遠場識別、跨信道等。預計3年左右,這些問題將得到較好地解決,在通過一段時間的實踐,算法和工程化都將得到驗證。總而言之,5年以內,風口將來。”

綜合論述,盡管現階段聲紋識別的應用仍具有局限性,但是聲紋主導的生物識別模式已經進入公眾視野,并被時代所接受。相信在未來,人臉識別大熱過后,聲紋識別一定能迎來屬于他的風口。

三、聲紋識別市場參與者

企業不斷入局聲紋賽道,原因為何?

近年來加入聲紋賽道的企業越來越多,包括騰訊、百度、字節跳動、平安科技等,創業者也不斷入局,究其原因,我們可以從以下幾個視角進行思考。

技術視角

李稀敏博士表示:“2011年前后神經網絡技術在人臉識別和語音識別領域的廣泛應用,帶動了神經網絡技術在聲紋技術領域的探索,直至2018年前后達到了一個高潮,各種算法層出不窮。所以,這個階段加入聲紋賽道,有其技術方面的因素。” 在另一方面,李智勇也指出,在原創技術的推動下,聲紋識別所帶來的技術紅利也是企業入局的促進因素。

市場視角

在語音研發的道路上,服務商們逐漸發現了聲紋的重要性,以及潛在的市場需求,因而逐漸向聲紋技術發展。而隨著聲紋技術在金融、安全領域的探索應用,身份認證及聲紋反欺詐應用不斷成熟,并引發了行業的廣泛關注。以金融、安全為引,聲紋市場逐漸向其他行業落地拓展,市場規模增長的情況下,企業紛紛入局聲紋賽道。

政策視角

生物識別政策頻出,2018年,央行正式發布《移動金融基于聲紋識別的安全應用技術規范》,加深了聲紋識別在金融行業的應用落地,大批聲紋服務商涌現。

聲紋識別服務商分類及布局

受市場、戰略以及技術的影響,聲紋識別技術服務商呈現出了多元化的趨勢,業務模式、產品形態以及用戶群體都展現出了較大的差異化。現階段聲紋識別的市場參與者主要有四類,分別為綜合語音技術服務商、人工智能初創公司、深耕聲紋的技術服務商以及互聯網巨頭。

綜合語音技術服務商

多為傳統語音服務商,普遍成立于2000年左右,擁有較為成熟的技術支持及產品體系。整體業務以融合了多元語音技術的通用解決方案為主,客戶群體以大型客戶為主。聲紋識別作為語音的技術分支,更多作為定制化選項搭配語音方案進行輸出。企業戰略本身就是平臺+賽道,也就是將其自身的AI平臺,落地到各種賽道。典型的綜合語音技術服務商為科大訊飛,捷通華聲等。

深耕聲紋的技術服務商

在傳統語音技術服務商進入市場后,一部分專注與語音細分賽道的企業相繼出現,以得意音通、遠鑒科技為代表的深耕聲紋識別的服務商進入市場。整體業務以聲紋識別產品及方案為主,相比起綜合語音技術服務商,更加聚焦行業的特定需求,并專注于聲紋技術的落地,探索各類潛在的應用場景。

人工智能初創公司

2010年開始,專注于特定行業的人工智能初創公司陸續進入市場。因聚焦行業,因此在行業圖譜及數據庫搭建上具備更大的優勢。整體業務以特定行業的SaaS服務及落地方案為主,在行業的基礎上應用聲紋技術,更加深入行業需求,主要面向中小企業。典型的代表企業為快商通,聲智科技等。

互聯網巨頭公司

近年來互聯網巨頭公司紛紛開始布局聲紋賽道,依托自身云服務優勢及龐大C端客戶流量進入市場。業務布局較廣,擁有較大的潛在用戶群體。典型的互聯網巨頭為阿里云、騰訊云、百度智能云及華為云。

責任編輯:xj

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 生物識別
    +關注

    關注

    3

    文章

    1210

    瀏覽量

    52524
  • AI
    AI
    +關注

    關注

    87

    文章

    30998

    瀏覽量

    269328
  • 聲紋識別
    +關注

    關注

    3

    文章

    141

    瀏覽量

    21529
收藏 人收藏

    評論

    相關推薦

    聚焦AI語音!聲揚科技張偉彬博士受邀為中山大學深圳校區師生作分享

    近日,聲揚科技聯合創始人、總經理張偉彬博士受邀前往中山大學深圳校區,為學校師生作“聲紋識別技術及其產業化應用”主題分享。憑借深厚的專業知識,結合前沿的產業落地實踐,張偉彬博士深入淺出地分享了
    的頭像 發表于 12-31 10:45 ?103次閱讀
    聚焦AI語音!聲揚科技張偉彬博士受邀為中山大學深圳校區師生作分享

    靈伴科技參編《空間計算發展報告(2024)》發布

    近日,元宇宙標準化大會暨工業和信息化部元宇宙標準化工作組年會在江西南昌舉辦。會議期間《空間計算發展報告(2024)》(以下簡稱《報告》)正式發布。靈伴科技作為參編單位之一,展示了其在空間計算領域從硬件設備到操作系統,再到場景
    的頭像 發表于 12-20 14:03 ?242次閱讀

    標貝智能語音識別在智能會議場景中的落地案例

    標貝科技專注智能語音交互領域多年,在語音識別和語音合成領域有著多項大型企業合作案例,標貝與多個智能會議系統廠商合作,成功將語音識別技術在智能會議系統中落地,并且隨著語音
    的頭像 發表于 12-20 10:31 ?189次閱讀
    標貝智能語音<b class='flag-5'>識別</b>在智能會議場景中的<b class='flag-5'>落地</b>案例

    語音識別技術的應用與發展

    語音識別技術發展可以追溯到20世紀50年代,但直到近年來,隨著計算能力的提升和機器學習技術的進步,這項技術才真正成熟并廣泛應用于各個領域。
    的頭像 發表于 11-26 09:20 ?516次閱讀

    RFID技術及其在電子政務中的應用

    ,RFID技術進入商業化應用階段。由于具有高速移動物體識別、多目標識別和非接觸識別等特點,RFI
    的頭像 發表于 11-24 11:47 ?432次閱讀

    AI汽車發展的新階段、新要素、新挑戰

    隨著以AI大模型為代表的生成式AI技術的快速發展,汽車正進入AI化發展階段。AI將通過持續學習和環境適應推動自動駕駛和智能交互進化,讓汽車
    的頭像 發表于 10-16 08:07 ?555次閱讀
    AI汽車<b class='flag-5'>發展</b>的新<b class='flag-5'>階段</b>、新要素、新挑戰

    無線充電技術發展趨勢

    目前無線充電技術還處于發展階段,距離方案的成熟尚需不斷探索和完善!降低熱損耗,提升效率縮短充電時間,改良充電曲線以更好的保護負載設備(終端或者電池等)。
    發表于 08-03 14:26

    工業控制系統的發展大致經歷了哪些階段

    工業控制系統是工業自動化的重要組成部分,它的發展經歷了多個階段,每個階段都有其獨特的特點和技術。 一、機械控制階段 機械控制
    的頭像 發表于 06-16 14:30 ?1464次閱讀

    電動車進入電梯識別報警攝像機

    電動車進入電梯一直是社區物業管理和居民關注的熱點問題。盡管一些小區已經規定禁止電動車進入電梯,但仍有不少違規現象存在,這不僅影響了其他居民的乘梯體驗,還存在安全隱患。為了解決這一問題,電動車
    的頭像 發表于 05-14 10:32 ?451次閱讀
    電動車<b class='flag-5'>進入</b>電梯<b class='flag-5'>識別</b>報警攝像機

    **十萬級口語識別,離線自然說技術,讓智能照明更懂你**

    NLP技術。該技術基于端到端語音識別技術及端側NLP技術,可識別端側十萬級別口語說法,打破傳統的
    發表于 04-29 17:09

    USB中斷setup,in和out階段到底什么時候進入中斷?

    第一個:比如在USB枚舉階段,設備usb模塊是收到setup令牌包之后馬上進入中斷 ,還是在setup的ACK之后進入中斷? 第二個問題:設備處理in packet階段,是收到in p
    發表于 04-29 08:37

    SPIN3202電機可以開環啟動,開環階段結束就停機,無法進入閉環怎么解決?

    開發板:SPIN3202 電機:無刷風扇 情況:電機可以開環啟動,開環階段結束就停機,無法進入閉環。串口故障信息為:過流
    發表于 04-11 06:05

    智能聲控燈具應用語音識別芯片AT6811

    AT6811是一款超低功耗的離線智能語音識別芯片,集成了先進的語音活動監測(VAD)、聲紋識別、自動消噪神經網絡,擁有高效的電源管理模塊、數字和模擬語音信號輸入接口以及ARMCortex-M0內核,并且搭配了GPIO、UART、SPI、I2C、I2S等片內外設。
    的頭像 發表于 02-28 16:41 ?639次閱讀
    智能聲控燈具應用語音<b class='flag-5'>識別</b>芯片AT6811

    射頻識別RFID

    射頻識別(RFID) 是 Radio Frequency Identification 的縮寫。 射頻識別技術是自動識別技術的,通過無線射頻
    發表于 02-28 11:31

    虹軟空間計算技術推動XR領域發展

    在過去的二十年中,移動計算技術的迅猛發展使智能手機嶄露頭角,成為主流的移動智能終端。雖然科技不斷進步,智能手機所面臨的可視空間受限、交互單一等局限問題仍待突破。隨著傳感器技術的提升、
    的頭像 發表于 01-26 10:15 ?719次閱讀
    主站蜘蛛池模板: 日韩综合nv一区二区在线观看| 亚洲人成www在线播放| 国产jlzzjlzz视频免费| 狠狠干夜夜草| 97超频国产在线公开免费视频 | 日韩特级| 免费人成观看在线网| 国内一级特黄女人精品毛片| 国产精品国产三级国产普通话对白| v天堂网| 天天av天天翘天天综合网| 加勒比一本一道在线| 亚洲啪啪| 性黄视频| 亚洲成色www久久网站| 日夜夜操| 国产精品成人四虎免费视频| 都市激情亚洲综合| 一级片在线免费| 男女性高爱麻豆| 欧美性黄色| 禁漫画羞羞动漫入口| 天堂网成人| 五月天婷婷激情| 七月婷婷精品视频在线观看| 色婷五月综激情亚洲综合| 欧美黄视频在线观看| 国产91久久最新观看地址| 天天澡天天摸天天爽免费| 超黄视频在线观看| 欧美午夜剧场| 四虎精品久久| 四虎午夜剧场| 久久综合九色综合精品| 97成人资源| 好吊色7777sao在线视频观看| 亚洲综合资源| 四虎精品成人免费观看| 狠狠躁夜夜躁人人躁婷婷视频| 国内精品视频在线| 天天搞夜夜操|