在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

語音UI的基本原則

星星科技指導員 ? 來源:嵌入式計算設計 ? 作者:Paul Beckmann ? 2022-10-25 16:17 ? 次閱讀

Amazon Echo和Google Home中的語音用戶界面(語音UI)功能吸引了消費者的注意。語音識別系統的效率很大程度上取決于麥克風陣列和算法集合,這些算法允許陣列聚焦于用戶的語音并拒絕不需要的噪聲。下面解釋這些算法的基本功能。

觸發/喚醒詞

語音 UI 系統使用分配的觸發詞(如“Alexa”或“確定谷歌”)來激活語音 UI 設備。設備必須使用自己的算法立即進行識別,因為使用互聯網資源會產生太多的延遲。

觸發詞必須產生一個獨特的波形,該波形可以使算法與正常語音區分開來,否則成功識別的百分比可能低得令人無法接受。通常,使用三到五個音節的觸發詞是最好的。

小觸發詞算法占用較少的內存和處理,但犯更多的錯誤,而大的算法需要更多的資源,但犯的錯誤更少。模型也是可調的 - 它們可以更嚴格(更少的誤報,但更難觸發)或更寬松(更多的誤報,但更容易觸發)。大多數產品設計師選擇更嚴格的調整,因為客戶對錯誤觸發沒有同情心。

圖 1 比較了不同調諧點的三觸發模型的性能。在測試條件下,每小時實現少于兩個錯誤觸發器是一個合理的目標。小模型只能通過圖形最左側的兩個最嚴格的調諧來實現這一點。中型和大型型號在更寬的工作范圍內實現了這一目標。

pYYBAGNXm7eAXMiVAAFTjAUgeAU218.png

圖 1. 每小時使用小型、中型和大型算法模型測試誤報,左側調整更嚴格,右側調整更寬松。

到達目的地(到達方向)

一旦觸發詞被識別出來,下一步就是確定用戶語音的到達方向(DOA)。一旦確定了方向,DOA算法就會告訴波束成形算法它應該聚焦在哪個方向。

DOA算法的核心功能是檢查來自陣列中不同麥克風的信號的相位關系,并使用此信息來確定哪個麥克風首先接收聲音。但是,由于來自墻壁,地板,天花板和房間內其他物體的反射,用戶的聲音也將從其他方向傳來。為此,DOA算法包括優先邏輯,它將更響亮的初始到達與更安靜的反射分開。

DOA 算法的操作通過自動調整環境噪聲水平得到增強。該算法測量房間內的平均噪聲水平,并且僅當輸入信號至少比環境噪聲水平高出一定數量的分貝時,才會重新計算用戶嘴巴的位置。

回聲消除器

為了更好地關注用戶的聲音,語音 UI 設備必須從其麥克風拾取的聲音中減去自己的揚聲器產生的聲音。這似乎很簡單,就像將節目材料的相位反轉版本混合到來自麥克風的信號中一樣簡單。然而,該過程不足以處理揚聲器對波形的改變、數字信號處理(DSP)均衡、麥克風和聲學反射。

AEC算法中的第一步是將麥克風的輸出與原始(前DSP)輸入信號進行比較,并計算校正曲線,以從語音命令的波形中減去揚聲器的直接聲音。

第二步是減去聲學回聲。該算法必須在一定的誤差范圍內“尋找”與節目材料匹配的聲音(以補償由聲學引起的波形變化),以及對應于預期混響時間的已定義時間窗口內的聲音。由于每個麥克風接收的回聲集略有不同,并且來自揚聲器的直接聲音也不同,因此要實現最佳性能,需要對每個麥克風進行單獨的 AEC 處理。

AEC 查找反射的時間段稱為“回波尾部長度”。回聲尾部長度越長,可以消除的反射越多,算法的性能就越好。然而,較長的尾巴需要更多的內存和更多的處理。圖2顯示了回聲消除器在逐漸增加混響的房間中的表現。對更長的回聲尾部的需求是顯而易見的。

poYBAGNXm8KACjm8AAFJhHlrwKk343.png

圖 2. 回聲消除器在四個房間中表現,混響時間增加。較大的房間受益于使用長回聲尾部的算法。

波束成形

波束成形允許麥克風陣列聚焦于來自特定方向的聲音。它提高了信噪比(SNR),因為它有助于隔離用戶的聲音,同時抑制來自其他方向的聲音。

例如,如果用戶位于麥克風陣列的一側,而空調位于另一側,則來自空調的聲音首先到達用戶對面的麥克風,然后在幾分之一秒后到達離用戶最近的麥克風。波束成形算法使用這些時差來消除空調聲音,同時保留用戶的聲音。

具有兩個麥克風的陣列取消聲音的能力有限,但具有三個或更多麥克風的陣列可以消除來自更多方向的聲音。麥克風越少,性能就越會隨著視角(用戶的聲音與語音 UI 產品前軸之間的角度)的變化而變化。

雖然麥克風陣列系統使用定向拾音模式來濾除噪聲,但某些噪聲可以通過識別將噪聲與所需信號分離的特性,然后消除噪聲的算法進行衰減。降噪算法可以幫助觸發單詞識別,并在所有其他算法完成其工作后提高語音UI性能。

語音命令是瞬時事件。可以檢測到始終存在或重復的任何聲音,并將其從來自麥克風陣列的信號中刪除。示例包括汽車中的道路噪聲,以及家庭中的洗碗機和HVAC系統噪聲。高于或低于人聲頻譜的聲音也可以從信號中濾除。

手機中使用的常見降噪算法傾向于突出顯示對人類理解最關鍵的頻譜,而不是對電子系統隔離和理解語音命令最關鍵的頻譜。大多數此類算法實際上會降低語音 UI 性能。簡單地說,人類聽的東西與語音UI系統不同。

圖3顯示了在有和沒有降噪的情況下觸發字檢測的功效。降噪算法將整體語音識別提高了2 dB -考慮到用戶的聲音通常僅比周圍噪聲大幾dB,這是一個很大的差異。

pYYBAGNXm86AEU3SAAFj-NKmSMQ786.png

圖 3. 降噪算法對觸發字檢測的影響。

審核編輯:郭婷

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • dsp
    dsp
    +關注

    關注

    554

    文章

    8030

    瀏覽量

    349359
  • 觸發器
    +關注

    關注

    14

    文章

    2000

    瀏覽量

    61222
收藏 人收藏

    評論

    相關推薦

    射頻電路設計的基本原則 射頻信號干擾的解決方法

    射頻電路設計的基本原則 射頻電路設計是一個復雜的過程,需要考慮多種因素以確保電路的性能和可靠性。以下是一些基本的設計原則: 頻率選擇性 :射頻電路需要根據工作頻率選擇合適的組件和設計參數,以確保電路
    的頭像 發表于 12-03 09:59 ?544次閱讀

    SQL數據庫設計的基本原則

    SQL數據庫設計的基本原則 1. 理解需求 在設計數據庫之前,首先要與業務團隊緊密合作,了解業務需求。這包括數據的類型、數據的使用方式、數據的增長預期等。需求分析是數據庫設計的基礎,它決定了數據庫
    的頭像 發表于 11-19 10:23 ?251次閱讀

    PCB上設置測試點的基本原則

    線路板PCB測試點設置的原則是確保測試的準確性和高效性,同時避免對PCB板造成不必要的損害。以下是一些關鍵的設置原則
    的頭像 發表于 10-22 10:57 ?883次閱讀

    連接器選型的幾項基本原則

    在連接器的領域連接器的選型是每個連接器人都必須要經歷的事情,在連接器選型的道路上有很多需要注意的東西,稍有不慎就會導致最終選擇的連接器無法投入使用。蓬生電子給大家整理了連接器選型的幾項基本原則,來
    的頭像 發表于 10-17 17:29 ?426次閱讀

    差動保護動作電流整定原則

    差動保護動作電流整定原則涉及多個方面,以下是對該原則的介紹: 一、基本原則 對稱性原則 :差動保護動作電流應該在正、負序電流及零序電流相等時啟動。這樣差動保護在正常工作時不至于誤動作,
    的頭像 發表于 10-08 15:45 ?1048次閱讀

    選擇電氣控制方案時的基本原則

    一系列基本原則。 控制方式與設備適應性 控制方式的選擇應與設備的通用化和專用化相適應。對于通用設備,可以采用標準化的控制方式,以降低設計和生產成本;而對于專用設備,則需要根據其特殊需求定制控制方式,以滿足特定的
    的頭像 發表于 08-28 10:47 ?360次閱讀

    組成放大電路的基本原則是什么?

    組成放大電路的基本原則主要包括以下幾個方面: 1. 穩定性原則 定義 :穩定性是指放大電路在工作過程中應能夠保持其性能不受外界干擾或內部變化的影響。 實現方式 :通過采取一些措施來保持電路的工作點
    的頭像 發表于 08-07 10:02 ?828次閱讀

    PCB設計基本原則總結,工程師必看

    一站式PCBA智造廠家今天為大家講講pcb設計安全規則有哪些要求?PCB工藝規范及PCB設計安規原則。在PCB設計中,遵循安規(安全規范)原則是確保電子產品安全性和合規性的關鍵。接下來為大家介紹一些
    的頭像 發表于 07-09 09:46 ?1006次閱讀

    電路仿真所遵循的基本原則是什么

    電路仿真是一種基于電子計算機進行模擬的技術,用于分析和預測電路的行為和性能。它可以幫助設計師優化電路的功能、減少成本和提高可靠性。為了保證仿真結果的準確性和可靠性,電路仿真需要遵循一些基本原則。本文
    的頭像 發表于 04-21 10:20 ?1300次閱讀

    鴻蒙原生應用元服務-訪問控制(權限)開發概念和使用基本原則

    )。TokenID是每個應用的身份標識,ATM通過應用的TokenID來管理應用的權限。 權限使用的基本原則 在進行權限的申請和使用時,需要滿足以下基本原則: 應用申請的權限,都必須有明確、合理
    發表于 04-18 15:39

    選擇IGBT的基本原則是什么

    選擇IGBT的基本原則涉及以下幾個方面: 電壓等級:選擇合適的IGBT要考慮其能夠承受的電壓等級。通常情況下,IGBT的額定電壓等級應大于實際電路中的最高電壓。 電流容量:根據電路的負載電流,選擇
    的頭像 發表于 03-12 15:29 ?1344次閱讀

    pcb設計的基本原則分享 PCB設計16個原則一定要知道

    PCB設計的這16個原則你一定要知道
    的頭像 發表于 03-12 11:19 ?2936次閱讀

    plc梯形圖編程的基本原則

    PLC(可編程邏輯控制器)是現代自動化控制領域中廣泛應用的一種控制裝置。PLC的梯形圖編程是PLC控制中最常用的編程方式之一。本文將詳細介紹PLC梯形圖編程的基本原則,包括其定義、基本概念、編程要點
    的頭像 發表于 01-22 10:51 ?2756次閱讀

    群脈沖預防方案的基本原則

    群脈沖預防方案的基本原則?|深圳比創達電子
    的頭像 發表于 01-15 14:03 ?636次閱讀
    群脈沖預防方案的<b class='flag-5'>基本原則</b>?

    群脈沖預防方案的基本原則?|深圳比創達電子a

    永久性的硬件損壞,甚至完整的電力網絡癱瘓。 二、群脈沖預防方案的基本原則1、預測與評估:通過監測可能的群脈沖來源和模擬群脈沖對不同系統的影響,評估潛在的風險和脆弱性;2、屏蔽與保護:采取物理和技術措施
    發表于 01-15 10:42
    主站蜘蛛池模板: 啪啪在线视频| 69xxx视频| 天天摸天天摸天天躁| 天天摸天天碰天天碰| 天天干夜夜看| 人人揉人人爽五月天视频| 四虎午夜剧场| 68日本xxxⅹxxxxx18| 中文字幕在线播放一区| 男女全黄做爰视频| 激情六月丁香婷婷| 黄色成人免费观看| 亚洲情a成黄在线观看动| αv天堂| 户外露出 自拍系列| 国产精品igao在线观看樱花日本| 模特精品视频一区| 日本三级香港三级人妇99| 欧美性久久| 国产一区二区三区影院 | 中文字幕一区二区三区四区五区| 亚洲福利视频一区二区三区| 中文天堂最新版资源新版天堂资源| 午夜丁香婷婷| 在线观看视频色| 中文字幕在线不卡| 五月婷婷社区| 欧美顶级xxxxbbbb| 丁香花在线| www天堂网| 女色窝人体色77777| 欧美爆操| 一区二区三区影视| 在线免费观看毛片网站| 日韩a视频| 丁香啪啪天堂激情婷婷| bt天堂电影| 国产又大又黄又粗又爽| 7777奇米| 黄篇网站在线观看| 亚洲国产欧美精品一区二区三区 |