首先我們簡單聊聊什么是麥克風陣列。
麥克風陣列 ≠一堆麥克風
風吹麥浪,高山流水,蛙聲蟲鳴......人類能聽到的聲音大約有40多萬種,頻率在20至20000赫茲之間。而在嘈雜的環境下,機器想要聽懂聲音,它必須能夠聽的更遠更清晰,人類可以帶上助聽器,機器需要什么呢?麥克風陣列就充當了助聽器這樣的角色。
麥克風陣列就是由一定數目的聲學傳感器(一般是麥克風)組成,用來對聲場的空間特性進行采樣并處理的系統。早在20世紀70、80年代,麥克風陣列已經被應用于語音信號處理的研究中,進入90年代以來,基于麥克風陣列的語音信號處理算法逐漸成為一個新的研究熱點。而到了“聲控時代”,這項技術的重要性顯得尤為突出。
如果把語音識別看成一個接收信息、解析信息、做出反饋過程的話,麥克風陣列解決的是聽不聽得到、多遠距離屬于合理范圍、不受噪音影響的問題。
單麥克 vs麥克風陣列
單麥克風系統可以在低噪聲、無混響、距離聲源很近的情況下獲得符合語音識別需求的聲音信號。但如果聲源距離麥克風距離較遠,并且存在大量的噪聲、多徑反射和混響,導致拾取信號的質量下降,這會嚴重影響語音識別率。而且,單麥克風接收的信號,是由多個聲源和環境噪聲疊加的,很難實現各個聲源的分離。這樣就無法實現聲源定位和分離,因為還有一類聲音的疊加并非噪聲,但是在語音識別中也要抑制,就是人聲的干擾,語音識別顯然不能同時識別兩個以上的聲音。
為了解決單麥克風的這些局限性,利用麥克風陣列進行語音處理的方法應時而生。麥克風陣列由一組按一定幾何結構(常用線形、環形)擺放的麥克風組成,對采集的不同空間方向的聲音信號進行空時處理,實現噪聲抑制、混響去除、人聲干擾抑制、聲源測向、聲源跟蹤、陣列增益等功能,進而提高語音信號處理質量,以提高真實環境下的語音識別率。
一個麥克風不足以接收全部信息,但麥克風陣列卻可以實現聲源定位、信號拾取、信號分離、去除噪音影響等。
麥克風結構和麥克風數量
在麥克風陣列里,麥克風的數量,從2個到上千個不等。復雜的麥克風陣列主要應用于工業和國防領域,而消費級領域的麥克風數量通常較少,一般有2、4、5、6、8等幾種形式。通常,這組麥克風會按照一定幾何結構擺放,比如線形、環形、球形等,比如訊飛開放平臺就研發出二麥線性陣列、四麥線性陣列和六四麥線性陣列。
適用場景解析
可別小看這些結構和數量,不同的組合都對硬件產品來說有著千差萬別的效果。比如雙麥克風陣列的結構簡單,成本低、容易實施、功耗低等特點讓它更容易在家電產品中實現落地。目前國內主流家電廠商應用語音交互技術的產品中,海信電視、美的空調等選擇的大都是雙麥克方案。
不過在機器人領域里,對聲源定位、降噪、識別率的要求比較高,一般都會使用環形多麥克方案。比如新松機器人使用的是訊飛四麥克風陣列,穿山甲機器人則選用六麥克風陣列。(ps:六麥是環形360拾音,需要水平放置,一般安置在機器人頭頂的位置,而四麥是180度正面的拾音,豎直放置,一般安置在機器人的胸前)。那么車載、智能音箱等領域又如何選擇這些方案呢?自己的產品究竟更適合哪種呢?
5月25日,AI公開課第四期我們就將為大家具體介紹。另外麥克風陣列的關鍵技術(噪聲抑制、混響消除、聲源定位等)也會在本期公開課展開詳細解讀。
-
傳感器
+關注
關注
2552文章
51302瀏覽量
755239 -
機器人
+關注
關注
211文章
28566瀏覽量
207716 -
語音識別
+關注
關注
38文章
1742瀏覽量
112747
發布評論請先 登錄
相關推薦
評論