電子發(fā)燒友早八點訊:智能語音交互市場的火熱逐漸輻射到產(chǎn)業(yè)鏈的供應商,其中最直接受益就是作為聲音的傳感設(shè)備——麥克風。特別是麥克風陣列的興起,未來可以讓麥克風廠家的銷量翻倍增長。在此之前,由于受制于智能手機和平板電腦的增長速度下滑,樓氏、歌爾和瑞聲的股票相繼在2016年中旬左右創(chuàng)下了低谷。
2017年的語音交互局勢趨于明朗,資本市場專注研究智能語音交互的投資機構(gòu)也明顯多了起來。那么,這就有必要深入了解一下麥克風這個行業(yè)以及技術(shù)的趨勢。
什么是麥克風?有哪些種類和指標參考?
麥克風作為業(yè)界通俗的一種叫法,是英文Microphone的音譯名稱,國內(nèi)的稱呼亂一些,有時候也簡單稱作話筒,香港和***地區(qū)也會稱作微音器、拾音器。麥克風的中文學術(shù)名稱正式是譯作傳聲器,這是一種將聲音轉(zhuǎn)換成電子信號的換能器,即把聲信號轉(zhuǎn)成電信號,這其實和光電轉(zhuǎn)換的原理是完全一致的。
消費級市場的麥克風基本都是標量麥克風,也就說只能采集單一的物理量信息——聲壓。聲壓是什么?聲壓是指聲波通過媒質(zhì)時,由振動所產(chǎn)生的壓強改變量,也可以理解為聲音的幅度或者強度。聲壓常用字母"p"表示,單位是帕斯卡(符號Pa)。聲壓的帕斯卡單位由于不方便記憶(比如20x10-6Pa~20Pa),一般就以對數(shù)尺衡量有效聲壓相對于一個基準值的大小來表示,即聲壓級,其單位是分貝(符號dB)。
人類對于1KHz的聲音的聽閾為20 x10-6Pa,通常以此作為聲壓級的基準值。這樣講可能晦澀難懂,我們來簡單的類比一下:人類的呼吸聲壓是60x10-6Pa左右,聲壓級大約10dB,火箭發(fā)射的聲壓是4000Pa左右,聲壓級大約165dB,閃光彈的聲壓超過1萬Pa,聲壓級大約175dB。
分析上述這些晦澀難懂的數(shù)字,自然就引出麥克風的參數(shù)指標,其實我們關(guān)注的就是麥克風還原真實聲音的能力,這是一個很難的挑戰(zhàn),因為聲電轉(zhuǎn)換即意味著失真。
為了描述麥克風的性能,有幾個性能指標是非常關(guān)鍵的,這包括了靈敏度、指向性、頻率響應、阻抗、動態(tài)范圍、信噪比、最大聲壓級(或AOP,聲學過載點)、一致性等。這幾個指標其實都好理解,決定了麥克風的性能,而且每個指標都非常關(guān)鍵,缺一不可。當然這些指標相對于喇叭的T-S參數(shù)來說,真的是簡單的了許多。
麥克風是典型的傳感器產(chǎn)業(yè),其技術(shù)迭代非常迅速,外觀也發(fā)生了不少變化,估計很多人從下面的麥克風陣列中準確找到麥克風就很困難。
現(xiàn)在麥克風陣列主要使用的是數(shù)字MEMS麥克風,其最長尺寸僅有3.76MM。MEMS麥克風也是手機中大量使用的傳感器件,一般手機至少有2個以上這類麥克風。MEMS麥克風實際上只是工藝上的改進,其原理依然屬于電容式麥克風。與MEMS麥克風直接PK的,就是駐極體麥克風。
這兩種麥克風是消費電子領(lǐng)域的主力軍,比如亞馬遜的Echo和聲智科技的開發(fā)板主要是MEMS麥克風,科大訊飛的開發(fā)板則主要是駐極體麥克風。這兩種麥克風從性能指標來看,沒有實質(zhì)性差別,駐極體麥克風的性能指標還更高,所以聲智科技的單麥系列也是駐極體麥克風,但是,MEMS麥克風的優(yōu)點是一致性比較好,更適合遠場語音交互用的麥克風陣列。
電容式麥克風還有另外一個形狀,就是錄音棚常用的專業(yè)麥克風,這與我們KTV唱歌的麥克風是有本質(zhì)區(qū)別的。KTV的麥克風一般都是動圈式麥克風,這種麥克風的性能不如電容麥克風,優(yōu)點是適合人聲收錄,缺點是靈敏度低,這在KTV反而是優(yōu)點,因為可以有效避免KTV環(huán)境的嘯叫。當然,還有帶式麥克風和碳精麥克風,這兩種麥克風已經(jīng)不常見了,特別是碳精麥克風,以前主要在老式電話中使用,現(xiàn)在基本被淘汰了。這幾種麥克風可以從圖中對比一下,有時候就會慨嘆,技術(shù)總是這樣顛覆式發(fā)展。
當然,新型的麥克風還包括壓電麥克風、光纖麥克風、激光麥克風等等,甚至可以直接把電視屏幕或者揚聲器(喇叭)也當作麥克風使用。另外,國防領(lǐng)域也在研究部署矢量麥克風等更復雜的麥克風。事實上,聲音的發(fā)展軌跡和雷達比較類似,麥克風陣列也是當前技術(shù)發(fā)展的一個階段,傳感技術(shù)的迭代是技術(shù)和市場迭代的重要原因。
全球麥克風的技術(shù)和市場的格局如何?
毫無疑問,在半導體生態(tài)體系中,MEMS正扮演著越來越重要的角色,其應用范圍包含了消費電子、汽車工業(yè)、工業(yè)控制乃至生物醫(yī)學、航空航天等領(lǐng)域,且仍在迅速擴大。隨著消費電子市場的增長,消費類應用已經(jīng)成為MEMS傳感器市場的主要推動力。2014年MEMS傳感器市場規(guī)模達到130億美元,最大的消費類應用規(guī)模達到59億美元,到2019年預計將超過250億美元,年復合增長率約11.2%。
我們比對了最新的行業(yè)調(diào)研數(shù)據(jù),從2013年到現(xiàn)在其市場格局變化并沒有想象的變化,反而是這幾年MEMS廠商集體進入了低速發(fā)展的時期,還好今年的語音交互市場火爆,也給MEMS麥克風市場帶來了想象空間。下面還是以互聯(lián)網(wǎng)公開的數(shù)據(jù)來概況介紹下市場,已經(jīng)公開報道了3年,相信很多質(zhì)疑的聲音也都消失了。這些數(shù)據(jù)并不能代表真實情況,特別是當前的市場狀態(tài),但是可以作為一個重要的參考。
根據(jù)IHS的統(tǒng)計數(shù)據(jù),美國公司樓氏電子在2013年是全球最大的已封裝MEMS麥克風(直接進行印刷電路板組裝)供應商;而德國公司英飛凌則是MEMS麥克風裸晶(供應給MEMS麥克風制造商)的龍頭廠商。樓氏的營收在已封裝MEMS麥克風市場中占據(jù)59%的比例,英飛凌出貨量則在MEMS麥克風裸晶市場占據(jù)78%。
全球已封裝MEMS麥克風供應商營收排行榜(單位:百萬美元)
全球MEMS麥克風裸晶供應商出貨量排行榜
在已封裝MEMS麥克風市場,排名第二的供應商為瑞聲(AAC),營收市占率13%;排名第三的則是歌爾(Goertek),營收市占率7%。瑞聲與歌爾都是中國廠商,其業(yè)務也重度依賴蘋果和三星;瑞聲供應iPhone5三顆高性能MEMS麥克風中的一顆,也進駐了iPhone5S;歌爾則是iPhone專用耳機的MEMS麥克風主要供應商。瑞聲2013年營收成長8%,歌爾則因為開始供應手機用高性能麥克風,2013年營收成長率高達35%。當然,經(jīng)過這3年市場變化,這三家的市場份額其實也發(fā)生了悄然改變,樓氏繼續(xù)強化了其行業(yè)龍頭的地位。
排名全球第四大已封裝MEMS麥克風供應商的是韓國BSE,其業(yè)績表現(xiàn)來自于擁有蘋果最大對手三星這個大客戶;BSE的2013年營收與2012年相較,成長率超過250%。緊追在BSE之后排名第五大的廠商則是歐洲業(yè)者意法半導體(ST),該公司的MEMS麥克風業(yè)務因為贏得了iPad設(shè)計案而持續(xù)擴張。
全球排名前50位MEMS廠商
國內(nèi)包括***也有一些麥克風廠商,這些廠商主要依靠價格制勝,技術(shù)方面并沒有建立起太高的壁壘。國內(nèi)外也出現(xiàn)了一些創(chuàng)業(yè)公司,比如美國的Vesper MEMS,以壓電麥克風作為主要技術(shù)特點,但是這些技術(shù)本身就是一線大廠掌握的技術(shù),只是考慮市場因素而沒有產(chǎn)線部署。所以這類創(chuàng)業(yè)公司當進入量產(chǎn)的時候壓力還是非常大的,因為這個行業(yè)確實需要重資產(chǎn)和重投入。
如何選型適用遠場語音交互的麥克風?
遠場語音交互的概念其實是相對的。我們知道,語音交互涉及了非常復雜的技術(shù)鏈條,包括了聲學處理、語音識別、語義理解和語音合成等核心技術(shù)。聲學處理主要是仿真人類的耳朵,保證機器能夠聽得準真實環(huán)境下人的聲音,語音識別則是把聽到的人聲翻譯成文字,語義理解則分析這些文字的意義,語音合成就把機器要表達的文字翻譯成語音。這四項技術(shù)雖然獨立發(fā)展,但實際上無法割裂,同時在其他技術(shù)的配合下,才能形成一次語音交互的完整鏈條。
以Siri為代表的近場語音識別已經(jīng)發(fā)展了60多年,特別是在2009年以后借助深度學習有了實質(zhì)性提高,但是正如扎克伯格所說的,當真正產(chǎn)品落地的時候,我們發(fā)現(xiàn)用戶真正需要的卻是類似Echo所倡導的遠場語音識別。顯然,這又是一個嶄新的技術(shù)領(lǐng)域,因為拾音距離的擴大帶來的問題不僅僅是語音信號的衰減,而且還帶來了復雜的真實環(huán)境以及復雜的用戶習慣。
近場語音識別要求必須是低噪聲、無混響、距離聲源很近的場景,比如用戶總是要對著手機講話才能獲得符合近場語音識別要求的聲音信號,同時還要求用戶滿足標準發(fā)音,其識別率才有可能達到95%以上。但是,若聲源距離較遠,并且真實環(huán)境存在大量的噪聲、多徑反射和混響,導致拾取信號的質(zhì)量下降,這就會嚴重影響語音識別率。同樣的,我們?nèi)祟愒趶碗s遠場環(huán)境的表現(xiàn)也不如兩兩交耳的竊竊私語。
通常近場語音識別引擎在遠場環(huán)境下,若沒有聲學處理的支持,比如麥克風陣列技術(shù)的適配,其真實場景識別率實際不足60%。而且,由于真實場景總是有多個聲源和環(huán)境噪聲疊加,比如經(jīng)常會出現(xiàn)周邊噪聲干擾和多人同時說話的場景,這就更加重了語音識別的難度。因為當前的語音識別引擎,都是單人識別模式,無法同時處理多人識別的問題。
麥克風陣列是當前解決上述問題的主要途徑,但是麥克風陣列也有諸多缺陷,其中之一就是對于硬件的要求較高,這包括了麥克風和芯片器件。因此麥克風陣列如何選型麥克風也是非常細致認真的一個工作。那么,如何選型智能語音交互的麥克風呢?
首先選型前我們要對產(chǎn)品有一個清晰的定義,比如產(chǎn)品銷量、產(chǎn)品壽命、產(chǎn)品場景等等,這非常重要。即便性能指標完全一致的情況下,也需要考慮麥克風供應廠商的成本、生產(chǎn)工藝、供貨能力等因素,因為傳感器件廠商歸根結(jié)底還是一個生產(chǎn)工藝的問題,比如國內(nèi)的很多麥克風廠商其實就是直接購買國外英飛凌的MEMS麥克風方案直接封裝,并不具有技術(shù)研發(fā)能力,其生產(chǎn)工藝和生產(chǎn)規(guī)模就是國內(nèi)很多廠商的主要差異。
其次選型要重點評估麥克風的性能指標,這包括了靈敏度、指向性、頻率響應、阻抗、動態(tài)范圍、信噪比、最大聲壓級(或AOP,聲學過載點)、一致性這幾個指標,其中指向性、信噪比、AOP和一致性是麥克風陣列最主要考慮的指標。一般來說,指向性也就下面幾種,各大廠商之間沒有實質(zhì)性差異。而信噪比(SNR)和AOP對于樓氏、歌爾和瑞聲三個巨頭來說,相差也不是太大,比如SNR基本都在65dB以上,AOP也都大于120dB,這個參數(shù)以上的麥克風質(zhì)量是當前較為可靠和成熟的,也是一線大廠的主要供應型號。一致性對于麥克風陣列則是需要特別考量的指標,因為MEMS麥克風需要焊接,這不能對于焊機廠商提出太苛刻的要求,當焊接以后麥克風是否還能保證一定的性能,這對于麥克風廠商來說就是巨大的考驗。所以,并不要輕信麥克風廠商提供的技術(shù)指標和承諾,需要認證考察他們的工廠以及生產(chǎn)車間及管理。
最后選型必須實際抽檢麥克風的質(zhì)量,即良品率,從聲智科技的經(jīng)驗來看,當批量生產(chǎn)的時候,有時候批次不一樣,導致麥克風的差異會很大,特別是一些中小的麥克風供應廠商。而且尤為麻煩的是,MEMS的更換成本也很大,一旦貼片焊接,若出現(xiàn)問題往往導致批量的麥克風報廢。當然,這只是量大的時候才需要重點考慮,當量小的時候這個問題不是太過關(guān)鍵。
MEMS競爭激烈,新興市場誰主沉浮?
但是不得不說,MEMS的市場競爭實際上一直非常激烈,前面也提到了這個市場已經(jīng)誕生了包括樓氏、歌爾、瑞聲、STM、Invense等巨頭,并且占據(jù)了其中80%以上的市場。雖然現(xiàn)在市場從手機和平板,逐漸向IOT設(shè)備過渡,但是當前的存量市場仍然還是手機和平板,IOT的量并不是太大。那么這就產(chǎn)生了兩個問號:一是這個市場未來到底是巨頭壟斷還是巨頭衰退?二是這個市場還有沒有創(chuàng)業(yè)機會?
雖然新興的語音交互市場對于麥克風器件是一個強需,但是這種場景變化會不會導致巨頭的市場變化?未來真的是都很難說,只能給出幾點思考以供參考:一是語音交互市場的強需是麥克風陣列,并非麥克風的元器件,因為對于麥克風廠商來說,除了增加了更多客戶,其客戶實質(zhì)上并沒有變化,也沒有更高技術(shù)方面的需求。從這點來看導致現(xiàn)有MEMS市場格局變化的理由還不夠充分。
二是若從技術(shù)層面來看,所有的技術(shù)廠商都需要關(guān)注技術(shù)的升級迭代,比如對于低功耗、高集成、矢量化麥克風的需求,若這些一線廠商不跟蹤技術(shù)的進展,當技術(shù)顛覆的時候很可能就會被取代,駐極體麥克風的供應商很可能短期內(nèi)就會面臨這個嚴峻問題。當然,總會有些公司的處境比較尷尬,特別是一些廠商當遇到麥克風技術(shù)和市場挑戰(zhàn)的時候選擇退縮轉(zhuǎn)型,轉(zhuǎn)型經(jīng)常會做成轉(zhuǎn)行,這對于傳感器廠商來說是巨大的挑戰(zhàn)。
那么,麥克風行業(yè)還沒有新的創(chuàng)業(yè)機會?從機會均等的角度來看,任何一個行業(yè)都存在眾多創(chuàng)業(yè)的機會,核心就在于如何把握和利用。這和芯片行業(yè)有些類似,麥克風的行業(yè)屬性決定了其必然是重資產(chǎn)的模式,包括設(shè)備和產(chǎn)線的規(guī)模投入,另外成本把控、產(chǎn)線管理和加工工藝也都是其核心要素,這些核心技術(shù)事實上每項都是極大的投入。
另外,有理想的廠商應該是堅持走技術(shù)驅(qū)動的路線,比如瑞聲科技和歌爾聲學剛開始都是購買英飛凌的MEMS和ASIC芯片,然后封測賣給客戶,這樣長時間技術(shù)積累,再利用收購,這兩家公司也逐步掌握了MEMS麥克風技術(shù)。那么對于其他廠商來說,這條路是不是可以復制或者超越,再或者干脆轉(zhuǎn)型,這是一個非常痛苦的過程。
小結(jié)
MEMS麥克風未來的市場空間必然更大,其技術(shù)要求也會越來越高,在巨頭已經(jīng)林立的情況下,新興的創(chuàng)業(yè)公司如何抓住機會突圍或者分享蛋糕,這是一個痛苦的考驗。到底是頂住壓力直面競爭,還是退縮轉(zhuǎn)型其他市場,這是經(jīng)常擺在所有創(chuàng)業(yè)者面前現(xiàn)實的問題。
聲明:電子發(fā)燒友網(wǎng)轉(zhuǎn)載作品均盡可能注明出處,該作品所有人的一切權(quán)利均不因本站轉(zhuǎn)載而轉(zhuǎn)移。作者如不同意轉(zhuǎn)載,即請通知本站予以刪除或改正。轉(zhuǎn)載的作品可能在標題或內(nèi)容上或許有所改動。
評論
查看更多