在2020年前,中國有望成為亞洲最大的智能家居市場。語音輸入作為智能家居的重要入口也一直被行業(yè)內(nèi)各個玩家所爭奪,通用微科技采用全產(chǎn)業(yè)鏈生產(chǎn)的商業(yè)模式,為各大公司提供了一整套智能語音入口的聲學(xué)硬件解決方案。
通用微CEO王云龍
當(dāng)今社會,雞尾酒會已經(jīng)成了人們很常見的社交活動,但這個看似簡單的活動卻成為了國內(nèi)外聲學(xué)領(lǐng)域?qū)<覍W(xué)者的難題——雞尾酒會問題。當(dāng)前語音識別技術(shù)已經(jīng)可以以較高精度識別一個人所講的話,但是當(dāng)說話的人數(shù)為兩人或者多人時,語音識別率就會極大的降低,這一難題被稱為雞尾酒會問題。
在多人同時說話的場景下追蹤并識別某一個特定說話人的語音,在自動語音識別技術(shù)大規(guī)模推廣應(yīng)用中,雞尾酒會問題是亟待解決的關(guān)鍵問題之一。各大聲學(xué)、AI公司紛紛推出解決方案希望能解決這個難題。
大洋彼岸的學(xué)霸團隊
通用微(GMEMS)就是這樣一家公司,它采取了軟硬件結(jié)合的方式,提出了領(lǐng)先的端測語音交互解決方案,開創(chuàng)性地解決了在高噪聲環(huán)境下,語音信號的完整攝取問題,也就是之前提到的雞尾酒會問題。
通用微CEO王云龍博士告訴億歐:“之所以能解決這一問題得益于通用微強大的研發(fā)實力。”億歐了解到,通用微在硬件、軟件和算法三大方面均有極強的實力。”
在硬件方面,通用微科技可以做到集IC、MEMS設(shè)計以及封裝于一體,擁有自主研發(fā)MEMS麥克風(fēng)芯片,產(chǎn)品已經(jīng)經(jīng)過數(shù)次更新?lián)Q代。目前供貨的主力產(chǎn)品為信噪比66dB的GMEMS2.0芯片。全球領(lǐng)先的信噪比為70dB、動態(tài)范圍達到135dB以上的GMEMS2.5芯片也即將在2019年下半年進入量產(chǎn)。
GMEMS更是計劃推出采用顛覆式四振膜新架構(gòu)的GMEMS3.0,信噪比同平臺實測可以達到76dB到80dB。王云龍表示:“GMEMS3.0將超越樓氏電子、歌爾股份、意法半導(dǎo)體等大公司的同類產(chǎn)品,達到行業(yè)領(lǐng)先的水平。”
在軟件方面,通用微擁有語音處理、自適應(yīng)波束形成、聲紋識別三大核心技術(shù),通過自適應(yīng)機器學(xué)習(xí)聲譜分析能有效分離用戶聲音源、干擾、背景噪聲、回聲,且無需調(diào)試因動態(tài)噪聲、回聲、非穩(wěn)態(tài)信號源帶來的問題。軟件的聲學(xué)設(shè)計容錯率和信號非穩(wěn)態(tài)容忍度都很高。通過聲紋庫的訓(xùn)練,軟件能有效識別用戶的聲音,能有效的解決雞尾酒會問題和魯棒性問題。
此外,在算法方面,通用微采用全球領(lǐng)先的深度學(xué)習(xí)算法可以輕松解決端測的語音交互功能,將實現(xiàn)包括微型傳感陣列、喚醒功能、降噪、消除回聲、語音增強等功能。同時算法還有喚醒率高、所需喚醒詞數(shù)據(jù)量小、喚醒準確率高的優(yōu)勢,相比于市面上的同類算法更優(yōu)秀。
通用微擁有強大的技術(shù)實力源于背后強大的技術(shù)團隊。CEO王云龍博士介紹,目前公司有150多人,核心研發(fā)團隊位于美國。公司研發(fā)大約有近40人。公司首席科學(xué)家李細林來自清華、CTO吳廣華來自伯克利加州大學(xué)、VP盧延禎來自英國謝菲爾德大學(xué)。加上自己,公司四位核心創(chuàng)辦人均是博士,從而保證了公司技術(shù)的持續(xù)領(lǐng)先。
深耕行業(yè),打造語音交互全產(chǎn)業(yè)鏈
除了核心人員的“學(xué)霸”背景外,GMEMS能取得領(lǐng)先地位,與創(chuàng)始人王云龍的經(jīng)歷也密不可分。王云龍博士告訴億歐,他是一名連續(xù)創(chuàng)業(yè)者。早在2003年國內(nèi)各產(chǎn)業(yè)都相對落后的時候,王云龍博士就開始在基于MEMS的聲學(xué)微型傳感器方面進行研發(fā),所研發(fā)的產(chǎn)品最終被各大品牌筆記本電腦(如聯(lián)想、戴爾等)和手機(如小米、聯(lián)想、魅族、索尼等)使用,王云龍博士并沒有因為自己的成績而止步不前,他重新以一個創(chuàng)業(yè)者的身份繼續(xù)在這個行業(yè)摸索,積累了大量的經(jīng)驗。
作為行業(yè)資深者的他,沒有選擇和大多數(shù)聲學(xué)前端器件廠商一樣,只從事產(chǎn)業(yè)鏈的某一環(huán)節(jié)的生產(chǎn)。王云龍帶領(lǐng)的通用微從算法切入,涉足芯片、傳感器、麥克風(fēng)陣列等環(huán)節(jié),采用全產(chǎn)業(yè)鏈生產(chǎn)的商業(yè)模式,提供了一整套智能語音入口的聲學(xué)硬件解決方案。
被問到采用這樣的模式會不會加大研發(fā)難度的問題,王云龍笑著說,之所以選擇這樣的商業(yè)模式,主要還因為半導(dǎo)體行業(yè)上游公司被國外壟斷,往往議價權(quán)較弱,越往產(chǎn)業(yè)上游公司能分到的利潤就越少。在聲學(xué)前端器件產(chǎn)業(yè)上游,從晶圓廠商及芯片廠商,到MEMS麥克風(fēng)廠商及IC廠商,再到麥克風(fēng)陣列廠商,所能獲得的收入及利潤往往是遞增的。
除此之外因為MEMS麥克風(fēng)整體市場較小,僅有10億美元左右,作為關(guān)鍵環(huán)節(jié)的MEMS麥克風(fēng),現(xiàn)階段即使每年有幾十億顆的銷量,利潤也不是很可觀。向MEMS麥克風(fēng)傳感器的下游環(huán)節(jié)切入,很可能是通用微的必選之路。這種發(fā)展路徑在音頻器件領(lǐng)域也已被許多大公司證明。
王云龍博士也提到,聲音降噪及MEMS麥克風(fēng)行業(yè)是一個比較難的行業(yè),第一他不像其他行業(yè)那樣容易產(chǎn)生利潤,即使產(chǎn)生利潤也相對較少。第二技術(shù)難度巨大,有非常多的“坑”。
“我就是在這些大坑中摸爬滾打過來的,就是在不斷的填坑?!蓖踉讫埐┦啃χf道。
雖然行業(yè)很難,但是王博士憑借著自身多年的經(jīng)驗與堅持,通用微還是取得了不錯的成績。日前通用微幫助位于美國的世界最大的家電芯片供應(yīng)商推出全球第一個基于微控制器(MCU)的語音控制解決方案。據(jù)了解,該解決方案在2019年2月25日前已經(jīng)通過了亞馬遜的Alexa語音服務(wù)(AVS)認證, 使原始設(shè)備制造商(OEM)能夠快速、輕松、廉價地為其產(chǎn)品添加語音交互功能,為終端客戶便捷使用Alexa豐富的語音體驗。
根據(jù)通用微與該家電芯片廠商簽訂的戰(zhàn)略合作協(xié)議,通用微科技為該解決方案獨家提供了整個聲學(xué)前端,包括噪聲抑制、回聲消除、波束形成和打斷喚醒等聲學(xué)前端功能。另外,根據(jù)客戶的需求,通用微科技也可以提供通過AVS認證的Alexa喚醒詞或定制其他的喚醒詞。
采用通用微語音交互解決方案的亞馬遜的Alexa
5G來臨,搶占智能家居入口
在自身取的巨大成功的同時,作為連續(xù)創(chuàng)業(yè)者的王云龍博士也有些經(jīng)驗想分享給后來的創(chuàng)業(yè)者。王云龍博士說道:“我十分贊同農(nóng)村包圍城市這項決策,運用到企業(yè)上也是這樣。初創(chuàng)公司和品牌合作的時候,先不要總想著和大品牌合作,可以先從小企業(yè)合作起,這樣可以讓產(chǎn)品有個落地驗證的過程。MEMS麥克風(fēng)也是如此,比如和華為、OPPO這些公司合作,不是說性價比最高他們就買了,而是說如果你的東西出了質(zhì)量問題能不能妥善處理減少損失。比如你買了一個智能冰箱,智能冰箱語音交互只是一部分的功能,即使語音交互壞了冰箱本身的功能還在,所以產(chǎn)品的安全性十分重要,要先保證產(chǎn)品的質(zhì)量?!?/p>
隨著目前科技的飛速發(fā)展,5G的到來也近在眼前,智能家居是5G落地的一個重要場景,據(jù)前瞻產(chǎn)業(yè)研究院數(shù)據(jù)顯示,2016年,我國智能家居市場規(guī)模達605.7億元,同比增長率50.15%。預(yù)計未來幾年內(nèi)智能家居將迎來爆發(fā),到2018年,智能家居市場規(guī)模將達1396億元。在2020年前,中國有望成為亞洲最大的智能家居市場。如此大的市場對各個行業(yè)的重要性不言而喻。
語音輸入作為智能家居的重要入口也一直被智能音箱行業(yè)內(nèi)各個玩家所爭奪,例如百度的小度、阿里的天貓精靈、小米的小愛同學(xué)等等。對此在美國生活多年的王云龍博士卻認為中國和美國國情不同?!爸袊说纳钋闆r與居住習(xí)慣和美國不同?!蓖踉讫堈f,中國人很少有美國人非工作時間之外的生活文化,中國版的Echo很可能不是智能音箱,而更可能是耳機。據(jù)了解,目前通用微已和一些著名品牌耳機廠商建立合作,為他們提供完整的聲音解決方案。王云龍希望在即將到來的5G時代,國內(nèi)的端側(cè)語音交互技術(shù)能取得進一步的成功。
關(guān)于通用微(GMEMS)
通用微成立于2016年6月,是一家端側(cè)智能語音傳感芯片、智能語音交互整體解決方案的供應(yīng)商。目前公司已完成聲學(xué)相關(guān)算法及軟件、MEMS麥克風(fēng)芯片的研發(fā),產(chǎn)品已在國內(nèi)外一線品牌的智能音箱、國內(nèi)一線品牌的主力手機、電腦、藍牙耳機等領(lǐng)域商用落地,公司已于2017年底實現(xiàn)5000萬顆硅麥產(chǎn)品出貨量。
-
智能家居
+關(guān)注
關(guān)注
1928文章
9602瀏覽量
185986 -
語音交互
+關(guān)注
關(guān)注
3文章
287瀏覽量
28048 -
5G
+關(guān)注
關(guān)注
1356文章
48497瀏覽量
565387
原文標題:通用微CEO王云龍:不僅是MEMS麥克風(fēng),而是打造語音交互全產(chǎn)業(yè)鏈
文章出處:【微信號:MEMSensor,微信公眾號:MEMS】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論