2018年11月1日,騰訊全球合作伙伴大會,以“開放·共生”為主題,在南京開幕。聲智科技聯合創始人兼首席知識官常樂受邀出席,并與來自全球的科技、文化與商業領域數百位國際大咖和萬名行業精英,以及騰訊微信、QQ、騰訊云、騰訊開放平臺、騰訊企鵝號、騰訊應用寶、騰訊AI Lab、騰訊車聯、騰訊自動駕駛、騰訊微瓴互聯、騰訊動漫等業務條線的合作伙伴,共商未來人機互聯戰略布局與發展之道。
聲智科技聯合創始人兼首席知識官常樂表示:“未來,我們將置身于人工智能語音交互時代,繼續朝著‘語音即搜索,語言即服務’方向演進。物理世界與數字世界的有機融合會進一步加速,日益形成更加智能化的萬物互聯的人機世界。實現這一美好智能圖景的關鍵在于,實現智能語音交互在更多真實復雜場景中的應用與落地。聲智科技,自2017年初成為騰訊人工智能生態合作伙伴以來,依托聲智科技自主研發的軟硬件一體的遠場語音交互技術勢能,先后為騰訊打造了騰訊智能音箱、智能車機系統以及全球首款王者榮耀智能機器人等產品,助力騰訊深化在家居、車載和機器人三大領域的人工智能布局與落地?!?/p>
全球首創的穿透式遠場語音交互解決方案
王者榮耀智能機器人,游戲人物戰神呂布為原型,是國內首款人工智能與游戲結合的智能機器人。搭載聲智科技為騰訊獨家定制的全球首創的穿透式遠場語音交互解決方案,采用全球首款人偶型音腔結構設計,由獨立的人偶和底座兩部分構成,底座裝有旋轉裝置,人偶可以追隨玩家用戶的聲源,并且旋轉定位;通過獨家的6麥環形倒置麥克風陣列(Inverse Array)設計,內置穿透式波達方向估計(Penetrated DOA),動態聲場的回聲消除(Vibrated AEC)等獨家定制的AI聲學算法,成就了具備“聽”、“說”感知能力的AI游戲達人——王者榮耀智能機器人!在騰訊全球合作伙伴大會上,王者榮耀智能機器人驚艷亮相展區,為現場觀眾帶來了真實不凡的語音交互體驗。
(1)6麥環形倒置麥克風陣列(InverseArray)
為了戰斗時,給游戲玩家身臨其境的聽覺享受,王者榮耀機器人將揚聲器設置于人偶的頭部。區別于常規智能語音設備(比如音箱、機頂盒)麥克風陣列置于頂端、揚聲器位于底部的“上聽下說”且“聽說一體”的圓柱或立方體的中空音腔結構,王者榮耀智能機器人的麥克風陣列設計位置只能置于底座,從而形成獨特的“下聽上說”且“聽說分離”的不規則非中空音腔結構。這樣的結構設計,也給麥克風陣列的結構設計與聲學AI算法適配帶來了巨大的難度。
同時,為了讓王者榮耀機器人可以隨時定位玩家位置,底盤設置了旋轉電機裝置,電機極為靠近麥克風陣列,當人偶被喚醒后進行大角度旋轉時,會產生電機噪音,影響麥克風陣列的準確拾音。
為此,聲智科技為騰訊的王者榮耀機器人量身研制了“倒置麥克風陣列(Inverse Array)”技術。基于聲智科技定制研發的6麥環形的倒置麥克風陣列,進一步加強麥克風陣列的聲音信號處理能力,對抗人偶機器人對于麥克風陣列的遮擋,以及其產生的聲反射和聲衍射的干擾,有效抑制自噪聲和其他外部噪音。在真實的環境中,王者榮耀智能機器人可拾取3-5米遠場距離聲音,并實現的360度全方位的語音喚醒與識別。
(2)穿透式波達方向估計(PenetratedDOA)
王者榮耀智能機器人獨特的設計,使人偶身體處在麥克風陣列正上方,成為直接障礙物,形成了大量因不規則外形的人偶身體產生的聲反射和聲衍射,導致了多徑傳播情況的普遍發生,極大影響了王者榮耀智能機器人的準確定位功能。
為了應對這些結構性挑戰,進一步加強麥克風陣列的聲音信號處理,有效抑制自噪聲和其他外部噪音,提高聲源測向的準確度,聲智科技最新研發了穿透式波達方向估計(Penetrated DOA)技術。即使在噪音干擾大,強混響,強反射面的條件下,王者榮耀智能機器人可實現360度全方位的測向,定位誤差在10度以內,隨時響應“主公”的呼喚。
(3)動態聲場的回聲消除(VibratedAEC)
傳統智能音箱等產品的設計揚聲器在底部,而王者榮耀智能機器人的揚聲器位于頭部兩側,一側指向性的揚聲器為全頻段發聲器件,承擔主動發聲功能,另一側為低頻共振被動膜片被動發聲,以達到較佳的低音效果。而這樣的特殊設計,導致位于揚聲器垂直下方的環形麥克風陣列單元拾取到的揚聲器系統自噪聲直達聲信號不一致,這無疑增大了語音喚醒與識別的難度。
而且,主動揚聲器的聲音會干擾麥克風陣列進行聲源側向,進一步影響人偶旋轉角度的準確性。同時,旋轉裝置的電機,極為靠近麥克風陣列,當人偶被喚醒后進行大角度旋轉時,產生的電機噪音影響麥克風陣列的拾音。
為此,聲智科技研發了最新的動態聲場回聲消除(Vibrated AEC)技術,可有效提升音樂狀態或語音合成(TTS)狀態下的喚醒率,以及在5米內的噪音環境下的遠場語音喚醒和識別率。搭配聲智科技自主知識產權的混響消除、寬場景高靈敏語音喚醒等專屬聲學AI算法,可在保護主方向語音不失真的前提下,去除環境中的語音等非穩態噪聲以及空調等其他平穩噪聲的干擾,自適應計算混響的能量,予以抑制,去除由于房間混響造成的語音拖尾,增強語音清晰度,同時解決弱參考信號或者無參考信號等復雜場景中的回聲抵消(自噪聲抑制)問題,在雙工語音交互(Double Talk)的情況下仍然魯棒。
所以,王者榮耀智能機器人在保證高喚醒率的同時,能有力降低誤喚醒率,實現輕松喚醒,隨時打斷、隨時喚醒,無懼環境,想說就說,聲隨心動,為用戶打造完美的遠場語音交互的體驗。
語音交互技術的創新,只有依托真實的場景,才能真正釋放技術的潛能,發揮技術的應用價值,推動人工智能朝著普惠化方向發展,讓更多人切實地感受到科技的智能、快捷與便利。聲智科技,將繼續堅持引領技術服務場景的創新路線,攜手生態合作伙伴,為不同的垂直行業打造適配多元場景的遠場語音交互系統方案。
-
機器人
+關注
關注
211文章
28466瀏覽量
207330 -
人工智能
+關注
關注
1791文章
47352瀏覽量
238774 -
語音交互
+關注
關注
3文章
286瀏覽量
28026
發布評論請先 登錄
相關推薦
評論