訊飛五麥震撼來襲
科大訊飛是國際上最早開始研究遠場語音識別技術的機構之一,也是國內唯一具備成熟解決方案的廠商。自2015年3月和8月,訊飛相繼對外發布四麥、二麥麥克風陣列解決方案。今天在深圳阿基米互聯網公社舉辦的“訊飛核心技術開發日——麥入云端,引領智能交互新主義”沙龍活動中,更重磅發布了打破語音交互瓶頸的利器——4+1環形五麥克風陣列,再次引領智能交互新主義!
在科大訊飛15年底年度發布會上,在場的3000余人見證了這樣的一場人機互動:演示人員在5米開外,用聲音操控叮咚音箱,完成了一系列高難度的訂票任務,引來臺下陣陣驚嘆——現場那么嘈雜,叮咚音箱卻如此“聽話”,要讓叮咚音箱聽懂這么多聲音,而且具備遠場識別的功能,它必須聽的到,而且要聽的更加清晰,人類可以帶上助聽器,機器需要什么呢?【麥克風陣列】就充當了助聽器這樣的角色。可以說,麥克風陣列猶如遠場識別的心臟。有了這顆“機器之心”, 在遠場場景中,就可以一舉解決在了遠場識別中遇到的背景噪聲、其他人聲干擾、回聲、混響等核心問題。
圖:“麥入云端,引領智能交互新主義”沙龍活動現場
定義人機交互的標準
訊飛開放平臺副總經理馬漢君進行了開場演講,馬漢君以”科大訊飛——人工智能引導者“為主題系統地介紹了人工智能的起源和發展,以及訊飛在人工智能領域里的最新研究成果和在人工智能+IOT時代的愿景和目標,并在演講的最后詳細的闡述了于去年底發布的人機交互界面——AIUI。
圖:訊飛開放平臺副總經理馬漢君
馬漢君說:“人工智能將助力IOT時代的蓬勃興起,而科大訊飛的愿景則是加速這一過程。當前訊飛的自然開放交互平臺上的應用已經超過90000個,連接終端超過8.8億臺。接下來訊飛將通過深度神經網絡與大數據的結合,實現人工智能從“能聽會說”到“能理解會思考”的突破。2014年8月,科大訊飛成為中國首個人工智能項目“類人答題機器人”的牽頭單位,正式啟動超腦計劃。未來,訊飛超腦將能參加高考甚至取得“一本”的成績。
在2015年,訊飛發布了AIUI,這是一個智能硬件量身定制了智能交互方案,重新定義了萬物互聯時代人機語音交互標準,具備了遠場降噪、方言識別、語音糾錯、多輪對話等功能。通過統一接口、開放的服務擴展、靈活的能力搭配實現人機交互與產品體驗的結合,科大訊飛希望和合作伙伴一起,用人工智能改變世界。
智能交互,與聲俱來
訊飛開放平臺智能硬件產品總監張良春則從人機交互的三大痛點談起,介紹了訊飛在這些問題的看法以及解決之道。“咬耳朵”不是智能交互,讓機器人可以遠場對話,需要使用麥克風陣列。現在訊飛推出有最新的環形五麥克風陣列,遠場拾音距離可達5米。相比以往線性麥克風單維180°覆蓋,環形五麥是360°全平面拾音角度,而且去噪效果更好,抗環境噪音的能力更強。
總的來說五麥麥克風陣列功能特性包括:二維空間拾音、抗噪能力增強、遠距拾取音頻、支持連續喚醒、支持回聲消除、支持語音打斷。麥克風陣列模塊優點是迅速集成,缺點成本較高,適合小批量。所以訊飛也可以提供麥克風軟核方案,包括算法SDK、錄音板、加密芯片和構型說明。目前軟核方案有單麥軟核、雙麥軟核、四麥線性軟核、環形五麥軟核和環形七麥軟核。環形七麥支持5~7米拾音距離、360°聲源定位、±10°聲源定位精度,陣列錄入的音頻信噪比更高。
圖:訊飛開放平臺智能硬件產品總監張良春
在演講的中,張良春還風趣的套用了周星馳電影國產凌凌漆中的一個橋段:咱們的產品只要一開口說話,無論在哪里,都像黑暗中的一只螢火蟲,那樣的鮮明,那樣的出眾……
干貨泥濘的麥克風陣列技術剖析
除了邀請訊飛開放平臺的相關同事,此次發布會還特意從訊飛研究院邀請了信號處理領域的技術大牛王海坤博士。而王博士的發言無疑讓此次本便干貨滿滿發布會變得更加泥濘。王博士從信號與信號聲學處理談起,全面的剖析了訊飛的麥克風陣列與回聲消除技術。
“噪聲、混響、干擾和回聲是聲學信號處理需要解決的問題,而這些問題的解決離不開麥克風陣列。訊飛采用聲源定位技術,利用麥克風陣列用基于TDOA(到達時間差)計算聲源距離陣列的角度和距離,實現對目標聲源的跟蹤。再通過波束形成技術,即在期望方向上有效地形成一個波束,僅拾取波束的信號,從而達到同時提取聲源和抑制噪聲的目的。對于混響,則使用麥克風陣列+深度學習,實現有效的混響處理“。
圖:訊飛研究院王海坤
“科大訊飛的回聲消除技術更是達到國際頂尖水平,利用自適應濾波方法估計回聲路徑和利用參考信號求得麥克風拾取的喇叭聲音,并將其減去。通過這一系列的技術,訊飛麥克風陣列實現了優異的聲學信號處理,確保了良好的用戶體驗”。
智能硬件客,共享語音云
發布會最后做壓軸演講的,是訊飛開放平臺智能硬件商務總監湯熙,湯熙以“生活不止眼前的茍且,還有詩和遠方的田野”生動開場,著重介紹了開發者獲取訊飛開放平臺相關能力的一套流程。
圖:訊飛開放平臺智能硬件商務總監湯熙
湯熙最后表示:如果你確定與訊飛合作,訊飛將提供深入對接的全套服務。我們在深圳、北京、合肥都有支持團隊,除了技術支持+商務本地化服務外,訊飛還提供包括資本服務、宣傳服務、渠道服務等多種服務。我們希望在做好服務的同時,陪伴大家共同成長。訊飛會不斷把核心技術做好,產品打磨好,把本地支持做好,只有這樣才能陪伴大家往前走。訊飛也許不夠完美,但是完美的訊飛需要大家一起締造。
麥克風猶如遠場識別的心臟和引擎,在其基礎上,遠場識別技術的遠距離、高識別率支撐,現在用戶在以家庭為單位的活動范圍內,可以通過語音輕松操控家里的一切智能硬件設備,推而廣之,搭載遠場識別的智能硬件產品將無限擴大適用范圍和應用場景。未來,科大訊飛將依靠自身強大的人工智能科研實力與優質產品,更具創造性地去改變世界,讓人們的生活更加美好。
-
助聽器
+關注
關注
18文章
171瀏覽量
40362 -
人工智能
+關注
關注
1791文章
47294瀏覽量
238578
發布評論請先 登錄
相關推薦
評論