在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

揭秘小米AI音箱的語音交互的優勢

聲智科技 ? 來源:djl ? 作者:聲智科技 ? 2019-08-13 10:52 ? 次閱讀

2018年是國內智能音箱的火爆元年,市場上短時間涌入了以小米、阿里、百度和騰訊等為首的數十款智能音箱,甚至出現了深圳一條街就有百家智能音箱廠商的盛況。但是迄今為止,市場銷量超過百萬的智能音箱廠家只有小米和阿里。

去年“雙十一”阿里的補貼戰略很快就讓天貓精靈率先破百萬,而小米的小米AI音箱繼續沿用小米口碑營銷思路,憑借用戶體驗優勢和性價比穩步上揚,在缺貨嚴重且渠道漲價的情況下,也輕松超過百萬銷量。同時,小米的小愛mini音箱自發布后更是一周之內銷量破百萬,自此,小米一家就擁有了小米AI音箱和小愛mini音箱兩款過百萬銷量的產品。目前,小米AI音箱依然保持著國內語音交互體驗評價更好的優勢。

很多人都會好奇這一點,為什么售價只有299元的小米AI音箱會贏得用戶口碑?除了小米的產品團隊對于用戶體驗的精準把握,其中智能音箱的靈魂——遠場語音交互技術也起到了非常關鍵的作用。遠場語音交互技術涉及到了麥克風陣列、遠場語音喚醒、語音端點檢測、遠場語音識別、語義理解和語音合成等技術。

聲智科技獨家供應了小米AI產品系列中的麥克風陣列、遠場語音喚醒和語音端點檢測及識別等技術,并與小米團隊密切配合,從用戶體驗角度重新打造了一整套更適應東方文化場景的新型遠場語音交互技術,從技術決定了用戶的第一體驗以及語音識別的效果。

麥克風陣列技術

麥克風陣列是由一定數目的聲學傳感器組成,用來對聲場的空間特性進行采樣并處理的系統。麥克風陣列通常包含2個以上的麥克風,2麥通常不稱為麥克風陣列,這有點類似于四個輪子的汽車和兩個輪子的摩托車之間的比較。

一般認為麥克風陣列的核心技術是降噪,事實上并非這樣,2麥在通信領域就能實現比較好的降噪效果。麥克風陣列的主要作用是幫助機器適應更加復雜的場景,尤其是語音交互的興起,它事實上改變了人類必須學習適應機器的現狀,轉而強調機器要學習適應人類的語言和習慣,這是一個產品思維的重大轉變,將會影響未來眾多AI產品的用戶體驗設計。

麥克風陣列的關鍵技術包含了通話降噪、混響抑制、回聲抵消、噪聲抑制、語音增強、波束形成、增益控制、識別優化等。除此之外,聲智科技所提供的麥克風陣列技術,還獨具抗強噪喚醒、90度抗強噪識別、空間感知和認知等新技術,其中的90度抗強噪識別技術則是面向東方文化場景的獨特技術。

由于中國和日本的家庭主要以公寓為主,這類居家環境下影響語音交互效果的主要是掛在墻上的電視,當智能音箱放置電視旁邊或者前方的時候,這時候噪聲源、語音源與智能音箱的夾角一般都會超過90度,當電視音量很大的時候,保證智能音箱的識別精準度就非常困難,目前來看,應用到小米AI音箱的技術體驗更為出色。

東西方的文化差異造就了不同的技術導向,當然也帶來了不同的技術測試驗證體系。所以,當前國內對于遠場語音交互技術的測試驗證的諸多場景是與國外截然不同的。自然,當問到為什么國內要用60度夾角測試噪聲源的干擾情況?很多技術人員就回答參考國外的測試標準,事實上這是不對的。

國外的居住環境以別墅為主,智能音箱的主要應用場景在開放式廚房,噪聲來源也主要是廚具設備噪聲,這相對電視噪聲來說更好處理(電視噪聲包含大量人聲),而且由于房子更大相對空曠,國外噪聲環境管理更加嚴格,室內強噪的情況并不多見,因此對于90度抗強噪識別技術的需求也不強烈。自然,總的來看,國內智能音箱對于遠場語音交互技術的要求事實上遠高于國外的標準。

遠場語音喚醒技術

遠場語音喚醒的主要作用距離是30CM-500CM,其主要技術指標是喚醒率和誤喚醒率,這兩個指標是一對蹺蹺板。聲智科技應用到小米AI音箱的技術,具有三個非常獨特的優勢,也是保證用戶體驗的關鍵因素。

其一就是寬場景高靈敏喚醒技術,這是用戶的第一體驗,小米AI音箱的喚醒詞是小愛同學,國內不管任何地區的發音,甚至國外的英式中文基本上都能第一次喚醒小愛同學,最差情況三次之內也能保證小愛同學響應。

事實上這是很難做到的,因為喚醒率和誤喚醒率是一對蹺蹺板,當喚醒效果很好的時候,誤喚醒通常也會很高,智能音箱毫無征兆的突然喚醒也是很麻煩的事情。為解決這個矛盾,通常會有些技巧性方法,比如阿里的天貓精靈,經常第一次很難喚醒,需要第二次才能喚醒,這就是通過工程技巧降低誤喚醒率的通常做法。聲智科技的技術路線并非這樣簡單,而是必須優先保證用戶的體驗,在此基礎上再降低誤喚醒率,同時還要提升強噪環境下的喚醒率,當前也只有聲智科技的技術做到了這點。

其二就是低成本高容錯喚醒技術,特別是面向低成本高失真產品的時候,這項技術顯得尤其重要。小米的產品一直以性價比為核心占領市場,比如小米AI音箱售價僅為299元,拋去市場的補貼因素,至今還是市面上最便宜的智能音箱。這也意味著小米AI音箱的麥克風、喇叭和結構都會以成本因素為第一考量進行選擇,這將帶給語音交互技術巨大的壓力,特別是自噪聲抑制和遠場信號處理的難度極具增加。

舉個簡單例子,比如麥克風器件的選擇,信噪比(SNR)70dB以上的麥克風要比信噪比60DB的麥克風的遠場和抗噪效果更好,但是選用高信噪比的麥克風,其結果就是成本會高出很多。為了給客戶更多產品設計的選擇自由度,聲智科技的技術必須徹底屏蔽硬件的差異化,并且努力幫助客戶降低成本,即便在一致性和失真度非常大的情況下,也要出色的保證用戶體驗的效果。這是聲智科技非常獨特的優勢,當然在一些特殊場景,也需要一些性能更好的麥克風和芯片才能保證基本效果,所以Google、Amazon等國外的產品通常都會選用更高性能的麥克風。Google、Microsoft等國外公司技術部門為了追求更好的演示效果,尤其不計成本使用高信噪比(SNR>70dB)的麥克風器件和芯片,這也常常會誤導國內廠商的判斷,聲智科技目前的技術幾乎做到極致,但是若廠商追求更好的效果,必然也還會增加各個鏈條的成本。

其三就是低功耗高性能喚醒技術,低功耗喚醒的核心就是算法的復雜度,這包括了麥克風陣列算法和語音喚醒算法,聲智科技對于算法的優化一直是非常領先的,目前在智能音箱最復雜的場景,即在立體聲回聲抵消過程中的打斷喚醒,聲智科技的算法復雜度也遠優于市面上的同類技術。

很多時候大家會對比一家廠商的語音喚醒技術,僅靠評判一個成熟喚醒詞(比如Alexa)也是不對的,應該是考驗這家廠商定制喚醒詞的能力,以及服務的客戶數量,這個階段就極其考驗供應商的技術迭代和服務支持能力,AI技術本身就是在不斷的演化和迭代。

語音端點檢測技術

語音端點檢測的目標是要判定語音開始和結束的位置,一般定義在語音識別領域。但是由于語音端點檢測決定了語音識別的響應速度,而且并不能向語音識別一樣通過增加服務器來解決,必須嚴重依賴算法來保證,所以當前也成為了遠場語音交互領域非常關鍵的因素。

舉個簡單例子,我們每個人說話的語速和節奏差異非常大,如何準確判斷前端點和后端點以識別成一個句子,并且控制這個時間在幾百毫秒以內(人類發一個“啊”音的時間大概是200毫秒),對于整個語音流程的體驗來說至關重要,否則判斷的失敗,也將會嚴重影響識別結果和語義理解。VAD判停的時間,長了影響交互體驗,短了難以適配復雜場景,還是以符合人類交流的習慣為最佳。

這其中還有一個技術難點,就是小愛同學喚醒之后的隨機應答詞,包括“我在”,“哎”等,而且小米的應答詞還可以根據系統音量自動調整,由于這些應答詞會嚴重干擾語音識別的VAD功能,這是對語音端點檢測技術挑戰很大的應用場景。

市面上的其他產品,比如天貓精靈系列則是取消了應答詞,僅靠燈效來顯示喚醒狀態,而小度視頻音箱則是通過恒定低音量的應答詞來繞開這項技術難題,顯然這類處理手段給用戶的體驗都不是太好。目前市面上最為成熟的還是聲智科技提供的動態應答詞匹配檢測技術。

遠場語音識別技術

由于遠場智能產品的場景特殊性,遠場語音識別相對更加垂直,比如智能音箱的識別偏重于音樂和百科領域,智能汽車的識別偏重于地圖和音樂領域,而對于地域性的覆蓋,則是遠場語音識別著重考慮的,并不能簡單把方言劃歸為一個技術系列,特別是消費電子領域的高度標準化思維,幾乎不可能存在切換ASR的方法。

所以聲智科技的ASR就要在垂直領域考慮更多場景難題,比如老人和小孩的識別怎么辦?南方和北方的語言差異怎么辦?真正的產品落地需要考慮眾多應用場景的難題,而并非只是簡單的技術疊加。

場景語音合成技術

語音合成的兩個關鍵點,一個是聲線的優美程度,另外一個就是抑揚頓挫的語感流暢程度,這決定了用戶對于機器的真實體驗。

其中,第一種技術需要選擇獨特的聲優就行聲音采集和訓練,由聲優的聲線決定了合成聲音的效果,選擇聲優是一個考驗產品經理能力的任務。第二種技術則更為重要,是要保證機器朗讀的聲音更加符合人類的習慣,但是目前來看所有的產品還遠遠沒有達到這點,聲智科技也正在致力研究突破這項技術,估計一到兩年時間我們就可以聽到幾乎和人類聲音感覺相同的機器聲音。

技術細節決定口碑

真正贏得用戶口碑的技術,都是極其注重細節的技術,而這類技術通常符合我們常說的“二八規則”,即企業需要投入80%的精力來實現20%的提升。遠場語音交互領域非常符合這一特點,表面似乎每家公司的技術大致一樣,但實際上真正服務到百萬、千萬甚者上億用戶的時候,才是真正考驗這家技術公司實力的時候。特別是當市場用戶對于AI產品用錢投票的時候,用戶事實上不太關注單項指標,而真正關心的則是綜合各個細節的語音交互體驗。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 人機交互
    +關注

    關注

    12

    文章

    1207

    瀏覽量

    55402
  • 人工智能
    +關注

    關注

    1791

    文章

    47279

    瀏覽量

    238511
  • 語音交互
    +關注

    關注

    3

    文章

    286

    瀏覽量

    28017
收藏 人收藏

    評論

    相關推薦

    智能音箱混戰 遠場語音交互只是開始

    優勢一方面在于它的控制能力,另一方面是它的服務能力。要做成一款成功的智能語音產品,并商業落地,不是一件容易的事。 中國會否出現Echo?   從早期的京東叮咚音箱到近期的喜馬拉雅小雅AI
    發表于 07-17 09:37

    智能音箱各自為政 不懂合作恐將重復智能穿戴之路

    ][/img]   除了具備聽音樂和常用的語音交互功能外,小米人工智能音箱與家用電器連接以后,可控制小米電視、掃地機器人、電飯煲、空氣凈化器
    發表于 07-30 09:17

    王川:未來不一定會有語音中心 冰箱電視都可能搭載語音功能

    媒體采訪時表示,市場上每天有六千萬小米的智能設備在運行,目標用語音將其對接起來,這是小米音箱的“護城河”。   據財新記者了解,小米
    發表于 08-31 09:18

    智能音箱PK人工智能電視:誰更適合做為智能家庭入口?

    相比,大屏智能電視顯然具有先天的優勢,可以為用戶提供尊貴、舒服、震撼的高品質家庭影院體驗。不過如果是以語音交互為技術基礎的信息查詢、智能問答等服務,智能音箱的觸控結合
    發表于 04-20 09:28

    AI音箱市場持續“白熱化” 注重消費者體驗是制勝“法寶”

    物。   但是,低價位“千元機”、簡單語音交互、功能極度相似的AI音箱在市面上越來越普遍,“你有我也有”似乎成了各品牌推出新產品的唯一門檻。從實際銷售情況來看,低端化、同質化的智能
    發表于 05-09 09:28

    智能音箱遇上瓶頸有待突破改善

    得出結果(其他設備開始運行)。 因為智能音箱語音技術可以分為三個階段:噪聲抵消、語音識別,和語義識別。相對于國外,我國在于AI智能語音助理
    發表于 11-20 15:02

    智能音箱成智能家居入口,最新國外智能語音音箱大盤點

    了爭取市場空間的決心。其中,小米在2017年年底率先布局搭載了“小愛同學”語音交互系統的智能音箱,三星于8月初公布智能音箱Galaxy Ho
    發表于 12-01 09:30

    語音交互技術感興趣的童鞋戳進來!

    `隨著非接觸經濟的到來,語音交互技術的應用即將迎來爆發期。而受疫情的影響,語音交互技術以便捷性、簡單性、避免接觸式交叉感染的特點得到人們廣泛的關注。 本期華秋創服硬創直播室<資事
    發表于 03-11 14:19

    小米智能音箱怎么樣_智能音箱哪個音質好

    2017年7月26日,小米正式發布了售價299元的小米AI音箱“小愛同學”,這是小米推出的第一款AI
    發表于 12-28 17:59 ?2.8w次閱讀

    小米AI音箱怎么樣_來自小米用戶的智能音箱真實使用體驗

    小米AI音箱售價299元,小米AI音箱在保持低價位前提下還引入了
    發表于 12-29 08:34 ?1.5w次閱讀

    小愛音箱 mini:小米AI音箱的替代品?

    為純白配色,底部的四個腳墊部分為黑色。與小米AI音箱一樣,它的按鍵和陣列麥克風都分布在機身的頂部。 小愛音箱mini和小米
    的頭像 發表于 03-31 10:31 ?2.3w次閱讀

    小米AI音箱拆解報告

    2017年7月26日,小米為我們帶來了自家的智能音箱產品——小米AI音箱,從此“小愛同學”這個熱點便開始逐漸被人所熟知。
    的頭像 發表于 06-01 15:41 ?7.8w次閱讀
    <b class='flag-5'>小米</b><b class='flag-5'>AI</b><b class='flag-5'>音箱</b>拆解報告

    小米AI智能音箱可以直接通過語音音箱進行控制

    小米AI智能音箱外觀與小米凈化器有點類似。音箱內部搭載環形陣列360度收音的6枚數字麥克風,能夠做到遠場
    發表于 12-28 11:27 ?1.2w次閱讀

    地平線語音技術賦能小米智能音箱 終端完整語音方案打造流暢交互體驗

    2月20日,搭載地平線自主研發的增強語音抽取(Enhanced Speech Extraction,ESE)方案的小米小愛觸屏音箱在京發布。小米小愛觸屏
    發表于 02-21 11:06 ?509次閱讀

    小愛音箱累計語音交互次數突破百億次 成績史無前例

    2017年,小米在發布會上正式發布了旗下的人工智能語音系統-小愛同學,自此之后這一智能語音系統也成為了智能音箱小米手機的核心
    發表于 06-07 17:16 ?1337次閱讀
    主站蜘蛛池模板: 四虎看片| 免费在线黄色网| 经典三级一区二区三区视频| 午夜一区二区三区| 91视频看看| 色黄网站成年女人色毛片| 97色在线视频观看香蕉| 88av免费| 毛片视频免费网站| 老师今晚让你爽个够| 男人你懂的在线观看视频| 天天干夜夜谢| 久久99热久久精品动漫| 全部免费a级毛片| 天天搞天天操| 轻点太大了好深好爽h文| 亚洲综合色婷婷久久| 狠狠做深爱婷婷综合一区| 精品在线一区二区| 亚洲视频入口| 欧美3d成人动画在线| 日本最黄| 一本到卡二卡三卡免费高| 国产裸体美女视频全黄| 天天操91| 日本污视频网站| 日韩一级视频| 一级片成人| 在线观看永久免费| 性做久久久久久| 四虎影院永久地址| 亚洲黄视频| 韩国韩宝贝2020vip福利视频| 色综合国产| 天天插天天狠天天透| www.99热.com| 成人女人a毛片在线看| 亚洲一区二区三区高清| 久久香蕉国产精品一区二区三 | 大学生毛片| 少妇被按摩|