在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

小米AI實驗室聲學團隊 獲嬰兒啼哭聲識別的挑戰賽任務第一名

小米公司 ? 來源:小米公司 ? 作者:小米公司 ? 2020-11-13 10:28 ? 次閱讀

對嬰兒來說,啼哭聲是一種通訊的方式,一個非常有限、但類似成年人進行交流的方式。它也是一種生物報警器,向外界傳達著嬰兒生理和心理的需求。 基于啼哭聲聲波攜帶的信息,嬰兒的身體狀況才能被確定,疾病才能被檢測出來。因此,有效辨識啼哭聲,成功地將嬰兒啼哭聲“翻譯”成“成人語言”,讓成年人讀懂啼哭聲的含義,有重大的實際意義。 2020 iFLYTEK A.I.開發者大賽中,有一項關于嬰兒啼哭聲識別的挑戰賽任務。本次競賽總共吸引了678只隊伍參賽,分別來自國內不同的公司和高校。最終小米AI實驗室聲學團隊以0.99123分的高分奪得第一名。

比賽的訓練數據集包含了awake(蘇醒)、diaper(換尿布)、hug(要抱抱)、hungry(饑餓)、sleepy(困乏)和uncomfortable(不舒服)六類哭聲,并且人工添加了來自Noisex-92標準數據庫的噪聲。 這項任務旨在判別嬰兒啼哭聲所傳遞的信息,需要分別在簡單噪聲環境和復雜噪聲環境下對嬰兒啼哭進行識別,判斷容易引起混淆的啼哭聲,分析各類啼哭聲的明顯特征及簡單直接的判別方式。 初賽訓練數據包含918條音頻,測試集包含228條。復賽賽方提供了添加不同噪聲的30294條訓練數據,需對7524條測試音頻進行識別。

嬰兒啼哭比賽背后的技術原理 小米AI實驗室聲學團隊借鑒說話人確認的方法,訓練網絡使得vector的余弦距在離類間間距拉大而類內間距減小。 在模型的訓練過程中,首先使用VAD算法對嬰兒啼哭音頻中的靜音部分進行剔除。去除靜音后隨機選取160幀,不足160幀的語音采用Cycle Padding方式,利用中間特征進行循環填充,相比與傳統的補0或用尾部填充的方式,特征更加豐富。 模型采用3 層 LSTM+256Dense 層,每層節點為 512。初賽訓練集中的所有純凈語音均看作 enroll 語料,所有訓練集中每個類別的 embedding 由該類別中的所有語音過模型求整體平均得到。測試集中的每條語音過模型后得到的 embedding與 enroll 中的每類 embedding 求余弦距離,分數對應最高的類別為預測類別。 訓練策略為:首先迭代第一個 5000 次,學習率設置為 1e-3,第二次加載預訓練模型(mAp 分數高的),調整學習率,再迭代 5000 次,最終交叉加載預訓練模型在不同的 part 上訓練。

模型的選擇和推理過程分為以下4個步驟:

測試集統計分析:首先統計測試集語音的信噪比、時長、靜音占比及語音相似度。通過對比分析,對相似數據進行歸類,選取最高信噪比數據進行預測。

模型選擇:在 5 個訓練集上分別擇優選取 2 個模型作為備用。

推理:計算測試語料經模型推理得到的vector 與每類哭聲embedding間的余弦距離,取分數最高的對應類為備選結果。

投票:根據單個模型預測的結果投票得到最終結果。

聲學感知技術未來將如何發展? 當前主流的聲學感知技術使用的是強監督的深度學習方法,隨著數據量的增大和技術的發展,未來監督學習的方法將逐漸過度為半監督甚至無監督學習。其中半監督學習正是當前聲音事件檢測技術的研究重點。 不僅如此,深度學習的網絡模型也從人工專家設計逐漸轉變為自動搜索架構,而元學習等小樣本學習方法也開始逐步應用在聲學感知方向。 嬰兒哭聲分析只是聲學感知技術的其中一個應用。當前的聲音場景分類和聲音事件檢測技術已能在設備端上實時分析當前用戶所處的場景和識別出各式各樣的聲音,如貓狗寵物叫聲、警報聲、汽車鳴笛聲等。

不僅如此,聲學感知技術還能分析出一些連人耳也無法聽出的聲音,如本次競賽的嬰兒啼哭意圖,以及應用在工業上,通過分析機器發出的聲音來判斷機器保養狀態的聲學分析技術。聲音作為一種最常見的傳感媒介之一,聲音感知技術在智能家庭、自動駕駛、智能工業化等領域都有廣泛的應用場景。 手機xAIoT小米AI全力打造小米智能家居 隨著小米最新的手機xAIoT戰略,智能家居環境是手機設備與全部智能家居設備聯動最全面的使用場景。手機、TWS耳機和越來越多的智能家居設備比如智能音箱、智能電視、米家IoT設備等都具有麥克風拾音功能。 我們獲得了足夠多場景下的聲音數據時,構建基于設備端的場景感知、事件感知、人體感知和空間感知能力成為了可能。 依賴于全球第一的AIoT平臺,小米可以實現對家中每一個角落無處不在的感知能力,并完成手機端事件提醒與多事件時間線回溯,聲學作為智能感知的一種手段,在未來與UWB技術、視覺圖像技術相結合,相互取長補短將成為主流的趨勢。

責任編輯:xj

原文標題:小米AI實驗室聲學團隊榮獲2020 iFLYTEK A.I.開發者大賽嬰兒啼哭聲識別挑戰賽冠軍

文章出處:【微信公眾號:小米公司】歡迎添加關注!文章轉載請注明出處。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    87

    文章

    30919

    瀏覽量

    269170
  • 智能語音
    +關注

    關注

    10

    文章

    784

    瀏覽量

    48776
  • 小米
    +關注

    關注

    70

    文章

    14356

    瀏覽量

    144234

原文標題:小米AI實驗室聲學團隊榮獲2020 iFLYTEK A.I.開發者大賽嬰兒啼哭聲識別挑戰賽冠軍

文章出處:【微信號:xiaomigongsi0406,微信公眾號:小米公司】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    達實再度榮獲十大出入口控制品牌第一名

    近日,被譽為智能建筑行業“奧斯卡”的中國智能建筑品牌獎頒獎典禮于廣州盛大舉行。達實智能子公司——深圳達實物聯網技術有限公司 連續14年 “十大出入口控制品牌第一名”榮譽,與此同時還攬“2024年優秀AIoT智控平臺品牌”等兩
    的頭像 發表于 12-11 10:23 ?209次閱讀

    蔚來獲得CACSI車型滿意度和售后服務滿意度第一名

    近日,由中國質量協會發布的2024年中國新能源汽車用戶滿意度測評結果(CACSI)出爐。蔚來ET5T榮獲純電動中型轎車滿意度第一名,蔚來品牌榮獲售后服務滿意度第一名。蔚來已連續兩年獲得CACSI車型滿意度和售后服務滿意度第一名
    的頭像 發表于 12-06 17:19 ?792次閱讀

    理想L6和理想L8榮獲中國新能源汽車用戶滿意度測評第一名

    近日,中國質量協會發布2024年中國新能源汽車行業用戶滿意度測評(NEV-CACSI)結果,理想L62024年市場關注新車(SUV) 第一名,理想L8也成為混動中大型SUV第一名。雙雙登頂,證明著
    的頭像 發表于 12-05 14:00 ?325次閱讀

    小米與聚飛光電成立聯合實驗室

    近日,“小米&聚飛聯合實驗室”在惠州聚飛正式揭牌成立。該實驗室將以Mini背光技術創新為主要方向,進步強化雙方在顯示終端領域的多元化合作。
    的頭像 發表于 11-27 10:45 ?179次閱讀

    TüV萊茵授予聯想合作實驗室資質

    聯想(北京)有限公司近日迎來重要里程碑,其聲學實驗室與安規實驗室成功獲得德國萊茵TüV大中華區頒發的合作實驗室資質證書。這殊榮不僅標志著聯
    的頭像 發表于 09-20 18:23 ?947次閱讀

    NVIDIA為AI城市挑戰賽構建合成數據集

    一年一度的 AI 城市挑戰賽中,來自世界各地的數百支參賽隊伍在 NVIDIA Omniverse 生成的基于物理學的數據集上測試了他們的 AI 模型。
    的頭像 發表于 09-09 10:04 ?484次閱讀

    軟通動力榮獲2023年中國IT服務市場第一名

    近日,迪顧問最新發布《2023-2024年中國IT服務市場研究年度報告》。報告中,軟通動力憑借在數字化轉型浪潮中卓越的數字化能力和表現,持續領跑IT服務市場,位列2023年中國IT服務市場第一名
    的頭像 發表于 07-31 10:18 ?455次閱讀

    潤和軟件連續四年蟬聯數字業務類解決方案市場第一名

    ,連續四年蟬聯數字業務類解決方案市場第一名。在細分領域:數字信貸系統解決方案子市場持續保持第一名,數字銀行解決方案子市場穩居第二,開放銀行解決方案子市場上升至第三。 ? 數字業務類
    的頭像 發表于 07-31 10:10 ?590次閱讀

    MediaTek與小米集團聯合實驗室正式揭幕

    MediaTek 宣布攜手小米集團持續強化戰略合作,共同開啟更深層次的多元合作,并為位于小米深圳研發總部的「聯合實驗室」揭牌。此次「聯合實驗室」的揭幕將進
    的頭像 發表于 07-03 14:52 ?706次閱讀

    浪潮信息CVPR2024自動駕駛挑戰賽"Occupancy& Flow"冠軍

    北京2024年6月25日 /美通社/ -- 近日,在全球權威的CVPR 2024自動駕駛國際挑戰賽(Autonomous Grand Challenge)中,浪潮信息AI團隊所提交的"F-OCC
    的頭像 發表于 06-25 20:29 ?376次閱讀
    浪潮信息<b class='flag-5'>獲</b>CVPR2024自動駕駛<b class='flag-5'>挑戰賽</b>&quot;Occupancy&amp; Flow&quot;冠軍

    基于Tiny AI技術的嬰兒哭聲事件離線檢測方案

    基于Tiny AI技術的嬰兒哭聲事件離線檢測模型,基于Arm Cortex/Risc V微處理器開發,芯片資源占用極少,有極高的準確率和極低的誤識別率。
    的頭像 發表于 06-17 15:25 ?749次閱讀

    基于深度神經網絡的嬰兒哭聲識別算法

    具體的軟硬件實現點擊 http://mcu-ai.com/ MCU-AI技術網頁_MCU-AI 嬰兒哭鬧識別
    發表于 05-20 19:20

    華潤微電子以第一名的成績榮獲新吳區區長質量獎

    近日,無錫高新區(新吳區)召開2023年度高質量發展總結暨2024年工作推進會,會議隆重表彰了新吳區區長質量獎單位,華潤微電子以第一名的成績榮獲新吳區區長質量獎。
    的頭像 發表于 04-07 09:19 ?664次閱讀
    華潤微電子以<b class='flag-5'>第一名</b>的成績榮獲新吳區區長質量獎

    長城汽車自主品牌首個氣動-聲學風洞實驗室即將建成

    長城汽車自主品牌首個氣動-聲學風洞實驗室將建成
    的頭像 發表于 03-28 10:03 ?413次閱讀
    長城汽車自主品牌首個氣動-<b class='flag-5'>聲學</b>風洞<b class='flag-5'>實驗室</b>即將建成

    上海AI實驗室發布新代書生·視覺大模型

    近日,上海人工智能實驗室(上海AI實驗室)聯手多所知名高校及科技公司共同研發出新代書生·視覺大模型(InternVL)。
    的頭像 發表于 02-04 11:25 ?1118次閱讀
    主站蜘蛛池模板: 啪啪亚洲| 亚洲欧美日韩国产一区二区三区精品| 亚洲综合亚洲综合网成人| 九色九色九色在线综合888| 色图插插插| 久久国产乱子伦精品免费午夜| 黄 色 成 年人在线| 99精品视频在线播放2| 一级黄色片在线| 看日本黄大片在线观看| 色之综合网| 在线观看国产精美视频| 一区二区三区高清不卡 | 色视频网站在线| 一级毛片ab片高清毛片| 怡红院精品视频| 四虎884| 亚洲九色| 色噜噜狠狠成人中文小说| 女人张开腿让男人桶免费网站| 骚淫| 黄色超污网站| 在线亚洲小视频| 玖玖福利| 亚洲免费播放| 新四虎影院| 免费看你懂的| 免费黄色地址| 成年女人毛片免费视频| 天堂在线视频| 手机看日韩毛片福利盒子| 久插| 婷婷午夜激情| 天堂中文在线网| 四虎影视网站| 久久精品综合| 国产美女在线精品观看| 偷自在线| 欧美激情 在线| 一级一片免费视频播放| 奇米视频在线观看|