阿里達摩院公布自研語音識別模型DFSMN，識別準確率達96.04%

【導讀】：日前，阿里巴巴達摩院機器智能實驗室推出了新一代語音識別模型DFSMN，據(jù)悉語音識別準確率達96.04%，未來將用于智能家居設備。

達摩院機器智能實驗室的語音識別團隊主導了這個模型的研發(fā)，并宣布向全世界企業(yè)與個人開源。對比目前業(yè)界使用最為廣泛的LSTM模型，DFSMN模型訓練速度更快、識別準確率更高。采用全新DFSMN模型的智能音響或智能家居設備，相比前代技術深度學習訓練速度提到了3倍，語音識別速度提高了2倍。

在近期舉行的云棲大會武漢峰會上，裝有DFSMN語音識別模型的“AI收銀員”在與真人店員的PK中，在嘈雜環(huán)境下準確識別了用戶的語音點單，在短短49秒內點了34杯咖啡。此外，裝備這一語音識別技術的自動售票機也已在上海地鐵“上崗”。

著名語音識別專家，西北工業(yè)大學教授謝磊表示：“阿里此次開源的DFSMN模型，在語音識別準確率上的穩(wěn)定提升是突破性的。是近年來深度學習在語音識別領域最具代表性的成果之一。對全球學術界和AI技術應用都有巨大影響。”有業(yè)內人士稱，DFSMN有望成為繼傳統(tǒng)的LSTM模型后，成為全球語音識別領域最主要的聲學識別模型之一。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

阿里巴巴

阿里巴巴

+關注

關注
7

文章
1616

瀏覽量
47214
語言識別

語言識別

+關注

關注
0

文章
15

瀏覽量
4826

如何提升人臉門禁一體機的識別準確率？

準確率，可以從以下幾個方面進行改進。一、優(yōu)化算法與模型人臉識別的核心在于算法的優(yōu)化和模型的調整，目前深度學習技術在圖像識別中的應用取得了顯著

發(fā)表于 12-10 15:05 ?147次閱讀

如何提升人臉門禁一體機的<b class='flag-5'>識別</b><b class='flag-5'>準確率</b>？

語音識別與自然語言處理的關系

了人機交互的革命，使得機器能夠更加自然地與人類溝通。語音識別技術概述語音識別，也稱為自動語音識別

發(fā)表于 11-26 09:21 ?382次閱讀

語音識別技術的應用與發(fā)展

體驗。語音識別技術的原理語音識別技術的核心在于將聲波信號轉換為可理解的文本信息。這一過程通常包括以下幾個步驟：聲學模型：用于

發(fā)表于 11-26 09:20 ?454次閱讀

ASR與傳統(tǒng)語音識別的區(qū)別

識別技術。構建更深更復雜的神經(jīng)網(wǎng)絡模型，利用大量數(shù)據(jù)進行訓練。提高了語音識別的準確率和穩(wěn)定性。傳統(tǒng)

發(fā)表于 11-18 15:22 ?467次閱讀

ai人工智能回答準確率高嗎

，AI可能表現(xiàn)出較高的準確率。例如，在圖像識別、語音識別等領域，經(jīng)過大量訓練的AI系統(tǒng)通常能夠取得令人滿意的準確率。然而，在其他領域或場景

發(fā)表于 10-17 16:30 ?3131次閱讀

阿里達摩院發(fā)布玄鐵R908 CPU

在杭州第四屆RISC-V中國峰會上，阿里達摩院再次展現(xiàn)技術實力，隆重推出了玄鐵處理器家族的最新成員——R908 CPU。此次發(fā)布標志著玄鐵系列在高端計算領域的全面升級，吸引了業(yè)界的廣泛矚目。

發(fā)表于 08-23 16:27 ?1001次閱讀

NRK3301識別語音芯片在智能按摩椅中的應用與體驗提升

了新的變革。?一、高識別準確率和快速響應?NRK3301語音識別芯片采用最新的神經(jīng)網(wǎng)絡（?TDNN）?算法，?具有高識別

發(fā)表于 08-03 08:07 ?439次閱讀

什么是離線語音識別芯片？與在線語音識別的區(qū)別

離線語音識別芯片適用于智能家電等，特點為小詞匯量、低成本、安全性高、響應快，無需聯(lián)網(wǎng)。在線語音識別功能更廣泛、識別

發(fā)表于 07-22 11:33 ?406次閱讀

Transformer模型在語音識別和語音生成中的應用優(yōu)勢

隨著人工智能技術的飛速發(fā)展，語音識別和語音生成作為人機交互的重要組成部分，正逐漸滲透到我們生活的各個方面。而Transformer模型，自其

發(fā)表于 07-03 18:24 ?1116次閱讀

有效提升智能會議系統(tǒng)語音識別準確性案例分享

語音識別技術是在智能會議系統(tǒng)中至關重要，準確的智能會議語音識別能力，意味著會議參與者可以通過語音

發(fā)表于 06-21 11:15 ?347次閱讀

有效提升智能會議系統(tǒng)語音識別準確性案例分享

語音識別技術是在智能會議系統(tǒng)中至關重要，準確的智能會議語音識別能力，意味著會議參與者可以通過語音

發(fā)表于 06-21 11:13 ?493次閱讀

阿里達摩院提出“知識鏈”框架，降低大模型幻覺

近日，阿里巴巴達摩院（湖畔實驗室）攜手新加坡南洋理工大學等研究機構，共同推出了大模型知識鏈（CoK）框架。該框架不僅可實時檢索異構知識源，還能逐步糾正推理錯誤，有效提高了大

發(fā)表于 05-10 11:46 ?695次閱讀

在全志V853平臺上成功部署深度學習步態(tài)識別算法

集上測試了NB模型的步態(tài)識別準確率。CASIA-B是一個大規(guī)模、多視角的步態(tài)識別數(shù)據(jù)集，共包含124個樣本，每個樣本都有10種步態(tài)序列，分為6個正常行走的序列（NM），2個身著長外套行

發(fā)表于 03-04 10:15

阿里達摩院在上海成立新公司，聚焦人工智能與軟件開發(fā)

天眼查信息顯示，達摩院（上海）科技有限公司已正式成立，法定代表人為張建鋒，注冊資本為1000萬人民幣。該公司由阿里巴巴旗下阿里巴巴達摩

發(fā)表于 02-04 10:52 ?1009次閱讀

重塑翻譯與識別技術：開源語音識別模型Whisper的編譯優(yōu)化與部署

模型介紹Whisper模型是一個由OpenAI團隊開發(fā)的通用語音識別模型。它的訓練基于大量不同的音頻數(shù)據(jù)集，是一個多任務

發(fā)表于 01-06 08:33 ?3663次閱讀

精選推薦
更多

文章

資料

帖子

2024過去了，留下十個科技記憶

腦極體
1天前

691 閱讀

兩款VR頭顯大拆解，都用了哪些芯片？

拍明芯城
1天前

507 閱讀

屏蔽柵MOSFET技術簡介

翠展微電子
1天前

463 閱讀

基于LKS32MC07x系列MCU的超高速清潔電器解決方案

晶豐明源
1天前

506 閱讀

基于瑞薩電子RA6T2 MCU的電機控制讓吸塵器更智能

瑞薩MCU小百科
1天前

406 閱讀

出貨檢驗報告書

其實znvm
433

10積分

96下載

OrCAD問題集綿

yanqitwins
60

免費

0下載

電路圖及印制電路板學習資料

xiaomiao
410 KB

免費

0下載

運算放大器選型指南2011-2012

yezi888
6.13 MB

免費

1893下載

Hyperic HQ IT資源管理平臺

安立路
51.66 MB

免費

0下載

【飛凌嵌入式OK3588J-C開發(fā)板體驗】OK3588J-C開發(fā)板的ffmpeg編解碼、HDMI輸入及編碼

dutong0321
2天前

447 閱讀

采集值突然驟降

塵埃sawdsa
1天前

499 閱讀

2024 電機控制年度技術分享會來啦！！！

ElecFans小喇叭
2天前

692 閱讀

[廣東龍芯2K1000/2K500開發(fā)板] OpenWRT 使用說明

jf_38522704
10月前

5620 閱讀

使用單片機驅動DAC088S085無反應

jf_68383328
2天前

908 閱讀

推薦專欄
更多

在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

搜索歷史

阿里達摩院公布自研語音識別模型DFSMN，識別準確率達96.04%

評論

如何提升人臉門禁一體機的識別準確率？

語音識別與自然語言處理的關系

語音識別技術的應用與發(fā)展

ASR與傳統(tǒng)語音識別的區(qū)別

ai人工智能回答準確率高嗎

阿里達摩院發(fā)布玄鐵R908 CPU

NRK3301識別語音芯片在智能按摩椅中的應用與體驗提升

什么是離線語音識別芯片？與在線語音識別的區(qū)別

Transformer模型在語音識別和語音生成中的應用優(yōu)勢

有效提升智能會議系統(tǒng)語音識別準確性案例分享

有效提升智能會議系統(tǒng)語音識別準確性案例分享

阿里達摩院提出“知識鏈”框架，降低大模型幻覺

在全志V853平臺上成功部署深度學習步態(tài)識別算法

阿里達摩院在上海成立新公司，聚焦人工智能與軟件開發(fā)

重塑翻譯與識別技術：開源語音識別模型Whisper的編譯優(yōu)化與部署