語音聽寫,是指將短音頻(≤60秒)精準識別成文字,實時返回結果,達到邊說邊返回的效果。
除了要考慮本身語音聽寫模型或算法的識別準確率之外,一些智能硬件的產品還需要額外考慮降噪、回聲消除、去混響等因素,這些都是保證最后識別效果的重要因素。因為涉及軟硬件,對能力交付方的項目經驗提出了較高的要求。
目前,國內提供語音聽寫技術的廠商主要有:
1、科大訊飛
成立于1999年,2008年,公司在深圳證券交易所掛牌上市(股票代碼:002230)。一直深耕在人工智能領域,技術很全也很綜合,多次在語音識別、語音合成、機器翻譯、圖文識別、圖像理解、閱讀理解、機器推理等各項國際評測中取得佳績。
在語音聽寫上,除中文普通話和英文外,支持51個語種、24種方言和1個民族語言,可提供公有云接口及私有化部署方案。采用行業先進的語音識別技術,識別率可達98% 。目前廣泛應用于語音搜索、聊天輸入、游戲娛樂、人機交互等場景。
2、百度
該技術主要由百度智能云提供,可適用于手機語音輸入、智能語音交互、語音指令、語音搜索等短語音交互場景。近場中文普通話識別準確率達98%,在語言支持上覆蓋主流的普通話、口音普通話、粵語、四川話、英語。
3、云知聲
2012年6月創立于北京,是國內頭部人工智能獨角獸企業。語音聽寫主要應用于語音搜索、語音輸入、語音控制等場景。準確率可達實用標準,支持普通話、四川話、粵語、英語的識別。
4、思必馳
07年創立于英國劍橋,08年回國落戶蘇州,12年完成A輪融資,是國內專業的對話式人工智能平臺公司,擁有全鏈路的智能語音語言技術。語音識別提供基于云+端混合引擎的連續語音識別,覆蓋中文、英文、葡萄牙語等語種,粵、川、滬等方言,以及帶方言的普通話。云端連續實時語音識別率>97%,可提供公有云接口及私有化部署方案。
審核編輯:符乾江
-
語音識別
+關注
關注
38文章
1742瀏覽量
112709 -
人工智能
+關注
關注
1792文章
47399瀏覽量
238902
發布評論請先 登錄
相關推薦
評論