人工智能、5G、大數據等正影響著各行各業的發展與轉型,傳統面對面的會議講座,很多時候已經不能滿足當下快速多變的商業環境。在疫情影響下,辦公學習正在迎來線上協同、異地連接的方式轉變,智慧辦公時代已經到來。
線上學習、辦公常常面臨準確“記錄”聲音的困擾,因此拾音、降噪、轉寫等能力顯得格外重要。依托麥克風陣列、智能降噪算法、長語音識別......思必馳目前已助力MAXHUB會議平板,飛利浦、紐曼、印象筆記、索尼等品牌錄音筆智能化升級。
AI加持,高效學習辦公
隨著人工智能在各行各業應用深化,AI語音轉換文本市場規模空前。
ReportLinker發布報告預計,到2027年,全球文本語音轉換市場規模將達到60億美元。其中,美國的文本語音轉換市場預計將達到6.013億美元。中國文本語音轉換市場規模將達到13億美元。
在AI加持下,錄音筆、手機、平板電腦等這些錄音設備早已不再只是單純的進行音頻記錄,它們能直接將音頻轉寫成文字,還能對文字進行編輯和處理,提升工作、學習效率。
眾多錄音設備中,最常見的是錄音筆。
紐曼多款AI錄音筆采用思必馳智能錄音筆解決方案,錄音筆連接到手機端或PC,即可實現音頻轉寫、對話翻譯、空間及文本管理等多種功能。印象掃譯筆專業版(EverSCAN Pro)采用雙麥方案,搭載思必馳AI降噪算法,長語音識別,不同場景下對噪音進行多重優化,清晰降噪,實現長語音實時轉寫、錄音文件轉寫等功能。
索尼錄音筆、飛利浦錄音筆、MAXHUB會議平板等產品中目前均內置了思必馳長語音識別服務。
思必馳長語音識別服務支持實時識別與離線識別,識別準確率可達98%(中國信息通信研究院檢測,報告編號:V21Y000005)。實時的錄音轉寫功能,無論上課、開會還是采訪,用戶都能快速準確出稿,極大提升工作、學習效率。
遠場+降噪,清晰自然交互
遠程會議、線上學習場景,常常需要遠場語音交互,并且伴隨著環境噪聲和人聲干擾。尤其在大型會議現場,遠距離拾音和噪聲盡管不會掩蓋正常語音通話,但是影響了清晰度。
針對遠場交互和噪聲問題,麥克風陣列可以有效抑制噪聲。
思必馳麥克風陣列集成波束成形、回聲消除、聲源定位等算法,可拾取半徑5m內的聲源,實現360°聲源定位,即使會議場景發言人之間遠距離從多方位發聲,也可以輕松拾音。
另外,新一代的智能降噪技術也是文本語音轉寫的“法寶”。
傳統的噪音抑制方法只能作用于某些固定的穩態噪音,如空調等電器的運轉聲,而動態噪音如開關門聲和人的語音出現頻率重疊時,傳統方法無法很好地抑制。隨著深度學習方法的飛速發展,更強大的深度神經網絡被應用于語音識別,包括卷積神經網絡(CNN)等。
思必馳智能降噪技術采用“傳統分離結合深度學習方案”,可以兼顧傳統信號處理的保真性和深度學習的非穩態噪聲抑制能力,即在良好去除非穩態噪聲的同時保證語音的較小失真,獲取純凈錄音,轉寫文本更準確。
說話人識別,AI智能轉寫
在論壇、大中小型會議、課堂等場景,參會者們滔滔不絕各抒己見,準確區分說話人并分角色輸出文本,變成了語音轉寫文字的一個重要標準。
人的聲紋具有特定的唯一性和穩定性,聲紋識別可以通過聲紋辨別說話人。在上述會議、課堂等多人混合說話場景下,聲紋識別的目標是讓機器將嘈雜環境下的多個混合說話人的聲音分離,識別每個說話人所說的內容并判斷每個說話人的身份。
思必馳針對會議、學習場景,智慧辦公解決方案對音頻的前端處理通過聲源分離技術,通過DOA、聲紋識別技術辨別說話人,拾音設備可以輕松區分說話人角色,按“角色”轉寫。
結合算法降噪,盲源分離,提供相對更“干凈”的音頻文件;自動標點識別、數字化處理等自然語言處理能力,能夠讓識別結果更加準確、規范。
隨著人工智能、云計算、物聯網等新興科技發展,企業紛紛進行智能化戰略轉型和業務升級,開拓智能時代新藍海。智慧辦公作為AIoT升級和演進方向之一,正在成為推動經濟發展、轉型升級、社會進步的重要驅動力量。結合長語音識別、聲紋識別、AI降噪等,思必馳未來將持續助力企業實現降本增效,成就高效能人士。
原文標題:言傳「譯」會,智慧辦公秘籍大公開!
文章出處:【微信公眾號:思必馳】歡迎添加關注!文章轉載請注明出處。
審核編輯:湯梓紅
-
AI
+關注
關注
87文章
31054瀏覽量
269408 -
人工智能
+關注
關注
1792文章
47387瀏覽量
238901 -
5G
+關注
關注
1355文章
48474瀏覽量
564716 -
智慧辦公
+關注
關注
0文章
66瀏覽量
1227
原文標題:言傳「譯」會,智慧辦公秘籍大公開!
文章出處:【微信號:思必馳,微信公眾號:思必馳】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論