1月15日消息 近日,微軟在全球范圍內(nèi)對 Cortana 進(jìn)行了神經(jīng)網(wǎng)絡(luò)語音全面升級,升級后的 Cortana 更加自然流暢,語音效果堪比真人發(fā)音。
IT之家獲悉,此次升級利用了深度神經(jīng)網(wǎng)絡(luò)技術(shù),打破重讀和語調(diào)的傳統(tǒng)語音合成限制。韻律預(yù)測和語音合成以同步方式執(zhí)行,使輸出聽起來更流暢且自然。該項(xiàng)技術(shù)能夠更流暢地將數(shù)字文本(如電子書)轉(zhuǎn)換為有聲讀物,也可以使得與聊天機(jī)器人和語音助手的交流更加自然,且富有吸引力。
微軟的神經(jīng)網(wǎng)絡(luò)語音已在全球部署,可通過 PC 瀏覽器免費(fèi)試用。
責(zé)任編輯:PSY
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。
舉報(bào)投訴
-
微軟
-
神經(jīng)網(wǎng)絡(luò)
-
語音
-
Cortana
相關(guān)推薦
重新訓(xùn)練神經(jīng)網(wǎng)絡(luò)是一個(gè)復(fù)雜的過程,涉及到多個(gè)步驟和考慮因素。 引言 神經(jīng)網(wǎng)絡(luò)是一種強(qiáng)大的機(jī)器學(xué)習(xí)模型,廣泛應(yīng)用于圖像識別、自然語言處理、語音識別等領(lǐng)域。然而,隨著時(shí)間的推移,數(shù)據(jù)分布可能會(huì)
發(fā)表于 07-11 10:25
?474次閱讀
RNN(Recurrent Neural Network)是循環(huán)神經(jīng)網(wǎng)絡(luò),而非遞歸神經(jīng)網(wǎng)絡(luò)。循環(huán)神經(jīng)網(wǎng)絡(luò)是一種具有時(shí)間序列特性的神經(jīng)網(wǎng)絡(luò),能夠處理序列數(shù)據(jù),具有記憶功能。以下是關(guān)于循環(huán)
發(fā)表于 07-05 09:52
?595次閱讀
人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Networks, ANNs)是一種模擬人腦神經(jīng)元網(wǎng)絡(luò)的計(jì)算模型,它在許多領(lǐng)域,如圖像識別、語音識別、自然語言處理、預(yù)測分析等有著廣泛的應(yīng)用。本文將
發(fā)表于 07-05 09:13
?1272次閱讀
。 遞歸神經(jīng)網(wǎng)絡(luò)的概念 遞歸神經(jīng)網(wǎng)絡(luò)是一種具有短期記憶功能的神經(jīng)網(wǎng)絡(luò),它能夠處理序列數(shù)據(jù),如時(shí)間序列、文本、語音等。與傳統(tǒng)的前饋神經(jīng)網(wǎng)絡(luò)不同
發(fā)表于 07-04 14:54
?809次閱讀
神經(jīng)網(wǎng)絡(luò)在許多領(lǐng)域都有廣泛的應(yīng)用,如語音識別、圖像識別、自然語言處理等。然而,BP神經(jīng)網(wǎng)絡(luò)也存在一些問題,如容易陷入局部最優(yōu)解、訓(xùn)練時(shí)間長、對初始權(quán)重敏感等。為了解決這些問題,研究者們提出了一些改進(jìn)的BP
發(fā)表于 07-04 09:51
?464次閱讀
神經(jīng)網(wǎng)絡(luò)在許多領(lǐng)域都有廣泛的應(yīng)用,如語音識別、圖像識別、自然語言處理等。然而,BP神經(jīng)網(wǎng)絡(luò)也存在一些問題,如容易陷入局部最優(yōu)解、訓(xùn)練時(shí)間長、對初始權(quán)重敏感等。為了解決這些問題,研究者們提出了一些改進(jìn)的BP
發(fā)表于 07-03 11:00
?830次閱讀
Network)有相似之處,但它們之間還是存在一些關(guān)鍵的區(qū)別。 一、引言 神經(jīng)網(wǎng)絡(luò)是一種模擬人腦神經(jīng)元結(jié)構(gòu)的計(jì)算模型,它由大量的神經(jīng)元(或稱為節(jié)點(diǎn))組成,這些神經(jīng)元通過權(quán)重連接在一起
發(fā)表于 07-03 10:14
?879次閱讀
卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,簡稱CNN)是一種深度學(xué)習(xí)模型,廣泛應(yīng)用于圖像識別、語音識別、自然語言處理等領(lǐng)域。本文將詳細(xì)介紹卷積神經(jīng)網(wǎng)絡(luò)的基本原理
發(fā)表于 07-02 15:30
?1247次閱讀
卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,簡稱CNN)是一種深度學(xué)習(xí)模型,廣泛應(yīng)用于圖像識別、語音識別、自然語言處理等領(lǐng)域。本文將詳細(xì)介紹卷積神經(jīng)網(wǎng)絡(luò)的原理,包括其
發(fā)表于 07-02 14:44
?678次閱讀
神經(jīng)網(wǎng)絡(luò)是一種強(qiáng)大的機(jī)器學(xué)習(xí)技術(shù),可以用于各種不同的應(yīng)用。以下是一些神經(jīng)網(wǎng)絡(luò)建模的適用范圍: 圖像識別和分類 神經(jīng)網(wǎng)絡(luò)在圖像識別和分類方面具有顯著的優(yōu)勢。它們可以用于識別和分類各種類型
發(fā)表于 07-02 11:40
?651次閱讀
、語音識別、自然語言處理等多個(gè)領(lǐng)域。本文將對幾種主要的神經(jīng)網(wǎng)絡(luò)架構(gòu)進(jìn)行詳細(xì)介紹,包括前饋神經(jīng)網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)、卷積神經(jīng)網(wǎng)絡(luò)、生成對抗
發(fā)表于 07-01 14:16
?744次閱讀
神經(jīng)網(wǎng)絡(luò)是人工智能領(lǐng)域的重要分支,廣泛應(yīng)用于圖像識別、自然語言處理、語音識別等多個(gè)領(lǐng)域。然而,要使神經(jīng)網(wǎng)絡(luò)在實(shí)際應(yīng)用中取得良好效果,必須進(jìn)行有效的訓(xùn)練和優(yōu)化。本文將從
發(fā)表于 07-01 14:14
?489次閱讀
現(xiàn)代語音增強(qiáng)算法利用大量遞歸神經(jīng)網(wǎng)絡(luò)(RNNs)實(shí)現(xiàn)了顯著的噪聲抑制。然而,大型RNN限制了助聽器硬件(hearing aid hardware,HW)的實(shí)際部署,這些硬件是電池供電的,運(yùn)行在資源
發(fā)表于 06-07 11:29
抑制任務(wù)是語音增強(qiáng)領(lǐng)域的一個(gè)重要學(xué)科, 隨著深度神經(jīng)網(wǎng)絡(luò)的興起,提出了幾種基于深度模型的音頻處理新方法[1,2,3,4]。然而,這些通常是為離線處理而開發(fā)的,不需要考慮實(shí)時(shí)性。當(dāng)使用神經(jīng)網(wǎng)絡(luò)
發(fā)表于 05-11 17:15
處理技術(shù)也可以通過深度學(xué)習(xí)來獲得更優(yōu)異的效果,比如去噪、超分辨率和跟蹤算法等。為了跟上時(shí)代的步伐,必須對深度學(xué)習(xí)與神經(jīng)網(wǎng)絡(luò)技術(shù)有所學(xué)習(xí)和研究。本文將介紹深度學(xué)習(xí)技術(shù)、神經(jīng)網(wǎng)絡(luò)與卷積神經(jīng)網(wǎng)絡(luò)
發(fā)表于 01-11 10:51
?2212次閱讀
評論