亞馬遜網絡服務公司(Amazon Web Services Inc.)正在接管Google LLC的人聲復制功能,今天為亞馬遜波利(Amazon Polly)添加了兩項新功能,這是一項基于云的服務,可將文本轉換為逼真的語音,并用于創建可以通話的應用程序。
新功能的第一個功能稱為“神經文本語音轉換”,亞馬遜表示,通過增強合成語音的“自然度”和“表達力”,可以在語音質量上“顯著改善”。
關于神經文本語音轉換的一大優點是,由于亞馬遜去年在研究論文中提到的一種新的人工智能模型,它只需訓練幾個小時就可以學習新的口語風格。該模型通過將大量標準的中性語音與僅幾個小時的目標語音風格的其他語音數據相結合而起作用。可以根據需要添加新的補充數據,以創建各種其他語音樣式。
AWS傳福音者朱利安·西蒙(Julien Simon)在博客中寫道,使用Neural-Text-To-Speech的基本算法,亞馬遜創建了第二個新功能,這是新聞播音員式的聲音,使敘事聲音在閱讀新聞和類似內容時“更加逼真”。發布。
西蒙說:“語音質量當然很重要,但是要使合成語音更加逼真和引人入勝,還可以做更多的工作?!?“風格呢?可以肯定的是,人耳可以分辨出新聞廣播,體育廣播,大學課程等之間的區別;實際上,大多數人在正確的環境中采用正確的言語風格,這無疑有助于傳達他們的信息?!?/p>
西蒙說,包括《環球郵報》,《大不列顛百科全書》和TIM Media在內的組織已經在使用Polly的新聞廣播員風格。該功能也已引入到支持Amazon Alexa的設備中,該設備用于敘述每日新聞簡報和類似內容。
-
人工智能
+關注
關注
1792文章
47425瀏覽量
238962 -
模型
+關注
關注
1文章
3267瀏覽量
48924 -
亞馬遜
+關注
關注
8文章
2669瀏覽量
83434
發布評論請先 登錄
相關推薦
評論