小編說:在這個技術快速更迭的時代,人工智能的可能性在逐漸拓寬。為了讓大家可以更好的理解人工智能在智能語音方面的強大能力,今天小編就來詳細為大家介紹微軟在人工智能TTS語音合成(Text-to-Speech)技術上的一些最新進展。
不同對話場景
用戶期待不同語氣的擬人 AI 語音
TTS 語音已被越來越多地用于支持人機對話或機器輔助的日常交流——例如人與人之間對話的同聲傳譯。在這些場景中,人們普遍期待能夠實現更自然、更口語化的對話風格。我們不妨從以下三個典型場景中,來理解用戶對于對話聲音和風格的不同需求。
客服機器人:語氣要自然、友好且專業
很多企業正在使用支持語音的聊天機器人或 IVR(互動式語音應答)系統,為客戶帶來相比傳統方式更為高效、體貼的客戶服務。例如國際移動通訊網絡公司沃達豐就成功地創建了一個擁有自然語音的客服機器人 TOBi。Azure 的人工智能和自然語言處理功能賦予了 TOBi 鮮明的個性,使客戶與 TOBi 之間的人機對話變得輕松自然,讓客戶更樂于與之交流。
設想這樣的情景:在客戶對 TOBi 報出姓名后,當 TOBi 需要了解客戶的地址以便提供進一步服務時,TOBi 并不會生硬地接著發問:「請說出您的地址。」而是會這樣表達:「嘿,好名字!接下來我還需要了解一下您住在哪里?」此時此刻,客戶一定希望 AI 能夠以聽起來熱情、友好、溫暖,且又專業的聲音來說出這句話。類似的需求不僅體現在 AI 解答客戶疑問時,還適用于 AI 語音向客戶打招呼,或表達共情態度時。個人助理:表情符號、重點強調要讀懂
隨著虛擬助手和虛擬現實技術的興起,使用 Neural TTS 來支持閑聊和日常對話功能的客戶數量正在不斷增加。想要讓 AI 與人類的對話更加自然,最主要的挑戰之一在于如何讓 AI 理解包含特殊字符在內的聊天用語——比如「呵呵」、「哈哈」、「哎喲」這類詞匯。
這類表情符號,還有重復字母如「soooo good」——然后再以自然的語氣提供即時響應。此外,讓 AI 能使用不同的信息來表達相應情感,從而表現出對人類感受的共鳴感,也正在成為一種越來越普遍的用戶需求。同聲傳譯:翻譯前后說話風格、語氣要一致
語音互譯是又一個對話式 AI 語音可支持的典型場景。Azure Neural TTS 已覆蓋 110 多種不同語言,被應用于多種翻譯場景中。不過,如何在翻譯的同時保持講話者的原始語氣風格,一直都是個挑戰。尤其是在較為隨意的對話場景中,講話者往往會使用語氣上的細微差別來與聽眾建立情感聯系。在這種情況下,如果 AI 語音可在提供同步翻譯的同時,又能捕捉并理解講話者的風格,就能使不同語言之間的對話依然生動且具有吸引力。
Azure Neural TTS
進化:多國語言皆可栩栩如生戶
Sara(英語):更能表現自然情感的聊天機器人語音
Sara 是一個新近推出的美式英語音色,尤其擅長輕松的對話。「她」有著輕松自然的年輕女性聲線,能夠勝任各種需要聊天機器人的場景。Sara 擁有三種情緒:快樂、悲傷和氣憤。她在閱讀表情符號時,可以發出笑聲、嘆息或氣憤語氣,而且還能發出「太~(拉長語調)好了」這種人類特有的語調。播放下面的語音,親耳感受一下效果。
下面這段錄音,來自 Sara 作為聊天機器人與人類用戶之間的自然對話。(此示例來自機器人和人類用戶之間的閑聊,對話很隨意,可能包含錯誤。)
除了預設的幾種「情緒」,用戶還可以通過 SSML 讓 Sara 在常規交流、歡快、悲傷和憤怒等幾種語氣風格之間隨意切換。
曉辰和曉顏(中文普通話):專為日常對話及客服場景而優化的全新中文語音
曉辰和曉顏是專為中文用戶提供的普通話語音。其中曉辰擅長逼真的自然語氣,曉顏與客戶服務場景更匹配。曉辰和曉顏最顯著的特征,在于能逼真模仿人類在日常場合下的交流。與朗誦、播音這類「嚴肅」場合不同,人們的日常對話中除了語氣隨意,韻律多變,而且常常出現詞語發音不完整,句子語法不像課本那么嚴謹,且會出現重復、不完整、或者啰嗦等情況。借助先進的建模技術,曉辰和曉顏的 AI 語音能夠學習并活用這些人類表達的「缺陷」,并逼真地還原這些「不完美」,使合成語音聽起來更加真實親切。在下面這段客服場景模擬對話中,曉顏是客服助理,曉辰是客戶。您可以從中感受到他們如同真人一般輕松、自然的對話語氣。
Nanami(日語):元氣滿滿的東瀛女聲
Nanami 是擁有動聽女性聲線的日語語音。「她」有著三種不同語音風格:聊天風格、客服風格和開朗風格,讓合成語音在各種場景中都更具吸引力。
來聽一聽 Nanami 元氣滿滿的聲音:
現在就來感受
Azure Neural TTS 擬人語音的動人表現力吧!
微軟不斷傾聽全球用戶對于 Azure Neural TTS 在不同情況下語音發音準確性的反饋,以負責任的 AI 及公平、可靠和安全、隱私和保障、包容、透明、負責的六項人工智能準則為前提,進行了這次更新,為用戶帶來表達更自然、語義更清晰的語音體驗。現在,微軟的文本轉語音可以支持超過 110 種語言的 270 多種 AI 語音。如果想親身感受 Azure Neural TTS 的強大,就來 Azure 官網親自體驗吧!還有聲音定制平臺可以即刻為企業創建多種語言和風格的獨特品牌語音。
原文標題:什么!跟我說話的竟然是AI!
文章出處:【微信公眾號:微軟科技】歡迎添加關注!文轉載請注明出處。
審核編輯:湯梓紅
-
微軟
+關注
關注
4文章
6598瀏覽量
104066 -
AI
+關注
關注
87文章
30897瀏覽量
269111 -
人工智能
+關注
關注
1791文章
47279瀏覽量
238513
原文標題:什么!跟我說話的竟然是AI!
文章出處:【微信號:mstech2014,微信公眾號:微軟科技】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論