“蘇州街站到了,請帶好隨身物品準備下車。”
“巴溝站到了,請帶好隨身物品準備下車。”
——地鐵語音播報編輯站名
隨著人工智能技術的發展,智能語音已融入我們日常生活的方方面面。在人機共生的智能時代,讓人機交互更自然、更流暢一直是人類不斷探索的目標。
近期,思必馳TTS技術上線語音編輯功能。語音編輯,即在一段語音中間插入語音內容,或根據之前的語音風格續寫,使得插入或續寫的語音內容與之前的語音風格完美融合,帶給用戶更自然、流暢的語音服務體驗。該技術可應用于自媒體語音修正,軌交、電商、快遞、銀行等行業中的智能客服語音播報場景,目前,思必馳語音編輯支持中文語音編輯及英文語音編輯。
語音編輯,像文本一樣修改音頻
點擊下方音頻,感受思必馳優化后的語音編輯效果
普通語音編輯,手機號部分能聽出明顯差異
思必馳語音編輯,手機號部分與原有音頻自然融合
日常生活中,如音頻中所展示的智能客服已被廣泛應用于快遞、銀行、電商等行業場景中,為行業降本增效帶來顯著作用。廠商通過語音編輯技術,僅需對固定話術中的人名、數字等變量進行替換,便可獲得針對不同用戶的差異性播報語音,批量通知用戶,大大提高了生產效率。
在語音編輯過程中,最大的挑戰就是如何使得編輯后的語音接近原有音頻的自然和流暢。情感的細微差別、語調變化、節奏等稍有不連貫,聽眾便能從中聽出明顯的語音差異。因此,為了讓此類編輯后的語音播報更自然,人類不斷優化語音合成技術水平。
點擊試聽思必馳語音編輯續寫后的文本
原有音頻風格
后半句為根據原有音頻風格進行編輯續寫
思必馳對語音編輯技術優化更新,應用深度合成技術,基于大模型實現零樣本高質量語音編輯,可對中英文語音進行插入文本、根據之前風格續寫等操作。經思必馳語音編輯后的語音更流暢、更自然,帶給用戶媲美原聲的聽覺體驗。
適用各種場景,音頻創作更高效
目前,語音編輯已經應用于快遞、電商、銀行等場景的智能客服以及自媒體短視頻配音修正中,為各行各業帶來更自然的語音服務。
智能客服固定話術修改變量
在快遞、電商、銀行、軌交等場景的智能客服中,常常需要用到固定話術,但與用戶通話時,固定話術需要根據不同用戶、場景對其中的變量進行修改。如:
應用場景
·張先生您好,請到樓下憑取件碼123取件;
·王女士您好,您近日在我店鋪購買的商品,如果滿意請給5分好評;
·劉先生您好,您的信用卡還款日為8月15日,請記得及時還款;
·蘇州街站到了,請帶好隨身物品準備下車;
·北京,天氣晴轉多云,氣溫25-30℃。
在此類語音播報中,應用思必馳語音編輯技術,可對固定話術中的人名、地名、數字、日期等變量進行編輯,從而快速獲得接近原聲的語音,滿足不同用戶、場景需求。
短視頻修正錄音口誤
修正前音頻
修正內容后音頻
短視頻博主在視頻創作過程中,視頻素材往往有口誤、詞不達意或冗余的內容,此時,重新對某一句話進行配音,則很難還原當時的環境音,出現該句配音與其他音頻存在些許差異的情況。如果對視頻一幀一幀進行修改,則需要花費大量時間。在修改音頻時,使用思必馳語音編輯技術,可對個別字詞及冗余內容進行替換,替換后的字詞可完美融入之前的語音環境,降低語音編輯前后的差異性,獲得更自然、流暢的語音。
為了保證語音編輯技術合法使用,思必馳可通過聲紋識別對用戶上傳的公眾人物、敏感話題等音頻進行屏蔽,拒絕編輯合成,保證技術安全。
除語音編輯外,思必馳聲音復刻、本地合成、情感音色合成等多項語音合成技術都迎來更新,敬請期待!
未來,思必馳將基于DFM-2大模型,結合語音合成技術進行技術聯動,為智能汽車、智能家居、消費電子,以及金融、軌交、政務等數字政企行業場景客戶帶來更加自然、流暢的語音交互服務。
審核編輯:彭菁
-
人機交互
+關注
關注
12文章
1207瀏覽量
55402 -
TTS
+關注
關注
0文章
41瀏覽量
10792 -
思必馳
+關注
關注
4文章
284瀏覽量
14286 -
短視頻
+關注
關注
1文章
124瀏覽量
8935
原文標題:語音編輯,讓智能播報更自然,思必馳TTS技術上新第一更!
文章出處:【微信號:思必馳,微信公眾號:思必馳】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論