機(jī)器學(xué)習(xí)以及自然語(yǔ)言處理技術(shù)的進(jìn)步,開(kāi)啟了人與人工智能進(jìn)行語(yǔ)音交互的可能,人們透過(guò)對(duì)話的方式獲取信息、與機(jī)器進(jìn)行交互,將不再只是存在科幻情結(jié)當(dāng)中。語(yǔ)音交互是未來(lái)的方向,而智能音箱則是語(yǔ)音交互落地的第一代產(chǎn)品。
1語(yǔ)音交互流程簡(jiǎn)介
AI 語(yǔ)音所需要的技術(shù)模塊有 4 個(gè)部分,分別為:
·自動(dòng)語(yǔ)音識(shí)別(Automatic Speech Recognition, ASR)
·自然語(yǔ)言理解(Natural Language Understanding, NLU)
·自然語(yǔ)言生成(Natural Language Generation, NLG)
·文字轉(zhuǎn)語(yǔ)音(Text to Speech, TTS)
以叮咚開(kāi)發(fā)文檔中的語(yǔ)音交互流程圖來(lái)看Ai 對(duì)話技術(shù)的主要路徑:
從上圖中可以看到,用戶與設(shè)備之間的交互,主要是采用語(yǔ)音方式處理和完成的。
2語(yǔ)音交互流程設(shè)計(jì)
一次完整的語(yǔ)音交互流程,成功的語(yǔ)音對(duì)話,通常是有以下幾個(gè)階段。
1.交互流程的核心—意圖
所謂意圖,表示用戶在使用應(yīng)用時(shí)所做的動(dòng)作(譬如:?jiǎn)栆粋€(gè)問(wèn)題或發(fā)送一條指令),這些意圖代表了應(yīng)用的核心功能。
如果應(yīng)用成功地識(shí)別了用戶意圖,則需要在完成業(yè)務(wù)動(dòng)作后,將結(jié)果反饋給用戶;如果應(yīng)用無(wú)法識(shí)別用戶意圖,則需要給用戶友好的提示,指導(dǎo)用戶使用。
用戶:七星彩的開(kāi)獎(jiǎng)時(shí)間是什么時(shí)候?Ai:體育彩票七星彩每周二、周四和周日開(kāi)獎(jiǎng)。
2. 如何識(shí)別意圖—語(yǔ)義解析
對(duì)語(yǔ)音識(shí)別結(jié)果進(jìn)行分析理解,簡(jiǎn)單來(lái)說(shuō)就是將用戶語(yǔ)音輸入映射到機(jī)器指令。它可能定義了一組包含指定的單詞或短語(yǔ)的語(yǔ)法結(jié)構(gòu),用戶通過(guò)說(shuō)出滿足這種結(jié)構(gòu)的語(yǔ)句,來(lái)調(diào)用意圖。
用戶:我要{聽(tīng)} {周杰倫}的{稻香}Ai:稻香.mp3
3.如何處理意圖—云端交互
調(diào)用意圖的結(jié)構(gòu)化請(qǐng)求,向服務(wù)器請(qǐng)求處理后做出反饋?lái)憫?yīng)。通俗來(lái)講該流程主要處理用戶的請(qǐng)求,解決用戶問(wèn)題的答案。
4、語(yǔ)言合成模塊 – 組織語(yǔ)言
根據(jù)解析模塊得到的內(nèi)部表示,在對(duì)話管理機(jī)制的作用下生成自然語(yǔ)言句子。同時(shí)將生成模塊生成的句子轉(zhuǎn)換成語(yǔ)音輸出。(把回答的機(jī)器語(yǔ)言再轉(zhuǎn)換成 口語(yǔ)語(yǔ)言)
3中文自然語(yǔ)言處理的關(guān)鍵技術(shù)
1、詞法分析
詞法分析包括詞形和詞匯兩個(gè)方面。一般來(lái)講,詞形主要表現(xiàn)在對(duì)單詞的前綴、后綴等的分析,而詞匯則表現(xiàn)在對(duì)整個(gè)詞匯系統(tǒng)的控制。在中文全文檢索系統(tǒng)中,詞法分析主要表現(xiàn)在對(duì)漢語(yǔ)信息進(jìn)行詞語(yǔ)切分,即漢語(yǔ)自動(dòng)分詞技術(shù)。通過(guò)這種技術(shù)能夠比較準(zhǔn)確的分析用戶輸入信息的特征,從而完成準(zhǔn)確的搜索過(guò)程。它是中文全文檢索技術(shù)的重要發(fā)展方向。
2、句法分析
句法分析是對(duì)用戶輸入的自然語(yǔ)言進(jìn)行詞匯短語(yǔ)的分析,目的是識(shí)別句子的句法結(jié)構(gòu),實(shí)現(xiàn)自動(dòng)句法分析過(guò)程。其基本方法有線圖分析法、短語(yǔ)結(jié)構(gòu)分析、完全句法分析、局部句法分析、依存句法分析等。
3、語(yǔ)義分析
語(yǔ)義分析是基于自然語(yǔ)言語(yǔ)義信息的一種分析方法,其不僅僅是詞法分析和句法分析這樣語(yǔ)法水平上的分析,而是涉及到了單詞、詞組、句子、段落所包含的意義。其目的是從句子的語(yǔ)義結(jié)構(gòu)表示言語(yǔ)的結(jié)構(gòu)。中文語(yǔ)義分析方法是基于語(yǔ)義網(wǎng)絡(luò)的一種分析方法。語(yǔ)義網(wǎng)絡(luò)則是一種結(jié)構(gòu)化的,靈活、明確、簡(jiǎn)潔的表達(dá)方式。
4、語(yǔ)境分析
語(yǔ)境分析主要是指對(duì)原查詢語(yǔ)篇以外的大量“空隙”進(jìn)行分析從而更為正確地解釋所要查詢語(yǔ)言的技術(shù)。這些“空隙”包括一般的知識(shí),特定領(lǐng)域的知識(shí)以及查詢用戶的需要等。它將自然語(yǔ)言與客觀的物理世界和主觀的心理世界聯(lián)系起來(lái),補(bǔ)充完善了詞法、語(yǔ)義、語(yǔ)用分析的不足。
4Ai對(duì)話目前存在的問(wèn)題
人機(jī)對(duì)話過(guò)程中,用戶難免會(huì)出現(xiàn)表達(dá)失誤的情況,導(dǎo)致機(jī)器對(duì)用戶語(yǔ)言理解出現(xiàn)偏差,在這時(shí), 糾錯(cuò)機(jī)制對(duì)機(jī)器而言則非常重要,如缺少這個(gè)機(jī)制,用戶需要花費(fèi)相當(dāng)長(zhǎng)的時(shí)間將其意圖解釋清楚,相應(yīng)的用戶體驗(yàn)也會(huì)十分糟糕。另一方面,雖然可以很好的識(shí)別語(yǔ)音,但是卻不能理解你的對(duì)話目的,語(yǔ)義理解上有偏差。
當(dāng)前,包括Alexa在內(nèi)的國(guó)內(nèi)外智能音箱之所以沒(méi)有表現(xiàn)的那么智能,出現(xiàn)了“人工智障”的嘲笑也是因?yàn)樵谝陨蟽煞矫鏇](méi)有處理太好。
因此語(yǔ)音交互最終需要解決的關(guān)鍵問(wèn)題是 歧義消解問(wèn)題,和未知語(yǔ)言現(xiàn)象的處理問(wèn)題。
-
人工智能
+關(guān)注
關(guān)注
1791文章
47279瀏覽量
238498 -
語(yǔ)音技術(shù)
+關(guān)注
關(guān)注
2文章
226瀏覽量
21277 -
自然語(yǔ)言處理
+關(guān)注
關(guān)注
1文章
618瀏覽量
13561
原文標(biāo)題:四大方面解析AI語(yǔ)音技術(shù),你不了解的人工智能語(yǔ)音識(shí)別
文章出處:【微信號(hào):elecfans,微信公眾號(hào):電子發(fā)燒友網(wǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論