智能座艙的語音交互系統(tǒng)技術(shù)應(yīng)用

動機(jī)

出于學(xué)習(xí)-總結(jié)的目的，在我從什么是智能座艙、智能座艙的發(fā)展驅(qū)動因素、智能座艙的構(gòu)成要素三個方面梳理我對智能座艙的基礎(chǔ)認(rèn)識之后，為了加深“智能座艙產(chǎn)品入門”課程中語音交互部分知識的理解，我從什么是語音交互、語音交互的底層技術(shù)、智能座艙的語音交互等方面，對智能座艙語音交互系統(tǒng)相關(guān)的知識進(jìn)行了梳理與總結(jié)。

一.什么是語音交互

語音交互：語音是方式，交互的對象是任何的智能設(shè)備，顧名思義，即通過語音的方式完成人與機(jī)的交互。

在現(xiàn)今的各種智能化場景中，語音交互已成為一種非常關(guān)鍵的人機(jī)交互方式。從用戶的角度來看，語音交互的核心價值主要體現(xiàn)在釋放用戶的雙手，使得人與機(jī)之間的交互變的更高效便捷。

然而，從用戶發(fā)出語音指令到實(shí)現(xiàn)與智能設(shè)備的交互，其過程并不像其名詞描述的那么簡單，要實(shí)現(xiàn)通過語音來完成人機(jī)交互，要解決解決三個關(guān)鍵問題，如何讓機(jī)器聽清用戶的語音內(nèi)容？如何機(jī)器理解用戶的意圖？如何讓機(jī)器執(zhí)行用戶的意圖？，解決這些問題的的過程是復(fù)雜的，其背后涉及到多個復(fù)雜的技術(shù)環(huán)節(jié)，如語音識別、自然語言理解、對話管理、自然語言生成、語音合成等。

二.語音交互的底層技術(shù)

(一).語音識別

在語音交互系統(tǒng)中，用戶的語音信號需要經(jīng)過多個處理階段才能得出正確的結(jié)果，而語音識別是實(shí)現(xiàn)語音交互的第一步，其在語音交互系統(tǒng)中負(fù)責(zé)對用戶的語音信號進(jìn)行前置處理，通過對用戶語音信息的預(yù)處理、解碼等關(guān)鍵任務(wù)，最終得到語音信號對應(yīng)的文本內(nèi)容，從而實(shí)現(xiàn)機(jī)器聽清的用戶的語音內(nèi)容。

1.語音輸入：用戶通過麥克風(fēng)輸入內(nèi)容語音，例如：打開空調(diào)

?2.預(yù)處理：預(yù)處理是語音識別過程中的一個基礎(chǔ)性步驟，它的意義在于對錄音文件進(jìn)行分幀、去除噪音、語音增強(qiáng)、加窗等預(yù)處理，提取出有效的聲音特征，用于后續(xù)的語音內(nèi)容分析處理。

去除噪音：由于用戶環(huán)境因素影響，MIC設(shè)備錄制的聲音，除了人聲，可能還會包各種噪音，那么為了語音識別的準(zhǔn)確性，在識別前就需要先處理掉原始音頻中的噪音部分。去除噪音的實(shí)現(xiàn)過程大體可以理解為：首先提取原始音頻中聲音的頻率、時域、能量等特征，通過對這些特征的對比分析區(qū)分原始音頻中的人聲和其他聲音，然后通過濾波、降噪算法（基于頻域的傅里葉變換、小波變換，或者基于時域的信號平滑法）等手段，實(shí)現(xiàn)去除噪聲的目標(biāo)。

預(yù)加重：在語音輸入的過程中，由于環(huán)境和距離等影響因素，MIC錄制聲音可能會出現(xiàn)高頻衰減和低頻增益等失真現(xiàn)象，這將會影響后續(xù)語音識別的結(jié)果。?

例如：用戶的語音內(nèi)容為“apple”，由于高頻信號被衰減掉，錄制的聲音中可能只留下了“p”和“l(fā)”的較強(qiáng)信號，這將導(dǎo)致語音識別系統(tǒng)誤認(rèn)為說的是“pl”而不是“apple”。?針對這種現(xiàn)象，預(yù)加重通過加強(qiáng)高頻成分的能量和減少低頻成分的能量，讓不同頻率的音頻信號能夠在信號處理過程中均衡化，從而提高語音識別的準(zhǔn)確性。

為了更形象的理解“預(yù)加重”，可以將其類比于在圖像中的“銳化”，使得邊緣更為清晰。

分幀：原始語音信號是一個連續(xù)的波形，是一種時間和頻率上都變化較快的信號，在語音識別的過程中，如直接對連續(xù)且長的語音進(jìn)行計算處理，會增加計算的難度降低識別的準(zhǔn)確性。因此，為了提高語言識別結(jié)果的準(zhǔn)備性，需要將連續(xù)且長的語音信號分為若干個固定長度的幀，分幀后每幀內(nèi)的信號的頻譜變化就會較為緩慢、穩(wěn)定。

例如：以“打開空調(diào)”為例，假設(shè)錄制的語音時長為2秒，采樣率為16000Hz，那么原始語音信號就是一個長度為32000的一維向量，如果直接對這個聲音信息進(jìn)行語音識別，計算量會非常大，而且由于語音信號的頻率和幅度變化非常快，很難進(jìn)行有效的特征提取。

特征提取：完成去噪、預(yù)加重、分幀等前端處理后的語音信號，不能直接用于識別，還需要將其變換到頻域，然后利用線性預(yù)測倒譜系數(shù)(LPCC)和 Mel 倒譜系數(shù)(MFCC)等方法，從語音信號中提取用來描述語音信號的各種特征，以便識別模型能夠更好地對其進(jìn)行分析和區(qū)分，這些特征包括：幀能量、音調(diào)（調(diào)子、語氣等）、基音頻率、音周期、共振峰、諧波結(jié)構(gòu)、聲道特性等。

為了更加形象的理解“特征提取”，可以將其類比為制作抖音電影解說短視頻，在制作的過程中，你需要從完整的電影中篩選出最精彩、最有代表性的片段，需要對整部電影進(jìn)行剪輯，然后把這些片段組成一部短視頻，以便于快速地展現(xiàn)電影的精華和主題。

其他：原始音頻的預(yù)處理，除了去除噪音、預(yù)加重、分幀，還有加窗、語音信號能量歸一化、頻率濾波、動態(tài)特征等，具體可以參考專業(yè)資料。

3.解碼：在完成原始音頻信號的預(yù)處理與特征提取之后，需要將提取到的特征輸入語音識別模型中通過聲學(xué)模型、詞典、語音模型的協(xié)同計算來得到最終的識別結(jié)果。

聲學(xué)模型：聲學(xué)模型負(fù)責(zé)對語音信號進(jìn)行特征提取和處理，生成一系列特征向量，然后使用這些特征向量來計算每個可能的音素的得分，并根據(jù)得分選出最可能的音素序列。

詞典：在生活中，我們有認(rèn)識的字的時候，可能會通過網(wǎng)絡(luò)搜索或查字典的方式去尋找答案。在語音識別系統(tǒng)中，也有需要一個詞典，用于識別音素對應(yīng)的漢字（詞）或者單詞。語音識別系統(tǒng)中的詞典包括了一系列的詞語和它們對應(yīng)的音素序列，這些音素序列反映了詞語在語音信號中的語音學(xué)特征和發(fā)音方式，通過將語音信號的實(shí)際發(fā)音與詞典中存儲的發(fā)音進(jìn)行匹配，語音識別系統(tǒng)可以推算出說話人所說的詞語。

語言模型：在通過聲學(xué)模型與詞典，得到一組候選詞語或句子的情況下，最后需要通過語言模型得到符合用戶表達(dá)內(nèi)容的結(jié)果。語音模型的作用就是通過統(tǒng)計文本中詞與詞之間的關(guān)系和概率，預(yù)測一個詞語或句子出現(xiàn)的概率大小，從而對識別出的多個文本候選結(jié)果進(jìn)行打分、排序和篩選，最終，得分最高的結(jié)果就是系統(tǒng)認(rèn)為最符合用戶表達(dá)內(nèi)容的結(jié)果。

舉個例子，如果用戶說的是“我想要一杯咖啡”，在語音識別的過程中，可能會產(chǎn)生如下多個候選句子：我向要一杯咖啡我想要一輩咖啡我想要一杯可菲我向要一杯咖啡色菲語言模型通過預(yù)測每個識別候選結(jié)果的概率大小，就可以計算出每個候選結(jié)果的得分，從而篩選出最符合用戶表達(dá)內(nèi)容的最終結(jié)果，“我想要一杯咖啡”。?

4.輸出結(jié)果：指最終輸出識別結(jié)果，即轉(zhuǎn)換后的文本或指令等形式的結(jié)果。

(二)自然語言處理

1.自然語言理解

在完成用于語音內(nèi)容的識別之后，要讓設(shè)備能順利執(zhí)行用戶的意圖，還需要自然語言處理（NLP）算法模型對計算機(jī)可識別的文本進(jìn)行分析和處理，以理解用戶語言的含義和意圖，并根據(jù)需要進(jìn)行相應(yīng)的回答或操作，一般情況下，NLP算法模型對文本的處理過程包括包括詞法分析、句法分析、語義分析等多個環(huán)節(jié)。

預(yù)處理：為了降低文本處理的復(fù)雜度，提高算法的精度和效率，文本本輸入自然語言理解模型前，需要先進(jìn)行預(yù)處理，如去掉句子中的特殊字符、停用詞、將所有字母變成小寫等。?

例如：停用詞是指一些在自然語言中使用比較頻繁但實(shí)際上并不具有實(shí)際含義，對于句子的語義理解貢獻(xiàn)較小的一些詞語，比如一些代詞、介詞、連詞等等（如“的”、“和”、“就”、“在”、“用”等），這些停用詞雖然常常出現(xiàn)在文本中，但是對于計算機(jī)理解句子的真實(shí)含義并沒有太大幫助，只會增加文本處理的復(fù)雜度，降低算法的精度和效率。

分詞：自然語言理解模型，在理解在自然語言文本時，不是整句直接分析的，而時通過對自然語言文本的每個組成部分（如單詞、短語等）的含義進(jìn)行深入的分析和理解，進(jìn)而確定整個文本的含義。因此，在對文本進(jìn)行預(yù)處理之后，需要對文本進(jìn)行分詞操作，將文本按照一定的規(guī)則切分成一個個詞語，它的目的是將文本轉(zhuǎn)化為計算機(jī)可以處理的離散的詞語序列。舉個例子：以“導(dǎo)航去寶安機(jī)場”為例，通過分詞，可以得到以下詞語序列：導(dǎo)航 / 去 / 寶安機(jī)場。

詞性標(biāo)注：對每個詞語進(jìn)行詞性標(biāo)注，即確定每個詞語在句子中的詞性，通過對每個詞語進(jìn)行詞性標(biāo)注，可以確定詞在句子中的語法角色和含義，從而更準(zhǔn)確地進(jìn)行語義分析、句法分析等任務(wù)。常見的詞性包括名詞、動詞、形容詞、副詞、介詞、連詞、代詞、數(shù)詞、量詞、助詞、嘆詞等。?

?舉個例子：以”導(dǎo)航去寶安機(jī)場“為例，”導(dǎo)航”：名詞、“去”：動詞，“寶安”：名詞，“機(jī)場”：名詞，通過這樣的詞性標(biāo)注，可以分析出“導(dǎo)航”為主語，“去”為動詞，表示導(dǎo)航的動作，“寶安”、“機(jī)場”由于都是名詞，可以確定它們是導(dǎo)航的目的地。

實(shí)體識別：指從文本中識別特定實(shí)體，例如如人名、地名、組織機(jī)構(gòu)名等，通過實(shí)體識別，計算機(jī)可以更準(zhǔn)確地理解文本中的內(nèi)容。

?舉個例子：以”導(dǎo)航去寶安機(jī)場“為例，實(shí)體識別可以識別出“寶安機(jī)場”是一個地名實(shí)體，通過這一步得到的結(jié)果，計算機(jī)可以更好地理解用戶的意圖。

句法分析：對句子的語法結(jié)構(gòu)進(jìn)行分析，確定句子中各個詞語之間的關(guān)系，其意義在于理清句子中的語法結(jié)構(gòu)和詞語關(guān)系以便于計算機(jī)進(jìn)一步理解語音交互中的用戶意圖。舉個例子：以“導(dǎo)航去寶安機(jī)場”為例，句法分析可以將這個句子分析為“導(dǎo)航去寶安機(jī)場”，從中獲取到“導(dǎo)航”是動作， “去”是一個方向，“寶安機(jī)場”是具體的地點(diǎn)信息，這些信息對于計算機(jī)進(jìn)行后續(xù)處理是非常重要的。

語義分析：在完成預(yù)處理、分詞、詞性標(biāo)注、實(shí)體識別、句法分析等前置任務(wù)之后，接下來就需要進(jìn)行最后的語義分析，例如：情感分析、主體提取、語義聯(lián)想、語義角色標(biāo)注、槽位信息等，其主要意義是更全面地理解用戶輸入的意圖，幫助計算機(jī)能夠更好地理解用戶輸入的內(nèi)容，從而根據(jù)用戶意圖執(zhí)行相應(yīng)的操作。

舉個例子：以“導(dǎo)航去寶安機(jī)場”為例，經(jīng)過語義分析后，計算機(jī)可以清晰地理解用戶的意圖，即需要進(jìn)行導(dǎo)航操作，并且目的地是寶安機(jī)場。

結(jié)果輸出：將經(jīng)過預(yù)處理、分詞、詞性標(biāo)注、實(shí)體識別、句法分析、語義分析處理后的結(jié)果，按結(jié)構(gòu)輸出給自然語言處理中的對話管理模塊，進(jìn)行進(jìn)一步處理。舉個例子：以“導(dǎo)航去寶安機(jī)場”為例，自然語言理解最終輸出的結(jié)果為“動作-導(dǎo)航，目的地-寶安機(jī)場，起點(diǎn)-當(dāng)前位置。”

2.對話管理

在自然語言理解對語音識別的文本進(jìn)行分析處理之后，需要對話管理系統(tǒng)進(jìn)行意圖識別，確定用戶想要做什么，并且根據(jù)所處的對話狀態(tài)進(jìn)行狀態(tài)跟蹤，決定下一步需要執(zhí)行的操作或回復(fù)用戶的方式，這個過程包括根據(jù)用戶輸入的信息選擇相應(yīng)的策略、控制多輪對話流程、解決歧義等。對話管理系統(tǒng)是基于一個預(yù)先定義好的對話模型工作，對話模型中定義了對話流程、對話狀態(tài)、對話策略等，在對話管理過程中，系統(tǒng)會使用這個對話模型來處理用戶的請求。

意圖識別：在通過自然語言理解對文本的分析處理，得到用戶意圖的關(guān)鍵詞之后，對話管理系統(tǒng)負(fù)責(zé)將用戶意圖的關(guān)鍵詞與預(yù)設(shè)的意圖庫（或指令庫）進(jìn)行對比來確定用戶的意圖，并進(jìn)一步?jīng)Q定下一步的操作。舉個例子：以“打開空調(diào)”為例，語音助手接收到語音信號后，會先進(jìn)行語音識別，將語音信號轉(zhuǎn)化為文本，然后，自然語言理解系統(tǒng)會對轉(zhuǎn)化后的文本進(jìn)行解析，提取其中的關(guān)鍵詞和語義信息，比如“打開空調(diào)”，理解用戶的意圖，接下來，對話管理系統(tǒng)會根據(jù)用戶的意圖進(jìn)行響應(yīng)。

對話狀態(tài)跟蹤：指的是記錄和維護(hù)整個對話過程中的各個狀態(tài)信息，以便在后續(xù)的對話中進(jìn)行參考、分析和處理，狀態(tài)信息包括上下文、用戶意圖、技能選擇等等。

舉個例子：當(dāng)用戶詢問“今天下雨嗎？”，對話管理系統(tǒng)可以通過狀態(tài)跟蹤，結(jié)合當(dāng)前的用戶意圖和上下文信息，快速準(zhǔn)確地回答用戶問題。

3.自然語言生成

在語音交互系統(tǒng)中，當(dāng)對話管理系統(tǒng)確定要繼續(xù)與用戶對話或反饋執(zhí)行結(jié)果的時候，此時需要自然語言生成模塊根據(jù)對話管理系統(tǒng)的指令，從相關(guān)的知識庫或語料庫中提取信息，以及根據(jù)語境和上下文信息，將結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)化為自然、邏輯連貫的文本，以人類語言回答用戶的問題、提供建議或執(zhí)行任務(wù)，其生成自然語言的過程一般包括：句法分析、語義分析、語法分析、信息抽取、輸出文本等步驟。

舉個例子，當(dāng)用戶詢問“明天的天氣如何？”時，自然語言生成模塊可能會根據(jù)當(dāng)前的時間和位置信息，生成類似于“明天的天氣為晴天，最高氣溫27℃，最低氣溫18℃”的文本回復(fù)內(nèi)容。

(三).語音合成

在通過語音識別、自然語言理解、對話管理、自然語言生成對用戶的語音信息進(jìn)行分析處理之后，最后想要機(jī)器開口與人交流，則需要語音合成系統(tǒng)將自然語言文本轉(zhuǎn)化為語音并通過輸出設(shè)備輸出給用戶。

語音合成系統(tǒng)既是語音交互的終點(diǎn)也是起點(diǎn)，是語音交互系統(tǒng)的的重要底層技術(shù)之一,它基于語言模型、聲學(xué)模型、音頻處理等技術(shù)，通過文本前置處理、聲學(xué)特征生成和音頻合成等關(guān)鍵步驟，將自然語言文本合成為高質(zhì)量、自然流暢的人類語音。

1.文本前置處理：在計算機(jī)獲得一段文本之后，要讓計算機(jī)像人類一樣開口講這段文本講出來，首先需要讓機(jī)器知道文本中字、詞如何發(fā)音和文本要表達(dá)的意思與文本里蘊(yùn)含的情緒。因此，在語音合成系統(tǒng)中，第一個關(guān)鍵任務(wù)對文本的前置處理，具體包括：分詞、詞性標(biāo)注、句法分析、韻律預(yù)測、字形轉(zhuǎn)音素、對音字與變調(diào)分析等。舉個例子：舉個例子，比如輸入一段文本：“明天下雨，出門記得帶傘。”在文本前置處理的過程中，可能需要經(jīng)過分詞、音素標(biāo)注和添加天氣標(biāo)簽的處理，變成：“明天/t 下雨/v ，出門/v 記得/v 帶/v 傘/n ，天氣/t 標(biāo)簽/rainy。”

2.聲學(xué)特征生成：要想讓機(jī)器像人類一樣將自然語言文本內(nèi)容有韻律、頓挫、情感地說出來，就需要讓機(jī)器知道自然語言文本中每個音素的聲學(xué)特征，包括基頻、時長、頻譜形態(tài)等，這些聲學(xué)特征是語音信號的特征，用于描述和控制語音信號的音色、音高、節(jié)奏等方面。因此，在完成文本預(yù)處理后，要將自然語言文本內(nèi)容合成為最近人類表達(dá)的語音內(nèi)容，就需要先將自然語言文本轉(zhuǎn)換成發(fā)音單元（音素），然后利用特定的算法將音素序列轉(zhuǎn)化為對應(yīng)的聲學(xué)特征。

3.音頻合成：這一步是將前面處理好的聲學(xué)特征和文本信息進(jìn)行結(jié)合，最終合成音頻文件，作為語音合成系統(tǒng)的輸出。具體來說，關(guān)鍵任務(wù)包括：波形合成、合成后處理等。

小結(jié)：以上我從產(chǎn)品的視角，基于課程內(nèi)容、專業(yè)資料結(jié)合自身的理解，梳理的我對語音交互系統(tǒng)底層關(guān)鍵技術(shù)的理解，目的不在于學(xué)習(xí)語言交互相關(guān)的具體技術(shù)知識，而是知其大概原理。如存在歧義，歡迎交流，并建議參考相關(guān)的專業(yè)書籍與資料。

三.智能座艙的語音交互

(一).語音交互對智能座艙的意義

在傳統(tǒng)的汽車座艙內(nèi)，存在著大量的傳統(tǒng)機(jī)械和電子設(shè)備，駕乘人員在執(zhí)行駕駛?cè)蝿?wù)或使用汽車功能時，需要不斷地操作各種控制器和按鈕，以控制車輛的速度、方向、功能等，這些操作可能同時占用駕乘人員的雙手、手眼、雙腳，不僅繁瑣和復(fù)雜，還容易導(dǎo)致駕駛疲勞和注意力不集中，從而增加駕駛安全的風(fēng)險。

因此，為了提高汽車駕駛的安全性和舒適性，語音交互系統(tǒng)被應(yīng)用在汽車智能座艙中。語音交互系統(tǒng)通過語音交互的方式來代替部分駕駛操作，從而可以讓駕乘人員的雙手、手眼、雙腳更多地用于安全駕駛和應(yīng)急操作。例如，駕乘人員可以使用語音指令來操控空調(diào)、導(dǎo)航系統(tǒng)、音樂播放器等，而不需要手動操作控制面板，減少了駕駛員的分心和疲勞，在一定程度上提高了駕駛安全性和方便性。

從消費(fèi)者的角度來看，語音交互系統(tǒng)不僅可以通過被動的接收用戶的指令，幫用戶高效地完成人與車交互，而且可以為通過主動式的交互為用戶帶來更智能化、情感化的人車交互體驗(yàn)。在當(dāng)前“人機(jī)共駕”階段，語音交互是座艙內(nèi)最直接、最人性化、最完全的交互方式。

從廠商的角度來看，由于語音交互系統(tǒng)具備較大個性化、自定義空間，廠商可以基于結(jié)合品牌定位與用戶需求，為用戶打造具有差異化特征語言交互系統(tǒng)，在品牌差異化發(fā)展中發(fā)揮著重要的作用。另外，基于用戶的個性化需求，在基礎(chǔ)語音服務(wù)的基礎(chǔ)上衍生除很多付費(fèi)服務(wù)場景，例如，在samrt精靈1號上，付費(fèi)的語音助手形象，付費(fèi)的音助手裝扮。

(二).智能座艙語音交互場景

基于用戶、場景、需求，以語音交互系統(tǒng)為起點(diǎn)，我們可以將智能座艙語音交互的場景抽象的分為主動交互場景和被動交互場景。

1.被動交互場景：當(dāng)我們在討論“人機(jī)交互”時，大部分情況討論的是“被動式交互”，它的實(shí)現(xiàn)邏輯很簡單，即由人給機(jī)器發(fā)號施令，機(jī)器執(zhí)行并輸出結(jié)果反饋給人。如，傳統(tǒng)的被動式語音交互，是由用戶主動向機(jī)器輸入語音指令，然后由機(jī)器對用戶的音指令進(jìn)行分析、處里并執(zhí)行，以實(shí)現(xiàn)特定的功能，其能為用戶提供的最大價值僅僅是“君子動口不動手”。? ?

在人與車的交互場景中，被動式的語音交互，僅能實(shí)現(xiàn)的是“不動手”地去實(shí)現(xiàn)車身功能、信息娛樂的功能的控制。這種被動式的交互，在某些情況下還是會分散用戶的注意力，從而造成安全隱患，例如：用戶在發(fā)起語言指令的時候，視線和注意力可能會從駕駛?cè)蝿?wù)上轉(zhuǎn)移。

2.主動交互場景：不同于被動式交互，主動式交互以機(jī)器為起點(diǎn)，機(jī)器可以自己主動地輸入信息，主動輸出執(zhí)行結(jié)果或建議給用戶。

在人與車的交互場景中，語音交互系統(tǒng)可以與其他模態(tài)交互融合，基于人、車狀態(tài)和內(nèi)外部環(huán)境，通過傳感器、攝像頭等設(shè)備主動輸入信息進(jìn)行決策判斷，為用戶提供主動的服務(wù)，例如：主動關(guān)懷服務(wù)、提醒服務(wù)、推薦服務(wù)等，主動式的語音交互，在一步提高人車交互效率的同時，還可以為用戶提供更加智能化、情感化的人交互體驗(yàn)。

(三).智能座艙語音交互系統(tǒng)基礎(chǔ)框架

智能座艙的語音交互系統(tǒng)是一個高度復(fù)雜的綜合系統(tǒng)，它不僅需要精密的硬件與軟件協(xié)同配合，同時需要專業(yè)的運(yùn)營管理來保障其可靠性和穩(wěn)定性。總的來看，整個系統(tǒng)可以分為硬件層、服務(wù)層、應(yīng)用層和運(yùn)營管理平臺四個組成部分。

1.硬件層：在語音交互系統(tǒng)中，硬件層是智能座艙語音交互系統(tǒng)的物理基礎(chǔ)，關(guān)鍵的硬件設(shè)備包括輸入/輸出設(shè)備和音頻處理芯片，其中輸入/輸出設(shè)備負(fù)責(zé)采集用戶的語音指令和反饋信息，主要包括：麥克風(fēng)陣列、揚(yáng)聲器、攝像頭、傳感器、燈光等，芯片部分主要負(fù)責(zé)音頻信號的處理與分析，主要包括數(shù)字信號處理器(DSP)、音頻解碼器、音頻放大器等。

2.服務(wù)層：服務(wù)層是智能座艙語音交互系統(tǒng)的核心，它承擔(dān)著語音、圖像等信息的處理和解析，并提供必要反饋和響應(yīng)的重要任務(wù)。主要包括自然語言處理(NLP)引擎、語音識別引擎、語音合成引擎、聲紋識別、云端服務(wù)、API服務(wù)、業(yè)務(wù)邏輯處理服務(wù)等模塊。

3.應(yīng)用層：應(yīng)用層是指基于服務(wù)層提供的核心能力與用戶的實(shí)際需求相結(jié)合，為用戶提供的具體應(yīng)用程序，以幫助用戶通過語音交互實(shí)現(xiàn)具體的功能控制。例如，車身控制模塊中的空調(diào)控制、座椅控制、車窗控制等應(yīng)用，以及信息娛樂模塊中娛樂、通訊、導(dǎo)航等應(yīng)用。

4.運(yùn)營管理平臺：用戶在使用語音交互系統(tǒng)的過程中，會產(chǎn)生大量的用戶行為數(shù)據(jù)與音頻、文本、圖像數(shù)據(jù)，運(yùn)營管理平臺通過對這些數(shù)據(jù)的統(tǒng)計分析，為語音交互系統(tǒng)與各種AI模型的持續(xù)優(yōu)化提供數(shù)據(jù)支持。從業(yè)務(wù)角度分類，運(yùn)營管理平臺主要分為兩大核心模塊：用戶數(shù)據(jù)統(tǒng)計分析和模型數(shù)據(jù)運(yùn)營。

用戶數(shù)據(jù)統(tǒng)計分析模塊，可以對實(shí)車用戶使用語音交互系統(tǒng)的行為數(shù)據(jù)進(jìn)行統(tǒng)計和分析，從而生成不同維度、不同粒度的分析報表。這些報表可以幫助我們深入了解用戶使用習(xí)慣和偏好，及時發(fā)現(xiàn)并解決系統(tǒng)存在的問題，為語音交互系統(tǒng)的優(yōu)化提供數(shù)據(jù)依據(jù)。

模型數(shù)據(jù)運(yùn)營模塊，可以通過對用戶在使用語音交互系統(tǒng)過程中產(chǎn)生的大量音頻、文本、圖像數(shù)據(jù)的定期回收與采集、標(biāo)注，生產(chǎn)出各個AI模型需要的數(shù)據(jù)，為模型訓(xùn)練提供數(shù)據(jù)支持。

編輯：黃飛

閱讀全文

語音交互(27795) 語音交互(27795)
智能座艙(15904) 智能座艙(15904)

語音交互技術(shù)為更好智能硬件而來

核心來談智能硬件那都是在耍流氓。而語音識別作為特別自然、學(xué)習(xí)成本低的交互方式勢必會成為智能硬件主流技術(shù)，同時也是整個物聯(lián)網(wǎng)的關(guān)鍵部分。

2015-11-12 18:37:27

1970

智能座艙人機(jī)交互技術(shù)發(fā)展與座艙檢測的傳感器模塊應(yīng)用探討

人臉；指紋識別、語音/手勢交互、多屏聯(lián)動等高科技技術(shù)，目前的汽車智能座艙在環(huán)境感知、信息收集與處理的能力得到顯著增強(qiáng)，成為人類駕駛的“智能小助手”。智能座艙告別簡單電子化進(jìn)入智能助理階段的一個顯著標(biāo)志是人與

2022-07-04 19:06:08

2621

智能交互新入口——語音識別【技術(shù)周刊】

虛擬現(xiàn)實(shí)技術(shù)無疑是今年科技圈關(guān)注的焦點(diǎn)，其交互方式也引發(fā)了多方討論。除了虛擬現(xiàn)實(shí)，智能家居、智能汽車等也不再滿足于現(xiàn)有的交互方式，語音識別技術(shù)為這些應(yīng)用帶來了新選擇。通過本技術(shù)周刊，你不僅能了解語音識別的發(fā)展及原理，還能掌握行業(yè)動態(tài)，同時也可以獲得語音識別開發(fā)的芯片和平臺資源。

2016-12-01 18:05:56

8170

智能汽車的交互戰(zhàn)場：AR-HUD量產(chǎn)上車，智能座艙加速升級

電子發(fā)燒友網(wǎng)（文/莫婷婷）隨著語音識別、人臉手勢識別等技術(shù)的快速發(fā)展，汽車座艙內(nèi)的交互體驗(yàn)也在不斷升級。在智能汽車邁向高階自動駕駛過程中，全系影像技術(shù)開始進(jìn)入車載顯示領(lǐng)域，開啟人車交互新窗口

2021-11-14 08:21:47

4999

作為第三生活空間，智能座艙如何先聲奪人？

的聽覺體驗(yàn)和反饋，也會在音響系統(tǒng)方面大幅改進(jìn)。綜合而言，目前聲學(xué)系統(tǒng)在智能座艙的應(yīng)用主要分為兩個方面，其一是智能語音交互，其二是沉浸式音響系統(tǒng)。? 智能座艙的語音交互系統(tǒng) 智能座艙的語音系統(tǒng)被稱為VOS（語音操作

2022-11-08 09:30:44

1649

智能座艙交互體驗(yàn)持續(xù)升級，傳感器件功不可沒

賣點(diǎn)。 ? 智能座艙是基于智能化、萬物互聯(lián)通過整合駕駛信息和車載應(yīng)用，利用車載系統(tǒng)的強(qiáng)大信息數(shù)據(jù)處理能力，為駕駛者提供高效且科技感的駕駛體驗(yàn)的概念。智能座艙由硬件、軟件、交互三大部分組成。 ? 智能交互與智能表面 ? 在智能座艙的

2023-10-10 00:08:00

880

智能硬件開發(fā)，我們需要知道哪些技術(shù)

開放的第三方語音云平臺為開發(fā)者提供了良好契機(jī)。其中訊飛開放平臺作為全球首個面向開發(fā)者提供智能交互服務(wù)的領(lǐng)先平臺，全面開放了業(yè)界最領(lǐng)先的語音合成、語音識別、語義理解、語音喚醒等技術(shù)，只需開發(fā)集成

2015-06-18 10:27:16

智能音箱混戰(zhàn) 遠(yuǎn)場語音交互只是開始

　　導(dǎo)讀：遠(yuǎn)場語音交互開始是智能音響，但是將來絕對不僅僅是智能音響，技術(shù)還會擴(kuò)展到很多其他的產(chǎn)品。　　7月5日，阿里推出了自己的首款消費(fèi)級AI產(chǎn)品天貓精靈X1，同日百度也宣布了DuerOS開放

2017-07-17 09:37:59

語音交互系統(tǒng)

能幫我寫語音交互程序嗎？硬件：MCU為STC89C52；SYN6288 TTS 語音合成模塊；語音識別模塊 LD3320芯片非特定語音；SD卡儲存。要求：用SD 卡儲存語音數(shù)據(jù)（txt格式）其中

2013-05-11 16:00:38

語音接口技術(shù)了解

語音接口已經(jīng)成為一個改變?nèi)藱C(jī)交互方式的全新切入點(diǎn)。這些系統(tǒng)如何工作？打造這樣一款設(shè)備在硬件方面有什么要求？隨著語音控制接口變得越來越普及，德州儀器（TI）的一位工程師對此技術(shù)進(jìn)行了深入的了解，并分享了其對這項技術(shù)的認(rèn)識和看法。

2019-07-19 08:45:54

語音識別技術(shù)的概念及應(yīng)用前景

智能語音技術(shù)是人工智能應(yīng)用最成熟的技術(shù)之一，并擁有交互的自然性，就是讓智能設(shè)備聽懂人類的語音。它是一門涉及數(shù)字信號處理、人工智能、語言學(xué)、數(shù)理統(tǒng)計學(xué)、聲學(xué)、情感學(xué)及心理學(xué)等多學(xué)科交叉的科學(xué)。智能語音

2023-05-27 09:41:03

語音識別系統(tǒng)在智能家庭系統(tǒng)中的應(yīng)用是什么？

語音識別系統(tǒng)在智能家庭系統(tǒng)中的應(yīng)用是什么？

2021-05-31 06:54:34

AITO問界M5率先搭載HarmonyOS智能座艙

座艙,重構(gòu)智能便捷安全AITO問界M5最讓人津津樂道的就是HarmonyOS智能座艙,它的神奇之處到底體現(xiàn)在哪些方面?首先是在操控的體驗(yàn)上,HarmonyOS智能座艙帶來了極簡交互、統(tǒng)一的通知和控制中心

2021-12-29 13:56:28

Azero + SoundPi 智能語音交互軟硬一體化開發(fā)套件

://azero.soundai.com/二、SoundPi是啥？SoundPi Mini Board是智能語音交互軟硬一體化開發(fā)板，支持Linux操作系統(tǒng)。為開發(fā)者和中小企業(yè)客戶提供低成本的語音進(jìn)入

2020-06-28 17:55:59

HarmonyOS智能座艙體驗(yàn)是怎樣煉成的？立即查看

交互之外，可以利用的還有車內(nèi)的音響、燈光、空調(diào)、座椅、車窗等硬件，以及人臉識別，位置識別、光線識別等能力。下面用兩個實(shí)際案例為大家介紹HarmonyOS智能座艙內(nèi)軟硬件聯(lián)合體驗(yàn)——小憩模式、K歌

2023-01-11 11:03:11

【平頭哥CB5654語音開發(fā)板試用連載】智能取貨機(jī)器人語音交互模組

項目名稱：智能取貨機(jī)器人語音交互模組試用計劃：申請理由本人在機(jī)器人控制有七年多的學(xué)習(xí)和開發(fā)經(jīng)驗(yàn)，曾參與設(shè)計過類似巡檢機(jī)器人，參與語音交互硬件開發(fā)，對語音識別技術(shù)有過深入的學(xué)習(xí)和探索。想借助發(fā)燒友論壇

2020-02-25 16:05:31

【Gokit 3試用體驗(yàn)】通過Lark 7618模組實(shí)現(xiàn)語音交互+語音交互UI設(shè)計理念

語言是人類交互最自然最舒適的方法，而今天，機(jī)智云Gokit 3上Lark7618智能語音識別模塊提供了一個很好的外圍音頻實(shí)時采集電路，以及快速的音頻合成輸出系統(tǒng)，有這兩樣，加持Gokit板載的上位機(jī)

2016-08-28 13:46:16

【MYD-Y6ULX申請】語音交互前端信號處理板

技術(shù)/語音信號前端處理技術(shù)有過深入的學(xué)習(xí)和探索。想借助發(fā)燒友論壇和米爾MYD-Y6ULX探索高性價比的語音交互前端信號處理的商業(yè)化。項目計劃①根據(jù)文檔，對米爾MYD-Y6ULX快速入門②通過學(xué)習(xí)米爾

2018-01-22 10:34:52

【潤和軟件DAYU200開發(fā)板體驗(yàn)】DAYU200開發(fā)板搭建智能座艙開發(fā)

常新。整個鴻蒙智能座艙不僅包括HarmonyOS基礎(chǔ)平臺，還有華為的UIUX人機(jī)交互、HarmonyOS分布式能力、HarmonyOS智慧能力、華為車載智慧屏和HUAWEI SOUND車載音響系統(tǒng)。這

2022-11-06 19:43:23

云知聲-蜂鳥-智能語音

蜂鳥系列芯片是云知聲專為離在線遠(yuǎn)場語音交互場景設(shè)計的高性能，高集成度，低成本的語音智能 IoT 芯片，圍繞蜂鳥所搭載的軟硬件方案，可應(yīng)用于多種智能家電終端。基于蜂鳥芯片的深度定制算法，云知聲離線語音

2020-05-27 10:47:46

介紹一套支持語音交互的車載導(dǎo)航系統(tǒng)

本文在課題組的車載導(dǎo)航系統(tǒng)和國內(nèi)兩款語音引擎的基礎(chǔ)上，開發(fā)了一套支持語音交互的車載導(dǎo)航系統(tǒng)。

2021-05-14 06:28:33

幾何 G6 / M6 汽車官圖曝光，均搭載基于鴻蒙 HarmonyOS 開發(fā)的數(shù)智座艙

近日，幾何汽車官方公布了旗下幾何G6、幾何M6部分車型信息。從目前公布的信息來看，幾何G6、幾何M6將搭載Harmony OS系統(tǒng)，在智能座艙、智能安全、智能續(xù)航等方面創(chuàng)新升級，為用戶帶來更好

2022-08-09 10:16:08

基于智能語音交互芯片的模擬訓(xùn)練器示教與回放系統(tǒng)設(shè)計

解決上述問題，模擬訓(xùn)練應(yīng)運(yùn)而生。為進(jìn)一步提高訓(xùn)練效果，本文利用智能語音交互芯片設(shè)計了某模擬訓(xùn)練器的示教與回放系統(tǒng)。示教系統(tǒng)為操作人員生動的演示標(biāo)準(zhǔn)操作流程及相應(yīng)的操作現(xiàn)象，極大地縮短了對操作人員的培訓(xùn)時間

2019-07-01 08:07:36

基于語音合成技術(shù)的車載終端系統(tǒng)該怎樣去設(shè)計？

什么是語音合成技術(shù)？基于語音合成技術(shù)的車載終端系統(tǒng)該怎樣去設(shè)計？

2021-05-12 07:25:05

基于語音識別的人機(jī)交互方式淺析

0 引言傳統(tǒng)的人機(jī)交互依靠復(fù)雜的鍵盤或按鈕來實(shí)現(xiàn)，隨著科技的發(fā)展，一些新型的人機(jī)交互方式也隨之誕生，帶給人們?nèi)碌捏w驗(yàn)。基于語音識別的人機(jī)交互方式是目前熱門的技術(shù)之一。但是語音識別功能算法復(fù)雜、計算

2022-01-25 07:00:22

如何去設(shè)計智能防超載及語音提示系統(tǒng)？

什么是智能防超載及語音提示系統(tǒng)？智能防超載及語音提示系統(tǒng)的硬件部分是怎樣構(gòu)成的？智能防超載及語音提示系統(tǒng)的軟件部分是怎樣構(gòu)成的？

2021-05-13 06:35:24

如何去設(shè)計一種汽車智能語音報警系統(tǒng)？

一種基于ADPCM算法的汽車智能語音報警系統(tǒng)的設(shè)計

2021-05-19 06:15:13

如何去設(shè)計一種汽車智能語音報警系統(tǒng)？

一種基于ADPCM算法的汽車智能語音報警系統(tǒng)設(shè)計

2021-05-17 06:41:35

如何開發(fā)智能家居語音控制方案

協(xié)議。解決方案與采用技術(shù) 啟英泰倫第三代語音控制芯片應(yīng)用框圖 系統(tǒng)方案設(shè)計簡單，功能強(qiáng)大，性價比超高如上圖所述，啟英泰倫第三代智能語音芯片集成度更高，外圍可擴(kuò)展更豐富應(yīng)用，通過串口可擴(kuò)展上位機(jī)MCU

2023-05-31 09:50:06

對語音交互技術(shù)感興趣的童鞋戳進(jìn)來！

`隨著非接觸經(jīng)濟(jì)的到來，語音交互技術(shù)的應(yīng)用即將迎來爆發(fā)期。而受疫情的影響，語音交互技術(shù)以便捷性、簡單性、避免接觸式交叉感染的特點(diǎn)得到人們廣泛的關(guān)注。本期華秋創(chuàng)服硬創(chuàng)直播室<資事通鑒

2020-03-11 14:19:54

嵌入式語音交互技術(shù)在智能家居中有哪些應(yīng)用？

的生活方式與工作習(xí)慣，使得家居系統(tǒng)的智能化成為一種消費(fèi)需求，基于嵌入式語音交互技術(shù)的智能家居系統(tǒng)越來越被重視。

2019-08-28 08:11:47

怎么實(shí)現(xiàn)基于語音控制的智能家居控制系統(tǒng)的設(shè)計？

如何實(shí)現(xiàn)基于語音控制的智能家居控制系統(tǒng)的設(shè)計？

2022-01-25 07:50:09

怎么設(shè)計基于嵌入式系統(tǒng)的語音口令識別系統(tǒng)？

隨著計算機(jī)技術(shù)和信息技術(shù)的迅速發(fā)展，語音口令識別已經(jīng)成為了人機(jī)交互的一個重要方式之一。語音口令識別系統(tǒng)將根據(jù)人發(fā)出的聲音、音節(jié)或短語給出響應(yīng)，如通過語音口令控制一些執(zhí)行機(jī)構(gòu)、控制家用電器的運(yùn)行或做出

2019-09-03 08:27:23

怎樣去設(shè)計一種基于STM32F429的語音識別交互系統(tǒng)

基于STM32F429的語音識別交互系統(tǒng)有哪些具體功能？怎樣去設(shè)計一種基于STM32F429的語音識別交互系統(tǒng)？

2021-10-20 06:58:05

樹莓派語音交互如何實(shí)現(xiàn)開關(guān)燈？

2021-11-08 07:08:19

請問怎樣去設(shè)計一種車載導(dǎo)航人機(jī)語音交互系統(tǒng)？

請問怎樣去設(shè)計一種車載導(dǎo)航人機(jī)語音交互系統(tǒng)？

2021-05-17 07:09:16

車聯(lián)網(wǎng)語音識別技術(shù)發(fā)展與應(yīng)用

延伸。但是對于高速行駛、行為受限的車載應(yīng)用場景中，社交功能的實(shí)現(xiàn)存在很大的挑戰(zhàn)。智能設(shè)備的交互方式中按鍵交互和觸摸屏交互應(yīng)用最廣也最為成熟，但對于車輛駕駛是“危險的動作”。在此背景下基于語音識別技術(shù)

2013-07-26 15:40:55

車載導(dǎo)航人機(jī)語音交互系統(tǒng)的實(shí)現(xiàn)

的技術(shù)基礎(chǔ)，特別是文語轉(zhuǎn)換TTS技術(shù)和基于中小詞匯量的語音命令識別技術(shù)已經(jīng)達(dá)到比較實(shí)用的程度。本文在課題組的車載導(dǎo)航系統(tǒng)和國內(nèi)兩款語音引擎的基礎(chǔ)上，開發(fā)了一套支持語音交互的車載導(dǎo)航系統(tǒng)。車載語音導(dǎo)航系統(tǒng)

2008-08-15 21:27:56

車載導(dǎo)航人機(jī)語音交互系統(tǒng)的設(shè)計和實(shí)現(xiàn)

和基于中小詞匯量的語音命令識別技術(shù)已經(jīng)達(dá)到比較實(shí)用的程度。本文在課題組的車載導(dǎo)航系統(tǒng)和國內(nèi)兩款語音引擎的基礎(chǔ)上，開發(fā)了一套支持語音交互的車載導(dǎo)航系統(tǒng)。車載語音導(dǎo)航系統(tǒng)結(jié)構(gòu)車載語音導(dǎo)航系統(tǒng)從功能上分為

2019-05-07 07:00:21

長虹首臺ciri語音智能電視在渝發(fā)布

，進(jìn)入到智能元年，長虹頗具勇氣的打造了一個實(shí)用、便捷、妙趣橫生的語音智能工具——ciri，這將大大豐富電視機(jī)用戶的使用體驗(yàn)。發(fā)布會當(dāng)天筆者看到，長虹最近推出了“內(nèi)置ciri語音智能交互”的語音電視，它

2012-03-05 17:12:23

隨著人工智能領(lǐng)域的發(fā)展，語音芯片也將迎來“爆發(fā)”

有數(shù)據(jù)顯示，到2020年，全球語音市場規(guī)模預(yù)計將達(dá)到 191.7 億美元。語音識別作為研究人工智能的方向之一，隨著語音交互技術(shù)的發(fā)展，語音AI芯片也隨之誕生。現(xiàn)在不論是互聯(lián)網(wǎng)巨頭，還是AI 初創(chuàng)公司

2019-06-26 02:08:55

鴻蒙座艙子品牌來了，華為發(fā)布 HarmonySpace：萬物互聯(lián)的智能出行空間

HarmonySpace 子品牌以及 HarmonyOS 應(yīng)用和硬件生態(tài)合作戰(zhàn)略。并提出以“硬件模塊化、接口標(biāo)準(zhǔn)化、系統(tǒng)平臺化”的發(fā)展戰(zhàn)略，與生態(tài)合作伙伴一同構(gòu)建開放共贏的 HarmonyOS 智能座艙

2021-12-23 14:40:26

基于Internet的語音交互系統(tǒng)的設(shè)計和實(shí)現(xiàn)

　描述了實(shí)現(xiàn)Internet語音交互系統(tǒng)的關(guān)鍵技術(shù)，即利用Windows的多任務(wù)機(jī)制，結(jié)合Windows MDK低層音頻服務(wù)、Windows Sockets和語音壓縮等技術(shù)，實(shí)現(xiàn)了PCto PC的實(shí)時通話。

2009-05-10 13:14:04

1340

體驗(yàn)上汽推出的iVoka語音交互技術(shù)

目前上汽推出了一個應(yīng)用于汽車上且類似Siri系統(tǒng)的iVoka語音云交互技術(shù)，中文的語音系統(tǒng)讓國人可以率先體驗(yàn)到人機(jī)交互系統(tǒng)的樂趣與魅力。

2012-07-19 11:34:36

2136

交互式智能家居系統(tǒng)設(shè)計論文

基于Arduino單片機(jī)的語音交互式智能家居系統(tǒng)設(shè)計

2017-04-26 09:25:21

暴風(fēng)推有語音交互邏輯X5 ECHO人工智能電視主打語音交互

昨日，暴風(fēng)正式發(fā)布了其旗下X5 ECHO人工智能電視，并稱這款電視有著一套完整的語音交互邏輯。除了最基本的鍵入式搜索以外，擬人化的語音交互是這款電視最大的特點(diǎn)，暴風(fēng)則稱其為人工智能。

2017-05-13 11:24:53

1165

詳細(xì)剖析漢云通信——人工智能語音交互系統(tǒng)

2018年漢云通信以“人工智能交互語音系統(tǒng)，讓人回歸人的價值，把人從重復(fù)腦力勞動中解放出來”為核心，開啟真人語音、智能交流、支持打斷的智能化服務(wù)模式，為企業(yè)創(chuàng)建最佳呼叫場景。

2018-02-07 16:40:31

6250

智能語音交互在汽車上的應(yīng)用有哪些

企業(yè)把智能語音交互技術(shù)落地在了汽車上。時年，智能汽車的概念風(fēng)靡一時，科技范兒的企業(yè)層出不窮，力求從各方面把汽車變聰明。那么，作為底層技術(shù)之一，CES上亮相的企業(yè)對智能語音交互在汽車上的應(yīng)用貢獻(xiàn)了哪些新產(chǎn)品。

2018-04-18 01:06:00

13926

智能語音交互是怎么實(shí)現(xiàn)交互流程中的輸入輸出呢?

智能語音交互是人工智能的分支，相當(dāng)于語音助手，屬于一款智能型的手機(jī)應(yīng)用，通過智能對話與即時問答的智能交互，實(shí)現(xiàn)幫助用戶解決問題的功能。

2018-03-13 15:49:28

11785

除了語音交互，未來的座艙智能化有什么樣的轉(zhuǎn)變？

“我們對于未來的座艙，更多的從用戶的角度出發(fā)，從用戶的體驗(yàn)和需求上來看整個座艙系統(tǒng)的開發(fā)。”李思霓表示，未來座艙的定義必須是通用，同時也是個性化的選擇。

2018-05-15 15:34:38

5356

如何加快座艙智能交互落地進(jìn)程

隨著車輛智能化的發(fā)展,車內(nèi)交互也成為了一項熱門的技術(shù)，包括液晶屏顯、HUD、語音交互等，各種交互方式因?yàn)?b class="flag-6" style="color: red">技術(shù)成熟度、產(chǎn)業(yè)鏈完善程度的不同，在整個行業(yè)內(nèi)的發(fā)展情況也不盡相同。

2018-11-14 09:55:39

3286

探析智能語音交互應(yīng)用和技術(shù)

北京聲加科技CEO邱鋒海受邀以《聲加萬物、聆聽未來：智能語音交互應(yīng)用和技術(shù)》為題，分享了目前正在爆發(fā)的智能語音交互市場中的各項明星產(chǎn)品和其技術(shù)鏈條。

2018-11-23 09:54:52

4553

冠林全新推出新一代智能語音交互工具全力打造家居語音交互新體驗(yàn)

語音交互作為物聯(lián)網(wǎng)智能終端主流的交互方式已越來越普及，讓機(jī)器聽懂用戶發(fā)出的指令，享受更為輕松、舒適的智能生活。為此，冠林全新推出了新一代智能語音交互工具——小慧，打破傳統(tǒng)設(shè)計，將語音控制功能導(dǎo)入開關(guān)面板形態(tài)，全力打造家居語音交互新體驗(yàn)。

2019-03-28 13:39:23

809

論智能語音技術(shù)在安防行業(yè)的應(yīng)用前景

智能語音技術(shù)在安防行業(yè)的應(yīng)用，不止停留在語音交互上那么簡單。

2019-04-26 15:09:05

2960

Qeexo核心觸控技術(shù)不會被語音交互技術(shù)取代

Qeexo奇手的下一代“觸控交互”平臺。Sang是Qeexo奇手的聯(lián)合創(chuàng)始人兼CEO，如今語音交互趨勢立現(xiàn)，公司的核心仍是觸控技術(shù)，他似乎并不擔(dān)心觸控技術(shù)會被語音交互技術(shù)所取代。

2019-06-18 10:28:43

1604

思必馳專注智能語音交互技術(shù)，打造最實(shí)用、有趣的人機(jī)交互體驗(yàn)

龍夢竹向品途商業(yè)評論表示，嚴(yán)格來說，思必馳也并不是純粹的B2B公司，而是B2B2C。思必馳提供的智能語音交互技術(shù)，應(yīng)用于智能硬件產(chǎn)品，最終為消費(fèi)者用戶使用。

2019-08-06 16:23:24

6472

語音交互技術(shù)為我們的生活帶來哪些改變

隨著眾多搭載人工智能技術(shù)的產(chǎn)品問世，AI從一個概念性的技術(shù)變成大多數(shù)人都能夠接觸到的東西，這其中受眾最多的要數(shù)語音交互技術(shù)，包括國外的“四大天王”蘋果、谷歌、亞馬遜、微軟以及國內(nèi)的科大訊飛、百度、阿里、搜狗等科技公司相繼布局智能語音交互市場,先后在智能家居。

2019-08-26 10:12:45

1358

醫(yī)療智能語音識別系統(tǒng)的研發(fā)與應(yīng)用

結(jié)合語音識別技術(shù)構(gòu)建醫(yī)療智能語音識別系統(tǒng)，達(dá)到減輕醫(yī)護(hù)人員日常工作負(fù)擔(dān)，減少重復(fù)性勞動，提高診療質(zhì)量的目的。基于語音識別的關(guān)鍵技術(shù)和海量的醫(yī)療數(shù)據(jù)，開發(fā)電子病歷與檢查報告智能語音錄入、移動護(hù)理智能語音錄入、非接觸式智能語音數(shù)據(jù)交互系統(tǒng)。

2019-10-21 16:46:27

3262

語音交互技術(shù)存在什么利與弊

在人工智能異常火熱的今天，從 Siri 到小度，從小冰到小娜，語音交互正悄無聲息的融入我們的生活之中。

2019-10-24 14:58:51

8730

智能語音在未來會有怎樣的地位

智能語音技術(shù)不斷創(chuàng)新進(jìn)步，眾多的企業(yè)投身其中，中天智領(lǐng)的智能AI語音交互系統(tǒng)，讓交互“說”出來。

2019-11-04 14:47:58

777

掌握聲音前處理核心技術(shù)，讓語音交互更智能

除了最常用的智能手機(jī)外，智能音箱、智能家居、智能機(jī)器人等眾多智能終端設(shè)備的語音應(yīng)用不斷涌現(xiàn)，使得智能語音技術(shù)成為智能設(shè)備交互的主要手段。

2019-12-26 11:26:08

821

未來的智能座艙是什么樣子？

8月26日，在仙豆智能舉行的智能座艙公開課上，仙豆智能用戶體驗(yàn)設(shè)計專家于吉良坦言，如同智能手機(jī)，智能座艙的發(fā)展趨勢同樣是硬按鍵越來越少，屏幕越來越大。與此同時，語音、眼球、面部追蹤、觸控、手勢、AR虛擬現(xiàn)實(shí)技術(shù)的引入，致使人機(jī)交互方式在不斷增加。

2020-08-28 11:39:34

3204

語音交互技術(shù)在AIoT場景中的應(yīng)用趨勢是怎樣的

過去幾年，語音交互無疑是人工智能領(lǐng)域發(fā)展的熱門方向，不管是科技巨頭大力推廣的智能音箱，還是各種智能設(shè)備都在植入語音交互能力，我們看到語音已經(jīng)成為一種通用能力，并逐步演變?yōu)槿藱C(jī)交互的新入口。根據(jù)

2020-10-24 11:08:17

1929

深度解讀智能座艙系統(tǒng)

銀河os”，通過3塊大屏實(shí)現(xiàn)了出色的人機(jī)交互。強(qiáng)強(qiáng)聯(lián)手Team 自2018年起，偉世通、億咖通科技與高通技術(shù)公司就開始聯(lián)合開發(fā)這套智能座艙系統(tǒng)，可以說是集合了多家企業(yè)的技術(shù)優(yōu)勢，真正意義上實(shí)現(xiàn)了智能化、網(wǎng)聯(lián)化。 技術(shù)優(yōu)勢Tech 硬件采用了偉世通的SmartCo

2021-09-22 16:44:38

4061

汽車智能化過程給座艙帶來了新的要求

隨著語音識別、人臉手勢識別等技術(shù)的快速發(fā)展，汽車座艙內(nèi)的交互體驗(yàn)也在不斷升級。在智能汽車邁向高階自動駕駛過程中，全系影像技術(shù)開始進(jìn)入車載顯示領(lǐng)域，開啟人車交互新窗口。在HUD技術(shù)中，AR-HUD結(jié)合

2021-11-15 09:07:10

2557

德賽西威攜手高通打造第四代智能座艙系統(tǒng)

德賽西威與高通技術(shù)公司宣布，雙方將基于第4代驍龍座艙平臺，共同打造德賽西威第四代智能座艙系統(tǒng)。

2022-01-05 14:25:23

3200

智能座艙人機(jī)交互模式的未來發(fā)展趨勢

隨著智能座艙AI算力的提高，沉浸式交互使得交互指令的輸入方式更加類人化，同時交互的發(fā)起方也不再僅限于人類。通過多種傳感器的支持，座艙可主動發(fā)起交互，讓駕乘人員感受到座艙的主動關(guān)懷，使駕乘體驗(yàn)更溫暖

2022-01-06 10:01:46

6595

智能座艙人機(jī)交互技術(shù)的發(fā)展趨勢

當(dāng)前，汽車不僅在動力源、驅(qū)動方式和駕駛體驗(yàn)上發(fā)生了改變，座艙也告別了傳統(tǒng)枯燥的機(jī)械和電子空間，智能化水平飆升，已經(jīng)成為繼家庭和辦公室之外的人們生活中的“第三空間”。通過人臉；指紋識別、語音/手勢交互

2022-03-26 17:13:55

4157

未來智能座艙市場容量智能座艙主流芯片820A

智能座艙是指搭載了智能化、網(wǎng)聯(lián)化的車載設(shè)備和服務(wù)，諸如車載信息娛樂系統(tǒng)、儀表盤、抬頭顯示（HUD）、流媒體后視鏡、語音交互系統(tǒng)等汽車電子系統(tǒng)。

2022-03-31 15:28:19

5763

如何提升智能座艙的多屏聯(lián)動和語音交互體驗(yàn)

如今，技術(shù)創(chuàng)新正在為整個汽車行業(yè)帶來顛覆性影響，智能化逐步成為定義產(chǎn)品體驗(yàn)的關(guān)鍵要素。其中，智能座艙作為駕乘者當(dāng)下最容易感知的部分，已經(jīng)成為購車的重要關(guān)注點(diǎn)之一。

2022-06-06 09:43:50

1467

誠邁科技智能座艙EX5.0軟件平臺

從最初的獨(dú)立車載信息娛樂系統(tǒng)到發(fā)展至今的5G時代智能導(dǎo)航信息娛樂系統(tǒng)，作為人機(jī)交互的接口，汽車座艙承載的功能與數(shù)字信息大幅度增加。座艙通過搭載智能化/網(wǎng)聯(lián)化車載設(shè)備或服務(wù)，可以逐步實(shí)現(xiàn)人、車、路、云智能交互，從多角度應(yīng)用場景出發(fā)構(gòu)建人機(jī)交互智能座艙系統(tǒng)，以獲得體驗(yàn)與消費(fèi)價值的雙重升級。

2022-06-09 09:22:44

2404

語音交互設(shè)備中的ASR和TTS技術(shù)

手機(jī)、手表、音箱等智能設(shè)備極大地便利了我們的生活，隨著語音交互設(shè)備的發(fā)展，智能交互依然面臨很多挑戰(zhàn)。

2022-06-16 17:23:48

2970

作為第三生活空間，智能座艙如何先聲奪人？

2022-11-08 07:15:09

623

關(guān)于智能座艙中RTC應(yīng)用介紹

智能座艙主要組成：智能座艙由三大部分組成：硬件（儀表盤、流媒體后視鏡、HUD、中控屏幕、后座娛樂系統(tǒng)、空調(diào)、座椅、音響等）、軟件、人機(jī)交互（語音、人臉、觸摸、手勢、生物等識別），融合了T-Box、DMS系統(tǒng)、ADAS系統(tǒng)、高精定位系統(tǒng)以及未來的V2X，為用戶提供更加便捷、智能、溫馨、舒適的體驗(yàn)。

2022-12-16 10:49:53

1308

瑞聲科技發(fā)布首個智能座艙與智能駕駛感知交互解決方案

瑞聲科技以汽車音響、觸覺反饋、語音采集、感知交互等四大模塊為著力點(diǎn)，將消費(fèi)電子領(lǐng)域的感知體驗(yàn)需求洞察和技術(shù)積累拓展至汽車圈，發(fā)布了行業(yè)首個智能座艙與智能駕駛感知交互解決方案。

2022-12-30 10:47:00

431

什么是多模交互智能座艙為什么要做多模交互

語音交互在實(shí)際應(yīng)用中是不可見的，如果不與其他模態(tài)進(jìn)行融合，很難預(yù)判出他們發(fā)出的指令處于哪個狀態(tài)。

2023-01-10 09:46:02

1295

340秒語音芯片,輕松實(shí)現(xiàn)語音交互，暢享智能生活WTV380語音ic方案

隨著智能家居、安防報警、寵物用品等，智能設(shè)備的普及，語音交互技術(shù)正在逐漸成為人機(jī)交互的主要方式之一。而如何實(shí)現(xiàn)穩(wěn)定高效的語音交互，就需要借助先進(jìn)的語音芯片技術(shù)。今天，我們介紹的是一款高性能的語音芯片——WTV380

2023-03-08 15:19:18

174

技術(shù)前沿：智能座艙的交互技術(shù)

智能座艙定義及組成對于智能座艙的概念或定義，行業(yè)內(nèi)主要存在兩種主流的觀點(diǎn)。第一種觀點(diǎn)將智能座艙定義一種智能服務(wù)系統(tǒng)，能主動洞察和理解用戶需求，又能滿足用戶需求：從終端消費(fèi)者需求及應(yīng)用場景出發(fā)，乘客不僅無需擔(dān)憂駕駛和出行，還能在智能座艙中獲得舒服的體驗(yàn)。

2023-04-12 10:16:49

2345

助力打造更加便捷、清晰的車載語音交互新體驗(yàn)

、個性化的用戶體驗(yàn)，車企提“智”升級，對車載語音交互系統(tǒng)的功能和性能提出了更高的要求。在此背景下，車載語音識別等技術(shù)逐漸成為了車載語音交互系統(tǒng)的重要組成部分。 ? 車載語音識別技術(shù)是車載語音交互系統(tǒng)中的另一個

2023-04-17 09:31:08

479

銳思華創(chuàng)與思必馳達(dá)成戰(zhàn)略合作，推動智能座艙多模交互發(fā)展

，雙方將基于各自資源優(yōu)勢，在智能車載中的多模交互展開深度合作，共建智能座艙新生態(tài)。銳思華創(chuàng)與思必馳達(dá)成戰(zhàn)略合作，推動智能座艙多模交互發(fā)展關(guān)于銳思華創(chuàng) 銳思華創(chuàng)技術(shù)有限公司成立于2019年，是智慧交通、輔助駕駛與 AR 顯示的整體解決方案提供商，致力于打造以創(chuàng)新

2023-04-21 14:41:11

378

車企提“智”升級，車載語音識別技術(shù)成就語音交互新體驗(yàn)

、個性化的用戶體驗(yàn)，車企提“智”升級，對車載語音交互系統(tǒng)的功能和性能提出了更高的要求。在此背景下，車載語音識別等技術(shù)逐漸成為了車載語音交互系統(tǒng)的重要組成部分。車載語音識別技術(shù)是車載語音交互系統(tǒng)中的另一個重

2023-04-23 15:15:38

380

車企提“智”升級，車載語音識別技術(shù)成就語音交互新體驗(yàn)

2023-04-23 18:13:41

423

智能座艙人機(jī)交互技術(shù)發(fā)展趨勢

智能座艙告別簡單電子化進(jìn)入智能助理階段的一個顯著標(biāo)志是人與座艙的交互從被動式進(jìn)入主動式，而這個“被動”和“主動”是圍繞座艙本身定義的。過往的信息交流主要由人發(fā)起，現(xiàn)在人與機(jī)器都可以發(fā)起，人機(jī)交互水平已經(jīng)成為定義智能座艙產(chǎn)品檔次的重要標(biāo)志。

2023-05-18 10:27:12

1548

智能座艙進(jìn)入大模型時代，語音遙控器的交互即將成為過去式

百度Apollo展示了其最新已量產(chǎn)的語音產(chǎn)品體驗(yàn)，小度車載語音SDK基于大模型本地化，持續(xù)推動座艙極致交互體驗(yàn)。流暢的免喚醒多路同時交互、全頁面所見所說、全域毫秒級響應(yīng)，讓用戶像是擁有了一個隨時待命的私人助理，能靠說的絕不動手，坐在主副駕和后排的每一個人都可以同時進(jìn)行暢快的交互體驗(yàn)。

2023-05-24 09:43:43

607

智能座艙仿真測試解決方案

過程中智能座艙系統(tǒng)的測試與驗(yàn)證。經(jīng)緯恒潤結(jié)合通信信息、人工智能、工業(yè)控制、硬件在環(huán)等技術(shù)，開發(fā)了一套智能座艙仿真測試系統(tǒng)，實(shí)現(xiàn)了對整車電氣、人機(jī)交互、交通場景和座艙體

2021-12-19 14:00:51

1529

340秒語音芯片,輕松實(shí)現(xiàn)語音交互，暢享智能生活WTV380語音ic方案

2023-03-08 16:55:15

365

智能座艙的七大趨勢

作為智能座艙最重要的交互手段之一，智能語音是智能座艙的核心功能之一。目前，智能語音的高識別率已成為標(biāo)配，分區(qū)語音識別及交互逐漸成為主流，領(lǐng)先車型已經(jīng)能夠非常準(zhǔn)確地識別語音指令來自車內(nèi)哪個方位，并且執(zhí)行相應(yīng)的操作。

2023-06-29 16:37:40

1677

語音識別喚醒詞-開啟智能化的語音交互時代

語音識別喚醒詞是指在語音交互系統(tǒng)中使用的特定詞語或短語，用于喚醒系統(tǒng)并啟動語音識別功能。這項技術(shù)的出現(xiàn)為智能化的語音交互帶來了革命性的改變，使得我們能夠更便捷、自然地與智能設(shè)備進(jìn)行交流。在傳統(tǒng)

2023-07-09 00:53:53

771

智能座艙仿真測試解決方案

2021-12-14 10:40:30

660

智能座艙HMI自動化測試之語音交互專項測試

隨著人工智能和物聯(lián)網(wǎng)技術(shù)的迅猛發(fā)展，智能座艙已經(jīng)成為現(xiàn)代汽車中的重要組成部分。語音交互作為智能座艙的核心功能之一，正日益受到用戶和汽車制造商的關(guān)注。車載語音交互具備的獨(dú)特優(yōu)勢：降低駕駛者對車內(nèi)

2023-09-04 16:58:58

1501

圓滿落幕 | 智能座艙人機(jī)交互關(guān)鍵技術(shù)創(chuàng)新分論壇

10月21日，由中國汽車工程學(xué)會主辦的【融合座艙生態(tài)，智享未來出行】2023國際汽車智能座艙大會，智能座艙人機(jī)交互關(guān)鍵技術(shù)創(chuàng)新分論壇在蘇州圓滿落幕。東舟技術(shù)產(chǎn)品總監(jiān)黃世富受邀出席論壇，并發(fā)表“智能

2023-10-24 16:26:06

1024

情感語音識別技術(shù)在人機(jī)交互中的應(yīng)用與挑戰(zhàn)

?一、引言隨著人工智能技術(shù)的不斷發(fā)展，人機(jī)交互已經(jīng)成為了研究的熱點(diǎn)之一。情感語音識別技術(shù)作為人機(jī)交互中的重要組成部分，能夠通過識別人的語音情感，實(shí)現(xiàn)更加智能化和個性化的交互體驗(yàn)。本文將探討情感語音

2023-11-09 15:27:27

333

情感語音識別技術(shù)在人機(jī)交互中的應(yīng)用與展望

一、引言隨著人工智能技術(shù)的不斷發(fā)展，人機(jī)交互已經(jīng)滲透到日常生活的方方面面。情感語音識別作為人機(jī)交互中的關(guān)鍵技術(shù)之一，能夠通過分析人類語音中的情感信息實(shí)現(xiàn)更加智能化和個性化的人機(jī)交互。本文將探討

2023-11-22 10:40:59

274

泰克智能座艙測試白皮書發(fā)布

伴隨智能座艙領(lǐng)域數(shù)字化、智能化的趨勢，多屏聯(lián)動、語音識別、手勢控制、增強(qiáng)現(xiàn)實(shí)、云交互成為主流，座艙在實(shí)現(xiàn)豐富功能的同時也給測試帶來很多新的挑戰(zhàn)，例如各種高速接口的測試，域控制器的測試等。

2024-01-10 11:36:34

371

智能座艙包含哪些功能智能座艙測試包括哪些方面？

功能測試：測試座艙的各種功能是否正常，如智能控制系統(tǒng)、人機(jī)交互系統(tǒng)等。故障診斷測試：測試座艙在工作過程中是否能夠及時檢測和診斷出故障，并給出相應(yīng)的提示和建議。性能測試：測試座艙在行駛中的性能和響應(yīng)速度，同時測試涉及到座艙的硬件、軟件和連接個個方面，如連接的音響、藍(lán)牙、無線網(wǎng)絡(luò)等的穩(wěn)定性。

2024-01-16 10:57:25

596

已全部加載完成

搜索歷史

智能座艙的語音交互系統(tǒng)技術(shù)應(yīng)用

評論