語音交互在汽車行業的應用并非是最近幾年才出現的,早在2000年的時候就已經有汽車搭載了語音交互,但那時用戶對這種交互方式還非常陌生,使用頻率也很低。
近年來,隨著人工智能、車聯網以及無人駕駛技術的快速發展,車載語音才真正地火爆起來為用戶所熟知。
盡管主機廠、供應商叫囂著汽車的車載語音如何準確、如何智能等,尷尬的現實情況卻是車載語音的火熱程度和它的用戶體驗度之間并不是一個正向遞增關系。
簡而言之,就是用戶對現今車載語音的體驗并不滿意。想讓用戶心甘情愿的為語音交互買單,語音技術廠商需要做出更多成果讓用戶信服。
合格的車載語音首先要保證聽得見
作為一家語音技術方案商,思必馳一直專注垂直領域下的智能對話式交互,根據各個垂直行業做場景化的語音技術創新、優化,做差異化的語音解決方案。先后推出環形6+1遠場麥克風陣列、車載天琴助手、DUI-對話定制平臺和會話精靈企業服務等多種業務方案。
在車載語音交互上,思必馳始終保持對車載的垂直領域進行不斷的技術創新,包括不斷引進國際化專家人才和人工智能人才培養。除了技術端,產品端口也一直不斷從穩定性、客戶剛需以及增加樂趣三個維度來進行產品體驗的提升。
互聯網在汽車領域的大規模普及和應用已經成為了既定的事實,未來車聯網和自動駕駛技術的不斷發展將會把汽車變成一個重要的入網端口。
作為一個人機交互系統,汽車上所有的功能應用都是基于安全這個大前提進行的,所以選擇一個安全自然的交互方式就顯得尤為重要,這也是為什么當下的觸屏 交互并不是最合適的車內交互方式。
思必馳車載事業部副總經理宋佳認為,與按鍵和觸控相比,語音交互是一個更好好的選擇,它可以讓駕駛員的雙眼鎖定在前方道路,不用低頭或是視線偏移,而僅靠語音指令就能夠實時溝通。在確保駕駛安全的前提下,駕駛員也能夠獲得更舒適流暢的車內交流體驗。
現在很多用戶抱怨車載語音不好用,很大原因在于車載語音在第一階段的接收和識別過程就已經出現問題。一方面是來自于語音識別引擎本身存在不完善,另一方面,其實對汽車的使用環境而言,麥克風陣列的設計也影響著整個車載語音的識別準確性。
宋佳表示,車載語音的交互并不是簡單的把識別引擎和硬件車機進行綁定就能夠達到一個很好的體驗效果,如果麥克風和音腔結構不合格,語音識別引擎再準確也難以發揮作用。因此在硬件方面,麥克風陣列和整個車機設計將是未來語音識別需要重點關注的部分。
對于車載語音交互來說,首先需要做到語音識別結果的準確性,保證識別率,才能真的聽的清、聽得懂,其次是對接豐富的第三方資源,具備較廣泛的知識面,能夠完成車內生活相關的指令。
宋佳表示,目前思必馳打造的天琴系統就已經初步具備了用戶對智能車載語音交互的需求。
天琴系統是一個人車合一的多模式交互系統,語音是首要的交互入口,用戶可以通過語音發布指令,完成搜索、查找等動作。在導航時,用戶不需要手動操作就可以快速完成搜索目的地、查找路線等一系列操作,減少了用戶使用雙手帶來的駕駛安全問題。
此外,語音并不是唯一的交互選擇,在天琴系統中,思必馳將語音、觸控屏和方向盤進行了高度的融合,使三者之間的交互實現了互融互通。這其實也是現在車載交互發展的趨勢,在觸控和物理按鍵無法被完全取代之前,三者不同交互方式之間實現有機的結合是最好的選擇。
值得一提的是, 思必馳的天琴系統優化了基于場景化的語音提醒,解決了用戶不知道如何與語音產品對話的煩惱,也省去用戶自己花費時間挖掘產品功能,降低學習使用的門檻,實現了可見即可說。
智能化的車載語音應該具有主動思考和預判能力
除了在識別準確率上存在的問題,現階段的車載語音還面臨著如何提高智能化的問題,比如,用戶希望車載語音系統能夠像真正的人工智能一樣,具有主動思考的能力。當用戶發出指令的時候,能夠快速的反應并捕獲用戶接下來的意圖,幫助用戶做出決定。
宋佳表示,車載語音交互再往更高一層發展必然是智能化的語音交互,而智能語音交互不是簡單的語音+車聯網的組合,它背后必然是基于機器大量的深度學習,包括從數據中尋找類似事例來訓練或是通過歸納大數據樣本的共性對語音指令做出決斷。
這也是語音技術發展的難點。
事實上,當前市面上多數語音技術方案商研發的語音+車聯網場景的應用平臺,大部分是基于硬性的問答式語音交互,而針對智能化、人性化的語音交互的探索還不夠深入,導致車機的主動思考及預判能力幾乎為零。
因此,對于語音供應商來說,如何讓車載語音覆蓋更多的應用場景提高它的思考預判能力成為車載語音智能化的關鍵。
思必馳的天琴系統通過場景化語義解析,涵蓋導航、電臺、音樂、電話、應用操控、汽車操控、違章查詢、指定地點查詢、路況、今日限行等各領域內容。
基于周邊服務的整合,語音系統已經可以開始預判用戶的需求,并幫助用戶做出預判。例如用戶語音搜索目的地電影院,系統除了快速彈出電影院推薦、結合導航時間進行場次推薦外,還能直接幫助訂票、選位。
技術的不斷創新對語音交互來說非常重要 ,因為語音底層技術能確保系統更清晰的識別用戶的語音指令,從而更好的接收指令、理解指令,最后快速的做出反饋。
但是隨著底層技術能力的不斷提升,未來關于語音交互服務的整合能力將成為影響用戶體驗的關鍵。這種整合能力不僅是讓車載語音系統聽得清楚、聽得懂,更重要的是如何將不同資源、服務對接,成為名副其實的智能語音。
畢竟,語音交互只是手段,不是最終目的,交互的目的只是為了讓機器更好地完成任務提升用戶體驗。
據思必馳介紹,公司現在已經占據了車載語音后裝市場70%的市場份額,今年進入前裝市場,目前前裝已經合作幾十家tier1企業和車廠,大部分都已量產上市。
宋佳表示,未來思必馳還將繼續拓寬車載語音的應用,2019年將實現聲紋商用落地,單輛車多賬戶并存成為可能,同時,還會有基于聲紋的個性化推薦和回復。在語音識別上,多麥克風陣列實現對不同方位的聲源定位,可以提供不同座位的獨立車控操作。
-
智能化
+關注
關注
15文章
4920瀏覽量
55555 -
車載語音
+關注
關注
0文章
19瀏覽量
10387
原文標題:從聽見到聽懂,思必馳在車載語音方面如何做好垂直化、差異化? | GGAI專訪
文章出處:【微信號:ilove-ev,微信公眾號:高工智能汽車】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論