“比做語音的公司更懂車,比做車的公司更懂語音。”這或許是車載語音交互戰場的殺手锏。
2017年4月,大眾汽車集團(中國)與人工智能初創公司出門問問正式建立合作伙伴關系,雙方確定將共同成立一家合資企業,在汽車領域展開合作。
這家名為問眾智能的合資公司,基于出門問問領先的語音識別、自然語言處理、垂直搜索和主動式搜索技術,以及大眾汽車集團在汽車和移動出行領域的地位,為未來的智能移動出行提供解決方案。
“公司成立之后比較低調,”1月15日下午,在2018高工智能汽車年會開幕式環節,來自問眾智能的CEO張亞登臺亮相,“大眾汽車大家都比較熟悉,出門問問則是一家AI語音企業,也是在可穿戴式設備,比如手表、耳機以及智能音箱等領域有比較好積累的AI獨角獸。”
這樣的行業組合背后,是快速增長的車載語音市場需求。有數據顯示,全球車載語音助理市場預計將在2017到2023年間以39.27%的年復合增長率增長,到2023年將達到78億美元市場規模。而根據高工智能產業研究院(GGAI)發布報告稱,到2020年中國前裝車載語音年均市場規模將達到25億元左右。
此外,車載語音交互市場的競爭也在從后裝市場向前裝蔓延。目前,各家汽車OEM廠商推出的2019年新車都將配置智能語音交互系統,前裝車型的市場爭奪戰也在悄然打響。
一、技術公司沒有商業邊界
之所以過去一年多時間公司一直沒有太多信息披露,張亞表示,做前裝的車載項目需要花很多的精力,這是一個比較漫長的過程,它和互聯網開發一個APP是不一樣的。
問眾智能從2017年初成立以來,其語音全棧式解決方案正在覆蓋大眾集團旗下多個乘用車品牌,包括一汽大眾、上汽大眾、江淮大眾,奧迪等等。去年8月,問眾智能成為南北大眾五百萬輛級車聯網系統的語音方案提供商。
“按照正在進行中的項目裝機覆蓋率計算,到2020年問眾智能在前裝語音市場的占有率將位居市場NO.1。”張亞表示。
不過,問眾智能并沒有局限于內部客戶。“我們以開放的心態,做技術的公司不太會介意自己的商業邊界,只要我們的產品和技術是過硬的,一定會贏得更多客戶的親睞。”張亞對此信心滿滿。
二、從標準化到差異化
車載語音,這并不是新鮮的細分市場應用,語音和汽車的捆綁是在3、4年前就開始了。張亞表示,曾經問自己一個問題,車載語音這個行業是不是需要多一家像問眾智能這樣的公司?我們認為自己對這個問題有答案。
傳統的語音供應商,接觸那么多潛在客戶之后,發現它只能提供標準化的語音服務方案,如果所有的客戶都是用同一種語音方案,顯然無法做到差異化的用戶體驗。
業內人士表示,雖然國內能夠提供語音交互方案的公司眾多,但真正應用到車載領域,獲得規模化用戶的企業并不多。通用的語音平臺一般功能相對完善,但是對應到車企的定制化需求,用戶的體驗就千差萬別了。
在張亞看來,問眾智能愿意與客戶做更多定制化的產品設計。像BAT互聯網巨頭進入到這個行業,很多OEM客戶在考慮要不要跟BAT合作。BAT真正的問題是不太懂車廠,車廠的開發流程,質量要求,包括產品的體驗。
往往對于BAT而言,則是希望把自己的一整套系統方案(不僅僅是語音)放在車上去用。而AI初創公司,對于車載上面的技術積累比較淺薄。
對于語音技術公司來說,產品效果,客戶服務能力和方案的穩定性是決定成敗的關鍵因素,尤其是客戶服務能力。
對此,問眾智能堅定認為作為一家全棧式智能網聯解決方案提供商,在車載語音方面,能夠獲得最后勝利的企業定位就是要深耕整個車載語音市場。
三、語音智能也有自己的邊界
“我們本身是做語音的,但是并不能自大的認為汽車加語音就能夠讓人機交互變得無所不能。”在張亞看來,語音智能也有自己的邊界。
過去幾年時間,語音識別成為功能日益復雜的汽車信息娛樂系統相結合的最安全的交互方式之一。但根據J.D. Power的數據,盡管汽車的語音識別系統的缺陷不斷改善,但它已經成為車主對汽車新技術體驗的最大抱怨之一。
張亞表示,現在行業里面有兩個普遍現象,讓他感到比較疑惑。
一方面是堆砌的低頻功能,比如有些客戶會提出來,能不能用語音來支持預定酒店,航班,或者查航班狀態。作為車主、終端用戶,這些服務一年里面能用到多少次?我們統稱為堆砌低頻功能,包括訂西餐廳,買票等等。
還有化簡為繁,違背初衷。比如說語音用在車控環節,車窗、雨刷,或者打開后備廂等等。在車內,通過按鍵操作就可以順利完成的功能,未必一定需要用語音去做交互。
總結起來,整個行業在走向的方向,要么是純粹用技術驅動思維、考慮車載人機交互,工程師認為這些事情我能干,我就干了。
二是忽略場景,直接把語音搬到車載場景當中。目前搭載在量產車上的語音交互系統存在不少用戶差評,主要集中在識別準確度(方言),識別的速度,語音喚醒不靈敏,語音控制車輛功能較少,語音系統的升級更新速度慢等問題。
四、回歸本質,回歸到車
在張亞看來,問眾智能的定位和立足之本還是要回歸本質,回歸到車。
一是,深耕在駕駛場景下的語音交互,有它的特殊性,比如把車窗打開的時候,有車外、車內噪音,車外風噪,胎噪,車內包括發動機的聲音,如何在車載混雜環境下把噪音能夠降低,并且在高噪狀態下(85分貝)做到正常識別,順利執行命令,需要工程優化。
這對車載語音的拾音和降噪能力提出了很高的要求,而這也正是車載語音當前比較難以攻克的問題。車載語音面臨的技術難關遠不止這些,比如,在拾音后要如何識別語義進行解析?包括對聲紋、性別和場景的識別等等。
而問眾智能在過去一年多時間里,就是一直在做這方面的技術與工程經驗的積累,在張亞看來,這會是未來和競爭對手形成差異化的一個點。
二是,真正車載語音的核心指標,在實車環境下,強調喚醒,數據量、準確率,要考慮到無論是哪個指標都要在實車環境之下來測。
同時,要基于車內采集的大量語料,大量數據來訓練模型。比如,在線ASR準確率還有響應時間,沒有用戶愿意等(響應)很長的時間,最后很重要的一環就是對于服務生態的連接。
此外,在車載語音交互上面,如何區別于像音箱這樣的一些其他場景的智能語音應用。
在車載環境當中有一些是定制的,比如說司機一直處在和(語音)系統相對固定的距離,而且是長時間保持相對的位置。同時對于服務的喚醒,有些時候比較頻繁,相當于音箱來講。
這里面當然涉及到自然語音理解,多輪對話,自定義喚醒詞,離線語音識別,這些都是最基礎的語音交互體驗。
同時,問眾智能還在做一些其他技術研發,比如全場景打斷,長時間的偵聽,跨場景上下文交互,免喚醒熱詞或者句式。
這些都是在真正的降低用戶交互成本。
五、做前裝,非常不容易
經過這一年多時間的打磨之后,問眾智能也看到了和傳統互聯網公司,或者技術公司之間的區別。
“從事車載市場并不容易,相比其他行業技術,質量,服務的要求都更為嚴格,而且要不斷完善,經常會被OEM考核。”對此,張亞深有體會,比如說軟件的質量,開發的周期,開發的復雜度要和各方溝通。
“我們從一個坑里爬出來再填另外一個坑,直到今天為止,很有信心的跟業界朋友說,我們已經成為一家真正能夠懂得車的AI科技公司。”在張亞看來,這也是一件非常不容易的事情。
在語音公司爭奪車廠前裝市場訂單的過程中,相關從業人員表示,車廠對于方案公司的服務達成率比較看重,也就是說,語音公司如果能夠較快的響應車廠需求,更好的服務好車廠,那么在跟同行競爭的時候,會有一定的優勢。
張亞表示,問眾智能是一家擁有車載語音全棧技術的公司,從DSP模組,到HMI、TTS、NLU、DM、ASR、NLG、VAD等等,同時提供靈活、高效、標準化的解決方案。
經過這一年多時間與車廠項目的錘煉,問眾智能對于語音SDS,DSP方案整合,適配到各個車載操作系統當中的量產經驗,對于其他OEM潛在客戶也是非常重要的。
-
人工智能
+關注
關注
1792文章
47425瀏覽量
238948 -
智能語音
+關注
關注
10文章
786瀏覽量
48810 -
車載語音
+關注
關注
0文章
19瀏覽量
10385
原文標題:做前裝不易,這家公司卻“喊出”到2020年成為前裝語音市場No.1 | GGAI頭條
文章出處:【微信號:ilove-ev,微信公眾號:高工智能汽車】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論