近日,美國專利商標局公布了一系列來自蘋果公司的69項新授權專利。在這份特定的報告中,介紹了蘋果申請的3D人機接口發明,它能夠實現用戶的手勢識別與交互,進而對Mac電腦的功能進行控制。
這背后是被蘋果收購的以色列PrimeSense公司,它是蘋果公司TrueDepth攝像頭和點陣投影器(Dot projector)背后的技術支持提供商。
在全球范圍內,“老牌”的Leap Motion和“新生”的Untouch(未動科技)、uSens(凌感科技)、微動、京龍睿信、車蘿卜、光暈Halo以及極魚科技等多家手勢識別公司算是中國代表公司。
從最早的消費類電子市場(手機、VR頭顯)到如今的汽車市場,手勢識別讓用戶能感受到“碟中諜”系列中阿湯哥在車內對空氣揮手就能操作信息的場景。
而從目前的技術發展來看,實際上自動駕駛汽車中間很重要的一環就是體驗,VR技術、AR技術,所有這些技術都是用來增強用戶體驗的。目前,利用攝像頭進行手勢識別已經成為部分高端車型的配置功能。
奧迪、奔馳、寶馬、大眾、福特等知名主機廠都在旗下的量產或概念汽車產品上加入了手勢識別技術,但這些產品的識別率及使用流暢程度并不完美。此外,包括偉世通、德爾福以及微軟、谷歌、三星等Tier1和IT公司也有發布類似產品方案。
在那些主打手勢控制的車中,寶馬7系無疑是一個典型代表。它可以識別6種預設手勢操作,實現音量、導航、通話和空調等的設置。大眾高爾夫的系統可以通過手勢滑動控制菜單選項、電臺、滾動播放列表和瀏覽媒體庫,可操作選項會出現光暈提示,同時還有可視化交互反饋。
而在2015年初,奧迪帶來了處于開發階段的手勢識別技術展示產品。有了它,后排乘客就可以通過手勢來控制后排娛樂系統的各項功能。
根據硬件實現方式的不同,目前行業內所采用的手勢識別大約有三種:結構光(Structure Light)、光飛時間(Time of Flight)以及多角成像(Multi-camera)。其中,寶馬、大眾等廠商采用的ToF,英特爾的結構光技術,以及谷歌的毫米波雷達技術。
同時,手勢識別在實際落地上,也正在與中控、智能后視鏡、HUD等硬件進行集成。而早前,谷歌更是宣稱,無人駕駛汽車已經可以探測“數百種情況”,能自我識別交警舉起的停車標志以及騎自行車的人所做的手勢。
同時,手勢識別與語音識別的集成交互,也在成為趨勢。目前,國內包括思必馳、云知聲等語音技術公司均有投資相關的手勢識別廠商。
此外,目前國內多家自主品牌的下一代互聯智能車載系統中,都已經將手勢識別作為其中一項功能進行集成。從目前的車型規劃來看,2019年發布車型有望出現手勢識別的第一波高峰。
去年奇瑞汽車舉辦了一場小型內部技術成果發布會,發布了一系列AR(增強現實)+語音控制+手勢識別等人工智能技術。按照目前透露的技術路線圖,這些技術有望在2018年左右陸續在奇瑞產品上量產應用。
而將于近日上市的寶馬全新5系插電混動版配備了全新“五維人機交互界面”,包含了自然語音識別、手勢控制、觸控屏幕、iDrive系統和熱敏按鍵。
Untouch(未動科技)
去年7月,Untouch(未動科技)正式發布4款3D視覺交互產品:3D手勢識別產品——黎曼平臺,3D人臉識別產品——歐拉平臺,SLAM產品——笛卡爾平臺,及場景重建產品——高斯平臺。
全球著名的ToF深度傳感器廠商PMD也宣布,選擇Untouch(未動科技)的黎曼平臺作為中間件為客戶提供非接觸式的交互方案,雙方深度合作,推出了完整的手勢識別軟硬件一體方案。
未動科技(Untouch)的核心競爭優勢一個是構建了智能視覺交互技術的基礎性平臺,另一個數以PB計的深度數據積累,二者結合保證了未動科技國內領先的嵌入式智能視覺交互技術。
目前,未動科技(Untouch)推出了車載智能視覺交互產品。該產品基于未動科技自主研發的國內頂尖的3D手勢識別與3D人臉識別技術,實現車內智能座艙的非接觸式手勢控制、身份認證與駕駛員狀態監控,從而提供一種安全愉悅的車載人機交互體驗。
未動科技(Untouch)正在加強和拓展與Tier1的合作關系,從而把視覺交互技術應用到更多的新車型中。
uSens(凌感)
2016年,uSens便與戴姆勒中國IT創新實驗室一起展示了最新合作成果。這個車載手勢交互應用了uSens的26自由度手勢追蹤以及6自由度頭部追蹤技術,體驗者不僅可以在ARVR場景中觀察3D汽車模型的內外部細節,而且可以進行交互。
uSens和Leap Motion采用的是相似的原理,都是使用復數的紅外相機來識別人手的運動。公司把這款自研的搭載紅外相機的手勢識別模組稱為Fingo。
uSens在2017年2月正式公開發售其手部追蹤解決方案——Fingo。Fingo集成軟硬件為一體,硬件上通過兩個紅外攝像頭及三個紅外輔助燈追蹤手部動作,軟件上基于計算機視覺及深度學習等算法,實現對雙手骨骼的識別,大部分常用手勢均可實現精準低延遲識別。
隨后,uSens發布新版Fingo SDK,在手勢算法底層進行了改進,新增一系列雙手交互動作,如握拳、手心寫字、十指交叉等,在同類產品中,率先實現對大面積遮擋的雙手交疊類手部動作的識別,并可實現對十個手指的細微運動追蹤。
微動Vidoo
在去年4月份的上海車展上,微動Vidoo發布了Vdrive車載手勢識別解決方案,實現傳感器定制到UI人機交互界面設計全閉環。
微動Vidoo從功能需求出發,進行算法優化裁剪,生成定制化方案;制定硬件通信接口與通信協議;量身打造標準化動作指令設計、UI設計、操作反饋設計。此外,通過HMI的動作設計環節以及底層的基礎數據分析,還可以明確區分用戶是有意進行手勢操作指令的下達還是不經意的無意識動作。
公開資料顯示,微動手勢識別技術的獨特之處主要體現在,復雜的核心算法以及大量的數據運算不依賴于主機去完成,而是依靠硬件設備上的FPGA獨立運算單元。Vdrive的手勢識別解決方案,采用120Hz高頻雙目深度傳感器,結合SoC架構的FPGA芯片,將圖形圖像、人工智能算法都跑在車載Vdrive內部完成,與上位車機進行指令級通信。
極魚科技
去年,國內以TOF方案實現手勢識別模塊的創業公司極魚科技宣布,已完成2000多萬元的A輪融資,將主要用于車內手勢識別模塊的研發和生產。彼時,極魚科技的手勢識別方案可以各識別5-10種動態和靜態手勢,車廠可以自選3-5個手勢,并自定義相應功能。識別精度在1-2cm,識別準確度可達95%以上。延遲率則可控制在25ms內。
目前極魚科技現在可以提供中控手勢交互、HUD手勢交互、車內乘客娛樂交互三種系統方案。去年12月,極魚科技進入Startup Autobahn中國第一期加速器,并且獲得了和戴姆勒合作的機會,推出基于手勢識別的車載娛樂系統。
京龍睿信
定位前裝及準前裝HUD定向研發與銷售平臺的京龍睿信,除了HUD本身,還自帶主要交互方式語音識別,同時輔以手勢識別。其中,手勢識別主要通過“上下左右”四個方向的手勢動作來識別相應的指令;這個是通過HUD機體面向車主一側的夜視紅外線傳感器實現,它可以識別用戶動作。
去年,京龍睿信與阿里YunOS達成合作,雙方將基于YunOS系統,合力推出京龍第三代HUD產品H3。這款產品將進一步實現圖像效果、距離、溫度的優化匹配,在實現語音、手勢等智能交互的基礎上,將手勢芯片和產品上揚窗口改版完成。在保證圖像清晰、色彩不眩暈、明暗環境可識別的前提下,增加角度識別力,讓產品與更多車型達到匹配。
光暈網絡
2016年底,總部位于深圳的初創團隊光暈網絡科技也發布其HUD產品光暈Halo,該產品歷經約兩年時間的研發。作為一個專注于車內交互功能的團隊,光暈網絡科技讓他們的首款HUD產品主打手勢識別、語音交互以及AR導航三位一體的集成體驗。
光暈Halo的攝像頭以自上而下的角度識別用戶特定的手勢,從而執行命令。該技術由光暈網絡科技團隊利用人工智能技術對200多萬張不同手勢的特定姿態圖片進行訓練;通過數據壓縮,他們將5TB的原始手勢數據庫控制在5MB左右,這樣大幅減少實際應用中耗費的計算資源。
樂駕科技(車蘿卜)
北京樂駕科技有限公司于2015年7月1日正式發布了全球首個基于語音與手勢操控的“車蘿卜”(Carrobot)HUD智能車載機器人。成立于2015年1月的樂駕科技,憑借在語音技術方面(思必馳)的積累和優勢,樂駕成立之初就定位于將打造一個基于語音操控和人機對話技術的人車交互平臺。
其基于機器視覺的疲勞駕駛與視線偏離檢測技術應用,通過在產品前置的攝像頭,不僅可以完成手勢識別的應用,還可以實現基于機器視覺的疲勞駕駛與視線偏離檢測,主要包括三部分:檢測人臉檢測技術、臉部特征定位技術和疲勞檢測技術。
評論
查看更多