2013年初,高通開始進(jìn)軍車載處理器市場,首款產(chǎn)品是2013年底的602A,在2014年初正式推出,不過推出后反應(yīng)平平。車載系統(tǒng)開發(fā)周期遠(yuǎn)比手機(jī)開發(fā)周期長,芯片至少要考慮5年后的市場,高通在2016年初推出820A(兩款芯片,一款為820A,不帶Modem,另一款為820Am,帶Modem),超前性能立刻獲得好評。
捷豹路虎第一個使用820A做座艙域控制器,在2017年下半年就有路虎星脈和捷豹I-PACE兩款量產(chǎn)車使用820A,隨后大眾、本田、吉利、PSA、比亞迪、瑪莎拉蒂也紛紛采用820A做座艙域控制器。本田的10代雅閣美版也采用820A,已正式上市,國內(nèi)則因為1.5T發(fā)動機(jī)機(jī)油增多問題,10代雅閣推遲上市。
上圖為路虎攬勝星脈的座艙,采用4塊屏幕,其中全液晶儀表為12.3英寸,Infotainment為10英寸,車載信息顯示也為10英寸,屏上有兩個碩大的鋁合金旋鈕,還有一塊HUD使用的3.1英寸顯示屏。可能由日本松下或哈曼打造。Infotainment屏幕在啟動后會自動前傾,方便駕駛者觀看。Infotainment屏下方的車載信息顯示屏可以對車輛的空調(diào)、座椅和車輛設(shè)定進(jìn)行控制,除了空調(diào)溫度旋鈕和音量旋鈕,其余都用觸控操作。儀表系統(tǒng)采用QNX,Infotainment用Linux+安卓界面。未來可能用Android Auto。
捷豹的第一款純電動車I-Pace采用了類似星脈的設(shè)計,只是把車載信息顯示屏換成了5.5英寸。這套系統(tǒng)中規(guī)中矩,唯一的出彩之處是激光HUD。捷豹路虎是第一個使用激光HUD的車廠,激光HUD顯示對比度極高,色彩艷麗。
雖然不能算嚴(yán)格意義上的AR HUD,但是已經(jīng)很不錯了,能與ADAS和導(dǎo)航地圖系統(tǒng)通信。
820A相比NXP的i.mx8或者瑞薩的R-CAR H3,亦或者德州儀器的Jacinto EX,優(yōu)勢有幾點:
820A的絕大部分開發(fā)成本已經(jīng)由手機(jī)廠家分?jǐn)偼戤叄谐渥愕慕祪r空間
820本來就是針對移動設(shè)備的,低功耗不言而喻
CPU和GPU性能強(qiáng)大,同時也是特別為安卓系統(tǒng)設(shè)計的
820A最大優(yōu)勢,內(nèi)含了4G Modem,無需再添加通訊模塊
820A的劣勢在于它最初不是針對車載市場的,不是按照ISO26262標(biāo)準(zhǔn)的開發(fā)流程得來的,安全等級連ASIL A級都達(dá)不到,只有AEC-Q100 3級。R-CAR H3是達(dá)到了ASIL B級,i.mx8暫時還未申請ASIL級別,但以NXP的能力,也能達(dá)到ASIL B級。當(dāng)然可以通過添加其他元件讓整體系統(tǒng)達(dá)到ISO 26262標(biāo)準(zhǔn),但畢竟是個麻煩。
和奔馳MBUX相比,820Am做域控制器的座艙并未給人帶來多少驚喜,820Am又多了一個強(qiáng)勁的對手,那就是英偉達(dá)的Parker。Parker一開始就是瞄準(zhǔn)車載市場的,采用ASIL B級安全架構(gòu),內(nèi)含鎖步的R5內(nèi)核,有內(nèi)存糾正功能。Parker的另一優(yōu)勢是深度學(xué)習(xí)能力。820A的硬件也具備深度學(xué)習(xí)能力,但是高通的起步稍微晚了點,高通在2017年7月才發(fā)布了NPE的SDK。所以這方面應(yīng)用還未看到,估計要等到下一代820座艙系統(tǒng)了。未來820域控制器可能接管部分ADAS功能,如360環(huán)視,車道線與行人識別,前撞報警,車道線偏離報警,不過應(yīng)該只用于報警系統(tǒng),不會用于主動執(zhí)行系統(tǒng),畢竟它沒有考慮功能安全,用起來還是讓人略微不放心。
此外深度學(xué)習(xí)這東西,沒有太多理論依據(jù),更多的像蠻力的搜索——非常深的層數(shù),幾千萬甚至上億參數(shù),然后調(diào)整參數(shù)擬合輸入與輸出。這是一個不可解釋的黑盒子,用在汽車以外的手機(jī)上沒什么問題,但汽車領(lǐng)域要有充足的可解釋性,這樣才能評估安全風(fēng)險。不過要想實現(xiàn)語義級的識別,深度學(xué)習(xí)幾乎是最好的方法,盡管汽車行業(yè)不喜歡這種黑盒子,但還是不得不高度重視深度學(xué)習(xí)。
高通的NPE主要在Caffe2和Tensor Flow上運行,Caffe2主要是圖形類,Tensor Flow還可以處理語音類。820內(nèi)部采用異構(gòu)架構(gòu),有三個運算單元,包括CPU、GPU、DSP分別針對不同類型的應(yīng)用。
820內(nèi)部的Hexagon 680 DSP內(nèi)置了一個1024bit的SMID矢量數(shù)據(jù)寄存器,高通稱之為Hexagon Vector Extensions—Hexagon矢量擴(kuò)展,簡寫為HVX。HVX每次可以處理四條VLIW向量指令,每個循環(huán)可以處理多達(dá)4096bit數(shù)據(jù),需要注意的是,一般實際應(yīng)用中的指令比DSP支持的最大指令寬度要小很多,不過借助于SIMD和系統(tǒng)的特性,單個指令可以一次操作多個數(shù)據(jù),因此在計算中很多數(shù)據(jù)可以被一次性填充進(jìn)入處理過程,實現(xiàn)效能的最大化。
另外,HVX為了實現(xiàn)上下文切換功能,還設(shè)計了32個向量寄存器。規(guī)格方面,HVX支持32位的定點十進(jìn)制數(shù)的操作,一般為INT8位,但不支持浮點計算,畢竟成本還是要考慮的。VX內(nèi)部擁有L1數(shù)據(jù)和指令緩存,4個并行的VLIW標(biāo)量處理單元,單元的運行頻率為500MHz,還有共享的L2緩存。
此外,HVX中還有兩組獨立的矢量單元,這樣設(shè)計實際上是為了執(zhí)行多線程任務(wù),比如同時處理音頻和圖像處理,矢量單元可以獨立進(jìn)行計算。ADAS中的視覺處理如360度環(huán)視,車道線識別,也就是量化的8比特數(shù)據(jù)交給DSP比較合適。DSP的能耗比差不多是最優(yōu)秀的。非量化的32比特數(shù)據(jù)交給CPU或GPU處理。
上圖為NPE工作流程
座艙領(lǐng)域的深度學(xué)習(xí)可能會以語音識別或NLP自然語音處理為主要任務(wù),并且是本地化離線與云端結(jié)合的NLP。離線NLP對目前高端CPU或者GPU來說處理能力問題不大,關(guān)鍵是存儲語音庫模型,消耗成本較高,存儲器價格持續(xù)上漲令人頭痛。再有可能就是知識產(chǎn)權(quán)的問題,離線的數(shù)據(jù)包有可能被人破解。
上圖為完整的深度學(xué)習(xí)平臺,可以說深度學(xué)習(xí)就是靠英偉達(dá)的GPU發(fā)展起來的,沒有英偉達(dá)的GPU,深度學(xué)習(xí)不會走到今天這等地步,今天大部分深度學(xué)習(xí)的訓(xùn)練部分加速都是GPU完成的。而英偉達(dá)在一開始就布局長遠(yuǎn),早在2007年推出CUDA的時候,就想到用CUDA建立了類似英特爾的生態(tài)圈。雖然官方發(fā)布的 CUDA Toolkit 并不總是最高效的實現(xiàn),而是存在一定認(rèn)知“黑洞”,一般用戶無論如何優(yōu)化CUDA C程序都無法逾越性能瓶頸。
而官方發(fā)布的庫,從早期的CUBLAS,CUFFT到后來面向深度學(xué)習(xí)的CUDNN,都不是用CUDA C寫的,而是NVIDIA內(nèi)部的編譯器完成的(這個是沒有公開的版本),這樣對NVIDIA好處顯而易見,既能賣硬件,又能在軟件上保持領(lǐng)先,增加用戶粘度。從用戶角度而言,使用高度封裝的庫可以降低開發(fā)、調(diào)試的門檻,直接調(diào)用C API就可以實現(xiàn)自己的算法,無需了解CUDA C的設(shè)計細(xì)節(jié)。即使是谷歌,也是選擇CUDA而不是OpenCL作為TensorFlow的后端。
問題來了,高通的GPU自然不可能用CUDA,只能用OpenCL。CUDA則有強(qiáng)大的生態(tài)體系,尤其是深度學(xué)習(xí)訓(xùn)練領(lǐng)域,遠(yuǎn)比OpenCL易用。OpenCL雖然句法上與CUDA接近,但是它更加強(qiáng)調(diào)底層操作,因此難度較高,但正因為如此,OpenCL才能跨平臺運行。基于C語言的CUDA被包裝成一種容易編寫的代碼,因此即使是不熟悉芯片構(gòu)造的科研人員,也可能利用CUDA工具編寫出實用的程序,程序員更喜歡CUDA。
當(dāng)然OpenCL與CUDA不是嚴(yán)格意義上的競爭關(guān)系,CUDA是一個并行計算的架構(gòu),包含有一個指令集架構(gòu)和相應(yīng)的硬件引擎。OpenCL是一個并行計算的應(yīng)用程序編程接口(API)。CUDA C是一種高級語言,那些對硬件了解不多的非專業(yè)人士也能輕松上手;而OpenCL則是針對硬件的應(yīng)用程序開發(fā)接口,它能給程序員更多對硬件的控制權(quán),相應(yīng)的上手及開發(fā)會比較難一些。所以用高通的GPU做深度學(xué)習(xí),難度頗高,好在高通還有個DSP,雖然這個DSP只能做定點運算,但是還是有點用處的,比如語音處理時消除背景噪音。
英偉達(dá)的Parker在性能方面優(yōu)勢比較明顯,在深度學(xué)習(xí)領(lǐng)域優(yōu)勢更明顯,但是在功耗方面很可能不如高通820Am,雖然高通未給出準(zhǔn)確的TDP數(shù)字,英偉達(dá)也未給出準(zhǔn)確數(shù)值,有說7.5瓦,也有說最高21瓦。TDP這個指標(biāo)已經(jīng)有點過時了,很難準(zhǔn)確評價芯片的功耗,但手機(jī)對功耗要求肯定比車載更加苛刻,尤其是高通810被人投訴發(fā)熱嚴(yán)重,820肯定不會掉以輕心,車載的估計也適當(dāng)降低CPU性能來降低功耗。
中美貿(mào)易爭端的大背景下,高通收購NXP很有可能得不到批準(zhǔn)。未來高通的820A,英偉達(dá)的Paker會對老牌廠家NXP的i.mx8 (i.mx8QM、 i.mx8QP要到2018年3季度才有量產(chǎn)樣片,且還是28納米的FD-SOI工藝),瑞薩的R-CAR H3、德州儀器的Jacinto 6 Plus構(gòu)成強(qiáng)大的威脅。820A可能會擠占i.mx8的中端市場,Parker則可能會主打高端市場,擠壓R-CAR H3的市場。
-
高通
+關(guān)注
關(guān)注
76文章
7487瀏覽量
190816 -
英偉達(dá)
+關(guān)注
關(guān)注
22文章
3800瀏覽量
91374 -
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5508瀏覽量
121305
原文標(biāo)題:高通和英偉達(dá)座艙域控制器之戰(zhàn)
文章出處:【微信號:zuosiqiche,微信公眾號:佐思汽車研究】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論