“自動駕駛所需要的計算力,是過去任何一臺計算機都沒有達到過的。” NVIDIA的掌門人黃仁勛曾在公開場合不止一次的說過這句話。
這句話背后,還有另一層意思。2010年之后,GPU類處理器內部的晶體管數量還保持著快速增長的勢頭,而CPU已經出現了明顯的放緩。
“摩爾定律已經終結,晶體管數每年增長50%,但CPU的性能每年僅增長10%,設計人員無法再創造出可以實現更高指令級并行性的CPU架構。”在2017年的GTC China上,NVIDIA的掌門人黃仁勛如是說。
NVIDIA是一家研發生產GPU的公司,對GPU自然有區別于他人的崇拜,捧GPU貶CPU可以理解。但,摩爾定律確實失效了。
NVIDIA是一家傳統消費電子廠商,但在汽車領域也不是完全的新手。早在2005年,NVIDIA就開發了用于3D導航信息系統的Tegra處理器,2011年用在了奧迪A8豪華車型上。
到目前為止,NVIDIA的汽車電子業務占該公司47億美元銷售額的4%。2015年,NVIDIA發布了針對自動駕駛的DRIVE PX系列,開啟了自動駕駛領域的馳騁,一時也成為了市場寵兒,股價扶搖直上。
支撐起這一切的,是NVIDIAGPU給自動駕駛帶來的想象——DRIVE PX運算力強大,是自動駕駛必備的運算力平臺。這正應驗了黃教主開頭所說的話,此話不僅被競爭對手英特爾聽了去,同時也被股民聽了去。
那么,自動駕駛到底需耗費多少算力?誰是算力的最大消耗者?GPU碾壓CPU,NVIDIA超車英特爾已成定局?
視覺處理是大頭
自動駕駛的實現,需要依賴感知傳感器對道路環境的信息進行采集,包括超聲波、攝像頭、毫米波雷達、激光雷達等,采集的好的數據需要傳送到汽車中央處理器進行處理,用來識別障礙物、可行道路等,最后依據識別的結果,規劃路徑、制定速度,自動驅使汽車行駛。
整個過程需要在瞬時完成,延時必須要控制在毫秒甚至微秒級別,才能保證自動駕駛的行駛安全。
要完成瞬時處理、反饋、決策規劃、執行的效果,對中央處理器的算力要求非常高。
最直觀的體現,便是用于感知道路環境的攝像頭,通常密布車身,數量在12個左右,為了識別障礙物,處理器需要對多路攝像頭實時拍攝的數據進行解析,而單顆1080P的高清攝像頭每秒可以產生超過1G的數據,數據量不可謂不大。而為了準確識別圖像、視頻中的有效信息,業內多采用深度學習神經網絡。
深度學習神經網絡尤其是幾百上千層的神經網絡對高性能計算要求非常高,GPU對處理復雜運算擁有天然的優勢:它有出色的并行矩陣計算能力,對于神經網絡的訓練和分類都可以提供顯著的加速效果。
適用于自動巡航功能的 NVIDIA DRIVE PX 2 計算平臺采用新型單處理器配置,功率僅為 10 瓦,可以幫助車輛利用深度神經網絡處理來自多個攝像頭和傳感器的數據,運算力達到了24 Tops。
Tops(Terra Operations per second)是一個單位,意為每秒運算10^12次,也稱萬億次。這種說法通常用于表示處理器的運算力。
但汽車是一個終端,對功耗要求苛刻,因此根據TI的官方報告,通常對效率、功耗、算力要求較高的時候,對運算力的表述更為貼切的是GOPS/W of TOPS/W,即消耗單位瓦數可以完成多少運算量。
業內人士表示,在自動駕駛中,最耗費算力的當屬視覺處理,占到全部算力需求的一半以上。而圖像處理是GPU的強項,CPU并不占優勢,這一點已經在傳統領域得到了驗證。
Mobileye的ADAS霸業
那么視覺處理中,不同等級自動駕駛中對算力的要求有什么區別?每一家公司在權衡之后,選擇特定的視覺芯片方案有什么原因?Minieye的CEO劉國清在面對《高工智能汽車》的提問時表示,這是一個業內人士都知但不為外人道的話題。
嗯,聽起來很神秘,但想要找到答案其實也并不難。
Mobileye是自動駕駛領域視覺處理最領先的公司(這是基于其市場占有率以及車載領域的經驗而言)。
從2004年開始,Mobileye相繼推出了EyeQ系列的視覺處理芯片,2010年上市的EyeQ2算力為 0.026Tops,功耗2.5w,支持L1的功能;2014年發布的EyeQ3每秒浮點運算為0.256萬億次,功耗為2.5w,支持L2;2015年發布EyeQ4每秒浮點運算可達2.5萬億次,功耗為3w,最高可支持L3;EyeQ5計劃于2020年量產,單顆芯片的浮點運算能力為12Tops,TDP是5W。
Mobileye通過EyeQ芯片,驅動單顆攝像頭,可以采集路面信息,對周圍環境進行精細解讀,實現前碰撞預警(FCW)、前方車距監測與預警系統(HMW)、車道偏離預警系統(LDW)、行人探測與防撞系統(PCW)、城市前碰撞警告 (UUFCW 與智能遠光燈控制系統(IHC)等功能,準確預測前方道路可以出現的障礙和危險。
其識別準確率達99.99%,到目前為止,已有超過千萬的出貨量,占市場份額超過70%。特斯拉的AutoPilot 1.0的硬件方案就選用了Mobileye的EyeQ3。
Mobileye通過使用專有的計算cores(加速器)實現功耗 - 性能成本目標,這些cores專門針對各種計算機視覺,信號處理和機器學習任務進行了優化,其中包括深度神經網絡。
這些加速器內核專為滿足ADAS和自動駕駛市場的需求而設計。每個EyeQ ?芯片具有異質的,完全可編程的加速器; 每種加速器類型都針對其自己的算法系列進行了優化。
加速器體系結構的多樣性使應用程序能夠通過為每項任務使用最合適的內核來節省計算時間和芯片功耗。優化任務cores的分配從而保證了EyeQ ? 在低功耗范圍內提供“超級計算機”功能,實現高性價比的被動散熱。
Mobileye的core是包含一組工作在1GHZ的工業級四核MIPS處理器,支持多線程技術能更好的進行數據的控制和管理; 多個專用的向量微碼處理器(VMP(Vector Microcode Processor,俗稱VMP)),用來應對ADAS相關的圖像處理任務(如:縮放和預處理、翹曲、跟蹤、車道標記檢測、道路幾何檢測、濾波和直方圖等);一顆軍工級MIPS Warrior CPU位于次級傳輸管理中心,用于處理片內片外的通用數據。
自動駕駛算力之爭,NVIDIA領銜
Autopilot 2.0 使用了Drive PX2,DRIVE PX 2有多個版本,AutoCruise,搭載一顆Tegra Parker,主要支持高速公路自動駕駛和高精地圖繪制的計算;AutoChauffeur,搭載2顆Tegra Parker和2顆獨立的Pascal架構GPU,支持點到點的自動駕駛;Fully Autonomous Driving,由多套Drive PX2組成的計算矩陣。
NVIDIA2015年推出了Drive PX系列,第一代Drive PX搭載TegraX1處理器和10GB內存,能夠同時處理12個200萬像素攝像頭每秒60幀的拍攝圖像,單浮點計算能力為2Tops,深度學習計算能力為2.3Tops,可支持L2高級輔助駕駛計算需求。
2016年發布的Drive PX2,單精度計算能力達到8TFlops,深度學習計算能力達24Tops,TDP達250W,可滿足L3級別的自動駕駛需求。
Drive PX2采用16nm FinFET工藝,TDP 250W,支持12路攝像頭輸入、激光定位、雷達和超聲波傳感器。
它的目的是通過NVIDIA DIGITS打造一套車輛的深度學習訓練平臺,讓每輛安裝Drive PX2的車輛都成為都成為NVIDIA DRIVENet深度神經網絡一部分,它將包括3個卷積碼層,3700萬個神經元。傳說如果一條信息要在整個網絡流經一次,將會產生400億次操作。
根據黃仁勛在BCW 2017的表述,Drive PX2的方案是針對L3的方案(作為參考的是奧迪A8推出的有限場景下的L3級自動駕駛,采用的ZF ProAI正是使用了NVIDIA Tegra K1 SoC,及Drive PX2 AutoCruise版本,當然負責視覺處理的還是Mobileye的EyeQ3),而Xavier則是針對L4的方案,Xavier的運算力達到了1Tops/W。Drive Xavier于2018年發布,算力可達30Tops,TDP為30W。
到目前為止,黃教主給L3、L4級別的自動駕駛算力,列出了自己心目中的標準。這一標準由于標新立異,還未有人敢質疑。
自動駕駛公司在進行新項目的研發時,也往往以NVIDIA的開發板為首。傳統的芯片巨頭英特爾,在巨資收購Mobileye后,心里還不踏實,因為Mobileye一直針對的是ADAS,其量產的EyeQ3芯片0.256Tops的算力,跟NVIDIA PX2的8/24Tops相比,似乎差了一個時代。
算力的焦慮在困擾著Inter這個巨頭,自動駕駛公司同樣也不輕松,開發中可以使用NVIDIA打底,量產方案卻少有人嘗鮮。
這一方面是源于價高非車規級,另一方面NVIDIA也需要汽車市場的驗證。另一頭Mobileye的EyeQ系列,基本為自用,不放心外人擅自開發,NVIDIA和Mobileye的分手據傳也緣起于此。
那么,留給自動駕駛公司的芯片方案,還有哪些呢?市場應聲者寥寥無幾,NXP、高通、英飛凌等公司,推出的都是針對較低自動駕駛等級的ADAS芯片方案,目前一些有量產項目的ADAS公司,采用的也多是這些傳統車載芯片領域廠商的產品。這些廠商之間的方案有什么異同?留待下一篇文章再述吧~
-
神經網絡
+關注
關注
42文章
4773瀏覽量
100890 -
NVIDIA
+關注
關注
14文章
5013瀏覽量
103245 -
自動駕駛
+關注
關注
784文章
13856瀏覽量
166590
原文標題:自動駕駛的算力之爭,誰在孤獨求敗? | GGAI視角
文章出處:【微信號:ilove-ev,微信公眾號:高工智能汽車】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論