隨著智能駕駛和自動駕駛等應用越發火熱,汽車AI芯片市場在最近幾年進入了高速發展期。無論是NXP和瑞薩這樣的傳統汽車芯片廠,還是如英偉達和英特爾這樣的消費芯片大廠,甚至是FPGA龍頭Xilinx,都對這個市場虎視眈眈。此外,國內外也有一大波初創芯片企業涌入這個市場。 Imagination作為全球半導體IP大廠,已推出多代AI加速產品,獲得了良好的市場反響,可以為汽車芯片廠商打造高性能車用AI芯片提供強有力的支持。日前,Imagination發布其最新一代IMG Series4神經網絡加速器(NNA)產品,該公司視覺和人工智能部門高級總監Andrew Grant在接受媒體采訪時指出:“雖然目前市場上已經有能滿足自動駕駛需求的AI芯片,但功耗不夠理想。所以,我們花兩年時間去了解和評估客戶需求,推出了高性能低功耗的4系列NNA產品,并且將自動駕駛作為主打市場”。
Andrew Grant還介紹道,IMG Series4 NNA采用了全新的多核架構,能提供高達600 TOPS的算力,從而為ADAS和自動駕駛等應用提供高效支持。Imagination之所以能提供性能如此強悍的產品,得益于公司多年來在IP領域的深厚積累。
IP專家的步步為“贏”
在談及Imagination的時候,大家首先想到的就是他們在手機GPU IP市場的影響力。
從Imagination提供的數據也可以看到,他們在移動GPU IP市場的份額已經達到35.5%,這幫助他們超越Arm Mali系列和高通Adreno系列,登上移動GPU IP龍頭的位置。除了移動GPU以外,Imagination在車載GPU IP市場也幾乎拿下了半壁江山。數據顯示,他們在這個市場的占有率高達43%。
此外,Imagination在近來熱門的AI 市場也布局多年。據介紹,Imagination在過去七年里持續加大對AI研發的投入,公司迄今已擁有超過80項針對AI領域的專利,并推出了一系列神經網絡加速器IP產品。 這系列IP是一個從0開始設計的完整、獨立式的硬件IP神經網絡加速器,可以同時支持CNN、RNN、LSTM三種神經網絡類型,并且可支持caff、caffe2、Google TensorFlow等通用機器學習體系架構,還支持可適用于移動端的TensorFlow Lite、caffe2go等機器學習體系架構。再加上這系列內核可在最小的硅面積上以非常低的功耗實現高性能的神經網絡計算,因此自面世以來獲得了客戶的高度認可。Imagination在過去幾年里也在快速迭代該系列IP。
2017年9月,Imagination發布了旗下首款神經網絡加速器PowerVR Series 2NX NNA,其單核性能僅覆蓋1 TOPS到4.1 TOPS的范圍;而到了2018年推出的第二代PowerVR 3NX,單核性能不但覆蓋了0.6 TOPS到10 TOPS,其多核產品性能更是能做到20 TOPS到160 TOPS,可以滿足從L2級到L5級自動駕駛的邊緣推理需求。 而文章開頭談到的IMG Series 4NNA則是Imagination推出的第三代NNA。 Andrew Grant表示,這款公司歷時兩年打造出來的產品不但在性能上獲得大幅度提升,還擁有靈活的多核設計、創新性的Tensor Tiling( Imagination’s Tensor Tiling,ITT)技術、低功耗和滿足車規級安全需求等多項優勢,從而能為領先的汽車行業顛覆者、一級供應商、整車廠(OEM)和汽車系統級芯片(SoC)廠商提供強大助力。
IMGSeries4 NNA 的強勢出擊
根據Andrew Grant的觀點,當前的車載AI芯片擁有三方面的需求,分別是超強性能、超低功耗和超低延遲。當然,作為汽車級別的芯片,安全也是必不可少的,這就是IMG Series 4 NNA的設計指導。
從官方提供的資料我們可以看到,Series4具有以下特性: 首先是多核擴展性和靈活性方面,據Imagination介紹,其多核架構支持在多個核之間對工作負載進行靈活的分配和同步。Imagination的軟件提供了精細的控制能力,并通過對多個工作負載進行批處理、拆分和調度而提高了靈活性,現在可以在任意數量的內核上使用。Series4可為每個集群配置 2個、4個、6個或者8個核。
其次是性能。據介紹,Series4的每個單核能夠以不到一瓦的功耗提供12.5 TOPS的性能。舉例來說,一個8核集群在5nm工藝的加持下,可以提供100 TOPS的算力。那就代表著配有6個8核集群的解決方案可以提供600 TOPS的算力。來到AI推理方面,Series4 NNA的性能比嵌入式GPU快20倍以上,與嵌入式CPU相比,更是快了1000倍。
第三,超低延遲也是這一代NNA IP的另一個特性。據了解,通過將多個單核組成2核、4核、6核或8核的多核集群,所有內核可以相互協作,并行處理一個任務。這就降低了處理延遲,縮短響應時間。數據顯示,對于一個8核集群,理想情況下延遲會減少為單核獨立執行時的1/8。節省大量帶寬則是Imagination新NNA的另一大優勢,這主要得益于公司正在申請專利的的Tensor Tiling技術(Imagination’s Tensor Tiling,ITT),這也是Series4中新增的功能。據介紹,借助這項技術,Imagination的Series4可以通過對計算任務進行tiling,充分利用片上存儲,提升數據處理效率,并節省訪問外部存儲的帶寬。
在具體操作中,針對不同的任務,有不同的操作方式。據了解,在批處理大量的小型任務時,Tensor Tiling能夠把批處理任務分配到各個NNA單核,讓每個NNA單核獨立工作,提升并行處理的能力;而在面對一些大型網絡的時候,Tensor Tiling則可以從多個維度拆分任務,讓所有NNA單核共同執行一個推理任務。這不但減少了網絡推理的延遲,在理想情況下,協同并行處理的吞吐量與獨立并發處理也是相同的。 值得一提的是,這里的拆分都是通過Imagination的編譯器來完成的,不需要開發者手動操作,借助NNA的性能分析工具,開發者還能對AI任務進行更好的調度和分配。
另外,因為利用本地數據的依賴性將中間數據保存在片上存儲器中,ITT可以最大限度地減少將數據傳輸至外部存儲器,從而將帶寬降低多達90%。作為一種可擴展的算法,ITT在擁有大量輸入數據的網絡上具有顯著優勢。車規級安全性則是Series4不得不提的另一個優勢。眾所周知,汽車芯片對安全提出了更高的要求。Imagination為其全新的NNA引入了IP級別的安全功能,且產品的設計流程符合ISO 26262標準,這就能幫助客戶更容易獲得ISO 26262認證。據報道,Series4可以在不影響性能的情況下,安全地進行神經網絡推理。硬件安全機制可以保護編譯后的網絡、網絡的執行和數據處理管道。
在IMG Series4 NNA的發布會上,Andrew Grant除了介紹新IP的硬件性能外,也同時講述公司圍繞這系列芯片打造的軟件生態系統,這與硬件配合,加速了開發者的開發速度,簡化了開發流程。而為了給汽車運算提供更多的算力支持,Imagination還打通了NNA多核平臺與GPU協同,給開發者提供更多的選擇。
Andrew Grant在發布會上表示,公司的IMG Series4 NNA已經開始向客戶提供授權,產品也將于2020年12月在市場上全面供應。 ABI Research智慧出行和汽車首席分析師James Hodgson說道:“在從L2和L3級ADAS向L4和L5級全自動駕駛演進的過程中,神經網絡的廣泛應用將是至關重要的因素。這些系統將要處理數以百計的復雜場景,從多個攝像頭和激光雷達等大量傳感器中提取數據,從而實現自動代客泊車、十字路口管理和復雜城市環境安全導航等解決方案。高性能、低延遲和高能效的結合將是實現高度自動駕駛的關鍵所在?!?由此可見,一個全新的大門正在面向Imagination開啟。
責任編輯:lq
-
傳感器
+關注
關注
2552文章
51302瀏覽量
755229 -
imagination
+關注
關注
1文章
574瀏覽量
61380 -
AI芯片
+關注
關注
17文章
1899瀏覽量
35129
原文標題:推出600 Tops產品,Imagination持續發力汽車AI芯片市場
文章出處:【微信號:Imgtec,微信公眾號:Imagination Tech】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論