昨天,深耕人工智能加速器領域的 Imagination Technologies帶來了一款瞄準ADAS的神器----多核IMG Series4 NNA,號稱為ADAS而生的終極AI加速器!其多核算力可以高達600 TOPS!而且,它不止可以應用在ADAS領域還可以應用到更多領域!牛!
“汽車行業正處于變革的風口浪尖,自動駕駛汽車和自動駕駛出租車等新的應用場景對人工智能(AI)的性能水平提出了更高的要求,它們需要高的算力,為此,Imagination已經與汽車行業和其他重視功能安全的行業中的領先企業和創新者展開了合作。Series4剛一推出就獲得了業界的認可,已經有多家公司授權該IP?!盜magination Technologies產品管理部門總監Gilberto Rodriguez在發布會上指出,“Series4 NNA擁有全新的多核架構,可提供600 TOPS(每秒萬億次操作)甚至更高的超高性能,并且可為大型神經網絡工作負載提供低帶寬和極低的延遲?!?/p>
對于汽車自動駕駛,要實現更高級的功能必須有強大的算力做保障,ABI Research智慧出行和汽車首席分析師James Hodgson表示預計到2027年左右,對ADAS的需求將增長兩倍,但汽車從L2和L3級ADAS向L4和L5級全自動駕駛演進的過程中,神經網絡的廣泛應用將是至關重要的因素。這些系統將要處理數以百計的復雜場景,從多個攝像頭和激光雷達等大量傳感器中提取數據,從多個攝像頭和激光雷達等大量傳感器中提取數據,從而實現自動代客泊車、十字路口管理和復雜城市環境安全導航等解決方案。而高性能、低延遲和高能效的結合將是實現高度自動駕駛的關鍵所在。 據Gilberto 介紹,Imagination自從2017年在業界率先推出NNA神經網絡加速器以后,至今已經是第三代產品,第一代第二代瞄準安防、消費電子等領域,已經獲得很多公司的采用,對于NNA的未來規劃,Imagination一直在考慮如何可以執行完整的網絡推理的同時滿足功能安全要求。Series4 NNA針對明確的場景需求,在內核架構上做了突破,從而大幅度提升了AI處理能效,為了這些突破,公司在Series3 NNA推出2年后才推出了4系列NNA。
據介紹,Series4 NNA有良好的可擴展性和靈活性,其多核架構支持在多個內核之間對工作負載進行靈活的分配和同步。Imagination的軟件提供了精細的控制能力,并通過對多個工作負載進行批處理、拆分和調度而提高了靈活性,現在可以在任意數量的內核上使用。Series4可為每個集群配置 2個、4個、6個或者8個內核。
Series4的每個單核能夠以不到一瓦的功耗提供12.5 TOPS的性能。舉例來說,一個8內核集群可以提供100 TOPS的算力,那么,配有6個8核集群的解決方案就可以提供600 TOPS的算力。在AI推理方面,Series4 NNA的性能比嵌入式GPU快20倍以上,比嵌入式CPU快1000倍。
延遲是AI運算最關鍵的指標之一,Imagination通過將多個單核組成2核、4核、6核或8核的多核集群,所有內核可以相互協作,并行處理一個任務,降低處理延遲,縮短響應時間。例如,對于一個8核集群,理想情況下延遲會減少為單核獨立執行時的1/8。 節省帶寬的專利技術 在進行人工智能計算中,帶寬是一個重要指標,如果能節省帶寬,則可以大幅度地提升能效,此外,據介紹,Imagination在4系列NNA使用了一個專利的技術--Tensor Tiling技術(Imagination’s Tensor Tiling,ITT),可以將帶寬使用減少90%!
Gilberto解釋說,在人工智能計算中,各層以融合內核的形式運行在加速器的硬件流水線里,融合內核之間的特征圖需要通過外部存儲進行交換,使用緊耦合的SRAM可以提升效率,通過tiling技術,充分利用緊耦合的SRAM來融合更多的層,更多的層被融合后,減少了需要通過外部存儲交換的特征圖。 這樣,通過對計算任務進行tiling,充分利用片上存儲,提升數據處理效率,并節省訪問外部存儲的帶寬。ITT利用本地數據的依賴性將中間數據保存在片上存儲器中,這樣可以最大限度地減少將數據傳輸至外部存儲器,從而將帶寬降低多達90%。ITT是一種可擴展的算法,在擁有大量輸入數據的網絡上具有顯著優勢。 他舉例說明,這是沒有使用ITT的ResNetv2-50運算過程
這是使用了ITT的ResNetv2-50運算過程
此外,他指出Series4NNA在處理任務上也有很強的靈活性,任務可以在多個維度被拆分,例如所有NNA單核可以運行不同的工作負載,如下圖core 0 可以執行A任務,core 1可以執行B任務,core 2可以執行C任務,core 3可以執行D任務,也可以組合為一起共同執行一個任務,或者為特定任務保留一個或一組單核。還可以在運行時動態分配,總之靈活性非常強。
可以按照場景需要實現延遲和吞吐量之間的平衡。
此外, Series4 NNA還可以和 Imagination 的GPU實現協同,進行更靈活的組合。
發力汽車ADAS
“Imagination和汽車領域的芯片廠商如TI、瑞薩等都有很好的長期合作,也了解芯片廠商以及一些造車新勢力的需求?!盜magination Technologies人工智能業務高級總監Andrew Grant表示:“我們相信Series4 NNA將成為開發先進駕駛輔助系統和自動駕駛汽車的行業標準平臺。一些創新者已經在著手打造支持下一代ADAS功能和自動駕駛汽車的芯片。任何希望在汽車領域扮演重要角色的公司或研發團隊是時候將這項技術集成至他們的平臺中了?!?/p>
據他介紹,Series4包含IP級別的安全功能且設計流程符合ISO 26262標準,可以幫助客戶獲得ISO 26262認證。ISO 26262是旨在解決汽車電子產品風險的行業安全標準。Series4可以在不影響性能的情況下,安全地進行神經網絡推理。硬件安全機制可以保護編譯后的網絡、網絡的執行和數據處理管道。 他表示Series4 NNA是以軟核的RTL代碼形式提供給客戶的,Imagination的軟件工具可以輕松幫助客戶導入設計。
Imagination Technologies中國區戰略市場與生態高級總監時昕博士表示中國車廠和一些造車新勢力在推進汽車智能駕駛方面力度很大,Imagination愿意以最新的技術和高性價比的IP幫助產業健康良性發展。
責任編輯:lq
-
加速器
+關注
關注
2文章
804瀏覽量
37980 -
AI
+關注
關注
87文章
31325瀏覽量
269671 -
adas
+關注
關注
309文章
2189瀏覽量
208753
原文標題:瞄準ADAS,算力突破600T!這顆AI加速器IP牛!
文章出處:【微信號:Open_FPGA,微信公眾號:OpenFPGA】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論