下一代 ADAS 和自動駕駛 (AD) 系統部署到市場后,將需要準確、高速的識別、判斷和操作。卷積神經網絡 (CNN) 需要大量計算來進行模式識別。隨著安裝的傳感器數量的增加,需要更高的 CNN 性能。然而,隨著功耗與性能成正比增加,需要一個笨重且昂貴的水冷系統。需要同時實現高深度學習性能和低功耗,以實現輕量級且具有成本效益的空氣冷卻系統。從實際的角度來看,實現 60TOPS 的 CNN 性能和 10TOPS/W 的效率是每個 LSI 設備的最佳目標。
具有高性能和高能效的 CNN 加速器
CNN 加速器 (CNNA) 的性能/效率目標是實現 60TOPS 性能和 10TOPS/W 效率。從實現的角度來看,它是用三個相同的加速器而不是一個加速器來實現的。一個CNNA包含13,824個MAC算術單元,工作頻率為800MHz。三個CNNA的理論最大性能為66TOPS。此外,每個 CNNA 通過一個 512 位互連模塊連接 2MB 專用暫存器 (SPM)。這提高了CNNA的執行效率,將CNNA與外部存儲器(DRAM)之間傳輸的數據量減少了約90%,并節省了DRAM接口和互連所消耗的功率。從測試芯片的實測來看,VGG16的性能為32TOPS,效率為6.1TOPS/W,CNNA優化網絡(Network-A)的性能為60.6TOPS,效率為13。
ASIL D 任務的安全機制
下一代 ADAS 和 AD 系統需要實現 ASIL D 的功能安全,這是 ISO 26262 中最嚴格的安全級別。雙核鎖步 (DCLS) 是可以滿足 ASIL D 指標的方法之一。可以通過在兩個冗余硬件上執行相同的過程并比較它們各自的輸出來檢測。
CNNA 還需要硬件冗余來滿足 ASIL D 指標,但簡單地應用 DCLS 需要大型 MAC 計算單元來實現冗余。這是不實用的,因為面積和功耗顯著增加。為了在不添加冗余硬件的情況下實現 ASIL D 指標,兩個 CNNA(CNNA1 和 CNNA2)由軟件動態配置,以在需要安全的處理過程中執行鎖步操作。
CNNA 用于從相機輸入的圖像識別處理 (ASIL B) 和從每個傳感器輸入的結果 (ASIL D) 對周圍環境進行建模。但大部分執行時間是以前的 ASIL B 圖像識別處理。因此,通過僅在周圍環境建模處理期間將 CNNA1 和 CNNA2 切換為鎖步操作,可以在不顯著影響性能或功率效率的情況下實現 ASIL D 任務。
下面是CNNA使用鎖步DMAC(LDMAC)的鎖步操作。
1) LDMAC 將相同的數據從 DRAM 加載到 SPM1 和 SPM2。
2)CNNA1和CNNA2執行相同的網絡處理。
3) LDMAC 從 SPM1 和 SPM2 讀取執行結果并進行比較。如果它們不匹配,則判斷為錯誤。只有CNNA1的結果存儲在DRAM中。
實現 ASIL D 的另一個重要因素是免于干擾 (FFI)。系統中混合了具有不同 ASIL 的任務。他們不得干擾更高級別的 ASIL 任務。前面說過,CNNA是被不同ASIL級別的任務訪問的,所以每個任務使用的內存空間必須是獨立的。
內存空間隔離機制在CNNA、LDMAC和內存管理單元(MMU)的內存保護表中實現。當前運行任務的上下文索引被賦予來自CNNA和LDMAC的事務輸出。MMU 接收它并在逐個事務的基礎上切換上下文。
審核編輯:郭婷
-
DRAM
+關注
關注
40文章
2320瀏覽量
183693 -
adas
+關注
關注
309文章
2189瀏覽量
208751 -
自動駕駛
+關注
關注
784文章
13899瀏覽量
166704
發布評論請先 登錄
相關推薦
評論