作者:Kenton Williston
人工智能 (AI)、機器學習 (ML) 和其他計算密集型工作負載在物聯(lián)網(wǎng)(IoT) 網(wǎng)絡邊緣的興起,給微控制器 (MCU) 帶來了額外的處理負載。處理這些新的工作負載會增加功耗,盡管要求設計人員盡量降低功耗并加快產(chǎn)品上市時間。
設計人員需要一個計算選項,既能保持 MCU 的效率,又能增加專為低功耗應用定制的高性能功能。這一選項還應保留與傳統(tǒng) MCU 相關的簡單部署模式,同時增加足夠的功能,以支持 AI 和 ML 帶來的復雜應用,如語音控制和預見性維護。
本文討論了推動 AI 和 ML 需求的因素,解釋了為什么需要新型處理器架構(gòu)來高效地實現(xiàn)這些功能。然后介紹 Renesas 的 RA8M1 系列 MCU,并說明如何利用其來滿足這些要求。
邊緣 AI 和 ML 的要求
從樓宇自動化、工業(yè)設備到家用電器,邊緣物聯(lián)網(wǎng)應用對 AI 和 ML 的需求與日俱增。現(xiàn)在,即使是相對較小、功耗較低的嵌入式系統(tǒng),也要承擔關鍵詞識別、語音命令控制和音頻/圖像處理等工作任務。目標應用包括傳感器中樞、無人機導航和控制、增強現(xiàn)實 (AR)、虛擬現(xiàn)實 (VR) 和通信設備。
為了最大限度地減少能耗、開銷和延遲,同時確保隱私,在邊緣處理數(shù)據(jù)通常比將數(shù)據(jù)發(fā)送到云更可行。這對設計人員來說具有挑戰(zhàn)性,因為邊緣設備往往資源有限,特別是在采用電池供電的情況下。
用于邊緣計算的增強型 MCU
AI 和 ML 工作負載通常包含在大型數(shù)據(jù)集中重復執(zhí)行相同的數(shù)學運算。這些工作負載適合使用單指令、多數(shù)據(jù) (SIMD) 處理進行加速。SIMD 可并行執(zhí)行多個數(shù)學運算,與傳統(tǒng)處理方式相比,吞吐量更多,能效更高。
由于傳統(tǒng) MCU 缺乏 SIMD 功能,因此無法獨立執(zhí)行 AI 和 ML 工作負載。一種解決方案是同時使用 MCU 和數(shù)字信號處理器 (DSP) 或其他 SIMD 加速器。然而,這種多處理器方法會使系統(tǒng)設計變得復雜。
另一種方法是使用具有 SIMD 功能且性能更高的微處理器單元 (MPU)。這可以在單處理器設置中提供必要的性能,但 MPU 在功耗和功能集方面需要進行權(quán)衡。例如,并非所有 MPU 都具有面向 MCU 應用所需的確定性、低延遲計算。
在 MCU 中實現(xiàn) AI 和 ML
Renesas 意識到需要一套優(yōu)化型 MCU 來支持 AI 和 ML 工作負載,因此推出了 RA8M1 系列 MCU(圖 1)。該系列基于帶有 Helium 和 TrustZone 的 Arm?Cortex?-M85 架構(gòu),其運行頻率為 480 MHz,典型功耗為 225μA/MHz。
圖 1:Renesas 的 RA8M1 MCU 基于 Arm Cortex-M85,包含可加速 AI 和 ML 處理功能的 Helium 技術(shù)。(圖片來源:Renesas)
RA8M1 MCU 專為實現(xiàn)高效性能和低功耗而設計,具有確定性、中斷時間短和最先進的電源管理支持等特性。該處理器的性能效率達到每兆赫 6.39 CoreMark (CoreMark/MHz)。
Helium 是一種 SIMD M-Profile 矢量擴展 (MVE),可顯著加快信號處理和 ML 的速度。它增加了 150 條標量和矢量指令,可處理 128 位寄存器(圖 2)。它針對資源有限、功耗較低的微控制器進行了優(yōu)化。例如,Helium 重新使用浮點單元 (FPU) 寄存器,而不是引入新的 SIMD 寄存器。這有助于降低處理器功耗,減少設計復雜性。
圖 2:Helium 重新利用 FPU 寄存器組進行矢量處理。(圖片來源:Image source: Arm)
如圖 3 所示,RA8M1 的 Cortex-M85 包含了 Arm 的 TrustZone 技術(shù)。TrustZone 為關鍵固件、資產(chǎn)和私人信息提供硬件隔離。Cortex-M85 還增加了新的安全保障功能,如指針驗證和分支目標識別 (PACBTI) 擴展。在 AI 環(huán)境下,設備可能會與個人數(shù)據(jù)進行交互,因此這些安全功能尤為重要。
圖 3:Cortex-M85 的 TrustZone 為關鍵固件、資產(chǎn)和私人信息提供硬件隔離。(圖片來源:Image source: Arm)
具備 AI 功能的 MCU 應具備的硬件特性
MCU 應將高效性與強大的功能集相結(jié)合,以支持人工智能應用。RA8M1 可用于電機控制、可編程邏輯控制 (PLC)、計量以及其他工業(yè)和物聯(lián)網(wǎng)應用。
例如,人工智能算法需要大量存儲器。RA8M1 系統(tǒng)存儲器包括高達 2 MB 的閃存和 1 MB 的 SRAM。SRAM 包括 128 KB 的緊耦合內(nèi)存 (TCM),可實現(xiàn)高性能計算的快速存儲訪問。
為確保可靠運行,384 KB 的用戶 SRAM 和整個 128 KB 的 TCM 均配置為糾錯碼 (ECC) 存儲器。32 KB 指令和數(shù)據(jù)高速緩存也受 ECC 保護。
RA8M1 除包含 Arm 內(nèi)核的功能外,還集成了多種安全功能。其中包括用于安全數(shù)據(jù)處理的可重復編程安全知識產(chǎn)權(quán) (RSIP) 加密引擎、用于關鍵數(shù)據(jù)保護的不可變存儲以及篡改保護機制。
在通信接口方面,MCU 配備了用于網(wǎng)絡連接的以太網(wǎng)、用于汽車和工業(yè)應用的控制器區(qū)域網(wǎng)靈活數(shù)據(jù)速率 (CAN FD) 以及用于通用連接的USB高速/全速接口。該器件還集成了攝像頭接口和八進制串行外設接口 (SPI),可為外部存儲器進行即時解密。
模擬接口包括 12 位模數(shù)轉(zhuǎn)換器 (ADC) 和數(shù)模轉(zhuǎn)換器 (DAC)、高速模擬比較器以及三個采樣和保持電路。RA8M1 支持多種串行通信協(xié)議,包括帶 SPI 的串行通信接口 (SCI)、通用異步接收器/發(fā)射器 (UART) 和內(nèi)部集成電路間 (I2C) 模式。該 MCU 還提供改進型內(nèi)部集成電路 (I3C),以提高數(shù)據(jù)傳輸速率和效率。
對于需要全面訪問這些輸入/輸出 (I/O) 功能的開發(fā)人員,可使用像 224 引腳 R7FA8M1AHECBD#UC0 這樣的球柵陣列 (BGA) 封裝。那些希望印刷電路板(PC 板)設計和組裝流程更加簡化的用戶,可考慮選用外形扁平的扁平封裝 (LQFP),如 144 引腳 R7FA8M1AHECFB#AA0。
AI 應用的開發(fā)環(huán)境
對 RA8M1 系列感興趣的設計人員可以從 EK-RA8M1 R7FA8M 評估板開始(圖 4)。該評估板包括一個 RJ45 RMII 以太網(wǎng)接口、一個 USB 高速主機和設備接口以及一個三針 CAN FD 插座。在內(nèi)存方面,該評估板配備 64 MB 的八進制 SPI 存儲器。
圖 4:EK-RA8M1 評估板具有強大的 I/O 支持功能,可用于 RA8M1 MCU。(圖片來源:Renesas)
RA8M1 由 Renesas Flexible Software Package (FSP) 提供支持,F(xiàn)SP 是一種綜合框架,旨在為嵌入式系統(tǒng)設計提供可擴展、高質(zhì)量的用戶友好型軟件基礎。
該軟件包提供開發(fā)工具,包括基于流行的 Eclipse IDE 的 e2 studio 集成開發(fā)環(huán)境 (IDE)。該軟件包還包含兩個著名的免費實時操作系統(tǒng):Azure RTOS 和 FreeRTOS。
該軟件包包括了支持嵌入式系統(tǒng)常見用例的輕型生產(chǎn)就緒型驅(qū)動程序。這些驅(qū)動程序與評估板相結(jié)合,成為開發(fā)人員使用 RA8M1 I/O 進行實驗的捷徑。
結(jié)語
RA8M1 為開發(fā)人員在邊緣物聯(lián)網(wǎng)應用中實施 AI 和 ML 工作負載提供了新的選擇,它可以節(jié)省功耗、提高性能、降低復雜性并縮短上市時間。
審核編輯 黃宇
-
AI
+關注
關注
87文章
30887瀏覽量
269068 -
Renesas
+關注
關注
0文章
1757瀏覽量
22754 -
ML
+關注
關注
0文章
149瀏覽量
34656
發(fā)布評論請先 登錄
相關推薦
評論