當為下一代控制應用選擇32位MCU時,必須考慮一點,就是面對某一實際的應用,不同供應商的處理器雖然在數據手冊上看起來或多或少有些相似,但實際上是非常不同的。雖然數據手冊中的規范和Dhrystone(處理器整型數計算能力)MIPS處理能力給出了一個粗略的評估標準,但必須考慮得更深入以保證MCU有足夠的吞吐量和過載余量來滿足當前和未來的應用需求。
運行編譯EEMBC汽車標準代碼的測試結果顯示:看起來類似的三款MCU實際性能差別很大
例如,價格低廉、基于ARM的MCU一般具有很多資源,雖然它們中的許多是基于相同的CPU核,通常是沒有高速緩存的ARM7TDMI處理器,但不同供應商的產品整體性能差別非常大。這主要是由于實現片上存儲子系統、片上總線結構和I/O功能所采用的方法不同。因此,為了確定哪一款處理器最有價值,就必須考察整個處理器子系統。
實時嵌入式應用
當在實時嵌入式應用中使用MCU時,MCU必須對所有操作做出確定性的響應,以保證任務在被分配的時間內完成,響應延遲對于實時系統來說也必須很短。為了達到這個目標,MCU必須具有有效的硬件中斷管理子系統,用于處理優先
權、向量和返回機制。此外,存儲子系統不應該成為處理器的制約,它應該能夠及時的向處理器提供指令和數據,以實現在指令執行流中插入最少的等待狀態。處理器也應該有一個有效的上下文切換機制,來保證當中斷改變指令流時損失的時間最短。內部系統總線應該有確定的響應時間,用于支持對時間要求嚴格的操作。
基于ARM的眾多MCU提供了針對不同系統解決方案的廣泛選擇,這些方案的區別在于時鐘速率、集成外設、高容量閃存和靜態RAM等。由于內部存儲子系統和系統總線效率,以及CPU對片上設備操作處理程度的差別,即使在相同時鐘頻率下,MCU的性能也存在著極大的差別。影響性能的一個關鍵問題就是片上閃存的訪問時間過長。
現實標準
為了更好地評估處理器的性能,一些現實標準已經開發出來了,例如由EEMBC(嵌入式微處理器基準聯盟),一個獨立的非營利組織正在開發的標準,可以對各種外部看起來相似的MCU之間的差別進行更深入的分析。
EEMBC在開發其評估標準套件時也面臨了巨大的挑戰。首先面對的就是開發測試軟件,它用于產生在一個應用中能夠代表實際性能的結果。這就表示要拋棄Dhrystone MIPS這一普遍采用的方法,該方法支持創建針對應用的測試,用于測試在汽車、網絡、電信、娛樂,以及其他嵌入式系統中處理器的工作。第二個挑戰就是起草標準,它需能夠非常容易地移植到使用不同處理器的各種開發板中,并且在這些開發板中都能夠正常地運行,以評估每個MCU或MPU的性能。
逐個比較的理想基礎是每個MCU周圍的硬件環境都盡可能地一致,并使用同樣的編譯器。最近,采用EEMBC系列汽車/工業標準,在同樣的條件下測試ARM MCU的比例正在上升。
三款MCU進行測試的結果數據顯示其吞吐率存在極大的差別,如圖所示。在比較過程中,結果數據根據它們的工作頻率進行了歸一化處理,并且所有的軟件都是在片外閃存中運行的。比較的結果表明:基于ARM的MCU普遍具有很好的性能,部分的性能差別在于MCU中實現片上閃存接口的優化方法不同。
改善CPU指令執行的吞吐量
由于閃存的訪問時間通常是CPU時鐘周期的3~4倍,找到一種從存儲器中快速傳輸數據,而不需要在昂貴的片內RAM中映射數據的方法,會極大地改善執行的吞吐量。對于測試結果中最快的那顆MCU,設計者通過展寬存儲器數據總線到128位,以允許4個32位字在一個周期中被傳輸到數據鎖存器,然后再傳輸到預取緩沖,從而解決了速度不匹配的問題。
由于CPU使用緩沖中的數據,當它執行第4個字時,另一個128位的字就被傳輸到了鎖存器中,而同時該第4個字被移出了緩沖,鎖存器中的新字也被傳輸到了緩沖。只要發起一個對閃存的數據讀訪問(裝入操作),輔助的支持電路就建立一個數據通路將128位數據存儲在緩沖中。這允許代碼獲取的歷史被保留,從而避免了需要重新獲取4個指令字的情況。
如果一個存儲器陣列(bank)可以在存儲器訪問中極大地提高速率,那么設置兩個存儲器陣列會怎樣呢?通過采用鎖存器將存儲器分成兩個陣列的結構,對于每個陣列所有的支持邏輯都相同,并可以具有兩倍的指令歷史,短循環就可以在所有的鎖存器中被完整捕獲,循環的執行得以加速。另外一點,雙陣列也可以對嵌套循環和尋找分支目標地址提供更好的支持。
內部總線支持
正如EEMBC的標準測試所揭示的那樣,CPU吞吐量只是衡量高性能的指標之一。對集成外設功能提供支持的MCU內部總線也可能有很大的不同。內部總線通常被連接到總線上的慢速設備所拖累,因此,更高速設備的數據傳輸就受到了限制。然而,通過采用總線分離的方法,將高速設備(例如10/100Mb/s以太網控制器或高速DMA控制器)連接到一段總線,而將低速設備(串行端口、定時器、脈寬調制器等)連接到另一段總線,就可以使每組設備發揮最好的性能。通過在芯片內建立分層的總線,CPU可以具有對片上RAM和閃存進行無約束訪問的局部總線。這就避免了CPU發出不必要的總線仲裁、總線批準延遲,以及總線等待狀態等,從而改善了整體性能。
對于要求高性能的功能,如向量式中斷控制器、以太網控制器、DMA控制器等,ARM高速總線(AHB)提供了對CPU的快速接口。慢速設備可以連接到ARM設備總線(APB)上,而且可以橋接到AHB,以使數據和指令從CPU和存儲器不被影響地傳輸到低速總線。
當CPU增加更多的片上資源時,對這種分層總線結構的需求就更高。在許多實時控制應用中,采用單一總線拓撲結構的處理器無法獲得有效的高性能I/O支持。大量的集成外設也增加了CPU的工作量,CPU必須持續處理中斷和響應所有的外設操作。通過使用高性能、向量式中斷控制器,許多過量的操作會得到卸載,從而縮短了CPU的響應時間。EEMBC正在探索一種通用的方法,測試MCU的集成外設并開發檢測處理器運行情況的標準。
審核編輯:湯梓紅
-
處理器
+關注
關注
68文章
19342瀏覽量
230227 -
mcu
+關注
關注
146文章
17173瀏覽量
351656 -
嵌入式
+關注
關注
5086文章
19143瀏覽量
306092
發布評論請先 登錄
相關推薦
評論