自從MCU(微控制器)導入了DSP(數字信號處理器)與FPU(Floating Point Unit;浮點運算單元)功能后,MCU可以拓展的應用范圍便大幅增加,這幾年來,諸多MCU大廠都紛紛導入,使得MCU市場戰局變得更加詭譎多變。各家大廠就MCU的產品策略也不盡相同。
然而,盡管應用面大幅增加,但DSP與FPU在功能上要如何區分?彼此的關系是什么?這在ARM推出了Cortex-M4后,這類的議題才開始漸漸被市場所重視。
DSP、FPU不再高不可攀
瑞薩電子營業行銷事業部第一營業行銷部副理黎柏均表示,其實FPU的導入,還是要考量成本的問題,若不需要,其實采用定點運算的MCU來因應系統需求即可。一般來說,SOC(系統單芯片)才會有所謂的DSP與FPU這類硬體加速器,其主要的功能大多負責影像或是音訊處理的工作,但隨著制程的進步,MCU在32位元架構也日趨成熟,所以MCU就開始能沿用SOC的部份功能,并進一步拓展MCU的應用范圍。黎柏均更直言,在早期,SOC與MCU之間有不小的價格差距。
圖1 : SOC本身就具備一定的DSP與FPU的功能,價格上也比MCU來得昂貴。(攝影:姚嘉洋)
不過,黎柏均認為,在現有市場所存在的MCU產品,即便主要供應商都能提供FPU的功能,但事實上,各家大廠的產品之間并沒有什么距離,關鍵最多就是在程式的執行效率上,能否形成差異。在過去,若要由定點運算架構的MCU來處理FPU的工作,會多出不少時間出來,而且也需要大量的記憶體資源,但有了FPU的導入后,其目標程式碼就能夠縮小,記憶體容量也能減少10%。換言之,若沒有時間上的考量,MCU是否要導入FPU,嚴格來看,并沒有太大的差別存在。TI(德州儀器)亞洲區市場開發經理陳俊宏也同意,利用定點運算的MCU來處理FPU要處理的工作,也并非不行,但就是需要耗費大量的記憶體資源與長時間的等待,來取得所要的運算結果,FPU的存在,就是要避免這樣的情況出現。
不論是從ARM或是TI,這些大廠對于DSP與FPU的看法,
仍然有一些差異存在,但也因此,讓MCU市場形成了多元并陳的景象。
在過去,傳統的8位元架構,在資料處理上仍然有其極限存在,陳俊宏指出,傳統的定點運算MCU在進行所謂的分數或是小數點計算,因為MCU本身的位元數有限,在面臨無法除盡而形成無窮數值(如1/3或是3/7等)的計算上,就必須有所取舍,在位元數有限而采取的有限數值,勢必與現實計算上而形成的數值產生一定的誤差,這種情形我們稱為:截斷誤差。在這種情況下,若要利用傳統MCU的處理器核心來處理分數運算,只會造成截斷誤差的不斷擴大。為了有效處理截斷誤差不斷擴大的問題,便有了FPU的出現。
回顧MCU的發展歷程,從傳統的8位元架構一路發展至今,已經進入到可以采用FPU與DSP等功能。之所以會有如此的進化,主因來自于從類比端擷取資料后,轉換成數字化,將「連續型」資料轉為「離散型」資料」以利于處理器進行運算。
圖2 : MCU的世界中,截斷誤差一直存在著,若要考量到高精度,如何減少截斷誤差的現象,就成了大家努力的方向之一。(Source:www.youtube.com)
陳俊宏談到,FPU并不能完全解決截斷誤差不斷擴大的現象,精確地說,只能將該現象盡可能地減少。陳俊宏進一步指出,從TI的角度來看,DSP要處理運算種類相當多種,所以需要更多的工具來處理不同需求。
延續陳俊宏的論述,Imagination MIPS業務開發資深經理Ian Anderton也指出,DSP可利用乘法/累加(MAC)指令、飽和、舍入和位元操作來執行多種數學運算─ 這些都是快速傅立葉轉換(FFT)和有限脈沖響應(FIR)等高效過濾器開發所需的基本功能。DSP同時也能支援并執行多種應用中所使用的8、16和32位元整數與分數資料長度。透過單周期MAC指令、SIMD(單一指令多重資料)和特殊的位元操作,DSP效能還可獲得進一步的增強。
FPU與DSP的相輔相成
ST(意法半導體)資深產品行銷經理楊正廉則是談到,針對訊號處理、數值運算與對應到各種應用的演算法,DSP與FPU某程度上,是相輔相成的角色,很難被加以拆分。當然,他也表示,ARM所推出的Cortex-M4核心,也有僅搭載DSP而沒有FPU的版本,但若要讓客戶能發揮更多的創意,那么就架構上就一次到位,也能省去不少不必要的麻煩。
圖3 : 某程度上,一次提供到位的硬體資源,工程師可以發揮更多的創意與想法。(Source:www.access2knowledge.org)
呼應楊正廉的說法,ARM***應用工程經理徐達勇指出,從應用面來說,楊正廉的看法并沒有問題。當然,FPU與DSP各自也有其定位。徐達勇舉例:0.8+0.5=1.3,這種運算工作就是由FPU來負責,但是如果要同時計算:「0.8+0.5=?與1.3+0.9=?」的話,就必須借重DSP的運算功能,所以FPU與DSP的密不可分,的確有其道理。楊正廉表示,廣義來看,讓MCU具備DSP與FPU功能,主要的目的在于能讓MCU的客戶群能夠享受到DSP與FPU帶來的功能與便利性,而過往采用DSP架構的客戶群,也能有機會轉移到MCU平臺。
Ian Anderton也從應用面出發,并以感測器融合(Sensor Fusion)為例,感測器融合是指把多個感測器結合在單一系統中共同運作。它需要高階的訊號處理功能,才能把訊號從嘈雜的環境中區隔出來。感測器融合可提供即時校正與調整控制,這是一種有限時間(time-limited)的應用,僅能透過利用DSP和FPU的協同處理功能來實現高效、高精密度的計算。此外,包括加速器、陀螺儀、壓力/溫度/觸控等各種感測器,以及其他擁有個別控制/管理演算法的感測器也增加了更多的挑戰,必須采用DSP/FPU才能設計出高效的系統。
圖4 : DSP加上FPU,對于近年來相當火熱的感測器融合技術有相當大的發揮空間。(Source:意法半導體)
黎柏均指出,導入FPU的另一個好處在于,可以利用FPU的運算能力,以數字方式進行濾波,以進一步提升SNR值,所以像是工業電表、量測與生理訊號等,都是十分適合的終端應用。黎柏均強調,過去的確在訊號鏈上,的確有用放大器與濾波器等類比元件來處理雜訊的問題,但這種作法,多少還是會有失真的問題存在,因此采用數字濾波的方式,亦不失為一種作法,此外還有可能可以省去一些不必要的系統成本。
然而,黎柏均也透露,讓MCU搭載FPU之后,系統業者為了能提升整體系統的效能或是解析度,在ADC的采用上,可能就會更加大膽,一口氣進入16位元甚至是24位元的規格,原因在于這類ADC所面臨的雜訊現象會更加嚴重,透過FPU來處理,不失為一種作法。
FPU仍有局限?TI提供其他硬體加速單元
不過,如同陳俊宏所提到的,如果DSP要處理的工作十分多元,意味著需要更多元的工具來加以因應,單靠FPU這樣的硬體加速單元仍有不足之處。
陳俊宏透露,延續TI的C2000架構,TI進一步推出了如TMU與VMU硬體加速單元,前者專職于三角函數運算(偏重馬達應用),后者則負責復數運算(對應通訊與軟體定義無線電),既有的FPU就負責分數與小數點的運算工作,透過分工合作的方式,來因應客戶不同的運算工作需求。他更舉例,就算是馬達所需要的運算工作,因應不同的馬達類型,TI也能給予不同的DSP架構來對應。
架構異曲同工MCU仍有市場區隔
就Cortex-M4 MCU而言,ST所提供的產品線相當廣泛,核心時脈從最低的72MHz到最高的180MHz,中間亦有84MHz、100MHz、168MHz的版本,這些不同核心時脈的產品,自然也對應到不同應用。STMF3(核心時脈為72MHz)系列,就是要因應既有的Cortex-M3的升級而推出的版本,其他如STMF401(核心時脈為84MHz)與STMF411(核心時脈為100MHz),是為了因應穿戴式與高C/P應用為主。而ST的STMF479,其核心時脈高達180MHz,也搭載繪圖引擎,專攻人機介面應用。
不過,撇除應用面不談,英飛凌在尚未導入Cortex-M4前,就已有FPU(浮點運算單元)與DSP(數字信號處理器)的MCU產品線:TriCore系列。該系列產品線,早在1999年就已經面世。
英飛凌電源管理與多元電子事業處亞太區市場部資深經理黃志鴻表示,當初英飛凌設計TriCode,本身就具備了DSP與FPU的功能,就應用面而言,就聚焦在汽車領域。而談到先前就引進Cortex-M4的原由,黃志鴻也直言,所鎖定的應用就是工業自動化領域,再加上ARM架構在全球市場中,本來就有其普遍性,并進一步取得過去由傳統的DSP業者所壟斷的市場。Cortex-M4在先天上,本身就具備即時性的特性,像是近期英飛凌所聚焦的工業乙太網路與工業標準SIL3、SIL4等,都十分適合。
圖5 : 乙太網路進入工業領域后,成了重要的網路通訊技術,由于有其普遍性與開放性,采用開放的處理器核心來提供MCU方案,也是合理的選擇。(Source:www.datacenterdynamics.com)
所以英飛凌的產品區隔相當明顯,擁有FPU與DSP的MCU產品線,延續TriCode架構,進而一脈相承的AURIX,聚焦車用應用,取得ARM授權的Cortex-M4,就扛下工業自動化市場的責任。當然,英飛凌對于Cortex-M4也還有其他的期待,像是數字電源與馬達控制領域,英飛凌也開始嘗試利用Cortex-M4 MCU打入其應用。他也不諱言,DSP也的確存在相當長的一段時間,產業界有不少工程師對于DSP本來就有相當高的熟悉度,MCU約莫是在三年前左右,才開始導入DSP功能。
圖6 : 車用電子產業的特性相對較為封閉,盡管在車用處理器可以看到ARM有明顯的市占率表現,但在MCU方面,還是由各大車用半導體所提供的自主架構居多, ARM的能見度相對較低。(Source:www.teijinaramid.com)
而黃志鴻也強調,Cortex-M4還是有其局限性在,像是視訊系統的設計,還是要透過DSP來處理會較為適當。像是高速鐵路或是風力發電系統等應用,普遍來看還是傳統的DSP業者主導。但如果是電動機車、一般風扇、家電與智慧家庭等,就有FPU功能的MCU的發揮空間。
談到數字電源,同樣也有類似的情況,黃志鴻表示,從功率大小來區分,從500瓦以上的系統設計,如伺服器或是電信設備的AC/DC電源,市場上還是以傳統DSP架構為主,但也的確有不少擁有Cortex-M4 MCU的業者對于該市場,有相當高的興趣。
圖7 : 數字電源在電源設計領域漸漸成為主流,市場也開始有了用MCU來進行數字電源設計。(攝影:姚嘉洋)
MCU多元架構并陳定位仍有不同
徐達勇表示,將DSP與FPU加以整合,無需外掛的好處在于,系統工程師可以用同一套的偵錯與編譯器等工具,進行系統開發,簡單說,簡化開發環境對于系統開發而言,可以提升不少效率。在過去,采用DSP設計,會有些設計方法必須動用組合語言的作法才能完成,但是,MCU的開發,最終還是要回歸到C語言的撰寫。若把DSP導入與MCU一同合作,ARM在作法上,就是統一采用C語言的方式,來統一DSP、FPU的撰寫方式,解決了過去組合語言所造成的困擾。然而,陳俊宏也強調,事實上組合語言是更為細膩的程式語法,對于工作執行上能更有效率,TI近年來也不斷努力,讓C語言與組合語言兩者之間的差異縮小,以讓使用者能有更多的選擇。
徐達勇也同意,目前MCU市場除了ARM架構外,的確也存在其他不同的架構,讓DSP與FPU形成多元共存的局面。他也坦言,在架構上,各家其實并沒有太大的差異,唯一能形成區別的,大概就是在效能與開發工具能分出高低而已。
而近年來,如英飛凌與瑞薩科技等,先后導入Cortex-M4核心,也使得MCU戰場顯得更詭譎多變。徐達勇強調,近年來產業界不斷地在談物聯網,這意味著需要用更為開放的架構來因應物聯網的設計需求,而這必須透過完整的生態系統才能作到,畢竟可能還會有第三方演算法設計或是設計工具業者,能夠提供比MCU業者更具競爭力的開發工??具也不一定,此時就會讓客戶有了更多不同的選擇。他不諱言,有些較為封閉特性的應用,或許采用其他架構的MCU來進行設計,也許就能滿足客戶的需求。
圖8 : 談到物聯網,ARM所形塑的生態系統相當完整,各大一線的MCU業者幾乎都向ARM靠攏,形成魚幫水,水幫魚的情景。(攝影:姚嘉洋)
評論
查看更多