隨著人們對實時信號處理要求的不斷提高和大規模集成電路的迅速發展,作為數字信號處理核心和標志的數字信號處理器?DSP?芯片得到了快速的發展和應用。本文將介紹Analog Device公司的一款DSP-TigerSHARC在信號處理系統中的應用,并將對設計中的一些問題進行討論說明。
1 系統設計及各部分功能簡介
圖1所示是一個信號處理系統的硬件框圖。實際上,為了簡化系統硬件,減少DSP片間連線,該系統的6個DSP以松耦合的鏈路方式進行連接。首先由DSP1通過外部DMA方式讀入中頻解調后的I、Q路數據,并由DSP1對讀入數據進行脈沖壓縮?匹配濾波?,脈沖壓縮后進行二次對消,以消除固定雜波。再由DSP1將處理后的數據按距離單元段通過鏈路口0、1分別發送給DSP2、DSP4。DSP2、DSP4主要進行目標檢測?MTD?,并采用滑窗加權FFT實現窄帶多譜勒濾波器組。當DSP2、DSP4完成MTD后? 再將對應每個距離單元的16個輸出數據通過鏈路口分別送到DSP3和DSP5。之后,由DSP3、DSP5先進行求模運算,再進行恒虛警計算。DSP3、DSP5處理后的數據經鏈路口傳輸到DSP6,在DSP6接到該信號后,先對距離單元內16個輸出進行門限處理,并選擇其中最小雜波剩余值作為本單元的輸出。門限處理后,DSP6還應完成視頻積累,視頻積累采用累加求平均的方式,這樣可以避免反饋積累的拖尾現象。視頻數據以DMA方式通過外部口送出,并分別加到D/A與DS96F172等輸入端,前者產生模擬視頻,后者以差分形式送到顯示單元。
圖1
2 TigerSHARC DSP簡介
TigerSHARC DSP是一款高性能的靜態超標量數字信號處理器,該處理器專為大的信號處理和通信任務而在結構上進行了優化。由于該處理器將非常寬的存儲帶寬和雙運算模塊結合在一起,從而建立了數字信號處理器性能的新標準。TigerSHARC靜態超標量結構使DSP每周期能夠執行多達4條指令、24個16-bit定點運算和6個浮點運算。
該TigerSHARC DSP器件在三條相互獨立的128bit寬度的內部數據總線中,每條可連接三個2Mbit內部存儲器中的一個,并可提供4個字的數據、指令及I/O訪問和12Gbytes/s的內部存儲器帶寬。當其運行在250MHz時,ADSP-TS101S的內核指令周期為4ns,同時可以提供20億次的40bit MAC運算或者500萬次80bit MAC運算。
TigerSHARC DSP器件的主要性能如下:
●最高運行速度為250MHz,指令周期為4ns;
●帶有6Mbits片內SRAM;
●帶有雙運算模塊?每個內部包含有一個ALU、一個乘法器、一個移位器和一個寄存器組;
●具有一個外部端口、4個鏈路口和可編程標志引腳、SDRAM控制器和2個定時器;
●與用于片上仿真的IEEE1149.1標準的JTAG接口兼容;
●可通過共享總線無縫連接多達8個Tiger-SHARC DSP的片內總線仲裁。
3 系統運算量分析及計算時間估計
根據信號處理任務,下面具體分析系統各組成部分的運算量,并估計所需的時間,并確定完成算法所需的DSP數目(總信號處理周期小于1000μs)。
3.1 脈沖壓縮
圖2所示是采用FFT技術實現脈沖壓縮濾波的算法框圖。若總距離單元數為1200,則需做2048點復數FFT。當2048點復數FFT完成后,還必須和預先存儲好的匹配濾波器系數H?k?相乘。一般需要做2048個復數乘法,相乘結果還需做2048點復數IFFT以獲得脈沖壓縮結果。TigerSHARC DSP做2048點復數FFT?IFFT?大約需要100μs?工作在250MHz?。因此,可以充分利用TigerSHARC DSP的雙運算塊和單指令多數據?SIMD?特點同時進行兩個距離單元的復數乘法,這種方法完成2048個復數乘法僅需25μs。
固定雜波對消可以采用二次對消器來實現,其差分方程為:
y(n)=x(n)-2x(n-1)+x(n-2)
對于每個距離單元,它都需要取三個數、做兩個減法、一個加法并存儲一個數,這樣,完成1200個距離單元的二次對消大約需要25μs。因此,脈沖壓縮和固定雜波二次對消只需要一片DSP便可完成,而且還有較多時間富余。
3.2 動目標檢測(MTD)
用FFT實現窄帶多譜勒濾波器組時,為了降低旁瓣,可在系統中采用滑窗加權FFT的方法,權系數為海明權,即:
S(k)=FFT{S(n)W(n)}? n=0,1,2,…N-1
其中S(n)為雷達回波序列,而W(n)則可用下式表示:
W(n)=0.54-0.46cos[2πn/(N-1)]
n=0,1,2,…N-1
TigerSHARC DSP做16點加權復數FFT大約需要80個指令周期?0.32μs?,因此,當距離單元數為1200時,共需384μs。這樣,此滑窗多譜勒濾波器組?考慮到運算的輔助操作?僅需要兩片TigerSHARC DSP就可實現并行處理,且還有較多的富余時間。
3.3 求模
求模可采用如下近似公式:
一般情況下,求模須對每個距離單元的16個通道FFT輸出進行運算。TigerSHARC DSP做一個16通道的求模運算需要0.5μs,距離單元數為1200時,共需600μs?故可由兩片TigerSHARC DSP并行處理。
3.4 恒虛警
恒虛警算法框圖如圖3所示。
該算法可充分利用TigerSHARC DSP的雙運算模塊,同時并行處理兩個距離單元的兩個通道,完成1200個距離單元的16個通道的恒虛警計算共需500μs,故可用DSP3和DSP4并行處理。
3.5 積累
積累可采用簡單累加求平均的方式,由于其計算量較少,因此,用一片TigerSHARC DSP實現仍有較大時間富余。
綜上所述,由TigerSHARC DSP構成的高速信號處理系統總共僅需6片DSP,即可對不同的距離單元段進行并行處理。
4 TigerSHARC DSP特殊的復位方式
TigerSHARC DSP的上電復位波形較為特殊,在設計時應充分重視,建議采用CPLD實現其復位。上電復位波形要求如圖4所示。但應注意以下幾點:
(1)tSTART_LO在供電穩定之后必須至少大于1ms?
(2)tPULSE1_HI必須大于50個系統時鐘周期,同時小于100個系統時鐘周期;
(3)tPULSE2_LO 必須大于100個系統時鐘周期。
(4)在DSP上電后,如需正常復位,其低電平持續時間必須大于100個系統時鐘周期。
本系統采用EP1K50產生上電復位波形和時序控制。由于EP1K50需要一個配置芯片,而且它和DSP存在一個上電先后的問題。也就是說,在上電后,如果CPLD芯片完成配置文件的讀入時,DSP仍未上電穩定,則應充分延長Tstart_lo的低電平時間,以避免DSP上電未穩定而CPLD上電波形已結束。因此,應保證DSP上電穩定先于CPLD芯片配置文件的讀入,此問題在系統設計時應予以充分重視,否則DSP將無法正常工作。
5 電源供電及功耗估計
TigerSHARC DSP有三個電源,其中數字3.3V為I/O供電;數字1.2V為DSP內核供電;模擬1.2V為內部鎖相環和倍頻電路供電。TigerSHARC DSP要求數字3.3V和1.2V應同時上電。若無法嚴格同步,則應保證內核電源1.2V先上電,I/O電源3.3V后上電。本系統在數字3.3V輸入端并聯了一個大電容,而在數字1.2V輸入端并聯了一個小電容,其目的就是為了保證3.3V充電時間大于1.2V充電時間,以便很好地解決電源供電先后的問題。
5.1 內核功耗估計
內核最大電流為1.277A,該電流是DSP進行單指令多數據(SIMD)方式下,4個16位定點字乘加與兩個四字讀取并行操作以及進行由外部口到內部存儲器DMA操作所需的電流。實際上,DSP內核電流大小還和內核工作頻率有關,圖5所示是其內核電流與頻率的關系曲線。因此,供給DSP內核電流可根據不同的并行處理任務和內核工作頻率來確定。若并行處理較少,工作頻率低,所需電流就小。這樣,最大內核功耗為:
PDD=VDD×IDD=1.2×1.277=1.534W
5.2 外部口功耗估計
外部口的功耗(對VDD-IO)主要是輸出引腳(例如數據線的某個位由高到低,或由低到高) 轉換的功率消耗,而且該功耗與系統無關。由于這種轉換的外部平均電流為0.137A,因此,功耗為:
PDD_IO=0.1370A×3.3V=0.45W
6 結束語
本文介紹了多片TigerSHARC DSP在實時信號處理系統中的應用。該系統充分利用了TigerSHARC DSP高速的運算能力及數據吞吐量,可對不同的距離單元段進行并行處理。文中分析了系統的運算量、所需計算時間以及完成算法所需的DSP數,并且討論了DSP應用過程中的復位,電源設計和功耗問題,因而具有一定的工程指導意義。實踐表明,由TigerSHARC DSP構成的系統硬件結構簡單,軟件編寫容易,且成本較低。目前該系統已成功用于某雷達系統。
評論
查看更多