背景:
快速傅里葉變換(FFT)在雷達(dá)、通信和電子對(duì)抗等領(lǐng)域有廣泛應(yīng)用。近年來隨著現(xiàn)場(chǎng)可編程門陣列(FPGA)的飛速發(fā)展,與DSP技術(shù)相比,由于其并行信號(hào)處理結(jié)構(gòu),使得FPGA能夠很好地適用于高速信號(hào)處理系統(tǒng),但是,由于Altera等公司研制的FFT IP核,價(jià)錢昂貴,不適合大規(guī)模應(yīng)用,在特定領(lǐng)域中,設(shè)計(jì)適合于自己領(lǐng)域需要的FFT處理器是較為實(shí)際的選擇,下面將關(guān)注一些關(guān)于流水級(jí)FFT處理器的一些最新發(fā)展。
SDF FFT Core → FPGA DSP slice:
近期,在IEEE VLSI系統(tǒng)專欄學(xué)報(bào)處有一篇12頁的題為“Efficient FPGA Mapping of Pipeline SDF FFT Cores”的新論文即將被發(fā)表(在IEEE Xplore可見)。而在這篇論文中作者就如何將一個(gè)SDF(single-path delay feedback單路延遲反饋)FFT核映射到Xilinx的全可編程芯片內(nèi)部的DSP48 slices的可編程邏輯及其他可用的存儲(chǔ)資源上進(jìn)行了深入周密的細(xì)節(jié)性討論。盡管這篇論文主要是針對(duì)Virtex-4和Virtex-6系列FPGA進(jìn)行討論的,但是作者也明確指出,由于Xilinx 7系列和UltraScale/UltraScale+ 系列FPGA與Virtex-6使用相同的slice 架構(gòu),所以這種映射其實(shí)很容易被推廣的。
在論文中,作者詳細(xì)闡述了Xilinx的產(chǎn)品,主要是從Virtex-4 FPGA開始到Xilinx后來的所有全可編程芯片等多代產(chǎn)品內(nèi)部的DSP48 slices的一個(gè)發(fā)展過程:首先,Virtex-4 FPGA系列包含一18X18bit乘法器和48bit累加器的XtremeDSP(DSP48);之后的Virtex-6系列FPGA加入了25x18bit乘法器和48bit累加器的DSP48 slices ;較新的7系列FPGA和Zynq-7000系列SoC則內(nèi)嵌了25x18bit乘法器和48bit累加器的DSP48 slices;而最強(qiáng)的UltraScale/UltraScale+系列FPGA則包括了27x18bit乘法器和48bit加法器的DSP48E2。除此之外,在Xilinx每一代FPGA的DSP48 slices的發(fā)展中都有很多額外的改進(jìn),比如時(shí)鐘率具有較穩(wěn)定的提高,也正是這么多代產(chǎn)品的不斷迭代,才使得現(xiàn)在的DSP48E2 功能更加強(qiáng)大。下圖是論文中作者提到的關(guān)于DSP48E2 功能實(shí)現(xiàn)的細(xì)節(jié)。
圖1 DSP48E2 功能細(xì)節(jié)
同時(shí),在這片IEEE的論文中還討論了如何將此FFT核蝶形轉(zhuǎn)換到較少的LUT單元中,而如何有效轉(zhuǎn)換關(guān)系到是否可以實(shí)現(xiàn)DSP48 preadders的蝶形地址,在實(shí)現(xiàn)過程中,通過將有效的數(shù)據(jù)映射和轉(zhuǎn)換因子存儲(chǔ)到BRAM 及分布式存儲(chǔ)資源中,有效地完成 radix-2k算法轉(zhuǎn)換因子的共享,此外采用重新定時(shí)和流水的方式來縮短實(shí)現(xiàn)時(shí)間。
雖然這篇博客展示的任何技術(shù)都是來自于論文中,讀者也可以從IEEE論文網(wǎng)站得到,但是還是會(huì)給出論文中的一些結(jié)論(以便可以提起您去檢索并閱讀全文的興趣):“報(bào)告的實(shí)現(xiàn)結(jié)果表明,相比于之前的有關(guān)實(shí)現(xiàn)而言,通過利用Virtex-4和Virtex-6內(nèi)部的DSP48實(shí)現(xiàn)一個(gè)FFT核,可以使其性能分別提高350%到400%,同時(shí),還可以獲得一個(gè)更高的混合時(shí)鐘頻率,并且整個(gè)實(shí)現(xiàn)過程只需要更少的存儲(chǔ)資源。這也正好如以前發(fā)表過的最好的報(bào)告結(jié)果一樣,都是使用完全一樣的架構(gòu),使用同Virtex-4完全一樣的算法,也體現(xiàn)出這種轉(zhuǎn)換的優(yōu)勢(shì)十分明顯,所以,為提高性能,可以嘗試將架構(gòu)映射到FPGA硬件結(jié)構(gòu)中來實(shí)現(xiàn)。
總結(jié):
在目前的市場(chǎng)中,尤其是一些互聯(lián)網(wǎng)公司,都開始利用FPGA做硬件加速的實(shí)現(xiàn),不僅是因?yàn)镕PGA的可用性,更主要的是各大公司都看中了硬件實(shí)現(xiàn)軟件算法時(shí)對(duì)整個(gè)算法質(zhì)量的極大提升,這類市場(chǎng)也恰好是我們Xilinx未來競(jìng)爭的關(guān)鍵點(diǎn)所在。
-
Xilinx
+關(guān)注
關(guān)注
71文章
2168瀏覽量
121706 -
FFT
+關(guān)注
關(guān)注
15文章
436瀏覽量
59427
原文標(biāo)題:性能飛升350%~400%!Xilinx DSP slices 實(shí)現(xiàn) SDF 流水 FFT Core
文章出處:【微信號(hào):xilinx_inc,微信公眾號(hào):賽靈思】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論