FPGA畢竟不是ASIC,對時序收斂的要求更加嚴(yán)格,本文主要介紹本人在工程中學(xué)習(xí)到的各種時序約束技巧。
首先強烈推薦閱讀官方文檔UG903和UG949,這是最重要的參考資料,沒有之一。它提倡要在設(shè)計的早期階段就要排除問題,越到后期時序的改善就越困難。其中HLS層次對性能的影響是最大的。
本文將從代碼風(fēng)格,時序修正,工程設(shè)置等幾個方面介紹本人的實踐經(jīng)驗,希望讓各位初學(xué)者快速提高,也希望FPGAer能給出寶貴建議。
1. 代碼風(fēng)格
推薦使用Xilinx language templates的代碼塊,這里的代碼能夠綜合出正確且結(jié)構(gòu)簡潔的電路,包括移位寄存器,乘法,復(fù)數(shù)乘法,F(xiàn)IR濾波器等,凡是涉及到的模塊盡量使用官方寫法。
合理的設(shè)計代碼框架。IO相關(guān)的代碼、時鐘管理單元盡量放在頂層,后者有助于以共享資源從而提高性能降低功耗。模塊的輸出最好是使用寄存器輸出,有助于降低路徑延時幫助時序收斂。
復(fù)位也是非常重要的問題。和ASIC不同,Xilinx FPGA的寄存器是高電平復(fù)位,支持異步復(fù)位和同步復(fù)位,但是DSP和BRAM內(nèi)部的寄存器不支持異步復(fù)位。因此,官方更推薦設(shè)計采用高電平同步復(fù)位,可以降低資源的使用和功耗,有助于時序收斂。由于FPGA的初始狀態(tài)是確定的(可以在定義說明中指定),為了更快地時序收斂,官方文檔認(rèn)為,能不用復(fù)位是最好的,尤其數(shù)據(jù)路徑和移位寄存器的設(shè)計中。不過使用同步復(fù)位仍需要注意控制集不能太多的問題。關(guān)于這方面的內(nèi)容,UG949第三章Control Signals and Control Sets給了詳細的說明。
數(shù)學(xué)運算使用DSP單元速度會更快一些,根據(jù)DSP的結(jié)構(gòu)重組數(shù)學(xué)運算,充分利用FPGA的DSP、BRAM資源。并且能做到對代碼映射的硬件資源心里有數(shù)。
如果并不需要優(yōu)先級,盡量將If語句轉(zhuǎn)化為case語句。
盡量不要使用Don't Touch這類語句。如今Vivado綜合工具已經(jīng)很完善了,除非代碼有問題或者手動復(fù)制寄存器,否則一般不會發(fā)生電路被綜合掉的現(xiàn)象。使用這些語句會覆蓋Vivado綜合設(shè)置,導(dǎo)致電路沒有得到充分的優(yōu)化,給時序收斂造成困難。
2. 時序修正
嚴(yán)格遵守Vivado開發(fā)流程,在第一次跑綜合時最好是在沒有任何物理約束的情況下,Vivado在越少物理約束的情況下綜合出來的效果越好。查看每個階段的時序報告,將每一階段的時序違例控制在300ps以內(nèi),盡早消除問題。以前本人RTL Analysis階段過了之后選擇運行Implementation跳過Synthesis報告,這是不可取的行為。有時候會發(fā)現(xiàn)Synthesis有時序問題而在Implementation階段反而沒問題,這是因為Vivado在Implementation階段對時序不滿足的地方傾斜了更多的資源保證時序收斂。但是忽略Synthesis的時序問題會在后期頂層模塊集成占用大資源時爆發(fā)出來。
下面介紹主要面對的兩個時序問題的處理技巧。
1)setup time 建立時間問題
建立時間是工程設(shè)計中最常遇到的問題了。一般說來,導(dǎo)致建立時間違例主要有兩個原因:邏輯級數(shù)太大或者扇出太大。
打開Report Timing Summary界面查看路徑延遲信息,如下圖所示。
Levels指的是邏輯級數(shù)logic level,一個logic level的延遲對應(yīng)的是一個LUT和一個Net的延遲,對于不同的器件,不同頻率的設(shè)計能容納的logic level是不同的。假設(shè)7系列的-2速度等級250MHz的設(shè)計,電路設(shè)計的大部分levels最好不要超過8,否則會造成時序收斂困難。
Logic level太大的處理方法就是重定時(Retiming)了,典型的重定時方法就是流水線,將過于冗長的組合邏輯增加寄存器進行打拍。
High Fanout指的是扇出,同樣和器件、設(shè)計頻率等有關(guān),如下圖所示:
降低扇出最好不要在綜合設(shè)置中指定,過低的扇出限制會造成設(shè)計堵塞反而不利于時序收斂,最好的方法是根據(jù)設(shè)計中時序最差路徑的扇出進行針對性的優(yōu)化。如果是寄存器的輸出扇出很大,可以使用max_fanout屬性標(biāo)記寄存器聲明,也可以手動復(fù)制寄存器,
如果不是關(guān)鍵時序路徑,而且高扇出網(wǎng)絡(luò)直接連接到觸發(fā)器,對扇出超過25K的net插入BUFG:
set_property CLOCK_BUFFER_TYPE BUFG [get_nets netName]
當(dāng)然,也可以在后期Implementation的物理優(yōu)化設(shè)置中優(yōu)化扇出。
2)hold time 保持時間問題
在實踐中,我發(fā)現(xiàn)保持時間問題的問題往往是異步處理的問題。
對于一個信號的跨時鐘域問題,一般使用雙寄存器法(對于慢采快的結(jié)繩法這里不討論)。為了降低MTBF(Mean Time Between Failures,平均無障礙時間),這兩個寄存器最好位于同一個slice中。可以使用tcl語言指定,如:
set_property ASYNC_REG TRUE [get_cells [list sync0_reg sync1_reg]]
也可以直接在代碼中指定:
(* ASYNC_REG = "TRUE" *) (* keep = "true" *)reg sync0_reg, sysnc1_reg;
也可以參考代碼模板使用XPM模板進行處理。
多個信號一般是使用FIFO或者握手的方法,這里不再贅述原理。同步CDC處理比較復(fù)雜,本人打算之后另外寫一篇文章詳細講述。
3. 工程設(shè)置
Vivado綜合實現(xiàn)本質(zhì)是時序驅(qū)動的,和ISE不同,因此再也沒有ISE那種用隨機種子綜合實現(xiàn)滿足時序收斂的工具。不過Vivado在布局布線方面提供了幾種不同的策略(directive),通過不同策略的組合可以產(chǎn)生上千種不同的布局布線結(jié)果,還可以使用tcl鉤子腳本自定義布局布線過程,足以滿足需求。而且,Vivado可支持同時運行多個Implementation,這為這種設(shè)計時間換取性能的方法提供了工具上的便利。
Implementation里Post-place Phys Opt Design和Post-route Phys Opt Design是沒有使能的。工程后期使能這兩個配置也能在一定程度上改善時序收斂。
FPGA工程師的工作不只是將電路功能實現(xiàn),由于器件和工具不是理想的,所以還需要研究器件特性和工具的局限,尤其是在如今算法結(jié)構(gòu)越來越成熟的背景下,不斷被工具折磨,也許這也是FPGA工程師的悲哀吧。
審核編輯 :李倩
-
FPGA
+關(guān)注
關(guān)注
1630文章
21769瀏覽量
604648 -
Vivado
+關(guān)注
關(guān)注
19文章
815瀏覽量
66705
原文標(biāo)題:Vivado工程經(jīng)驗與時序收斂技巧
文章出處:【微信號:gh_9d70b445f494,微信公眾號:FPGA設(shè)計論壇】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論