在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

基于FPGA設計的sysGen算法系統設計

電子設計 ? 來源:CSDN 博主 ? 作者: 沒落騎士 ? 2020-12-30 12:59 ? 次閱讀

一、前言

利用FPGA設計算法一直以來都是熱點,同樣也是難點。將復雜的數學公式 模型通過硬件系統來搭建,在低延時 高并行性等優勢背后極大提高了設計難度和開發周期。Xilinx公司的sysGen(system generator)工具擴展了MATLABsimulink,提供很多IP Catalog中沒有的基礎模塊和針對DSP應用的硬件模型。工程師利用豐富的模塊和MATLAB強大的數據處理及可視化能力能夠更快速完成設計與仿真驗證工作。

二、sysGen算法系統設計

本文以個最簡單的例子講述利用sysGen搭建算法IP核,并集成到IP Integrator中作為ZYNQ PS端CPU的“定制外設”。僅用于測試目的。設計需求:在sysGen中搭建系統,將輸入定點整數數據*2后輸出,輸入位寬為8bit。

pIYBAF9uKDmAGlS-AACLMgeqkdk369.png

在System Generator token中設定仿真步長為1sec。點擊需要觀測的信號連線,右擊選擇Xilinx add to viewer。啟動仿真并啟動Xilinx waveform viewer:

本質上就是調用Vivado的XSim工具進行行為仿真。仿真結果可見完成預期目標,現雙擊System Generator token ,選擇Compiliation類型為IP Catalog并勾選Create testbench,按下Generate生成IP核。

三、仿真測試

根據User Guide介紹sysGen是“周期和比特精準的”,我們還是在Vivado環境下再次驗證下。netlist文件夾內子文件夾ip_catalog中為IP核示例工程,由于自動生成了testbench,打開后直接進行行為仿真。sysGen在創建testbench時會將經過gatein和gateout的數據儲存到文件中,testbench進行的工作為:將gatein數據作為測試激勵送入到相應設計輸入端口,之后把設計輸出得到結果與gateout文件數據進行逐一比較從而驗證設計是否與sysGen環境下仿真結果一致。

發現個比較有意思的現象,自動生成的testbench中clock生成并約束的50MHz,而是認為進行了拓展。

仿真波形如圖:

將clock處改動為50MHz后,經過測試發現如果系統一開始就輸入數據,前幾個數據沒有被真正處理,輸出錯誤??赡苁擒浖﨎UG吧,不過這種情況也非常少見,實際系統中輸入數據大多情況會啟動一段時間后才輸入。這里等待100ns后再啟動clock翻轉:

改動后仿真波形:

四、AXI-Stream總線形式IP

到此算法IP的設計與驗證結束。如果想將這個IP核導入到IP Integrator中作為CPU的外設,其接口必須滿足AXI總線標準,因此回到sysGen中更改端口名稱和位寬。端口要符合AXI-Stream標準信號名稱,位寬為8bit整數倍。

o4YBAF9uKEiAVeSPAARNJArcqqo731.png

生成IP核后,打開新的工程,導入該IP核到repository。

五、Block Design系統搭建

系統結構與上一篇該系列博文類似,均是以AXI DMA為核心的Loop系統,只是將AXI-Stream Data FIFO改成了自定義IP核。由于IP核slave和master接口只包含tdata和tvalid信號,因此需要添加接口銜接的一些簡單邏輯。tready信號和tkeep信號直接連接constant使用常數驅動,DMA的s_axis_s2mm接口的tlast由wrapper內計數器邏輯驅動,將system中FCLK_CLK0 peripheral_aresetn m_axis_tvalid和s_axis_s2mm_tlast信號引出到wrapper中。

有一點比較坑:自定義IP通過AXI總線與DMA互聯時,總線下相應的接口不一定會正確對應,所以需要分別將兩端的每個接口相連。可以通過打開綜合后的設計來確認連線無誤。

自動生成wrapper后改動添加代碼如下:
`timescale 1 ps / 1 ps

module user_wrapper
(DC,
DDR_addr,
DDR_ba,
DDR_cas_n,
DDR_ck_n,
DDR_ck_p,
DDR_cke,
DDR_cs_n,
DDR_dm,
DDR_dq,
DDR_dqs_n,
DDR_dqs_p,
DDR_odt,
DDR_ras_n,
DDR_reset_n,
DDR_we_n,
//FCLK_CLK0,
FIXED_IO_ddr_vrn,
FIXED_IO_ddr_vrp,
FIXED_IO_mio,
FIXED_IO_ps_clk,
FIXED_IO_ps_porb,
FIXED_IO_ps_srstb,
RES,
SCLK,
SDIN,
VBAT,
VDD
//m_axis_tvalid,
//peripheral_aresetn,
//s_axis_s2mm_tlast
);
output DC;
inout [14:0]DDR_addr;
inout [2:0]DDR_ba;
inout DDR_cas_n;
inout DDR_ck_n;
inout DDR_ck_p;
inout DDR_cke;
inout DDR_cs_n;
inout [3:0]DDR_dm;
inout [31:0]DDR_dq;
inout [3:0]DDR_dqs_n;
inout [3:0]DDR_dqs_p;
inout DDR_odt;
inout DDR_ras_n;
inout DDR_reset_n;
inout DDR_we_n;
//output FCLK_CLK0;
inout FIXED_IO_ddr_vrn;
inout FIXED_IO_ddr_vrp;
inout [53:0]FIXED_IO_mio;
inout FIXED_IO_ps_clk;
inout FIXED_IO_ps_porb;
inout FIXED_IO_ps_srstb;
output RES;
output SCLK;
output SDIN;
output VBAT;
output VDD;
//output [0:0]m_axis_tvalid;
//output [0:0]peripheral_aresetn;
//input s_axis_s2mm_tlast;

localparam DATA_NUM = 256;

wire DC;
wire [14:0]DDR_addr;
wire [2:0]DDR_ba;
wire DDR_cas_n;
wire DDR_ck_n;
wire DDR_ck_p;
wire DDR_cke;
wire DDR_cs_n;
wire [3:0]DDR_dm;
wire [31:0]DDR_dq;
wire [3:0]DDR_dqs_n;
wire [3:0]DDR_dqs_p;
wire DDR_odt;
wire DDR_ras_n;
wire DDR_reset_n;
wire DDR_we_n;
wire FCLK_CLK0;
wire FIXED_IO_ddr_vrn;
wire FIXED_IO_ddr_vrp;
wire [53:0]FIXED_IO_mio;
wire FIXED_IO_ps_clk;
wire FIXED_IO_ps_porb;
wire FIXED_IO_ps_srstb;
wire RES;
wire SCLK;
wire SDIN;
wire VBAT;
wire VDD;
wire [0:0]m_axis_tvalid;
wire [0:0]peripheral_aresetn;
wire s_axis_s2mm_tlast;

reg [8-1:0] cnt;
wire add_cnt;
wire end_cnt;

system system_i
(.DC(DC),
.DDR_addr(DDR_addr),
.DDR_ba(DDR_ba),
.DDR_cas_n(DDR_cas_n),
.DDR_ck_n(DDR_ck_n),
.DDR_ck_p(DDR_ck_p),
.DDR_cke(DDR_cke),
.DDR_cs_n(DDR_cs_n),
.DDR_dm(DDR_dm),
.DDR_dq(DDR_dq),
.DDR_dqs_n(DDR_dqs_n),
.DDR_dqs_p(DDR_dqs_p),
.DDR_odt(DDR_odt),
.DDR_ras_n(DDR_ras_n),
.DDR_reset_n(DDR_reset_n),
.DDR_we_n(DDR_we_n),
.FCLK_CLK0(FCLK_CLK0),
.FIXED_IO_ddr_vrn(FIXED_IO_ddr_vrn),
.FIXED_IO_ddr_vrp(FIXED_IO_ddr_vrp),
.FIXED_IO_mio(FIXED_IO_mio),
.FIXED_IO_ps_clk(FIXED_IO_ps_clk),
.FIXED_IO_ps_porb(FIXED_IO_ps_porb),
.FIXED_IO_ps_srstb(FIXED_IO_ps_srstb),
.RES(RES),
.SCLK(SCLK),
.SDIN(SDIN),
.VBAT(VBAT),
.VDD(VDD),
.m_axis_tvalid(m_axis_tvalid),
.peripheral_aresetn(peripheral_aresetn),
.s_axis_s2mm_tlast(s_axis_s2mm_tlast));

always @(posedge FCLK_CLK0)begin
if(!peripheral_aresetn)begin
cnt end
else if(add_cnt)begin
if(end_cnt)
cnt else
cnt end
end

assign add_cnt = m_axis_tvalid;
assign end_cnt = add_cnt && cnt== DATA_NUM-1;

assign s_axis_s2mm_tlast = end_cnt;

endmodule

user_wrapper

當自定義IP核輸出256個數據時,拉高tlast信號結束傳輸。打開綜合后的設計,添加調試探針,抓取DMA與自定義IP之間的接口信號,set up debug后完成接下來的流程。

六、軟硬件聯調

在硬件系統中定義數據幀長度為256個,數據位寬為16bit,因此C代碼中DMA啟動傳輸函數中數據長度參數為512byte。測試數據生成與檢測代碼非常簡單:

我們直接查看ILA抓取AXI S總線波形:


看到CPU產生數據從1到4重復遞增,IP核輸出結果從2到8重復遞增,輸出為輸入的2倍。

傳輸完成后進入DMA發送和接收中斷,軟件檢測結果正確。在Memory窗口能夠直接查看內存絕對地址里的數據,選定DDR接收緩存區起始地址,其中的數據與AXI總線傳回數據一致,證明系統聯調成功。之后任意算法模塊均可采用本文方式進行設計和集成,可以說一勞永逸!

編輯:hfy


聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
收藏 人收藏

    評論

    相關推薦

    為什么FPGA屬于硬件,還需要搞算法?

    交流學習,共同進步。 交流問題(一) Q:為什么FPGA屬于硬件,還需要搞算法? 剛入門準備學fpga但一開始學的是語法,感覺像是電路用軟件語言描述出來,fpga
    發表于 09-09 16:54

    FPGA-5G通信算法的基本套路

    ? 一個完整的通信系統,是十分龐大的,沒有幾百上千人,在短時間內是做不好的。本文僅僅針對5G NR中的基帶算法部分,做一個簡單梳理。 對于5G通信系統, 站在基站側的角度,那么下行方向的整個處理
    發表于 08-15 17:34

    基于 FPGA 的會議系統設計

    比較好的魯棒性。Adaboost 是一種 迭代算法,其核心思想是針對同一個訓練集訓練不同的弱分類器,然后把這些弱 分類器集合起來,構成一個更強的最終分類器。Adaboost 算法系統具有較高的 檢測
    發表于 08-01 18:40

    FPGA在自動駕駛領域有哪些應用?

    通過實現控制算法來增加系統的安全性和穩定性。例如,FPGA可以用于實現車輛的防碰撞系統,通過實時監測并處理傳感器數據,預測并避免潛在的碰撞風險。 四、具體實例以國內某個自動豪華車型為例
    發表于 07-29 17:09

    FPGA在人工智能中的應用有哪些?

    FPGA可以快速調整其硬件結構以適應新的算法,而無需更換整個硬件系統。 二、云計算加速FPGA也被廣泛應用于云計算領域,用于加速各種網絡功能,如數據包的控制、分類和改寫等。這樣可以提
    發表于 07-29 17:05

    基于FPGA的指紋識別系統設計

    隨著人們對安全問題的日益重視,指紋識別作為一種高效、可靠的生物識別技術,在多個領域得到了廣泛應用。本文設計并實現了一種基于FPGA的嵌入式指紋識別系統,該系統利用FPGA的高集成度、低
    的頭像 發表于 07-17 16:33 ?1432次閱讀

    基于FPGA的CCD工業相機系統設計

    基于FPGA的CCD工業相機系統設計是一個綜合性的項目,它結合了硬件電路設計、FPGA編程以及圖像處理技術。以下是一個詳細的系統設計方案,包括設計概述、硬件架構、
    的頭像 發表于 07-17 11:24 ?1285次閱讀

    基于FPGA的圖像采集與顯示系統設計

    源和固有的并行處理能力,在數字信號處理、硬件加速、汽車電子等領域得到了廣泛應用。在圖像采集與顯示系統中,FPGA能夠實現高速、并行的數據處理,顯著提高系統的實時性和性能。本文設計了一個基于FP
    的頭像 發表于 07-17 10:58 ?2015次閱讀

    FPGA能實現什么樣的算法?

    FPGA功能如此強大,請問用FPGA能實現或者比較適合實現什么樣的算法
    發表于 05-26 20:18

    基于FPGA的實時邊緣檢測系統設計,Sobel圖像邊緣檢測,FPGA圖像處理

    摘要 :本文設計了一種 基于 FPGA 的實時邊緣檢測系統 ,使用OV5640 攝像頭模塊獲取實時的視頻圖像數據,提取圖像邊緣信息并通過 VGA顯示。FPGA 內部使用流水線設計和 并行運算加速
    發表于 05-24 07:45

    算法系列:彩色轉灰度

    今天和大俠簡單聊一聊彩色轉灰度的算法,話不多說,上貨。 一、基礎  對于彩色轉灰度,有一個很著名的心理學公式: Gray = R*0.299 + G*0.587 + B*0.114 二
    發表于 05-22 19:02

    基于FPGA的常見的圖像算法模塊總結

    意在給大家補充一下基于FPGA的圖像算法基礎,于是講解了一下常見的圖像算法模塊,經過個人的總結,將知識點分布如下所示。
    的頭像 發表于 04-28 11:45 ?630次閱讀
    基于<b class='flag-5'>FPGA</b>的常見的圖像<b class='flag-5'>算法</b>模塊總結

    基于 FPGA 的光纖混沌加密系統

    FPGA 設計加密算法具有安全性高,加密速度快,開發周期短,開發成本較低,可重配,可靠性高以及移植性好等優點。 3.2 混沌序列密鑰設計 混沌序列的產生主要有兩類:一類是利用微分方程表示的混沌系統
    發表于 04-26 17:18

    基于FPGA的光纖通信加密系統

    FPGA 設計加密算法具有安全性高,加密速度快,開發周期短,開發成本較低, 可重配,可靠性高以及移植性好等優點。 系統鏈路部分采用 Aurora 協議,該協議是一款輕量級的光纖鏈路協議,具有冗余少,可定制度高,鏈路速率快等特點。
    發表于 04-26 11:33 ?1318次閱讀
    基于<b class='flag-5'>FPGA</b>的光纖通信加密<b class='flag-5'>系統</b>

    算法系列:基于 FPGA 的圖像邊緣檢測系統設計(sobel算法

    今天給大俠帶來基于 FPGA 的圖像邊緣檢測設計,話不多說,上貨。 設計流程如下:mif文件的制作→ 調用 ip 核生成rom以及仿真注意問題→ 灰度處理→ 均值濾波:重點是3*3 像素陣列
    發表于 03-26 16:40
    主站蜘蛛池模板: 天天摸夜夜添狠狠添2018| 扒开双腿疯狂进出爽爽爽| 天天尻逼| 性夜影院午夜看片| 无人区理论片手机看片| 色综合久久网| 欧美一级三级在线观看| 欧美h视频| 国产一级特黄高清在线大片| 成熟女人免费一级毛片| 亚洲国产精品热久久2022| 亚洲理论在线观看| 欧美黄色免费大片| 西西人体44rt高清午夜| 亚洲男人的天堂久久香蕉| 久草视频一区| 韩国三级日本三级在线观看| 高清毛片aaaaaaaaa片| 午夜影院免费观看视频| 美女好紧好大好爽12p| 天天干天天射天天舔| 人人福利| 免费看h视频| 国产福利vr专区精品| 天堂bt在线| 久久久久综合中文字幕| www.91免费视频| 免费理论片在线观看播放| 欧美猛交lxxxxxxxxx| 在线播放黄色网址| 亚洲免费国产| 婷婷色婷婷| 久草一区| 天天操天天操| 黄色小网站在线观看| 一区二区三区欧美在线| 四虎影院在线观看免费| 欧美一级视频精品观看| 国产精品虐乳在线播放| 欧美三级午夜伦理片| 中文字幕一区二区三|