在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

德思特分享 突破FPGA限制:德思特TS-M4i系列數字化儀利用GPU加速實現高效塊平均處理

虹科技術 ? 來源:虹科技術 ? 作者:虹科技術 ? 2024-08-20 09:26 ? 次閱讀

來源:德思特分享| 突破FPGA限制:德思特TS-M4i系列數字化儀利用GPU加速實現高效塊平均處理

原文鏈接:https://mp.weixin.qq.com/s/vV0kwM7Rh3tomrGwgHSGlw

歡迎關注虹科,為您提供最新資訊!

#塊平均 #數據處理 #GPU

應用背景

塊或分段內存平均模式常用于在不同應用當中,移除信號中不相干的噪聲。不管是哪家的數字化儀制造商,幾乎所有基于FPGA實現的塊平均模式都會受到塊或者段內存大小的限。該限制一般取決于FPGA的容量,最大樣品量通常在32k到500k之間。

本白皮書將展示如何使用德思特TS-M4i系列數字化儀的高速PCIe流模式來在軟件中實現塊平均處理,從而突破FPGA的限制。 我們用了TS-M4i.2230(1通道,5 GS/s,8位垂直分辨率,1.5 GHz帶寬)作為例子,對比硬件和軟件進行塊平均處理的效果。

什么是塊平均?

塊平均模式可以用來移除隨機噪聲成分,提高重復信號的保真度。該模式允許對多次單段采集進行處理、累積和平均。 這個過程減少了隨機噪聲,提高了重復信號的可見性,平均后的信號具有增強的測量分辨率和更高的信噪比(SNR)

塊平均模式可用于改善雷達測試、天文學、質譜學、醫學成像、超聲波測試、光纖測試和激光測距等各種不同應用中的測量。

下面截圖顯示了一個較低電平的信號(大約2mV),完全被隨機噪聲覆蓋的情形,以及使用不同平均因子獲得的信號質量改進。雖然在原始單次采集中源信號基本無法看到,但10x平均時,能顯示出實際上有5個信號峰。執行1000x的塊平均可以進一步改善信號質量,揭示出帶有二次最大值和最小值峰的完整信號形狀。
圖片1.png

通過塊平均改善噪聲問題,該示例使用了一個500MS/s采樣率(每個采樣點2ns)和14位分辨率的數字化儀制作

系統配置

為了兼顧更多老舊設備的性能狀況,測試系統選用了一臺德思特公司內的舊辦公電腦,大致配置如下:

● 主板:技嘉GA-H77-D3H

CPUIntel i7-3770,4核3.4 GHz

● 運行內存:8 GB DDR3

● 硬盤:120 GB固態

操作系統:Win 7 64bit

● IDE:Visual Studio 2005標準版

主板上有一個空閑的PCIe Gen2 x8插槽,我們就使用該插槽來插數字化儀板卡。此時,德思特的TS-M4i板卡的流式傳輸可以達到滿速,約3.4 GB/s(不考慮數據處理的情況下)。

軟件實現

測試軟件使用純C++編寫,并基于德思特流式傳輸示例。數字化儀板卡通過外部觸發采集,板卡會自動在每個觸發事件后獲取一段數據。數據會先存儲在板載內存中,然后通過分散聚集式式DMA直接傳輸到PC的運行內存,并在運行內存中進行累積,進而執行塊平均操作。我們針對不同的配置方式和優化策略進行了測試,來看看分別能達到什么樣的性能水平。

摘錄出來的一小段源代碼顯示了多線程版本的主求和循環,這正是軟件處理的關鍵部分,也是決定速度的部分。
圖片2.png

以下列表提供了具體實現各個方面的一些信息和備注:

● 數據段大小:收到觸發事件后將獲取數據的樣本點數量

● 平均次數:對于一個數據段,在算法重置前,整個過程中需要執行多少次平均前的累加操作。

● 通知大小:硬件生成中斷所需的數據量。該參數決定了整個平均循環的速度。如果通知大小大于數據段大小,則會在一次中斷中傳輸多個數據段的內容,這將減少線程通信和中斷處理的額外開銷。

● 緩沖區大小:DMA傳輸的目標緩沖區整體大小。在我們的實驗中,這個緩沖區固定等于通知大小的16倍。

● 觸發速率:作為外部觸發的信號發生器的信號重復頻率。在結果表格中,我們給出的是在不填滿(溢出)緩沖區的情況下可以達到的最大觸發速率。

● 線程數:為了加快求和過程,我們對該任務進行并行化優化,將其分割成多個不同的軟件線程。如果線程為1,則表示求和過程不使用額外線程,而是直接在主循環中直接執行。

● CPU負載:由于平均過程是用軟件完成的,具體來說就是CPU進行了所有的工作。幸好現代CPU往往包含多個內核,我們實際上可以輕松地在它們之間共享工作任務。

● SSE/SSE2指令:乍一看,這些命令似乎非常適合并行化求和過程,并似乎可以在不需要任何線程編程的情況下加快軟件的速度。但不幸的是,SSE命令集都是基于相同類型的數據的,而由于獲取的數據是8bit寬度,而平均緩沖區是32位寬,因此在本例中無法利用該指令集進行加速。

效果和比較

所有的測量都是使用一個采樣率高達5GS/s、垂直分辨率為8位,并且帶有外部觸發通道的數字化儀進行的。我們在表格中還列出了不同的程序配置以對比效果差異。
圖片3.png

通過普通(性能偏低的)PC在時域上進行塊平均的性能對比

新方法:使用CUDA進行平均運算

2018年11月, 德思特推出了一些使用SCAPP(通過CUDA訪問數據和并行處理)選項進行塊平均的示例,適用于非常高速的數據處理。 其基本概念與前文所述相同,即數據由數字化儀采集并通過PCIe總線連續傳輸。不同之處在于,平均值的計算操作不是由CPU完成,而是在GPU中完成。GPU解決方案的一個主要優點在于, GPU本身就是為并行計算而設計,這使GPU成為各種類型的塊平均運算的理想選擇

在實現上,SCAPP允許用戶直接將數據傳送到GPU,這使用了RDMA(遠程直接內存存取)技術,然后可以在GPU上執行高速時域和頻域信號的平均,并突破通常在CPU和FPGA中出現的數據長度或算力限制。

比如, TS-M4i.2220數字化儀可以以2.5 GS/s的速度連續采樣信號,我們可以做到在不丟失樣品點的情況下,進行長達數秒的平均運算 。類似地,我們還有14位垂直分辨率的TS-M4i.4451數字化儀可以以450 MS/s的速度同時對四個通道的信號進行同一功能的采樣。數字化儀板卡還提供了靈活的觸發、捕獲和讀出模式設置,從而使它們能夠在觸發速率極高的情況采回原始信號,進而做平均處理。相比之下,FPGA方案需要最高性能級別的FPGA來同時滿足數據拉取和平均運算,而GPU方案則可以輕松跑滿數字化儀的全速,即使是使用入門級GPU也不會成為瓶頸。

以下表格展示了使用GPU,并在和之前表格中板卡參數相同的情況下的測試結果:
圖片4.png

在時域上使用GPU進行塊平均的測試結果

這些結果是在使用一張Quadro P2000 GPU獲得的。如表所示,數據段大小和通知大小并未限制性能,我們遇到唯一限制的瓶頸是GPU內存(顯存)。

使用GPU進行頻域平均

在需要進行頻域平均的情況下,也建議使用GPU,因為GPU允許比FPGA方案更大的平均塊大小。頻域的平均運算過程包含兩個步驟,一個是針對塊數據的FFT運算,另一個是對FFT結果求和(然后取平均)。其中FFT計算在處理能力方面要求非常高,因此對于頻率域平均而言,除了FPGA外,GPU是唯一的可行方案,CPU并不適合在高速下進行FFT轉換。

以下表格顯示了使用最大采樣率為500 MS/s的TS-M4i.4451數字化儀(4通道,14位垂直分辨率)的一些測試結果。最終表明該方案能高效地實現無間隙數據采集,將每個塊中的原始數據轉換為對應電壓值,然后再轉換至頻率域做平均。
圖片5.png

使用GPU進行頻率域塊平均的測試結果

結論

如上述結果所示,只要重復率不算太高,得益于PCIe總線的高速數據傳輸率,使用基于CPU的軟件在進行塊平均時,可以實現比FPGA更大的總數據段大小,從而平均更長時間的樣本;而使用GPU時,更是可以達到PCIe總線傳輸所限制的上限速度。對于需要處理更高重復觸發率的情況,會對總線傳輸速度提出更高的要求,此時基于FPGA硬件的塊平均仍將是最佳選擇。

上述測試程序也可以提供給您,以便您自己進行重復測試,或者作為實現其他軟件程序的基礎。其中GPU示例是SCAPP軟件選項的一部分,在選購后,德思特的客戶可按照NDA協議使用。

總的來說,通知大小設為1 MByte時,可獲得最佳性能。具體執行的平均次數對測試性能并沒有明顯的影響。因為復制結果段和清除結果緩沖所需的時間相對于樣本求和運算而言微不足道。

由于在同時采集多個通道時,整個的數據處理和求和過程并沒有本質區別,因此只需等價成一個把所有數據都合并到一起的新通道即可(等效采樣率= 每通道采樣率 × 通道數)。以下設置對應的最大觸發速率完全相同:

● 1通道5 GS/s @ 數據段大小S1

● 2通道2.5 GS/s @ 數據段大小S1/2

● 4通道1.25 GS/s @ 數據段大小S1/4

將采樣速度降低到2.5 GS/s時,可以在理論上使軟件針對1個通道執行平均運算的速度最大化。對于1 M樣本點的數據段大小,外加死區長度為160個樣本點時,理論上的最大觸發速率為:(2.5 GS/s) / (1 MS+ 160 S) = 2.38 kHz。

注意,這確實會明顯低于單純采集時的最大觸發速率:2.9 kHz @ 5 GS/s。

關于德思特 :德思特是虹科的一家姐妹公司,基于超過10年的業務沉淀,德思特公司專注提供電子測試/測量解決方案。主要業務范圍涵蓋:汽車電子仿真及測試、射頻微波無線通信測試、無線頻譜監測與規劃、無線通信(包括智能網聯汽車無線通信、軌道交通、衛星通信、室內無線通信)、半導體測試、PNT解決方案、大物理和光電測試等。更多資訊請關注tesight.com或公眾號德思特測試測量

審核編輯 黃宇

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • FPGA
    +關注

    關注

    1629

    文章

    21736

    瀏覽量

    603429
  • gpu
    gpu
    +關注

    關注

    28

    文章

    4740

    瀏覽量

    128951
  • PCIe
    +關注

    關注

    15

    文章

    1239

    瀏覽量

    82660
  • 數字化儀
    +關注

    關注

    0

    文章

    143

    瀏覽量

    17938
收藏 人收藏

    評論

    相關推薦

    Spectrum儀器數字化現已提供基于FPGA平均

    的信號噪音,提高測量的分辨率、動態范圍以及信噪比(SNR)而言可謂是一款重要的工具。新選項使M5i數字化能夠通過先進的板上現場可編程門陣列(FPGA)技術
    的頭像 發表于 10-12 15:08 ?697次閱讀
    Spectrum儀器<b class='flag-5'>數字化</b><b class='flag-5'>儀</b>現已提供基于<b class='flag-5'>FPGA</b>的<b class='flag-5'>平均</b>值

    分享丨一文帶你了解ADC測試參數有哪些?

    模數轉換器(ADC)是數字電子系統中重要組成部分,用于捕獲外部世界的模擬信號,將它們轉化為數字信號0\1, 以供計算機進行處理分析。
    的頭像 發表于 11-20 13:25 ?734次閱讀
    <b class='flag-5'>德</b><b class='flag-5'>思</b><b class='flag-5'>特</b>分享丨一文帶你了解ADC測試參數有哪些?

    增加3~4個獨立數字脈沖發生器通道!數字化儀和AWG新增DPG功能

    數字脈沖升級功能Spectrum系列全部在售數字化儀和AWG產品(包括
    的頭像 發表于 11-30 11:19 ?606次閱讀
    增加3~<b class='flag-5'>4</b>個獨立<b class='flag-5'>數字</b>脈沖發生器通道!<b class='flag-5'>數字化</b>儀和AWG新增DPG功能

    方案 | 毫米波RIS研究測試方案:一站式助力工程師探索高頻通信未來

    毫米波RIS研究測試方案憑借其一站式的服務和專業的設備組合,為工程師和科研人員開展毫米波RIS研究提供強有力的支持,助力他們在探索未來無線通信技術的道路上不斷前行。
    的頭像 發表于 12-22 09:37 ?577次閱讀
    <b class='flag-5'>德</b><b class='flag-5'>思</b><b class='flag-5'>特</b>方案 | <b class='flag-5'>德</b><b class='flag-5'>思</b><b class='flag-5'>特</b>毫米波RIS研究測試方案:一站式助力工程師探索高頻通信未來

    新聞 | PANORAMA天線與Robustel(魯邦通)建立合作

    “堅固可靠,齊心協力”,Panorama天線與魯邦通路由器的結合為工業應用提供了強大的連接性!
    的頭像 發表于 12-25 15:06 ?904次閱讀
    <b class='flag-5'>德</b><b class='flag-5'>思</b><b class='flag-5'>特</b>新聞 | <b class='flag-5'>德</b><b class='flag-5'>思</b><b class='flag-5'>特</b>PANORAMA天線與Robustel(魯邦通)建立合作

    如何使用SBench6軟件對數字化采集信號進行處理?(二)——平均運算功能

    上一篇文章介紹了了SBench 6為板卡式數字化提供的波形算術運算及直方圖功能。本章將繼續為大家SBench 6的
    的頭像 發表于 01-15 14:05 ?480次閱讀
    如何使用SBench6軟件對<b class='flag-5'>數字化</b><b class='flag-5'>儀</b>采集信號進行<b class='flag-5'>處理</b>?(二)——<b class='flag-5'>平均</b>運算功能

    如何使用SBench 6對數字化采集信號進行處理?(三)——快速傅立葉變換(FFT)

    上一篇文章介紹了SBench 6的平均運算功能。本章將繼續為大家介紹SBench 6的快速傅立葉變換(FFT)。
    的頭像 發表于 01-23 10:38 ?598次閱讀
    如何使用SBench 6對<b class='flag-5'>數字化</b><b class='flag-5'>儀</b>采集信號進行<b class='flag-5'>處理</b>?(三)——快速傅立葉變換(FFT)

    如何正確使用數字化前端信號調理?(一)

    一、前言 板卡式的數字轉換器和類似測量儀器,比如圖1所示的TS-M4i系列,都需要為各種各
    的頭像 發表于 04-11 14:01 ?408次閱讀
    如何正確使用<b class='flag-5'>數字化</b><b class='flag-5'>儀</b>前端信號調理?(一)

    TS-AWG7000系列新品重磅來襲!

    ? ? 一、新聞速覽 自豪地宣布,我們最新推出的TS-AWG7000系列臺式任意波形發生器現已正式上市。這一最新
    的頭像 發表于 04-22 14:09 ?456次閱讀
    <b class='flag-5'>德</b><b class='flag-5'>思</b><b class='flag-5'>特</b><b class='flag-5'>TS</b>-AWG7000<b class='flag-5'>系列</b>新品重磅來襲!

    信號穩定,性能卓越!礁鯊系列MiMo天線正式發布!

    ? 作者介紹 礁鯊?系列天線,以其獨特的外觀設計和強大的性能,成為Panorama智能天線家族的最新成員。這款天線不僅穩定提供5G、WIFI和GNSS信號,更能在各類復雜環境中展
    的頭像 發表于 05-31 10:28 ?447次閱讀
    信號穩定,性能卓越!<b class='flag-5'>德</b><b class='flag-5'>思</b><b class='flag-5'>特</b>礁鯊<b class='flag-5'>系列</b>MiMo天線正式發布!

    Spectrum控制中心為數字化提供強大的軟件支持

    應用程序來控制、查看和傳輸數模轉換器的數據。軟件可以由我們提供,也可以根據客戶需要自行定制開發,今天特為您介紹模塊數字化的軟件支持。
    的頭像 發表于 06-12 10:27 ?396次閱讀
    <b class='flag-5'>德</b><b class='flag-5'>思</b><b class='flag-5'>特</b>Spectrum控制中心為<b class='flag-5'>數字化</b><b class='flag-5'>儀</b>提供強大的軟件支持

    從探頭到傳感器:數字化的全面結合與應用

    電壓探頭可以用于轉換信號電平、改變阻抗或提供更方便的連接方法。而包括電流探頭、加速度計和光電倍增管在內的傳感器或變送器,則可以將各種物理量轉換為電信號。 這兩種輸入設備都受到
    的頭像 發表于 06-28 10:59 ?336次閱讀
    從探頭到傳感器:<b class='flag-5'>德</b><b class='flag-5'>思</b><b class='flag-5'>特</b><b class='flag-5'>數字化</b><b class='flag-5'>儀</b>的全面結合與應用

    突破FPGA限制TS-M4i系列數字化利用GPU加速實現高效平均處理

    的容量,最大樣品量通常在32k到500k之間。 本白皮書將展示如何使用TS-M4i系列數字化的高速PCIe流模式來在軟件中實現
    的頭像 發表于 08-19 15:27 ?333次閱讀
    <b class='flag-5'>突破</b><b class='flag-5'>FPGA</b><b class='flag-5'>限制</b>:<b class='flag-5'>TS-M4i</b><b class='flag-5'>系列</b><b class='flag-5'>數字化</b><b class='flag-5'>儀</b><b class='flag-5'>利用</b><b class='flag-5'>GPU</b><b class='flag-5'>加速</b><b class='flag-5'>實現</b><b class='flag-5'>高效</b><b class='flag-5'>塊</b><b class='flag-5'>平均</b><b class='flag-5'>處理</b>

    榮獲廣東省科技型中小企業資質

    在科技創新的浪潮中,廣州科技有限公司(簡稱“”)以其深厚的行業積淀和卓越的創新能力,
    的頭像 發表于 12-09 15:25 ?263次閱讀

    特與Sanko達成合作伙伴關系

    近日,科技有限公司(以下簡稱“”)與知名品牌Sanko正式簽署代理協議,標志著雙方正
    的頭像 發表于 12-12 09:52 ?246次閱讀
    主站蜘蛛池模板: 嘿嘿午夜| 国产乱人视频免费播放| 国产亚洲人成网站观看| 奇米影视7777| 男女性生动态免费视频| 日本三级在线播放线观看2021| brazzersvideosex欧美最| 2018天天干天天射| 香蕉视频一级| 色福利在线| 夜夜爽爽| 亚洲国产女人aaa毛片在线| 日本午夜片| 天天操 夜夜操| 乱轮黄色小说| 黄色美女网站在线观看| 国产亚洲欧美成人久久片| 亚洲激情视频网| 成人a级特黄毛片| 久久久久久久久久免免费精品| 在线视频免费视频网站| 婷婷久久综合网| 亚洲热热久久九九精品| 亚洲精品资源| 久久狠色噜噜狠狠狠狠97| 国产香蕉免费精品视频| 亚欧免费视频| 夜夜夜夜操| 九九热精品在线视频| 国产女人视频免费观看| 人人做人人爽人人爱秋霞影视| 色多多www网站| 男女性高爱潮免费的国产| 性午夜影院| 午夜免费片| 在线观看a网站| 最新激情网站| www.一区二区| 综合网自拍| 97久久草草超级碰碰碰| www.久色|