資料介紹
高性能浮點處理一直與高性能 CPU 相關(guān)聯(lián)。在過去幾年中,GPU 也成為功能強大的浮點處理平臺,超越了圖形,稱為 GPGPU(通用圖形處理單元)。新創(chuàng)新是在苛刻的應(yīng)用中實現(xiàn)基于 FPGA 的浮點處理。本文的重點是 FPGA 及其浮點性能和設(shè)計流程,以及 OpenCL 的使用,這是高性能浮點計算前沿的編程語言。各種處理平臺的 GFLOP 指標(biāo)在不斷提高,現(xiàn)在,TFLOP/s 這一術(shù)語已經(jīng)使用的非常廣泛了。但是,在某些平臺上,峰值 GFLOP/s,即,TFLOP/s 表示的器件性能信息有限。它只表示了每秒能夠完成的理論浮點加法或者乘法總數(shù)。分析表明,F(xiàn)PGA 單精度浮點處理能夠超過 1 TFLOP/s。一種不太復(fù)雜的常用算法是 FFT。使用單精度浮點實現(xiàn)了 4096 點 FFT。它能夠在每個時鐘周期輸入輸出四個復(fù)數(shù)采樣。每一個 FFT 內(nèi)核運行速度超過 80 GFLOP/s,大容量 FPGA 的資源支持實現(xiàn) 7 個這類的內(nèi)核。但是,如圖 1 所示,這一 FPGA 的 FFT 算法 GFLOP/s 接近 400 GFLOP/s。這是“按鍵式”O(jiān)penCL 編譯結(jié)果,不需要 FPGA 專業(yè)知識。使用邏輯鎖定和 DSE 進行優(yōu)化,7 內(nèi)核設(shè)計接近單內(nèi)核設(shè)計的 Fmax,將其 GFLOP/s 提升至 500,超過了 10 GFLOP/s 每瓦。這一每瓦 GFLOP/s 要比 CPU 或者 GPU 功效高很多。對比一下 GPU,GPU 在這些 FFT 長度上效率并不高,因此,沒有進行基準(zhǔn)測試。當(dāng) FFT 長度達到幾十萬個點時,GPU 效率才比較高,能夠為 CPU 提供有效的加速功能。
?
- 以太網(wǎng)EMC接口硬件電路如何在PCB上實現(xiàn)資料下載
- 如何使用FPGA實現(xiàn)運動估計算法的設(shè)計 13次下載
- 如何使用FPGA實現(xiàn)FFT的研究 15次下載
- 使用FPGA實現(xiàn)流水線結(jié)構(gòu)的FFT處理器論文講解 12次下載
- 如何在DSP芯片上實現(xiàn)Matlab的仿真算法 33次下載
- 如何才能在FPGA上實現(xiàn)對數(shù)函數(shù) 12次下載
- 浮點運算單元的FPGA實現(xiàn) 8次下載
- 計算器復(fù)數(shù)運算方法 4次下載
- 計算器-復(fù)數(shù)的計算方法 0次下載
- 對Altera 28nm FPGA浮點DSP設(shè)計流程和性能的獨立分析 31次下載
- WP409利用Xilinx FPGA打造出高端比特精度和周期精度浮點DSP算法實現(xiàn)方案 25次下載
- 浮點反正切函數(shù)的FPGA實現(xiàn)
- 基于CORDIC算法高精度浮點超越函數(shù)的FPGA實現(xiàn) 0次下載
- 利用CORDIC 算法在FPGA 中實現(xiàn)可參數(shù)化的FFT
- 用VHDL語言在CPLD/ FPGA上實現(xiàn)浮點運算
- 如何在FPGA中實現(xiàn)隨機數(shù)發(fā)生器 329次閱讀
- 浮點加法是如何計算的 951次閱讀
- FPGA浮點數(shù)轉(zhuǎn)化為定點數(shù)方法 4396次閱讀
- 如何在OLED上實現(xiàn)字符的顯示 4668次閱讀
- 如何在OCI Ampere A1上啟動計算密集AI應(yīng)用程序 1777次閱讀
- 如何在FPGA中正確處理浮點數(shù)運算 4795次閱讀
- 如何在QCC300x上實現(xiàn)I2C功能 3341次閱讀
- Altera FPGA硬核浮點DSP模塊解決方案提高運算性能 3498次閱讀
- 如何在單片機上實現(xiàn)卡爾曼濾波詳細計算方法和程序概述 1.2w次閱讀
- 一文了解FPGA浮點小數(shù)與定點小數(shù)的換算及應(yīng)用 6850次閱讀
- 基于Xilinx FPGA上實現(xiàn)深度遞歸神經(jīng)網(wǎng)絡(luò)語言模型 1393次閱讀
- 基于FPGA的嵌入式處理器的浮點系統(tǒng) 1558次閱讀
- 快速高效的實現(xiàn)浮點復(fù)數(shù)矩陣分解 955次閱讀
- 在FPGA上優(yōu)化實現(xiàn)復(fù)數(shù)浮點計算 1817次閱讀
- FPGA工程師:如何在FPGA中實現(xiàn)狀態(tài)機? 1.2w次閱讀
下載排行
本周
- 1山景DSP芯片AP8248A2數(shù)據(jù)手冊
- 1.06 MB | 532次下載 | 免費
- 2RK3399完整板原理圖(支持平板,盒子VR)
- 3.28 MB | 339次下載 | 免費
- 3TC358743XBG評估板參考手冊
- 1.36 MB | 330次下載 | 免費
- 4DFM軟件使用教程
- 0.84 MB | 295次下載 | 免費
- 5元宇宙深度解析—未來的未來-風(fēng)口還是泡沫
- 6.40 MB | 227次下載 | 免費
- 6迪文DGUS開發(fā)指南
- 31.67 MB | 194次下載 | 免費
- 7元宇宙底層硬件系列報告
- 13.42 MB | 182次下載 | 免費
- 8FP5207XR-G1中文應(yīng)用手冊
- 1.09 MB | 178次下載 | 免費
本月
- 1OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234315次下載 | 免費
- 2555集成電路應(yīng)用800例(新編版)
- 0.00 MB | 33566次下載 | 免費
- 3接口電路圖大全
- 未知 | 30323次下載 | 免費
- 4開關(guān)電源設(shè)計實例指南
- 未知 | 21549次下載 | 免費
- 5電氣工程師手冊免費下載(新編第二版pdf電子書)
- 0.00 MB | 15349次下載 | 免費
- 6數(shù)字電路基礎(chǔ)pdf(下載)
- 未知 | 13750次下載 | 免費
- 7電子制作實例集錦 下載
- 未知 | 8113次下載 | 免費
- 8《LED驅(qū)動電路設(shè)計》 溫德爾著
- 0.00 MB | 6656次下載 | 免費
總榜
- 1matlab軟件下載入口
- 未知 | 935054次下載 | 免費
- 2protel99se軟件下載(可英文版轉(zhuǎn)中文版)
- 78.1 MB | 537798次下載 | 免費
- 3MATLAB 7.1 下載 (含軟件介紹)
- 未知 | 420027次下載 | 免費
- 4OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234315次下載 | 免費
- 5Altium DXP2002下載入口
- 未知 | 233046次下載 | 免費
- 6電路仿真軟件multisim 10.0免費下載
- 340992 | 191187次下載 | 免費
- 7十天學(xué)會AVR單片機與C語言視頻教程 下載
- 158M | 183279次下載 | 免費
- 8proe5.0野火版下載(中文版免費下載)
- 未知 | 138040次下載 | 免費
評論
查看更多