在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

數據中心中的FPGA硬件加速器

FPGA技術江湖 ? 來源:FPGA技術江湖 ? 2025-01-14 10:29 ? 次閱讀

再來看一篇FPGA的綜述,我們都知道微軟包括國內的云廠商其實都在數據中心的服務器中部署了FPGA,所以這篇論文就以數據中心的視角,來看下FPGA這個硬件加速器。

還是一樣,想要論文原文的可以私信我。

由于論文不長,我們就直接把原始論文翻譯出來,而不是跟之前一樣只總結部分內容。

摘要

數據流特征的日益動態化,給研究帶來了更多挑戰。數據中心的計算復雜度、存儲、能源和安全等方面的資源消耗正處于 intense 的研究焦點之下。本文旨在回顧通過部署現場可編程門陣列(FPGA 設備)來提高數據中心 operational 效率的方法。由于數據中心對高性能計算的需求巨大,本文解決了在處理數據方面的問題,盡管傳統方案仍然存在挑戰。本文還回顧了支持 FPGA 在數據中心中取得積極進展的關鍵使能技術,如大數據和云計算,以及它們所面臨的挑戰。本文匯編并介紹了研究人員提出的 novel 架構,并對基于 FPGA 的數據中心數據管理進行了詳細分析,為研究人員提供了更多有前景的研究方向。

1. 引言

數據中心是一種物理計算設施,用于存儲關鍵應用程序和數據,并用于共享計算應用程序。數據中心的主要組件是交換機、路由器、防火墻、服務器和存儲介質。在現代,多個數據中心通過邊緣、私有和公共云連接。在當今的情況下,數據中心在企業資源規劃、客戶關系管理、大數據、機器學習人工智能方面發揮著重要作用。數據中心的infrastructure經歷了三個主要的時代:第一個時代是從大型機到 X-86 服務器,第二個時代是infrastructure的虛擬化,而現在是云、混合云和云原生。在過去十年中,計算負載從 10 萬增加到數百萬;所需的存儲容量從 PB 級增加到 EB 級,網絡容量所需的速度也朝著 Pbps 級方向增加。因此,技術擴展對功率/熱密度、中央處理器 (CPU) 性能、異構計算(即低功耗下的高性能)的需求非常迫切。現在是時候從應用程序加速、處理器卸載、性能/功耗和軟件定義開發的角度重新定義數據中心網絡架構,以實現規模擴展。

A. 數據中心中的 FPGA

為了填補數據中心的計算空白,人們認為現場可編程門陣列 (FPGA) 將發揮主導作用,其市場價值預計將大幅上升。現在的 FPGA 具有高速連接、存儲塊和信號處理塊。除此之外,還提供 USB 3.0、SATA 3.0、DDR4 控制器,以實現高速數據處理。此外,借助內置的 ARM 處理器,可以實現實時處理,該處理器具有浮點和內存管理功能。顯然,最新的 FPGA 部署了應用處理器單元、實時處理單元和多媒體處理單元。此外,它們還具有復雜的加密算法、高速外設和收發器。上面討論的功能都集成在 FPGA 中。Xilinx 開發了專用的自適應加速器卡硬件模塊 ALVEO,用于數據中心相關應用。同樣,英特爾開發了 Agilex 和 Stratix 10 FPGA 系列,用于支持四核 ARM Cortex-A53 處理器的高性能加速應用。強烈建議對下一代計算的芯片制造工藝進行必要的更改,尤其是在數據中心應用中。全球大多數著名的數據中心都使用可再生能源和超環路網絡設施來運營,以提供高效的電信數據和基于云的服務。

II. 數據中心大數據處理方案的演進

使用無源光網絡,可以通過協同流調度來管理大數據,并進行資源優化。作者還考慮了改變大數據的流量模式,并使用 MapReduce 在以交換機為中心的設計中路由數據包。無源光網絡還用于以服務器為中心的應用,為數據中心網絡提供可靠的高速骨干架構。為了使用戶能夠在異構數據中心中完美地利用 FPGA 加速器,Kchris 等人開發了一種集成的多功能加速器。圖 1 顯示了在數據中心應用中發揮重要作用的節能大數據處理方案的詳細分類。

829ed66c-cfb7-11ef-9310-92fbcf53809c.png

B. 案例研究:用于數據處理的可重構設備

硬件加速器

谷歌、微軟和亞馬遜已經更新了部署 FPGA 的數據中心,以增強后端的機器學習。FPGA 為節能可編程硬件架構提供了一種很有前景的替代方案。FPGA 的可重構能力允許在數據中心的不同環境下實現高性能、低功耗和高吞吐量。表 1 列出了 CNN 在 FPGA 中的性能。基于全方位、基于加速器的異構集成數據中心的 VINEYARD .

82c84ee8-cfb7-11ef-9310-92fbcf53809c.png

如圖 2 所示,它為具有粗粒度和細粒度可編程加速器的低能耗數據中心提供了一個單一平臺。基于 FPGA 的加速與超片概念是為 CNN 設計的,用于在數據中心中執行各種不同的視頻和圖像相關推理任務。圖 3 顯示了超片單元上的卷積計算。在此設計中,對基本增強處理單元 (EPE) 進行了放大和修改,使其成為超片單元,以提高不同種類卷積過程的交錯類型任務調度的性能。ConvNet、DNN Weaver、Caffeine 和 Snow Flake CNN 在 Zynq 和 Kintex FPGA 設備中實現。這些結果表明,所實現的 CNN 的工作頻率高達 250 MHz,延遲為 8.22 毫秒,并且能夠在 FPGA 中執行 197.4 GOPS(每秒千兆次運算),如表 1 所示。

82e61e6e-cfb7-11ef-9310-92fbcf53809c.png

830c5124-cfb7-11ef-9310-92fbcf53809c.png

微軟自 2015 年起就將 FPGA 集成到 Bing 中,以加速數據搜索。它由 PCI Express 交換機中的 6 個 Virtex 6 組成。該 FPGA 加速器卡安裝在 Supermicro-Super-Server 中,用于 48(根據需要)節點服務器 pod,連接到 10 Gb 每秒以太網通信端口的 4 個節點。它已擴展到 1632 個節點集群。圖 2 顯示了 FPGA 查詢延遲行為。FPGA 的采用將搜索性能提高了 2 倍。吞吐量增加,延遲減少了 29%,與 X86 iron 相比,降低了成本(高達 30%)和功耗。可以將計算密集型任務轉發到附近的邊緣節點。具有 FPGA 的硬件可定制邊緣計算提高了性能并節省了能源。使用此方法通過卸載實現了基于計算機視覺的移動應用程序,這分別為邊緣設備和移動設備提供了 16.2% 和 29.5% 的能效。如表 4 和表 5 所示,響應時間也大大減少了。

83393e78-cfb7-11ef-9310-92fbcf53809c.png

最近,CESNET(捷克 NREN)演示了基于 Virtex Ultra Scale+ FPGA 的 NFB-200G2QL 加速器可在單個 NIC 卡中實現 200 Gbps 吞吐量的網絡數據傳輸。在此環境上進行的現代基準測試模擬提供的性能是完整軟件模擬的兩倍。

C. 高性能計算

本節主要強調了將基于云的服務與基于 FPGA 的數據中心架構相集成的重要性,以及基于云網絡的數據處理任務的動機。表 7 突出顯示了 FPGA 支持的云計算在數據中心中的各種作用。

8352066a-cfb7-11ef-9310-92fbcf53809c.png

在 FPGA 上移植應用程序并不是適用于數據中心或云應用程序中使用的所有類型和配置的 FPGA 的即插即用任務。為數據中心開發的 FPGA 虛擬化可用于與領域無關的用戶設計進行交互。顯然,虛擬化 FPGA 是為數據中心中的流式云應用程序開發的,并將結果與使用 FPGA 設計的傳統虛擬機進行了比較。即使 FPGA 中軟錯誤的物理發生頻率不高,也需要測試 FPGA 的魯棒性。尤其是在采用了超過 100,000 個 FPGA 節點的大規模數據中心中,需要確保可靠性以避免數據損壞。對基于 FPGA 的云計算節點進行故障分析,以估計 FPGA 在云計算中對軟錯誤的敏感性。對 FPGA 結構代理和多 FPGA 結構的設計進行了動態策略分析,并對 FPGA 的擴展進行了分析,觀察到吞吐量、性能和延遲方面的改進。

D. 高性能計算

隨著智能設備、自動駕駛汽車和互聯工廠的發展,它們將生成大量需要處理的數據。高性能計算用于利用分布式計算資源來解決復雜問題,其中包含大約 TB 甚至 ZB 的大型數據集,這些數據集需要實時處理。此類高性能計算通常由 CPU 和 GPU 執行。表 8 突出顯示了 FPGA 在 HPC 中最重要的作用。

83695bee-cfb7-11ef-9310-92fbcf53809c.png

與 CPU 和 GPU 相比,FPGA 在某些應用中的性能優于 CPU 和 GPU:

線性代數方程的求解速度比 CPU 快 19 倍。地球物理的 3D 卷積比 CPU 快 70 倍,比 CPU 快 14 倍。分子動力學的求解速度比 NAMD CPU 快 80 倍。用于生物信息學的基本局部比對搜索工具 (BLAST) 的求解速度比并行優化的 CPU 快 5 倍。用于氣候建模的全球大氣方程比 CPU 快 19 倍,比 GPU 快 7 倍。FPGA 可配置用于具有高速計算的數據壓縮應用程序,并將其集成到虛擬化環境中。

此外,在沒有任何通信開銷的情況下,FPGA 可以配置為提供具有更好硬件加速的微服務。使用帶有 OpenCL 編譯器的 Nallatech FPGA 實現了兩個 HPC 應用程序,例如最近鄰和 Lava MD(分子動力學)以及文檔分類。與 Xeon 類型的處理器相比,此硬件架構產生的結果快 4.3 倍、5.3 倍和 1.3 倍。FPGA 實現的功耗也降低了。表 9 顯示了上述應用程序的實現時間。在 FPGA、CPU 和 GPU 上演示了 AES256。基于 FPGA 的密碼分析在成本、功耗和吞吐量方面的性能優于 GPU 和 CPU,如表 9 和表 10 所示。

837d719c-cfb7-11ef-9310-92fbcf53809c.png

83933234-cfb7-11ef-9310-92fbcf53809c.png

基于 ZU102 FPGA 的配置與純軟件數據傳輸相比,延遲降低了 25%。此外,在相同配置上進行 HPC 矩陣乘法的吞吐量提高了 10%。FPGA 可以配置為協處理器,因此與英特爾 i5 處理器相比,它可以使同態加密算法的速度提高 13 倍。表 11 列出了 FFT 實現的結果。它證實了基于 FPGA 的實現具有更高的吞吐量,并且由于模塊之間通過互連進行高速數據傳輸而降低了延遲。

83ab823a-cfb7-11ef-9310-92fbcf53809c.png

因此,可以將 FPGA 集成到特定應用任務、計算密集型任務、內存訪問結構等中,以改善延遲、吞吐量和執行速度。

III. 未來研究趨勢、挑戰和機遇

隨著數據量的增加,數據中心必須移動更多的數據,它們面臨著來自不同方向的重大挑戰。盡管列出的問題并不代表所有基于 FPGA 的數據中心中尚未解決的研究趨勢,但它們對通過高速計算執行以數據為中心的功能(如持久性、數據縮減、數據安全、數據過濾、數據分析等)具有長期影響。因此,FPGA 數據中心預計將與 CPU 進行協同調度,包括異構云數據中心管理、深度神經網絡加速、通道攻擊管理、FPGA 調度、虛擬化和漏洞分析。

IV. 結論和未來范圍

芯片制造技術和 FPGA 的進步至關重要,它們在增強數據中心數據管理性能方面發揮著至關重要的作用。CPU 和傳統計算資源面臨著許多與數據流的動態特性相關的問題,這些問題涉及在數據中心云網絡中處理數據流。FPGA 集群架構、云計算、硬件加速方面的創新可用于實現數據的快速處理并適應其動態流特性。

83beb256-cfb7-11ef-9310-92fbcf53809c.png

83e21fca-cfb7-11ef-9310-92fbcf53809c.png

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • FPGA
    +關注

    關注

    1630

    文章

    21796

    瀏覽量

    605409
  • 加速器
    +關注

    關注

    2

    文章

    806

    瀏覽量

    38032
  • 數據中心
    +關注

    關注

    16

    文章

    4855

    瀏覽量

    72335

原文標題:數據中心中的FPGA硬件加速器

文章出處:【微信號:HXSLH1010101010,微信公眾號:FPGA技術江湖】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    PCIe加速卡在數據中心的應用

    隨著數據中心的快速發展,對計算能力的需求也在不斷增長。PCIe(Peripheral Component Interconnect Express)加速卡作為一種高性能的計算設備,已經在數據中心中
    的頭像 發表于 11-06 09:32 ?715次閱讀

    適用于數據中心應用中的硬件加速器的直流/直流轉換解決方案

    電子發燒友網站提供《適用于數據中心應用中的硬件加速器的直流/直流轉換解決方案.pdf》資料免費下載
    發表于 08-26 09:38 ?0次下載
    適用于<b class='flag-5'>數據中心</b>應用中的<b class='flag-5'>硬件加速器</b>的直流/直流轉換<b class='flag-5'>器</b>解決方案

    半導體存儲數據中心中的應用

    半導體存儲數據中心中的應用是極其重要且廣泛的,它們不僅是數據中心存儲系統的核心組件,還直接關系到數據處理的效率、可靠性和安全性。以下將詳細闡述半導體存儲
    的頭像 發表于 08-20 10:17 ?749次閱讀

    圖形圖像硬件加速器卡設計原理圖:270-VC709E 基于FMC接口的Virtex7 XC7VX690T PCIeX8 接口卡

    擴展。軟件支持windows,Linux操作系統。Net FPGA , XC7VX690T板卡 , 軟件無線電處理平臺 , 圖形圖像硬件加速器
    的頭像 發表于 08-06 10:16 ?559次閱讀
    圖形圖像<b class='flag-5'>硬件加速器</b>卡設計原理圖:270-VC709E 基于FMC接口的Virtex7 XC7VX690T PCIeX8 接口卡

    混合冷卻在數據中心中仍將是必不可少的#混合冷卻

    數據中心
    深圳崧皓電子
    發布于 :2024年08月06日 06:58:06

    “白地板”方案,智算中心加速器

    明德源能白地板方案,智算中心加速器
    的頭像 發表于 06-21 11:54 ?842次閱讀

    八大科技巨頭攜手推進UALink,加速數據中心AI互聯

    近日,英特爾、Google、微軟、Meta等八家科技巨頭宣布共同成立超加速器鏈接(UALink)推廣小組,致力于推動數據中心內AI加速器芯片的連接組件發展。UALink旨在優化數據中心
    的頭像 發表于 05-31 10:59 ?879次閱讀

    PSoC 6 MCUBoot和mbedTLS是否支持加密硬件加速

    v3.0,它的上限是 MCUBoot v1.8.1。 當前版本基于 MCUBoot v1.9.1,似乎支持加密硬件加速。 有什么最簡單的方法可以更新我的舊版引導加載,以便運行 MCUBoot v1.9.1? 順便說一下,我的 PSoC 是 CY8C624ABZI-S2
    發表于 05-29 08:17

    數據中心市場的關鍵以太網解決方案

    了解數據中心市場動態的關鍵在于以太網解決方案。Synopsys負責產品管理和高性能計算IP的副總裁Michael Posner說:“以太網在數據中心中根深蒂固……雖然它并不廣為人知,但60%的數據中心硬件都是通過以太網通信的。
    發表于 03-12 09:53 ?490次閱讀
    <b class='flag-5'>數據中心</b>市場的關鍵以太網解決方案

    330-基于FMC接口的Kintex-7 XC7K325T PCIeX4 3U PXIe接口卡 圖形圖像硬件加速器

    標簽: Net FPGA , XC7K325T板卡 , XC7K325T處理板 , 軟件無線電處理平臺 , 圖形圖像硬件加速器
    的頭像 發表于 03-04 14:14 ?662次閱讀
    330-基于FMC接口的Kintex-7 XC7K325T PCIeX4 3U PXIe接口卡 圖形圖像<b class='flag-5'>硬件加速器</b>

    【國產FPGA+OMAPL138開發板體驗】(原創)7.硬件加速Sora文生視頻源代碼

    hardware_accelerator_done; // 硬件加速器完成信號(假設) // FPGA內部處理函數 always @(posedge clk or posedge reset) begin
    發表于 02-22 09:49

    音視頻解碼硬件加速:實現更流暢的播放效果

    隨著多媒體內容的日益豐富和高清化,傳統的軟件解碼已經難以滿足人們對流暢播放體驗的需求。因此,音視頻解碼硬件加速技術的出現,為提升播放效果帶來了革命性的改變。 硬件加速的原理 硬件加速
    的頭像 發表于 02-21 14:40 ?1048次閱讀
    音視頻解碼<b class='flag-5'>器</b><b class='flag-5'>硬件加速</b>:實現更流暢的播放效果

    FPGA圖書分享系列-2024.01.31

    成本具有重要意義。 設計優化:書中對FPGA加速器的技術進行了優化,例如循環平鋪和轉換,并通過定量分析計算吞吐量和片內外I/O帶寬,幫助讀者理解如何設計出更高效的加速器硬件參數。 實際
    發表于 01-31 21:14

    集中電源控制數據中心的應用

    集中電源控制數據中心的應用非常廣泛。數據中心通常需要大量的電源來支持服務、網絡設備和存儲設備等關鍵基礎設施的運行。集中電源控制可以提
    的頭像 發表于 01-30 15:24 ?556次閱讀
    集中電源控制<b class='flag-5'>器</b>在<b class='flag-5'>數據中心</b>的應用

    回旋加速器原理 回旋加速器的影響因素

    回旋加速器的核心部分是一個半徑為R的磁場區域和一對位于磁場中心的D形電極。磁場區域由一個或多個磁鐵和調節磁場強度的電流源組成。當加速器通電時,在磁場中心將產生一個垂直于電極的磁場。
    的頭像 發表于 01-30 10:02 ?4551次閱讀
    主站蜘蛛池模板: 色偷偷综合 | 女同在线视频 | 深夜释放自己vlog糖心旧版本 | 亚洲高清不卡视频 | 性夜影院爽黄e爽在线观看 羞羞色院91精品网站 | 五月天婷婷色综合 | 一级久久久 | 欧美69视频在线 | 无人码一区二区三区视频 | 亚洲国产成人精品久久 | 亚欧有色亚欧乱色视频 | 午夜看看 | 四虎影视大全免费入口 | 最新久久免费视频 | 亚洲午夜久久久久久噜噜噜 | 视频在线观看免费网站 | 三级国产 | 天天综合日日噜噜噜 | 手机看片福利盒子久久 | 久久青草91免费观看 | 欧美二区三区 | 欧美性黑人十极品hd | 成人免费久久精品国产片久久影院 | 欧美人与禽 | 一级特黄视频 | 国产精品免费久久久免费 | 国产精品嫩草影院人体模特 | 欧美黑人粗硬大在线看 | 欧美性白人极品1819hd高清 | 国产午夜在线观看视频播放 | 韩国三级理论在线看中文字幕 | 丁香六月在线观看 | 欧美 在线播放 | www.四虎影院在线观看 | 就去干综合 | luxu259在线中文字幕 | 国产小视频在线高清播放 | 国内精品久久久久影院男同志 | 国产资源在线播放 | 美女被免费网站91色 | 欧美一级爱操视频 |