FPGA中GPU深度學習面臨的挑戰

作者 | Ben Dickson 譯者 | 大小非 ?

人工智能的興起觸發了市場對 GPU 的大量需求，但 GPU 在 AI 場景中的應用面臨使用壽命短、使用成本高等問題。現場可編程門陣列 (FPGA) 這一可以定制化硬件處理器反倒是更好的解決方案。隨著可編程性等問題在 FPGA 上的解決，FPGA 將成為市場人工智能應用的選擇。

現場可編程門陣列 (FPGA) 解決了 GPU 在運行深度學習模型時面臨的許多問題

在過去的十年里，人工智能的再一次興起使顯卡行業受益匪淺。英偉達 (Nvidia) 和 AMD 等公司的股價也大幅上漲，因為事實表明，它們的 GPU 在訓練和運行深度學習模型方面效果明顯。實際上，英偉達也已經對自己的業務進行了轉型，之前它是一家純粹做 GPU 和游戲的公司，現在除了作為一家云 GPU 服務提供商外，英偉達還成立了專業的人工智能研究實驗室。

不過，機器學習軟件公司 Mipsology 的首席執行官兼聯合創始人盧多維奇?拉祖爾 (Ludovic Larzul) 表示，GPU 還存在著一些缺陷，這使其在 AI 應用中面臨著一些挑戰。

Larzul 表示，想要解決這些問題的解決方案便是實現現場可編程門陣列 (FPGA)，這也是他們公司的研究領域。FPGA 是一種處理器，可以在制造后定制，這使得它比一般處理器更高效。但是，很難對 FPGA 進行編程，Larzul 希望通過自己公司開發的新平臺解決這個問題。

專業的人工智能硬件已經成為了一個獨立的產業，但對于什么是深度學習算法的最佳基礎設施，人們仍然沒有定論。如果 Mipsology 成功完成了研究實驗，許多正受 GPU 折磨的 AI 開發者將從中受益。

GPU 深度學習面臨的挑戰

三維圖形是 GPU 擁有如此大的內存和計算能力的根本原因，它與深度神經網絡有一個共同之處：都需要進行大量矩陣運算。

顯卡可以并行執行矩陣運算，極大地加快計算速度。圖形處理器可以把訓練神經網絡的時間從幾天、幾周縮短到幾小時、幾分鐘。

隨著圖形硬件公司供貨的不斷增加，GPU 在深度學習中的市場需求還催生了大量公共云服務，這些服務為深度學習項目提供強大的 GPU 虛擬機。

但是顯卡也受硬件和環境的限制。Larzul 解釋說：“神經網絡訓練通常是在一個確定的環境中進行的，運行神經網絡的系統會在部署中遇到各種限制——這可能會對 GPU 的實際使用造成壓力。”

GPU 需要大量的電力，會產生大量的熱量，并需要使用風扇冷卻。當你在臺式工作站、筆記本電腦或機架式服務器上訓練神經網絡時，這不是什么大問題。但是，許多部署深度學習模型的環境對 GPU 并不友好，比如自動駕駛汽車、工廠、機器人和許多智慧城市環境，在這些環境中硬件必須忍受熱、灰塵、濕度、運動和電力限制等環境因素。

Larzul 說：“在一些關鍵的應用場景中，比如智慧城市的視頻監控，要求硬件暴露在對 GPU 有不利影響的環境因素 (比如太陽) 下。“ GPU 受晶體管技術的限制，導致它們在高溫下運行時需要及時冷卻，而這并不總是可以實現的。要做到這點需要更多的電力、維護成本等。”

使用壽命也是一個問題。一般來說，GPU 的使用壽命約為 2-5 年，這對那些每隔幾年就換一次電腦的玩家來說不是什么大問題。但在其他領域，如汽車行業，需要硬件有更高的耐用性，這就帶來了問題。特別是過多的暴露在惡劣的環境中，再加上高強度的使用，GPU 的使用壽命將會更短。

Larzul 說：“從商業可行性方面考慮，自動駕駛汽車等應用可能需要多達 7-10 個 GPU（其中大多數會在不到四年的時間內失效），對于大多數購車者來說，智能或自動駕駛汽車的成本將變得不切實際。”

機器人、醫療保健和安全系統等其他行業也面臨著類似的挑戰。

FPGA 和深度學習

FPGA 是可定制的硬件設備，可對其組件進行調節，因此可以針對特定類型的架構 (如卷積神經網絡) 進行優化。其可定制性特征降低了對電力的需求，并在運算速度和吞吐量方面提供了更高的性能。它們的使用壽命也更長，大約是 GPU 的 2-5 倍，并且對惡劣環境和其它特殊環境因素有更強的適應性。

有一些公司已經在他們的人工智能產品中使用了 FPGA。微軟就是其中一家，它將基于 FPGA 的機器學習技術作為其 Azure 云服務產品的一部分來提供。

不過 FPGA 的缺陷是難于編程。配置 FPGA 需要具備硬件描述語言 (如 Verilog 或 VHDL) 的知識和專業技能。機器學習程序是用 Python 或 C 等高級語言編寫的，將其邏輯轉換為 FPGA 指令非常困難。在 FPGA 上運行 TensorFlow、PyTorch、Caffe 和其他框架建模的神經網絡通常需要消耗大量的人力時間和精力。

“要對 FPGA 進行編程，你需要組建一支懂得如何開發 FPGA 的硬件工程師團隊，并聘請一位了解神經網絡的優秀架構師，花費幾年時間去開發一個硬件模型，最終編譯運行在 FPGA 上，與此同時你還需要處理 FPGA 使用效率和使用頻率的問題。“Larzul 說。此外你還需要具備廣泛的數學技能，以較低的精度準確地計算模型，并需要一個軟件團隊將 AI 框架模型映射到硬件架構。

Larzul 的公司 Mipsology 希望通過 Zebra 來彌合這一差距。Zebra 是一種軟件平臺，開發者可以輕松地將深度學習代碼移植到 FPGA 硬件上。

Larzul 說：“我們提供了一個軟件抽象層，它隱藏了通常需要高級 FPGA 專業知識的復雜性。”“只需加載 Zebra，輸入一個 Linux 命令，Zebra 就可以工作了——它不需要編譯，不需要對神經網絡進行任何更改，也不需要學習任何新工具。不過你可以保留你的 GPU 用于訓練。”

Zebra 提供了將深度學習代碼轉換為 FPGA 硬件指令的抽象層

AI 硬件前景

Mipsology 的 Zebra 平臺是開發者探索在 AI 項目中使用 FPGA 的眾多方案之一。Xilinx 是 FPGA 領域的領導者，已經開發了 Zebra 并將其集成到了電路板中。其他公司，如谷歌和特斯拉，也正積極的為其開發專用的 AI 硬件，用于自己的云產品和邊緣計算產品環境中。

神經形態芯片方面也有著一些發展，這是一種專門為神經網絡設計的計算機架構。英特爾在神經形態計算領域處于領先地位，已經開發了幾種模型架構，不過該領域仍處于早期發展階段。

還有專門用于特定應用的集成電路 (ASIC)，即專為某一特定人工智能需求制造的芯片。但 ASIC 缺乏 FPGA 的靈活性，無法重新編程。

Larzul 最后說，“我們決定專注于軟件業務，探索研究提升神經網絡性能和降低延遲的方案。Zebra 運行在 FPGA 上，因此無需更換硬件就可以支持 AI 推理。FPGA 固件的每次刷新都能給我們帶來更高的性能提升，這得益于其高效性和較短的開發周期。另外，FPGA 的可選擇方案很多，具有很好的市場適應性。”

英文原文：

https://bdtechtalks.com/2020/11/09/fpga-vs-gpu-deep-learning/

編輯：黃飛

閱讀全文

FPGA(591969) FPGA(591969)
神經網絡(98380) 神經網絡(98380)
深度學習(119797) 深度學習(119797)

看FPGA如何擊敗GPU和GPP

本文從硬件加速的視角考察深度學習與FPGA，指出有哪些趨勢和創新使得這些技術相互匹配，并激發對FPGA如何幫助深度學習領域發展的探討。

2016-03-24 13:41:06

2481

相比GPU和GPP，FPGA是深度學習的未來？

相比GPU和GPP，FPGA在滿足深度學習的硬件需求上提供了具有吸引力的替代方案。憑借流水線并行計算的能力和高效的能耗，FPGA將在一般的深度學習應用中展現GPU和GPP所沒有的獨特優勢。同時，算法

2016-07-28 12:16:38

7349

深度學習框架只為GPU? 答案在這里

目前大多數的機器學習是在處理器上完成的，大多數機器學習軟件會針對GPU進行更多的優化，甚至有人認為學習加速必須在GPU上才能完成，但事實上無論是運行機器學習的處理器還是優化的深度學習框架，都不

2018-03-14 18:29:09

8148

FPGA在做深度學習加速時需要的技能

的主要有三種不同架構的器件種類：CPU，GPU，AI芯片/FPGA。CPU是一個通用架構芯片，其計算能力和數據帶寬相對受到限制，面對大計算量的深度學習就顯露出其缺點了。GPU含有大量的計算陣列，可以適用于大規模運算，而且其生態較為成熟和完整，所以現在包

2020-10-10 16:25:43

3349

FPGA 超越 GPU，問鼎下一代深度學習主引擎

的合著者之一，說：“深度學習是AI中最令人興奮的領域，因為我們已經看到了深度學習帶來的巨大進步和大量應用。雖然AI 和DNN 研究傾向于使用 GPU，但我們發現應用領域和英特爾下一代FPGA 架構之間

2017-04-27 14:10:12

FPGA/SDI子系統中的高速板布局挑需要面對哪些挑戰？

工程師和物理布局設計師面臨著更大的挑戰。很多視頻系統都采用多功能FPGA和多傳輸率SDI集成電路，以支持高性能專業視頻在長距離的傳輸。FPGA需要高密度、細跡線寬度的傳輸，而高速模擬SDI傳輸需要阻抗匹配和信號保真。那么FPGA/SDI子系統中的高速板布局挑需要面對哪些挑戰？具體該怎么做呢？

2019-08-06 07:23:31

FPGA在深度學習應用中或將取代GPU

現場可編程門陣列 (FPGA) 解決了 GPU 在運行深度學習模型時面臨的許多問題在過去的十年里，人工智能的再一次興起使顯卡行業受益匪淺。英偉達 (Nvidia) 和 AMD 等公司的股價也大幅

2024-03-21 15:19:45

FPGA測試面臨哪些挑戰？測試方案是什么？

率和低功耗已經成為FPGA的發展重點，也對FPGA測試提出了新的需求。本文根據FPGA的發展趨勢，討論了FPGA測試面臨哪些挑戰？測試方案是什么？

2019-08-07 07:50:15

深度學習中的IoU概念

深度學習中的IoU概念理解

2020-05-29 09:24:28

深度學習中的圖片如何增強

深度學習中的圖片增強

2020-05-28 07:03:11

深度學習在汽車中的應用

神經系統，因此支持人工智能的概念。圖 2：簡易反向傳播示例盡管深度學習具有效力，但其在實際應用中也遇到了一些挑戰。對于容易受到系統限制因素（如總體成本、功耗和擴展計算能力）影響的嵌入式應用程序而言，在

2019-03-13 06:45:03

深度學習在預測和健康管理中的應用

深度學習在預測和健康管理中的應用綜述摘要深度學習對預測和健康管理（PHM）引起了濃厚的興趣，因為它具有強大的表示能力，自動化的功能學習能力以及解決復雜問題的一流性能。本文調查了使用深度學習在PHM

2021-07-12 06:46:47

深度學習存在哪些問題？

深度學習常用模型有哪些？深度學習常用軟件工具及平臺有哪些？深度學習存在哪些問題？

2021-10-14 08:20:47

深度學習推理和計算-通用AI核心

，支持廣泛的應用程序和動態工作負載。本文將討論這些行業挑戰可以在不同級別的硬件和軟件設計采用Xilinx VERSAL AI核心，業界首創自適應計算加速平臺超越了CPU/GPU和FPGA的性能。

2020-11-01 09:28:57

深度學習框架TensorFlow&TensorFlow-GPU詳解

TensorFlow&TensorFlow-GPU：深度學習框架TensorFlow&TensorFlow-GPU的簡介、安裝、使用方法詳細攻略

2018-12-25 17:21:10

深度學習框架只為GPU?

CPU優化深度學習框架和函數庫機器學***器

2021-02-22 06:01:02

HUD 2.0面臨哪些挑戰？如何去解決？

HUD 2.0的發展動力是什么？HUD 2.0面臨哪些挑戰？如何去解決？

2021-06-01 06:44:07

LED在汽車領域應用面臨哪些挑戰？

控制LED的方法有哪些？LED在汽車領域應用面臨哪些挑戰？LED主要應用于哪些領域？

2021-05-11 06:08:17

MEMS傳感器面臨哪些挑戰呢？如何去解決？

MEMS傳感器面臨哪些挑戰呢？MEMS傳感器面對這些挑戰該如何去解決呢？

2021-07-19 06:39:01

Mali GPU支持tensorflow或者caffe等深度學習模型嗎

Mali GPU 支持tensorflow或者caffe等深度學習模型嗎？好像caffe2go和tensorflow lit可以部署到ARM，但不知道是否支持在GPU運行？我希望把訓練

2022-09-16 14:13:01

Nanopi深度學習之路(1)深度學習框架分析

學習，也就是現在最流行的深度學習領域，關注論壇的朋友應該看到了，開發板試用活動中有【NanoPi K1 Plus試用】的申請，介紹中NanopiK1plus的高大上優點之一就是“可運行深度學習算法的智能

2018-06-04 22:32:12

RFID原理是什么？RFID技術面臨哪些挑戰？

2021-05-26 06:06:21

　　華為云深度學習服務，讓企業智能從此不求人

把企業標注好的數據加載到華為云深度學習服務中，該服務就可以快速自動的訓練出企業的業務模型，這樣就免除了模型訓練的編程過程。比如在企業的生產場景，一般都有環境健康安全（EHS）檢查。以前企業的EHS檢查

2018-08-02 20:44:09

【詳解】FPGA：深度學習的未來？

學習的硬件需求上提供了具有吸引力的替代方案。憑借流水線并行計算的能力和高效的能耗，FPGA將在一般的深度學習應用中展現GPU和GPP所沒有的獨特優勢。同時，算法設計工具日漸成熟，如今將FPGA集成到

2018-08-13 09:33:30

為什么說FPGA是機器深度學習的未來？

都出現了重大突破。深度學習是這些領域中所最常使用的技術，也被業界大為關注。然而，深度學習模型需要極為大量的數據和計算能力，只有更好的硬件加速條件，才能滿足現有數據和模型規模繼續擴大的需求。　　 FPGA

2019-10-10 06:45:41

為什么采用WCSP？WCSP面臨的挑戰有哪些？

2021-04-21 06:14:53

什么是深度學習？

深度學習是什么意思

2020-11-11 06:58:03

什么是深度學習？使用FPGA進行深度學習的好處？

上述分類之外，還被用于多項任務（下面顯示了四個示例）。在 FPGA 上進行深度學習的好處我們已經提到，許多服務和技術都使用深度學習，而 GPU 大量用于這些計算。這是因為矩陣乘法作為深度學習中的主要

2023-02-17 16:56:59

什么電源管理適用于FPGA、GPU和ASIC系統

在 FPGA、GPU 或 ASIC 控制的系統板上，僅有為數不多的幾種電源管理相關的設計挑戰，但是由于需要反復調試，所以這類挑戰可能使系統的推出時間嚴重滯后。

2019-10-09 06:21:11

什么電源管理適用于FPGA、GPU和ASIC系統？

2019-09-30 06:59:24

使用空中鼠標系統面臨哪些挑戰？如何去克服這些挑戰？

2021-05-10 07:26:42

剛開始進行深度學習的同學怎么選擇合適的機器配置

怎么為自己的深度學習機器選擇合適的GPU配置呢？對于那些一直想進行深度學習研究的同學來說，一直是個比較糾結的問題，既要考慮到使用的場景，又要考慮到價格等各方面因素。如何選擇深度學習的組件？這真的很

2018-09-19 13:56:36

制造NIST相機面臨的主要挑戰是什么？如何去解決？

NIST相機是由哪些部分組成的？NIST相機有什么作用？制造NIST相機面臨的主要挑戰是什么？如何去解決？

2021-07-09 06:58:12

基于能量采集技術的BLE傳感器節點設計面臨哪些挑戰？

基于能量采集技術的BLE傳感器節點設計面臨哪些挑戰？如何去應對這些挑戰？

2021-05-17 06:03:02

多點綜合技術面臨什么挑戰？

隨著設計復雜性增加，傳統的綜合方法面臨越來越大的挑戰。為此，Synplicity公司開發了同時適用于FPGA或 ASIC設計的多點綜合技術，它集成了“自上而下”與“自下而上”綜合方法的優勢，能提供高結果質量和高生產率，同時削減存儲器需求和運行時間。

2019-10-17 06:29:53

射頻系統的深度學習【回映分享】

本文由回映電子整理分享，歡迎工程老獅們參與學習與評論內容? 射頻系統中的深度學習? Deepwave Digital技術? 信號檢測和分類示例? GPU的實時DSP基準測試? 總結回映電子是一家

2022-01-05 10:00:58

工業互聯網面臨的挑戰

工業互聯網面臨的挑戰新一代工業控制網解決方案的重要性全光纖工業傳輸控制網的系統架構

2021-02-22 09:17:49

當AI遇上FPGA會產生怎樣的反應

是人工智能大躍進的基礎，在線下模型訓練中Xeon-Phi、GPU等發揮著巨大的作用，而在線上的推理任務中，浪潮FPGA深度學習加速解決方案則能夠實現7倍以上的能效比提升。卷積網絡之父、Facebook

2021-09-17 17:08:32

無線基礎設施容量面臨的挑戰是什么？

2021-05-20 06:47:50

無線智能IP監控面臨的技術挑戰是什么？怎么解決？

2021-05-31 06:27:15

智能卡天線設計面臨什么挑戰？

本文討論了在不同領域實施非接觸式項目過程中卡天線設計面臨的共同挑戰。為實現卡天線設計的最優化，不同的應用領域會有不同的解決方案。在同一張卡具有多個功能以及存在多種可能的天線尺寸的情況下，天線系統的優化設計顯得尤其關鍵。

2019-08-14 06:21:58

有什么方法可以解決HID設計面臨的挑戰？

HID設計面臨哪些挑戰？有什么方法可以解決HID設計面臨的挑戰？

2021-05-17 06:06:54

機器開發人員面臨哪些軟件挑戰以及硬件挑戰？如何去應對這些挑戰？

2021-06-26 07:27:31

汽車無線安全應用面臨哪些設計挑戰？

2021-05-19 06:41:47

電力系統設計面臨什么挑戰？

電力系統設計工程師們正面臨著較之以往更大的挑戰。更加復雜的傳感算法、最新的能源效率挑戰和新一代高級傳感器的應用，都意味著電力設計師們需要學習比以往更加廣泛的技能，同時不斷吸收新的設計思想和解決方案，只有這樣才能讓企業在電力市場上占有一席之地。

2019-08-20 07:33:45

電動汽車無線充電面臨哪些挑戰？

電動汽車無線充電面臨哪些挑戰？有哪些問題正阻礙無線充電的普遍運用？

2021-06-26 06:44:22

電子系統設計所面臨的挑戰是什么

電子系統設計所面臨的挑戰是什么什么是高速電路？高速電路面臨的問題怎么解決？

2021-04-26 06:55:11

移動電視射頻技術面臨什么挑戰

隨著數字移動電視不斷向移動設備的應用轉移，應用和系統工程師正面臨著各種挑戰，比如外形尺寸的小型化、更低的功耗以及信號完整性。對現有移動電視標準的研究重點將放在了DVB-H上。本文將從系統角度討論DVB-H接收器設計所面臨的機遇和挑戰，并重點介紹射頻前端。

2019-06-03 06:28:52

精確測量阻抗所面臨的挑戰有哪些

精確測量阻抗所面臨的挑戰

2021-01-27 07:34:05

自動駕駛車輛中AI面臨的挑戰

自動駕駛車輛中采用的AI算法自動駕駛車輛中AI面臨的挑戰

2021-02-22 06:39:55

調試速度高達幾個Gb每秒的連接時所面臨的挑戰

本文將討論信號集成和硬件工程師在設計或調試速度高達幾個Gb每秒的連接時所面臨的挑戰。無論是進行下一代高分辨率視頻顯示、醫學成像、數據存儲或是在最新的高速以太網和電信協議中，我們都面臨相同的信號集成挑戰。那就從過度均衡開始討論。

2021-03-01 10:17:12

高速通信面臨的挑戰是什么？

2021-05-24 06:34:15

FPGA是深度學習的未來

FPGA是深度學習的未來，學習資料，感興趣的可以看看。

2016-10-26 15:29:04

深度學習之GPU硬件選型

本文談了談gpu的一些重要的硬件組成，就深度學習而言，我覺得對內存的需求還是比較大的，core多也并不是能夠全部用上，但現在開源的庫實在完整，想做卷積運算有cudnn，想做卷積神經網絡caffe

2018-01-06 12:01:09

3486

深度學習方案ASIC、FPGA、GPU比較哪種更有潛力

幾乎所有深度學習的研究者都在使用GPU，但是對比深度學習硬鑒方案，ASIC、FPGA、GPU三種究竟哪款更被看好？主要是認清對深度學習硬件平臺的要求。

2018-02-02 15:21:40

10203

FPGA在深度學習領域的應用

本文從硬件加速的視角考察深度學習與FPGA，指出有哪些趨勢和創新使得這些技術相互匹配，并激發對FPGA如何幫助深度學習領域發展的探討。

2019-06-28 17:31:46

6529

Mipsology Zebra在深度學習推斷的應用

Zebra 可消除深度學習推斷中具有挑戰性的編程及 FPGA 任務。Zebra 可輕松部署和適應廣泛的神經網絡及框架。

2019-07-21 10:59:09

893

GPU和GPP相比誰才是深度學習的未來

相比GPU和GPP，FPGA在滿足深度學習的硬件需求上提供了具有吸引力的替代方案。憑借流水線并行計算的能力和高效的能耗，FPGA將在一般的深度學習應用中展現GPU和GPP所沒有的獨特優勢。

2019-10-18 15:48:14

1326

FPGA在深度學習領域的未來會有怎樣的發展

近十年來，人工智能又到了一個快速發展的階段。深度學習在其發展中起到了中流砥柱的作用，盡管擁有強大的模擬預測能力，深度學習還面臨著超大計算量的問題。在硬件層面上，GPU，ASIC，FPGA都是解決龐大計算量的方案。

2019-10-22 15:26:21

977

如今FPGA飛速發展，它會是深度學習的未來嗎

作為GPU在算法加速上強有力的競爭者，FPGA是否立即支持不同硬件，顯得尤為重要。FPGA與GPU不同之處在于硬件配置靈活，且FPGA在運行深入學習中關鍵的子程序（例如對滑動窗口的計算）時，單位能耗下通常能比GPU提供更好的表現。

2019-10-29 16:04:48

850

FPGA有什么優勢，可以讓FPGA替代GPU嗎

的深度學習訓練模型領域，并且GPU創建了包含CNN、DNN、RNN、LSTM以及強化學習網絡等算法在內的應用加速平臺和生態系統。

2019-11-01 15:07:07

2656

基于深度學習的ADAS系統，是GPU的主力市場

事實上，今天在汽車行業，GPU的用例幾乎涵蓋了從ADAS到自動駕駛，從儀表到中控信息娛樂等等多個車載系統。而在實際大規模量產落地領域，基于深度學習的ADAS系統，是GPU的主力市場。

2020-08-22 09:48:51

2003

深度學習的火熱，GPU面臨嚴峻挑戰

在人工智能興起之后，安防行業就成為了人工智能技術最大的試驗田，也是落地的主要場景之一。對于視頻監控行業來說，在GPU的CUBA模塊出現后（相關鏈接：為何GPU能在安防行業呼風喚雨？十幾年前這件

2020-10-15 10:32:57

1735

自動駕駛汽車深度學習如何應對挑戰，有哪些解決方法

學習可以輕松地將兩個數字都識別為9。深度學習準確地對不同對象進行分類的能力可以解決自動駕駛汽車面臨的一些主要挑戰。

2020-10-23 16:05:32

1290

GPU深度學習面臨的挑戰分析

人工智能的興起觸發了市場對 GPU 的大量需求，但 GPU 在 AI 場景中的應用面臨使用壽命短、使用成本高等問題。現場可編程門陣列（FPGA）這一可以定制化硬件處理器反倒是更好的解決方案。隨著可編程性等問題在 FPGA 上的解決，FPGA 將成為市場人工智能應用的選擇。

2020-12-11 15:02:41

2493