在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

在 FPGA 上實(shí)施 AI/ML 的選項(xiàng)

李晶 ? 2022-12-28 09:51 ? 次閱讀

現(xiàn)場(chǎng)可編程門陣列 (FPGA) 以加速人工智能/機(jī)器學(xué)習(xí)應(yīng)用而聞名,但它是如何在 FPGA 中實(shí)現(xiàn)的,有哪些不同的方法?讓我們探索工程師的設(shè)計(jì)空間。

人工智能 (AI) 是云和邊緣應(yīng)用程序中的熱門話題。在許多情況下,人工智能可以實(shí)現(xiàn)更安全、更高效和安全的系統(tǒng)。人工智能已經(jīng)存在很長時(shí)間了,它于 1956 年由約翰·麥卡錫 (John McCarthy) 在第一次人工智能會(huì)議召開時(shí)首次使用。雖然幾十年來進(jìn)行了大量研究,但僅在最近 5 到 10 年,人工智能系統(tǒng)才從實(shí)驗(yàn)室和研究轉(zhuǎn)移到產(chǎn)品路線圖和產(chǎn)品中。

在云和邊緣環(huán)境中,部署最廣泛的 AI 形式之一是機(jī)器學(xué)習(xí) (ML)。機(jī)器學(xué)習(xí)是對(duì)計(jì)算機(jī)算法的研究,它允許計(jì)算機(jī)程序通過經(jīng)驗(yàn)自動(dòng)改進(jìn)。這方面的一個(gè)例子是為 ML 網(wǎng)絡(luò)提供帶有標(biāo)簽的圖像數(shù)據(jù)集。機(jī)器學(xué)習(xí)算法識(shí)別圖像的特征和元素,以便在輸入新的未標(biāo)記的、以前未見過的圖像時(shí),ML 算法確定圖像包含任何已學(xué)習(xí)特征和元素的可能性。可以訓(xùn)練此類 ML 算法來檢測(cè)圖像中的對(duì)象、處理語音中的關(guān)鍵字以及分析傳感器數(shù)據(jù)的異常情況。典型應(yīng)用包括視覺引導(dǎo)機(jī)器人、車輛自主操作以及工業(yè)和安全關(guān)鍵系統(tǒng)的預(yù)測(cè)。

因此,ML 學(xué)習(xí)算法分為兩個(gè)要素,第一個(gè)是針對(duì)訓(xùn)練數(shù)據(jù)集對(duì)網(wǎng)絡(luò)進(jìn)行訓(xùn)練。第二個(gè)是訓(xùn)練網(wǎng)絡(luò)領(lǐng)域的部署,這些元素分別稱為訓(xùn)練和推理。訓(xùn)練準(zhǔn)確的模型需要一個(gè)帶標(biāo)簽的大型數(shù)據(jù)集,并且通常在基于云的 GPU 上執(zhí)行以加速訓(xùn)練過程。設(shè)計(jì)工程師可以跨從 MCU 到 GPU 和 FPGA 的一系列技術(shù)部署訓(xùn)練有素的網(wǎng)絡(luò)。

在 FPGA 中嵌入 AI

幾個(gè)非常流行的框架——Caffe、TensorFlow。和 Pytorch——幫助訓(xùn)練和部署 AI/ML 系統(tǒng)。這些框架用于網(wǎng)絡(luò)定義、訓(xùn)練和推理。

許多基于邊緣的人工智能系統(tǒng)的關(guān)鍵要素之一是能夠在確定的時(shí)間范圍內(nèi)執(zhí)行推理。例如,自動(dòng)駕駛汽車必須快速檢測(cè)車輛、障礙物和行人以防止碰撞。這需要一個(gè)既響應(yīng)又確定的解決方案,響應(yīng)是因?yàn)閭鞲衅鲾?shù)據(jù)必須以最小延遲快速處理,確定是因?yàn)槊總€(gè)輸入的響應(yīng)時(shí)間必須相同并且不依賴于系統(tǒng)操作條件或資源使用,例如,使用共享 DDR 內(nèi)存會(huì)減慢響應(yīng)時(shí)間。

由于響應(yīng)性和確定性的要求,基于邊緣的解決方案的開發(fā)人員通常以 FPGA 或基于異構(gòu) SoC 的解決方案為目標(biāo)。這些為開發(fā)人員提供了可編程邏輯,是實(shí)現(xiàn)機(jī)器學(xué)習(xí)網(wǎng)絡(luò)的理想選擇,因?yàn)樗牟⑿刑匦灾С猪憫?yīng)式應(yīng)用程序和非常確定的解決方案。

在可編程邏輯中實(shí)現(xiàn) ML 推理時(shí),可以采用兩種方法。在使用浮點(diǎn)數(shù)學(xué)開發(fā)和訓(xùn)練神經(jīng)網(wǎng)絡(luò)時(shí),無論采用哪種方法,F(xiàn)PGA 或異構(gòu) SoC 中的實(shí)現(xiàn)通常都使用定點(diǎn)實(shí)現(xiàn)。從浮點(diǎn)數(shù)到定點(diǎn)數(shù)的轉(zhuǎn)換過程稱為量化,推理精度會(huì)略有下降;然而,對(duì)于大多數(shù)應(yīng)用程序,可以使用量化的權(quán)重和激活來執(zhí)行額外的訓(xùn)練以恢復(fù)準(zhǔn)確性。

第一種方法直接在可編程邏輯中實(shí)現(xiàn)神經(jīng)網(wǎng)絡(luò)。為推理訓(xùn)練的權(quán)重被加載到網(wǎng)絡(luò)中。這可以在運(yùn)行時(shí)或在設(shè)計(jì)的編譯/綜合期間實(shí)現(xiàn)。

這些神經(jīng)網(wǎng)絡(luò)的一個(gè)例子是 AMD-Xilinx FINN 網(wǎng)絡(luò),它可用于在 FPGA 中實(shí)現(xiàn)量化神經(jīng)網(wǎng)絡(luò)。這些量化神經(jīng)網(wǎng)絡(luò)被實(shí)現(xiàn)為具有二進(jìn)制權(quán)重和兩位激活的量化神經(jīng)網(wǎng)絡(luò)。

有了量化神經(jīng)網(wǎng)絡(luò),神經(jīng)網(wǎng)絡(luò)可以在 FPGA 中實(shí)現(xiàn),資源更少,因?yàn)椴恍枰獠?DDR 或 SoC 支持。使該方法成為空間、組件和成本非常寶貴的受限開發(fā)的理想選擇。雖然它需要更多的專業(yè)知識(shí)才能集成到整體解決方案中,但它可能非常有效。可能使用此類方法的典型示例可能是工業(yè)機(jī)械的預(yù)測(cè),例如軸承磨損或振動(dòng)等。

在 FPGA 邏輯中使用神經(jīng)網(wǎng)絡(luò)直接實(shí)現(xiàn)的替代方法是使用高度專業(yè)化的神經(jīng)網(wǎng)絡(luò)加速器。神經(jīng)網(wǎng)絡(luò)加速器在可編程邏輯中實(shí)現(xiàn),并與具有高帶寬鏈路的 DDR 存儲(chǔ)器以及異構(gòu) SoC 中的專用處理器緊密耦合

在使用神經(jīng)網(wǎng)絡(luò)加速器的應(yīng)用程序中,它們由軟件應(yīng)用程序提供網(wǎng)絡(luò)和權(quán)重/激活和偏差。因此,這使得 ML 推理更容易集成到整個(gè)應(yīng)用程序中。神經(jīng)網(wǎng)絡(luò)加速器的一個(gè)例子是 AMD-Xilinx 深度學(xué)習(xí)單元,它可以與 Pytorch、Caffe 和 TensorFlow 中定義的網(wǎng)絡(luò)一起工作,并為應(yīng)用程序執(zhí)行所有量化、再訓(xùn)練和程序生成。這樣可以更輕松地集成到正在開發(fā)的應(yīng)用程序中。這種方法的典型應(yīng)用是基于視覺的高性能應(yīng)用,例如視覺引導(dǎo)機(jī)器人、智能城市解決方案,當(dāng)然還有提高汽車 SAE 自主水平。

最高的準(zhǔn)確性和性能來自于使用專門的神經(jīng)網(wǎng)絡(luò)加速器,并且易于集成通常提供更好的整體解決方案。因此,這種方法被多家供應(yīng)商用于他們的 AI 解決方案。這種方法更容易與更高級(jí)別的軟件框架和抽象堆棧集成,這是利用整體性能的關(guān)鍵,因?yàn)?AI 通常只是整體解決方案的一小部分(但很重要)。

最后的想法

很多時(shí)候,選擇哪種解決方案取決于最終應(yīng)用,即使 AI 可能是主要的營銷元素。在現(xiàn)實(shí)世界中,人工智能通常只是整個(gè)解決方案的一小部分,因?yàn)閭鞲衅?a target="_blank">接口、預(yù)處理、執(zhí)行器驅(qū)動(dòng)和構(gòu)成解決方案的其他元素也會(huì)有自己的限制和要求。

可編程邏輯使開發(fā)人員能夠構(gòu)建具有響應(yīng)性和確定性的 AI/ML 解決方案。通過將這些解決方案與行業(yè)標(biāo)準(zhǔn)框架相結(jié)合,開發(fā)人員可以使云和邊緣 AI/ML 應(yīng)用程序更安全、更高效、更安全。

審核編輯黃昊宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • FPGA
    +關(guān)注

    關(guān)注

    1629

    文章

    21736

    瀏覽量

    603387
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    新思科技Foundation IP:AI芯片低功耗設(shè)計(jì)必選項(xiàng)

    ? ? ?? 人工智能(AI)近年來已廣泛應(yīng)用,并迅速成為一項(xiàng)具有變革性的技術(shù)。AI依托于機(jī)器學(xué)習(xí)(ML)算法,而這些算法需要強(qiáng)大的計(jì)算能力。傳統(tǒng),開發(fā)者們依賴圖形處理器(GPU)來
    的頭像 發(fā)表于 11-29 11:46 ?452次閱讀
    新思科技Foundation IP:<b class='flag-5'>AI</b>芯片低功耗設(shè)計(jì)必<b class='flag-5'>選項(xiàng)</b>

    芯科科技前沿的MCU+AI/ML開發(fā)工具解決方案

    人工智能(AI)和機(jī)器學(xué)習(xí)(ML)是使系統(tǒng)能夠從數(shù)據(jù)中學(xué)習(xí),進(jìn)行推斷并隨著時(shí)間的推移提高其性能的關(guān)鍵技術(shù)。這些技術(shù)通常用于大型數(shù)據(jù)中心和功能強(qiáng)大的GPU,但是將它們部署資源有限的設(shè)備(如微控制器MCU)
    的頭像 發(fā)表于 08-20 11:38 ?651次閱讀

    使用PYNQ訓(xùn)練和實(shí)現(xiàn)BNN

    使用 PYNQ 可以輕松 FPGA 實(shí)現(xiàn)加速 AI/ML,而無需編寫一行 HDL!讓我們看看如何做到這一點(diǎn)。
    的頭像 發(fā)表于 08-05 17:15 ?549次閱讀
    使用PYNQ訓(xùn)練和實(shí)現(xiàn)BNN

    FPGA集群實(shí)現(xiàn)高級(jí)并行編程

    今天我們看的這篇論文介紹了FPGA集群實(shí)現(xiàn)高級(jí)并行編程的研究,其主要目標(biāo)是為非FPGA專家提供一個(gè)成熟且易于使用的環(huán)境,以便在多個(gè)并行運(yùn)行的設(shè)備
    的頭像 發(fā)表于 07-24 14:54 ?1263次閱讀

    使用 Renesas RA8M1 MCU 快速地部署強(qiáng)大高效的 AIML 功能

    作者:Kenton Williston 人工智能 (AI)、機(jī)器學(xué)習(xí) (ML) 和其他計(jì)算密集型工作負(fù)載物聯(lián)網(wǎng) (IoT) 網(wǎng)絡(luò)邊緣的興起,給微控制器 (MCU) 帶來了額外的處理負(fù)載。處理這些
    的頭像 發(fā)表于 05-05 10:14 ?622次閱讀
    使用 Renesas RA8M1 MCU 快速地部署強(qiáng)大高效的 <b class='flag-5'>AI</b> 和 <b class='flag-5'>ML</b> 功能

    基于 Renesas 的 RA8M1 實(shí)現(xiàn) AIML 部署

    作者:Kenton Williston 人工智能 (AI)、機(jī)器學(xué)習(xí) (ML) 和其他計(jì)算密集型工作負(fù)載物聯(lián)網(wǎng)?(IoT) 網(wǎng)絡(luò)邊緣的興起,給微控制器 (MCU) 帶來了額外的處理負(fù)載。處理這些
    的頭像 發(fā)表于 04-23 15:04 ?1230次閱讀
    基于 Renesas 的 RA8M1 實(shí)現(xiàn) <b class='flag-5'>AI</b> 和 <b class='flag-5'>ML</b> 部署

    新型的FPGA器件將支持多樣化AI/ML創(chuàng)新進(jìn)程

    的來臨,而是包括GPU、FPGA和NPU等一眾數(shù)據(jù)處理加速器時(shí)代的來臨,就像GPU以更高的計(jì)算密度和能效勝出CPU一樣,各種加速器件不同的AI/ML應(yīng)用或者細(xì)分市場(chǎng)中將各具優(yōu)勢(shì),未來
    的頭像 發(fā)表于 04-02 15:25 ?331次閱讀
    新型的<b class='flag-5'>FPGA</b>器件將支持多樣化<b class='flag-5'>AI</b>/<b class='flag-5'>ML</b>創(chuàng)新進(jìn)程

    為何高端FPGA都非常重視軟件

    它們適用于AI推理加速任務(wù),聲稱的TOPS / FLOPS性能功能以及片互連,例如FPGA路由資源和片上網(wǎng)絡(luò)(NOC)。第二部分,我們研究了內(nèi)存架構(gòu),封裝內(nèi)集成架構(gòu)和高速串行IO功
    發(fā)表于 03-23 16:48

    是德科技推出AI數(shù)據(jù)中心測(cè)試平臺(tái)旨在加速AI/ML網(wǎng)絡(luò)驗(yàn)證和優(yōu)化的創(chuàng)新

    2024年2月29日,是德科技(Keysight Technologies,Inc.)宣布,針對(duì)人工智能(AI)和機(jī)器學(xué)習(xí)(ML)基礎(chǔ)設(shè)施生態(tài)系統(tǒng),推出了 AI數(shù)據(jù)中心測(cè)試平臺(tái),旨在加速AI
    的頭像 發(fā)表于 02-29 09:32 ?637次閱讀
    是德科技推出<b class='flag-5'>AI</b>數(shù)據(jù)中心測(cè)試平臺(tái)旨在加速<b class='flag-5'>AI</b>/<b class='flag-5'>ML</b>網(wǎng)絡(luò)驗(yàn)證和優(yōu)化的創(chuàng)新

    FPGAFPGA設(shè)計(jì)PCB的步驟詳解

    FPGA(Zynq? UltraScale+? MPSoC) 的 Ubuntu 22.04 桌面映像安裝了各種 EE 設(shè)計(jì)應(yīng)用程序(包括 KiCad),并用它設(shè)計(jì) PCB。
    的頭像 發(fā)表于 02-26 09:04 ?2003次閱讀
    <b class='flag-5'>在</b><b class='flag-5'>FPGA</b><b class='flag-5'>上</b>為<b class='flag-5'>FPGA</b>設(shè)計(jì)PCB的步驟詳解

    國際最新AI算力評(píng)測(cè)標(biāo)準(zhǔn)SPEC ML即將發(fā)布,浪潮信息連任SPEC ML主席

    國際權(quán)威標(biāo)準(zhǔn)性能評(píng)估組織SPEC第35屆年會(huì)日前美國舉行。會(huì)上,SPEC組織確定新一年工作計(jì)劃,為推動(dòng)AI算力產(chǎn)業(yè)的更快發(fā)展,國際最新AI算力評(píng)測(cè)標(biāo)準(zhǔn)SPEC ML即將發(fā)布,該標(biāo)準(zhǔn)由
    的頭像 發(fā)表于 02-24 19:07 ?3639次閱讀
    國際最新<b class='flag-5'>AI</b>算力評(píng)測(cè)標(biāo)準(zhǔn)SPEC <b class='flag-5'>ML</b>即將發(fā)布,浪潮信息連任SPEC <b class='flag-5'>ML</b>主席

    時(shí)序電路為什么FPGA綜合成了latch?

    有朋友提問,下面的代碼為什么DC里可以綜合成DFF,而在FPGA卻綜合成了latch。
    的頭像 發(fā)表于 02-20 16:12 ?816次閱讀
    時(shí)序電路為什么<b class='flag-5'>在</b><b class='flag-5'>FPGA</b><b class='flag-5'>上</b>綜合成了latch?

    【國產(chǎn)FPGA+OMAPL138開發(fā)板體驗(yàn)】(原創(chuàng))5.FPGAAI加速源代碼

    if; end process; end architecture Behavioral; 本人寫的這個(gè)程序極度簡(jiǎn)化了FPGA實(shí)現(xiàn)AI加速器的過程,例如并行處理、流水線
    發(fā)表于 02-12 16:18

    Supermicro推新AI存儲(chǔ)方案,助力AIML應(yīng)用加速

    Supermicro首席執(zhí)行官梁見后先生高瞻遠(yuǎn)矚地指出:針對(duì)AIML應(yīng)用的加速處理,我們推薦配置以每機(jī)柜20 PB高速閃存為主,配備四個(gè)NVIDIA HGX H100系列優(yōu)化版8-GPU氣冷服務(wù)器或者八個(gè)同款液冷服務(wù)器。
    的頭像 發(fā)表于 02-03 14:46 ?636次閱讀

    深入探討工業(yè)AI/ML技術(shù)的發(fā)展趨勢(shì)及相關(guān)解決方案

    芯科科技已經(jīng)創(chuàng)建了一套完整的硬件和軟件解決方案,可支持開發(fā)用于工業(yè)市場(chǎng)的工業(yè)AI/ML解決方案。具體來說,我們的Sub-GHz、藍(lán)牙和802.15.4產(chǎn)品內(nèi)置了硬件加速功能,可優(yōu)化邊緣的AI/
    的頭像 發(fā)表于 01-29 09:42 ?491次閱讀
    主站蜘蛛池模板: 深爱五月婷婷| 操人网站| xxxx黄| 欧美日本一区| 日韩免费精品视频| 在线视频影院| 国产人成午夜免费噼啪视频| 性生生活三级视频在线观看| 久久精品亚洲青青草原| 天堂最新版在线www在线| 亚洲色播永久网址大全| 日成人网| 天天看天天爽天天摸天天添| 亚洲视频在线免费看| 色老头在线官方网站| 一级毛片女人喷潮| 一区二区三区四区在线 | 最新色视频| 精品三级网站| 国产午夜精品片一区二区三区| 在线亚洲色图| 国产成人永久免费视频| 在线观看黄网| 色综合天天射| 天天色天天干天天射| 乱人伦小说短篇| 激情综合五月网| 1024你懂的日韩| 深爱五月激情网| 天天做天天干| 久久精品国产亚洲婷婷| 经典三级四虎在线观看| haodiaose在线精品免费观看| 特级毛片a级毛免费播放| 亚洲伊人久久综合影院2021| 天天躁夜夜躁狠狠躁2021a| 久久综合九色综合欧美狠狠| 国产精品资源在线观看网站| 亚洲一区欧美一区| 女性一级全黄生活片在线播放| 久久久午夜影院|