在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

后摩爾時代的創新:在米爾FPGA上實現Tiny YOLO V4,助力AIoT應用

米爾電子 ? 2024-11-22 01:00 ? 次閱讀

學習如何在 MYIR 的 ZU3EG FPGA 開發板上部署 Tiny YOLO v4,對比 FPGA、GPUCPU 的性能,助力 AIoT 邊緣計算應用。

一、為什么選擇 FPGA:應對 7nm 制程與 AI 限制

在全球半導體制程限制和高端 GPU 受限的大環境下,FPGA 成為了中國企業發展的重要路徑之一。它可支持靈活的 AIoT 應用,其靈活性與可編程性使其可以在國內成熟的 28nm 工藝甚至更低節點的制程下實現高效的硬件加速。

米爾的 ZU3EG 開發板憑借其可重構架構為 AI 和計算密集型任務提供了支持,同時避免了 7nm 工藝對國產芯片設計的制約。通過在 ZU3EG 上部署 Tiny YOLO V4,我們可以為智能家居、智慧城市等 AIoT 應用提供高效的解決方案。

1fd53440-a82a-11ef-8084-92fbcf53809c.png1ff59190-a82a-11ef-8084-92fbcf53809c.png

CPU GPU FPGA 架構對比

二、了解 Tiny YOLO 模型及其適用性

YOLO(You Only Look Once)是一種實時物體檢測模型,它通過一次性掃描整個圖像,實現高效的對象識別。

而其簡化版 Tiny YOLO V4 更適合嵌入式設備,具有較少的層數和參數。其輕量化特性更適合在資源受限的設備上運行,尤其在低功耗、實時檢測的邊緣計算設備中表現出色。

相比傳統 GPU,FPGA 能在小面積和低功耗下實現類似的推理性能,非常契合 AIoT 應用。像米爾 ZU3EG 這樣的 FPGA 開發板,通過底板和豐富接口的載板設計,非常適合高效的嵌入式低功耗數據處理。

20207e64-a82a-11ef-8084-92fbcf53809c.png

Yolo V4 網絡結構圖

204930fc-a82a-11ef-8084-92fbcf53809c.png

Tiny Yolo V4 網絡結構圖

(通過優化網絡結構和參數,保持較高檢測精度的同時,降低模型的計算量和內存占用)

三、獲取數據集和模型

下載開源訓練集或預訓練模型。為了確保兼容性,建議將模型轉換為 ONNX 格式,以便后續能在 FPGA 上完成優化。

1.下載 Tiny YOLO V4 模型:從Darknet 的 GitHub 倉庫獲取 Tiny YOLO 的預訓練權重,或者在 COCO 等數據集上自行訓練模型。自定義的模型適用于特定應用場景(如車輛檢測、人臉檢測等)。

2.數據準備:若要自定義模型,可使用 LabelImg 等工具對數據集進行標注,將數據轉為 YOLO 格式。之后,可將 YOLO 格式轉換為 ONNX 格式,以便兼容 FPGA 優化工具鏈。

206cb2fc-a82a-11ef-8084-92fbcf53809c.png

Tiny YOLO 在 Darknet 上訓練的截圖

四、通過 Vivado HLS 為 FPGA 準備模型

要將模型部署到 FPGA,需要將神經網絡操作轉換為硬件級描述。使用 Xilinx 的 Vitis HLS(高級綜合)可以將 Tiny YOLO v4 的 C++ 模型代碼的轉化為 Verilog RTL(寄存器傳輸級)代碼,從而將模型從軟件世界帶入硬件實現。

詳細步驟

1.模型層映射和優化

  • 將 YOLO 的每一層(如卷積層、池化層)映射為硬件友好的 C/C++ 結構。例如,將卷積映射為乘累加(MAC)數組,通過流水線實現并行化。

2.算子加速與指令優化

  • 流水線(Pipelining):利用流水線來處理多項操作并行,減少延遲。

  • 循環展開(Loop Unrolling):展開循環,以每周期處理更多數據,尤其在卷積操作中有效。

  • 設置 DATAFLOW指令,使層間獨立處理。

3.量化與位寬調整

  • 將激活值和權重量化為定點精度(例如 INT8),而非浮點數。這在維持準確度的同時顯著降低計算量,尤其適合 FPGA 的固定點運算支持。
209fc19c-a82a-11ef-8084-92fbcf53809c.png

Tiny YOLO 模型在 Vivado HLS 中的層層轉化流程圖

五、使用 Vivado 綜合與部署 Verilog 到 米爾的ZU3EG FPGA開發板

當 HLS 生成的 RTL 代碼準備就緒后,可以使用 Vivado 將模型部署到 FPGA。

1.Vivado 中的設置

將 HLS 輸出的 RTL 文件導入 Vivado。

在 Vivado 中創建模塊設計,包括連接AXI 接口與 ZU3EG 的 ARM 核連接。

2.I/O 約束與時序

定義 FPGA 的 I/O 引腳約束,以匹配 ZU3EG 板的特定管腳配置。配置時鐘約束以滿足合適的數據速率(如視頻數據 100-200 MHz)。

進行時序分析,確保延遲和響應速度達到實時要求。

3.生成比特流并下載到 ZU3EG

生成的比特流可以直接通過 JTAG 或以太網接口下載到 ZU3EG。

20e78144-a82a-11ef-8084-92fbcf53809c.png

將 Tiny YOLO 處理模塊連接到 米爾ZU3EG開發板 的外設和接口

六、在 FPGA 上測試并運行推理

現在 Tiny YOLO 已部署,可以驗證其實時對象檢測性能。

1.數據采集

  • 通過連接的相機模塊捕捉圖像或視頻幀,或者使用存儲的測試視頻。

  • 使用 ZU3EG 的 ARM 核上的 OpenCV 對幀進行預處理,再將它們傳入 FPGA 預處理后進行推理。

2.后處理與顯示

  • 模型檢測對象后,輸出邊框和類別標簽。使用 OpenCV 將邊框映射回原始幀,并在每個檢測到的對象周圍顯示類別和置信度。

3.性能測試

  • 測量幀速率(FPS)和檢測準確度。微調量化位寬或數據流參數,以優化實時需求。
2109e676-a82a-11ef-8084-92fbcf53809c.png

Tiny YOLO 模型在 ZU3EG 上顯示檢測結果的實時輸出,視頻幀中標注了檢測到的對象

七、性能優化與調試技巧

為提高性能,可以進行以下調整:

  • 內存訪問:設計數據存儲方式,最大限度利用緩存并減少數據傳輸,降低內存瓶頸。

  • 降低延遲:重新評估關鍵路徑延遲。若延遲過高,調整 Vitis HLS 中的流水線深度,并驗證層間的數據依賴性。

  • 量化改進:嘗試 INT8 量化。Xilinx 的 Vitis AI 可幫助微調量化參數,以平衡準確性與速度。

2148355c-a82a-11ef-8084-92fbcf53809c.png

不同優化配置對資源使用的影響

215bf43e-a82a-11ef-8084-92fbcf53809c.png

米爾MYC-CZU3EG/4EV/5EV-V2核心板及開發板

在MYIR 的 ZU3EG 開發平臺上提供了一種高效的解決方案。利用 FPGA 獨特的靈活性和低功耗優勢,助力未來 AIoT 設備的普及和智能升級。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • FPGA
    +關注

    關注

    1629

    文章

    21736

    瀏覽量

    603321
  • AIoT
    +關注

    關注

    8

    文章

    1408

    瀏覽量

    30684
  • 米爾電子
    +關注

    關注

    0

    文章

    110

    瀏覽量

    451
收藏 人收藏

    評論

    相關推薦

    助力AIoT應用:米爾FPGA開發板實現Tiny YOLO V4

    學習如何在 MYIR 的 ZU3EG FPGA 開發板上部署 Tiny YOLO v4,對比 FPGA、GPU、CPU 的性能,
    發表于 12-06 17:18

    《DNK210使用指南 -CanMV版 V1.0》第四十一章 YOLO2物體檢測實驗

    YOLO2網絡的物體檢測應用在CanMV實現。本章分為如下幾個小節:41.1 maix.KPU模塊介紹41.2 硬件設計41.3 程序設計41.4 運行驗證 41.1 maix.KPU模塊介紹
    發表于 11-14 09:22

    《DNK210使用指南 -CanMV版 V1.0》第四十章 YOLO2人手檢測實驗

    中進行運算,然后再進行YOLO2網絡運算,最后便得到網絡識別出人手輸入圖像的一些信息,將這些信息繪制到圖像
    發表于 11-14 09:20

    《DNK210使用指南 -CanMV版 V1.0》第三十九章 YOLO2人臉檢測實驗

    KPU中進行運算,然后再進行YOLO2網絡運算,最后便得到網絡識別出人臉輸入圖像的一些信息,將這些信息繪制到圖像
    發表于 11-13 09:37

    米爾-Xilinx XC7A100T FPGA開發板試用】+01.開箱(zmj)

    】資料:米爾-Xilinx XC7A100T FPGA開發板 【圖】資料:米爾-紫光同創PG2L100H國產FPGA開發板 3.硬件電狀
    發表于 11-12 15:45

    摩爾斯微電子榮獲2024年WBA行業大獎最佳Wi-Fi創新獎等多項殊榮

    1000倍。頒獎評委們評價道:“摩爾斯微電子穩定、低功耗的物聯網連接方面的開創性工作,使其穩居行業領先地位。該公司正在真正推動創新,這將對物聯網的未來起到關鍵作用,并重新定義下一代Wi-Fi。”顛覆性
    發表于 11-01 14:41

    高密度互連,引爆摩爾技術革命

    領域中正成為新的創新焦點,引領著超集成高密度互連技術的飛躍。通過持續的技術創新實現高密度互連,將是推動先進封裝技術在后摩爾時代跨越發展的關鍵所在。
    的頭像 發表于 10-18 17:57 ?276次閱讀
    高密度互連,引爆<b class='flag-5'>后</b><b class='flag-5'>摩爾</b>技術革命

    使用OpenVINO C# API部署YOLO-World實現實時開放詞匯對象檢測

    YOLO-World是一個融合了實時目標檢測與增強現實(AR)技術的創新平臺,旨在將現實世界與數字世界無縫對接。該平臺以YOLO(You Only Look Once)算法為核心,實現
    的頭像 發表于 08-30 16:27 ?651次閱讀
    使用OpenVINO C# API部署<b class='flag-5'>YOLO</b>-World<b class='flag-5'>實現</b>實時開放詞匯對象檢測

    特斯拉正積極測試其V4超級充電樁

    近日,特斯拉快速充電技術領域的最新動態引發了廣泛關注。據悉,特斯拉正積極測試其現有的V4超級充電樁(基于V3充電柜構建)的潛力,旨在突破300千瓦的充電功率上限,這一舉措標志著特斯拉
    的頭像 發表于 08-06 16:52 ?824次閱讀

    FPGA集群實現高級并行編程

    今天我們看的這篇論文介紹了FPGA集群實現高級并行編程的研究,其主要目標是為非FPGA專家提供一個成熟且易于使用的環境,以便在多個并行
    的頭像 發表于 07-24 14:54 ?1263次閱讀

    “自我實現的預言”摩爾定律,如何繼續引領創新

    未來的自己制定了一個遠大但切實可行的目標一樣, 摩爾定律是半導體行業的自我實現 。雖然被譽為技術創新的“黃金法則”,但一些事情尚未廣為人知……. 1.?戈登·摩爾完善過
    的頭像 發表于 07-05 15:02 ?277次閱讀

    X-CUBE-CRYPTOLIB V4庫文件無法添加,鏈接錯誤的原因?

    看官方介紹,V4版本的靜態庫是支持多個編譯器的,芯片是stm32h743,我用的是arm-none-eabi-gcc,版本是gcc version 13.2.1 20231009 (Arm GNU
    發表于 05-31 07:54

    STM32 x 米爾共同推動工業行業應用創新

    STM32 x 米爾共同推動工業行業應用創新
    的頭像 發表于 05-30 08:01 ?587次閱讀
    STM32 x <b class='flag-5'>米爾</b>共同推動工業行業應用<b class='flag-5'>創新</b>

    米爾-芯馳D9360商顯板試用評測】使用ffmpeg實現遠程視頻監控

    ,解壓,直接上傳給開發板。 2、插上攝像頭,查看攝像頭的編號: 3、win11安裝好esadarwin,并開啟服務,配置文件中,我
    發表于 04-11 13:07

    高精度納米級壓電位移平臺“PIEZOCONCEPT”!

    高精度納米級壓電位移平臺“PIEZOCONCEPT”半導體界摩爾時代的手術刀!第三代半導體是摩爾時代實現芯片性能突破的核心技術之一,優越
    的頭像 發表于 01-26 08:16 ?747次閱讀
    高精度納米級壓電位移平臺“PIEZOCONCEPT”!
    主站蜘蛛池模板: 亚洲第一区在线| 天堂网av2014| 国产亚洲欧美日本一二三本道| 乱操视频| 啪啪免费看视频| 欧美不卡一区| 亚洲综合一| 日本黄在线| 国产视频一区二| 午夜视频一区二区| 久久三级网站| www爽| 日本午夜大片| 99久久免费精品高清特色大片| 欧美簧片| 中文字幕va一区二区三区| 一级a毛片免费| 国内一级野外a一级毛片| 天堂资源8中文最新版在线| 欧美乱理伦另类视频| 亚洲香蕉久久一区二区三区四区| 久草热线视频| 天天操综合视频| 4444kk在线看片| 午夜影院色| 精品久久成人| 日日干干| 亚洲黄网站wwwwww| 色吧视频| freesex性欧美重口| 狠狠色综合色综合网络| 男男np主受高h啪啪肉| 日本三级在线观看免费| 天天色天天操综合网| 激情丁香六月| 天堂网www在线观看| 午夜小福利| 尤物啪啪| 激情天堂| 好爽的视频黄| 日韩综合色|