在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

使用NVIDIA CUDA-Pointpillars檢測點云中的對象

星星科技指導員 ? 來源:NVIDIA ? 作者:NVIDIA ? 2022-04-13 16:42 ? 次閱讀

點云是坐標系中的點數據集。點包含豐富的信息,包括三維坐標(X、Y、Z)、顏色、分類值、強度值和時間等。點云主要來自于各種NVIDIA Jetson用例中常用的激光雷達,如自主機器、感知模塊和3D建模。

其中一個關鍵應用是利用遠程和高精度的數據集來實現3D對象的感知、映射和定位算法

PointPillars是最常用于點云推理的模型之一。本文將探討為Jetson開發者提供的NVIDIA CUDA加速PointPillars模型。馬上下載CUDA-PointPillars模型。

什么是CUDA-Pointpillars

本文所介紹的CUDA-Pointpillars可以檢測點云中的對象。其流程如下:

基本預處理:生成柱體。

預處理:生成BEV特征圖(10個通道)。

用于TensorRT的ONNX模型:通過TensorRT實現的ONNX模式。

后處理:通過解析TensorRT引擎輸出生成邊界框。

圖 1 。 CUDA 點柱管道。

基本預處理

基本預處理步驟將點云轉換為基本特征圖。基本特征圖包含以下組成部分:

基本特征圖。

柱體坐標:每根柱體的坐標。

參數:柱體數量。

poYBAGJWjTyABlEDAACUw3Ico5I757.png

圖 2 。將點云轉換為基礎要素地圖

預處理

預處理步驟將基本特征圖(4個通道)轉換為 BEV 特征圖(10個通道)。

圖 3 。將基本要素地圖轉換為 BEV 要素地圖

用于TensorRT的ONNX模型

出于以下原因修改OpenPCDet的原生點柱:

小型操作過多,并且內存帶寬低。

NonZero等一些TensorRT不支持的操作。

ScatterND等一些性能較低的操作。

使用“dict”作為輸入和輸出,因此無法導出ONNX文件。

為了從原生OpenPCDet導出ONNX,我們修改了該模型(圖4)。

圖 4 。 CUDA Pointpillars 中 ONNX 模型概述。

您可把整個ONNX文件分為以下幾個部分:

輸入:BEV特征圖、柱體坐標、參數,均在預處理中生成。

輸出:類、框、Dir_class,在后處理步驟中解析后生成一個邊界框。

ScatterBEV:將點柱(一維)轉換為二維圖像,可作為TensorRT的插件。

其他:TensorRT支持的其他部分。

圖 5 。將點支柱數據散射到二維主干的二維圖像中。

后處理

在后處理步驟中解析TensorRT引擎的輸出(class、box和dir_class)和輸出邊界框。圖6所示的是示例參數。

poYBAGJWjW6AY7PjAAE6J47WgR0196.png

圖 6 。邊界框的參數。

使用 CUDA PointPillars

若要使用CUDA-PointPillars,需要提供點云的ONNX模式文件和數據緩存:

 std::vector nms_pred; PointPillar pointpillar(ONNXModel_File, cuda_stream); pointpillar.doinfer(points_data, points_count, nms_pred);

將OpenPCDet訓練的原生模型轉換為CUDA-Pointpillars的ONNX文件

我們在項目中提供了一個Python腳本,可以將OpenPCDet訓練的原生模型轉換成CUDA-Pointpillars的ONNX文件??稍贑UDA-Pointpillars的/tool 目錄下找到exporter.py 腳本。

可在當前目錄下運行以下命令獲得pointpillar.onnx文件:

$ python exporter.py --ckpt ./*.pth

性能

下表顯示了測試環境和性能。在測試之前提升CPUGPU的性能。


表 1 測試平臺與性能

開始使用 CUDA PointPillars

本文介紹了什么是CUDA-PointPillars以及如何使用它來檢測點云中的對象。

由于原生OpenPCDet無法導出ONNX,而且對于TensorRT來說,性能較低的小型操作數量過多,因此我們開發了CUDA-PointPillars。該應用可以將OpenPCDet訓練的原生模型導出為特殊的ONNX模型,并通過TensorRT推斷ONNX模型。

關于作者

Lei Fan 是 NVIDIA 的高級 CUDA 軟件工程師。他目前正與 TSE 中國團隊合作,開發由 CUDA 優化軟件性能的解決方案。

Lily Li 正在為 NVIDIA 的機器人團隊處理開發人員關系。她目前正在 Jetson 生態系統中開發機器人技術解決方案,以幫助創建最佳實踐。

審核編輯:郭婷

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    5026

    瀏覽量

    103292
  • 數據集
    +關注

    關注

    4

    文章

    1208

    瀏覽量

    24743
收藏 人收藏

    評論

    相關推薦

    NVIDIA推出DRIVE AI安全檢測實驗室

    全新 NVIDIA 實驗室獲得美國國家標準學會國家認可委員會(ANAB)的認證,可執行自動駕駛汽車的功能安全、網絡安全和 AI 檢測
    的頭像 發表于 01-09 16:01 ?100次閱讀

    NVIDIA加速全球大多數超級計算機推動科技進步

    HPCwire 讀者和編輯選擇獎。 自 2006 年發布 CUDA 以來,NVIDIA 不斷推動 AI 和加速計算的進步,最新發布的全球最強超級計算機 TOP500 榜單突顯了該公司在超算領域取得的矚目成就
    的頭像 發表于 11-24 14:38 ?348次閱讀
    <b class='flag-5'>NVIDIA</b>加速全球大多數超級計算機推動科技進步

    NVIDIA與谷歌量子AI部門達成合作

    NVIDIA CUDA-Q 平臺使谷歌量子 AI 研究人員能夠為其量子計算機創建大規模的數字模型,以解決設計中面臨的各種挑戰
    的頭像 發表于 11-20 09:39 ?279次閱讀

    NVIDIA 助力谷歌量子 AI 通過量子器件物理學模擬加快處理器設計

    NVIDIA CUDA-Q 平臺使谷歌量子 AI 研究人員能夠為其量子計算機創建大規模的數字模型,以解決設計中面臨的各種挑戰 ? ? SC24 — NVIDIA 于今日宣布正在與谷歌量子 AI 合作
    發表于 11-19 10:39 ?278次閱讀
    <b class='flag-5'>NVIDIA</b> 助力谷歌量子 AI 通過量子器件物理學模擬加快處理器設計

    IB Verbs和NVIDIA DOCA GPUNetIO性能測試

    NVIDIA DOCA GPUNetIO 是 NVIDIA DOCA SDK 中的一個庫,專門為實時在線 GPU 數據包處理而設計。它結合了 GPUDirect RDMA 和 GPUDirect
    的頭像 發表于 08-23 17:03 ?653次閱讀
    IB Verbs和<b class='flag-5'>NVIDIA</b> DOCA GPUNetIO性能測試

    打破英偉達CUDA壁壘?AMD顯卡現在也能無縫適配CUDA

    電子發燒友網報道(文/梁浩斌)一直以來,圍繞CUDA打造的軟件生態,是英偉達在GPU領域最大的護城河,尤其是隨著目前AI領域的發展加速,市場火爆,英偉達GPU+CUDA的開發生態則更加穩固,AMD
    的頭像 發表于 07-19 00:16 ?4751次閱讀

    英國公司實現英偉達CUDA軟件在AMD GPU上的無縫運行

    7月18日最新資訊,英國創新科技企業Spectral Compute震撼發布了其革命性GPGPU編程工具包——“SCALE”,該工具包實現了英偉達CUDA軟件在AMD GPU上的無縫遷移與運行,標志著在GPU計算領域,NVIDIA長期以來的市場壟斷地位或將迎來重大挑戰。
    的頭像 發表于 07-18 14:40 ?680次閱讀

    軟件生態上超越CUDA,究竟有多難?

    神壇的,還是圍繞CUDA打造的一系列軟件生態。 ? 英偉達——CUDA的絕對統治 ? 相信對GPU有過一定了解的都知道,英偉達的最大護城河就是CUDACUDA在后端架構上處于絕對的統
    的頭像 發表于 06-20 00:09 ?3698次閱讀

    借助NVIDIA Aerial CUDA增強5G/6G的DU性能和工作負載整合

    Aerial CUDA 加速無線接入網 (RAN)可加速電信工作負載,使用 CPU、GPU 和 DPU 在云原生加速計算平臺上提供更高水平的頻譜效率 (SE)。
    的頭像 發表于 05-24 11:10 ?614次閱讀
    借助<b class='flag-5'>NVIDIA</b> Aerial <b class='flag-5'>CUDA</b>增強5G/6G的DU性能和工作負載整合

    NVIDIA 通過 CUDA-Q 平臺為全球各地的量子計算中心提供加速

    —— NVIDIA 于今日宣布將通過開源的 NVIDIA CUDA-Q? 量子計算平臺,助力全球各地的國家級超算中心加快量子計算的研究發展。 ? 德國、日本和波蘭的超算中心將使用該平臺來賦能他們由
    發表于 05-13 15:21 ?209次閱讀
    <b class='flag-5'>NVIDIA</b> 通過 <b class='flag-5'>CUDA</b>-Q 平臺為全球各地的量子計算中心提供加速

    Keil使用AC6編譯提示CUDA版本過高怎么解決?

    \' ArmClang: warning: Unknown CUDA version 10.2. Assuming the latest supported version 10.1
    發表于 04-11 07:56

    基于NVIDIA開源CUDA-Q量子計算平臺發布

    NVIDIA 于太平洋時間 3 月 18 日推出一項云服務,旨在幫助研究人員和開發人員在化學、生物學、材料科學等關鍵科學領域的量子計算研究中取得突破。
    的頭像 發表于 03-21 09:54 ?456次閱讀

    深度解讀Nvidia AI芯片路線圖

    Nvidia是一個同時擁有 GPU、CPU和DPU的計算芯片和系統公司。Nvidia通過NVLink、NVSwitch和NVLink C2C技術將CPU、GPU進行靈活連接組合形成統一的硬件架構,并于CUDA一起形成完整的軟硬件
    發表于 03-13 09:25 ?985次閱讀
    深度解讀<b class='flag-5'>Nvidia</b> AI芯片路線圖

    OpenCV4.8 C++實現YOLOv8 OBB旋轉對象檢測

    YOLOv8框架在在支持分類、對象檢測、實例分割、姿態評估的基礎上更近一步,現已經支持旋轉對象檢測(OBB),基于DOTA數據集,支持航拍圖像的15個類別
    的頭像 發表于 02-22 10:15 ?1752次閱讀
    OpenCV4.8 C++實現YOLOv8 OBB旋轉<b class='flag-5'>對象</b><b class='flag-5'>檢測</b>

    對象檢測邊界框損失函數–從IOU到ProbIOU介紹

    目標檢測損失函數的選擇在目標檢測問題建模中至關重要。通常,目標檢測需要兩個損失函數,一個用于對象分類,另一個用于邊界框回歸(BBR)。
    的頭像 發表于 01-24 10:50 ?2945次閱讀
    <b class='flag-5'>對象</b><b class='flag-5'>檢測</b>邊界框損失函數–從IOU到ProbIOU介紹
    主站蜘蛛池模板: caoporn成人免费公开| 亚洲jizzjizz中文在线播放| 日本精品视频一视频高清| 欧美一级视频免费看| 好色亚洲| 黑人xxxx精品| 久操视频免费| 天天草视频| 色极影院| 夜夜操操| 五月天婷婷丁香中文在线观看| 视频网站免费看| 成年香蕉大黄美女美女| 好黄好硬好爽好刺激| 深夜福利欧美| 亚洲免费在线看| 午夜h| 一区二区三区高清不卡| 日本人善交69xxx| 黄色成人在线网站| 日本68xxxxxxxxx老师| 亚洲一区二区三区不卡视频| 99热久久精品最新| 亚洲黄色在线网站| 最新黄色地址| 日韩在线视频免费观看| 欧美成人一区亚洲一区| 在线免费成人| 日韩毛片免费视频一级特黄| 黄色香蕉网站| 好男人社区www在线观看| 两性午夜欧美高清做性| 美女网站一区二区三区| 男人天堂网在线观看| 国产黄色三级三级三级| 国产精品久久久精品视频| 天天综合网在线| 天堂中文最新版www| www.av毛片| www夜夜操com| 爽好舒服快受不了了老师|