2022 年 GTC ,NVIDIA 宣布Jetson Orin Nano 系列系統模塊( SoM )。它們的 AI 性能是 NVIDIA Jetson Nano 的 80 倍,為入門級邊緣 AI 和機器人應用設定了新標準。
Jetson 系列現在首次包括基于 NVIDIA Orin 的模塊,從入門級的 Jetson Orin Nano 到最高性能的 Jetson AGX Orin 。這使客戶能夠靈活地輕松擴展其應用程序。
借助 Jetson AGX Orin Developer Kit 提供的完整軟件仿真支持,立即啟動您的 Jetson Orin Nano 開發。
跨行業的日常用例對增強實時處理能力的需求繼續增長。入門級 AI 應用程序,如智能相機、手持設備、服務機器人、智能無人機、智能儀表等,都面臨著類似的挑戰。
這些應用程序需要在設備上對來自其多模式傳感器管道的數據進行更低延遲的處理,同時保持在節能、成本優化的小尺寸尺寸的限制范圍內。
Jetson Orin Nano 系列
Jetson Orin Nano 系列生產模塊將于 1 月份上市,起價 199 美元。這些模塊以最小的 Jetson 外形尺寸提供高達 40 TOPS 的 AI 性能,功率選項低至 5W ,高達 15W 。該系列有兩個不同的版本: Jetson Orin Nano 4GB 和 Jetson Orin Nano 8GB 。
圖 1. Jetson Orin Nano 的方塊圖
* Jetson Orin Nano 8GB 的 NVIDIA Orin 架構, Jetson Orin Nano 4GB 有 2 個 TPC 和 4 個 SM 。
如圖 1 所示, Jetson Orin Nano 展示了帶有 NVIDIA 安培架構 GPU 的 NVIDIA -Orin 架構。它有多達 8 個流式多處理器( SM ),由 1024 個 CUDA 核和多達 32 個用于 AI 處理的張量核組成。
NVIDIA Ampere Architecture 第三代 Tensor Cores 的每瓦特性能優于前一代,并在支持稀疏性的情況下帶來更高的性能。通過稀疏性,您可以利用深度學習網絡中的細粒度結構化稀疏性,將 Tensor Core 操作的吞吐量提高一倍。
為了加速應用程序管道的所有部分, Jetson Orin Nano 還包括一個 6 核 Arm Cortex-A78AE CPU 、視頻解碼引擎、 ISP 、視頻圖像合成器、音頻處理引擎和視頻輸入塊。
Jetson Orin Nano 模塊占地面積小,為 70x45mm , 260 針 SODIMM ,包括各種高速接口:
最多七條 PCIe Gen3 通道
各種傳感器 I / O
為了減少您的工程工作量,我們已使 Jetson Orin Nano 和 Jetson Orin NX 模塊完全兼容引腳和外形。表 1 顯示了 Jetson Orin Nano 4GB 和 Jetson Orin Nano 8GB 之間的差異。
立即使用 Jetson AGX Orin Developer Kit 和模擬開始您的開發
Jetson AGX Orin Developer Kit 和所有Jetson Orin模塊共享一個 SoC 架構,使開發人員工具包能夠模擬任何模塊,使您能夠輕松開始開發下一個產品。
在開始將其應用程序移植到新的 NVIDIA Orin 體系結構和最新的 NVIDIAJetPack之前,您無需等待 Jetson Orin Nano 硬件可用。使用今天發布的新疊加層,您可以使用開發人員工具包模擬 Jetson Orin Nano 模塊,就像其他 Jetson Orin 模塊一樣。通過將開發人員工具包配置為模擬 Jetson Orin Nano 8GB 或 Jetson Orin Nano 4GB ,您可以開發和運行完整的應用程序管道。
圖 2.模擬所有六個 Jetson Orin 模塊
Jetson Orin Nano 的性能基準
憑借 Jetson AGX Orin , NVIDIA 在 MLPerf 的inference performance類別中處于領先地位。 Jetson Orin 模塊為您的下一代應用程序提供了巨大的飛躍,現在入門級 AI 設備也可以使用相同的 NVIDIA Orin 架構。
我們使用 NVIDIA JetPack 5.0.2 的仿真模式運行 Jetson Orin Nano 的計算機視覺基準測試,結果顯示了它是如何設置新標準的。測試包括來自 NGC 的一些密集 INT8 和 FP16 預處理模型,以及標準 ResNet-50 模型。我們還在 Jetson Nano 、 TX2 NX 和 Xavier NX 上運行相同的模型進行比較。
以下是基準的完整列表:
NVIDIA PeopleNet v2.3用于修剪人員檢測,NVIDIA PeopleNet v2.5用于最高精度的人員檢測
NVIDIA ActionRecognitionNet二維和三維模型
NVIDIA LPRNet用于車牌識別
NVIDIA DashCamNet,BodyPoseNet用于多人人體姿勢估計
ResNet-50( 224 × 224 )型號
圖 3. Jetson Orin Nano 系列基準編號
圖 4. Jetson Orin Nano 系列基準圖
以這些基準的平均值來看, Jetson Orin Nano 8GB 的性能比 Jetson Nano 提高了 30 倍。隨著未來軟件的改進,我們預計性能將提高 45 倍。其他 Jetson 設備自其第一個支持軟件發布以來,性能提高了 1.5 倍,我們預計 Jetson Orin Nano 也會如此。
Jetson 運行 NVIDIA AI 軟件堆棧,并提供特定于用例的應用程序框架,包括用于機器人的NVIDIA Isaac、用于視覺 AI 的NVIDIA DeepStream和用于會話 AI 的NVIDIA Riva。使用NVIDIA Omniverse Replicator可以節省大量時間用于合成數據生成( SDG ),使用NVIDIA TAO Toolkit可以節省大量的時間用于微調 NGC 目錄中的預處理 AI 模型。
Jetson 與整個 NVIDIA AI 加速計算平臺的兼容性使開發和無縫遷移變得容易。有關我們引入 Jetson Orin 的 NVIDIA 軟件技術的更多信息,請加入我們即將推出的webinar about NVIDIA JetPack 5.0.2。
使用 NVIDIA ISAAC ROS 增強入門級機器人
Jetson Orin 平臺旨在解決最棘手的機器人挑戰,并為 70 多萬 ROS 開發者帶來加速計算。結合 Jetson Orin Nano 強大的硬件功能, ROS 最新 NVIDIA ISAAC 軟件的增強功能為機器人專家提供了卓越的性能和生產力。
新的Isaac ROS DP版本優化了可以在 Jetson Orin 平臺上執行的 ROS2 節點處理管道,并提供了新的基于 DNN 的 GEMS ,旨在提高吞吐量。 Jetson Orin Nano 可以利用那些高度優化的ROS2 packages執行定位、實時 3D 重建和深度估計等任務,這些任務可用于避障。
與只能處理簡單應用程序的原始 Jetson Nano 不同, Jetson Orin Nano 可以運行更復雜的應用程序。隨著不斷致力于提高 NVIDIA ISAAC ROS ,您將看到 Jetson Orin 平臺的精確度和吞吐量隨著時間的推移而不斷提高。
對于開發下一代服務機器人、智能無人機等的機器人專家來說, Jetson Orin Nano 是一種理想的解決方案,它具有高達 40 個 TOPS ,可在節能和小尺寸的情況下實現現代 AI 推理管道。
關于作者
Leela Karumbunahan 是 NVIDIA 的硬件產品經理,專注于 Jetson 和自動機器。她曾在半導體行業從事工程和產品相關工作。她獲得了約翰·霍普金斯大學電氣工程學士學位。
審核編輯:郭婷
-
機器人
+關注
關注
211文章
28418瀏覽量
207095 -
NVIDIA
+關注
關注
14文章
4986瀏覽量
103055 -
AI
+關注
關注
87文章
30894瀏覽量
269085
發布評論請先 登錄
相關推薦
評論