NVIDIA NetQ 是一種高度可擴展的現代網絡操作工具,為 NVIDIA Spectrum Ethernet 平臺提供可操作的可見性。它將高級遙測技術與用戶界面相結合,使網絡工作流程更易于故障排除和自動化,同時減少維護和停機時間。
我們最近發布了 NetQ 4.2.0 ,其中包括:
簡化的事件管理
增強的流量遙測分析
新 RoCE 驗證
新增 DPU 監控
簡化的事件管理
通過 NetQ 4.2 ,我們簡化了通過接口傳遞網絡事件的方式。事件的嚴重性各不相同。一些事件是網絡警報,可能需要進一步調查,而其他事件是信息性通知,可能不需要干預。在此版本之前, NetQ 將報警和信息事件顯示為兩個單獨的卡。 NetQ 4.2 版本將兩個卡合并為一個卡,擴展后,該卡將顯示一個儀表板,以幫助您快速可視化所有網絡事件。
圖 1 :。 NetQ 事件儀表板
儀表板顯示事件的時間線,以及導致大多數事件的開關。您可以按類型篩選事件,包括接口、網絡服務、系統和閾值交叉事件。
承認事件有助于你關注需要你關注的活動事件。從儀表板中,還可以創建規則以抑制事件。此功能還可幫助您關注活動事件,從而使已知問題或錯誤警報的顯示方式與錯誤顯示方式不同。
增強的流量遙測分析
NetQ 4.1.0 為 Cumulus Linux 5 引入了 結構范圍內的網絡延遲和緩沖區占用分析 。 x 數據中心結構。現在, NetQ 4.2 支持混合結構(使用 Cumulus Linux 5 )中的部分路徑流遙測分析。 x 交換機與其他交換機(包括非 Cumulus Linux 5.x 和第三方交換機)結合使用。 Cumulus Linux 5 。路徑中的 x 設備顯示流統計信息,例如延遲和緩沖區占用率。不受支持的設備在流量分析中表示為帶紅色 X 的黑條,并且設備不顯示流量統計信息。
圖 2 :。 NetQ 流量遙測分析結果
此外, NetQ 4.2 流量遙測分析顯示了所分析流量的上下文“剛剛發生的事情”( WJH )事件和下降。帶有 WJH 事件的交換機在流分析圖中表示為紅色條紋條。將鼠標懸停在帶有紅色條的設備上,會顯示 WJH 事件摘要。
圖 3 :。利用 WJH 數據進行 NetQ 流量遙測分析
新 RoCE 驗證
通過聚合以太網使用 RDMA ( RoCE ),您可以通過以太網使用遠程直接內存訪問( RDMA )而不是使用主機 CPU 來寫入計算或存儲元素。 NetQ 4.0.0 引入了 RoCE 配置和計數器,包括設置各種 RoCE 閾值交叉警報( TCA )的能力。
使用 NetQ 4.2.0 , RoCE 驗證檢查:
交換機間有損或無損模式配置的一致性
DSCP 、服務池、端口組和流量類設置的一致性
ECN 閾值設置的一致性
無損模式 PFC 配置的一致性
增強型變速箱選擇設置的一致性
您可以安排 RoCE 驗證定期或按需運行。
新增 DPU 監控
NVIDIA BlueField 數據處理器 ( DPU )通過卸載、加速和隔離廣泛的高級網絡、存儲和安全服務,為任何工作負載提供安全、加速的基礎架構。
NetQ 幫助您監控網絡上的 DPU 庫存。您可以監視 DPU 操作系統、 ASIC 、 CPU 型號、磁盤和內存信息,以幫助管理升級、法規遵從性和其他規劃任務。 使用 NetQ ,您可以查看和監視鍵 DPU 屬性,包括已安裝的軟件包以及 CPU 、磁盤和內存利用率。
圖 4 :。 NetQ- DPU 利用率詳細信息
在本文中,您已經看到了 NetQ 4.2.0 提供的一些新功能的概述。
關于作者
Ranga Maddipudi 是 NVIDIA 網絡組的產品管理總監,負責網絡遙測和 NetQ 。他在網絡控制器、自動化和分析方面有豐富的經驗。
審核編輯:郭婷
-
控制器
+關注
關注
112文章
16379瀏覽量
178271 -
NVIDIA
+關注
關注
14文章
4991瀏覽量
103138 -
交換機
+關注
關注
21文章
2642瀏覽量
99701
發布評論請先 登錄
相關推薦
評論