NVIDIA vGPU 解決方案能夠將 NVIDIA GPU 的強大功能帶入虛擬桌面、應用程序和工作站,加速圖形和計算,使在家辦公或在任何地方工作的創意和技術專業人員能夠訪問虛擬化工作空間。
完整的 NVIDIA vGPU 方案包含 GPU 硬件與 vGPU 軟件,將 GPU 硬件與 vGPU 軟件解耦,能夠使用戶定期從軟件的更新功能中受益,同時也為 IT 部門提供靈活性,以滿足不同環境中用戶的特定需求。
那么,如何選擇能滿足用戶工作負載要求的 NVIDIA GPU 和虛擬化軟件的組合方案呢?
今天我們從 vGPU 的許可類型、軟件版本、支持的虛擬化平臺、物理 GPU、虛擬機 vGPU Profile 等方面來介紹 NVIDIA vGPU 的軟硬件選型指南,以幫助您選擇適合不同工作負載的虛擬化軟件和 GPU。
vGPU 許可類型的選擇
NVIDIA vGPU 目前包含三種許可類型,NVIDIA Virtual Applications (vApp)、NVIDIA Virtual PC (vPC)、NVIDIA RTX Virtual Workstation (vWS),原來的 NVIDIA Virtual Compute Server (vCS) 已合并至 NVIDIA AI Enterprise (NVAIE) 軟件套件中,本篇不做闡述。那么,在日常的虛擬化應用場景中,如何選擇合適的 vGPU 許可類型呢?
1
vApp
vApp 即 NVIDIA Virtual Applications(NVIDIA 虛擬應用程序)軟件,專為應用程序流和遠程桌面共享主機 (RDSH) 工作負載而設計。
2
vPC
vPC 即 NVIDIA Virtual PC(NVIDIA 虛擬 PC)軟件,專為知識工作者 VDI 工作負載而設計,可加速以下軟件和應用設備:
辦公生產力應用程序,如 Office 軟件
流媒體視頻
Windows OS
多顯示器
高分辨率顯示器
3
vWS
vWS 即 NVIDIA RTX Virtual Workstation(NVIDIA RTX 虛擬工作站)軟件,專為專業圖形工作負載而設計,主要優勢有:
RTX Enterprise 平臺驅動程序和 ISV 認證
支持 NVIDIA CUDA 工具包和 OpenCL
更高分辨率的顯示器
具有大量幀緩沖區的 vGPU 配置文件
NVIDIA RTX vWS 可加速專業設計和可視化應用程序,例如:
Autodesk Revit
Dassault Systèmes CATIA
Esri ArcGIS Pro
Maya
Petrel
SolidWorks
…
NVIDIA vGPU 軟件版本及虛擬化平臺的推薦
歷經十多個版本的迭代更新,NVIDIA vGPU 軟件已經更新到最新的 vGPU 16 版本,目前仍在支持的 NVIDIA vGPU 軟件版本有 NVIDIA vGPU software 13、NVIDIA vGPU software 15 和 NVIDIA vGPU software 16,其各自的 EOL 日期如下:
考慮到使用日期和售后支持等方面,推薦使用 vGPU 16 版本。
以 vGPU 16.2 版本為例,其支持的系統和虛擬化產品如下,用戶可以根據現有的虛擬化平臺進行選擇。
1
Citrix Hypervisor
2
Microsoft Azure Stack HCI
3
Microsoft Windows Server
4
Red Hat Enterprise Linux with KVM
5
Ubuntu with KVM
6
VMware vSphere ESXi
7
Nutanix AHV
該版本的 NVIDIA vGPU 軟件支持 Nutanix AHV,基于 Linux 的 KVM 虛擬機管理程序。
未在列表中的、基于 Linux KVM 開發的其他虛擬化平臺,需要和廠家確認是否兼容適配 vGPU 軟件,建議實際測試,確定是否可以正常安裝部署。
物理 GPU 的選擇
NVIDIA vGPU 軟件需要在具備 NVIDIA GPU 的平臺上運行。vGPU 通過 time-sliced(時間切分)的方式共享 GPU 引擎,包括圖形 (3D)、視頻編解碼引擎等,不同的 GPU 具備不同的規格,用戶可以根據性能、成本和顯存大小等因素選擇合適的 GPU。針對目前仍在支持的虛擬 GPU 軟件版本,支持的 GPU 有:
虛擬機 vGPU Profile 的設定
可用 vGPU Profile 配置文件,在虛擬化教程 (2) 和虛擬化教程 (3)(點擊藍字跳轉鏈接)中介紹許可類型功能特性時有提到,包括 vWS 的 1Q/2Q/../48Q,vPC 的 1B/2B,vApp 的 1A/2A/.../48A,可以將其認為是給虛擬機分配的顯存大小。
經常有用戶會問:如何去設定 vGPU Profile,才能滿足當下的應用場景和業務需求?
大致可以從以下三個方向去考慮:
首先,反推法,先確定當下使用的物理 GPU 型號,以及支持應用程序或業務工作負載所需的顯存大小,再反推應該怎么去劃分。
其次,可以根據具體的應用程序官方推薦的 GPU 和顯存大小等硬件需求,來進行具體的 vGPU 文件的配置和顯存劃分。
最后,正向測試方法,比如設計類用戶,考慮到運行模型大小以及復雜程度的不同,可以通過一些工具或尋求供應商來評估,獲取 POC 支持和優化的方案。這里推薦兩個工具:
1
GPU Profiler
GPU Profiler(GitHub 上可下載)是一個常用的工具,可以實時記錄資源在虛擬機上執行工作負載時的利用率。該工具通常在 POC 階段幫助調整虛擬環境大小,以確保可接受的性能。GPU Profiler 可以在具有各種 vGPU 配置文件的單個 VM 上運行。可以獲取以下指標:
幀緩沖區
GPU 利用率
vCPU
內存
視頻編碼
視頻解碼
2
NVIDIA System Management Interface
(nvidia-smi)
NVIDIA vGPU Manager 提供監控功能,讓 IT 人員能夠了解更好地利用 NVIDIA vGPU 的各種引擎的使用情況,包括幀緩沖區、編解碼器等都可以通過命令行界面工具 nvidia-smi 進行監控和記錄,并可以在 Hypervisor 或者虛擬機內進行訪問。
適用于虛擬化工作負載的
NVIDIA vGPU解決方案推薦
NVIDIA 虛擬化解決方案與基于當下 NVIDIA Ada Lovelace 和 Ampere 架構的 GPU 配合使用時,可提供巨大的靈活性和性能,從而滿足當今企業不斷變化的工作負載和組織需求。
▲ 推薦 vGPU 軟硬件方案
如上圖所示,如果追求最大限度地提高虛擬化工作負載的性能,可以考慮性能優化的 GPU,如果考慮到成本因素,則可以選擇高性價比的 GPU。
當然,除了 NVIDIA 數據中心 GPU 之外,還有很多其他 GPU 支持虛擬化,包括 NVIDIA RTX 專業圖形卡系列:NVIDIA RTX 5880 Ada Generation、NVIDIA RTX 5000 Ada Generation、NVIDIA RTX A5000 等。用戶可根據具體需求,選擇合適的 GPU 和軟件。
*與NVIDIA產品相關的圖片或視頻(完整或部分)的版權均歸NVIDIA Corporation所有。
審核編輯:劉清
-
NVIDIA
+關注
關注
14文章
4986瀏覽量
103055 -
gpu
+關注
關注
28文章
4740瀏覽量
128948 -
虛擬機
+關注
關注
1文章
917瀏覽量
28196 -
OpenCL
+關注
關注
2文章
48瀏覽量
33309 -
多顯示器
+關注
關注
0文章
2瀏覽量
1146
原文標題:虛擬化教程 (4) : NVIDIA vGPU 軟硬件選型指南
文章出處:【微信號:Leadtek,微信公眾號:麗臺科技】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論