全球正在加速部署 5G 網絡。許多電信運營商已上線并迅速推廣 5G 服務。除了電信運營商之外,企業也對利用 5G 的高帶寬、低時延、網絡切片、毫米波和 CBRS 頻譜來建立專網產生了極大的興趣。
5G 目前正處于一個有趣的發展時期。在過去的 20 年中,云計算已發展成熟并成為開發者構建應用的首選平臺。云具有許多優勢,包括成熟的軟件工具、自動化和編排、業務敏捷性、較低的總擁有成本(TCO)等。
此外,工業機器人、云游戲、智慧城市、安全、零售、自動駕駛、智能農業等各個領域都在越來越多地使用 AI 創造革命性的體驗。5G、云計算和 AI 的這一融合將推動未來十年的諸多創新。
NVIDIA Aerial SDK 是構建虛擬無線接入網(vRAN)的關鍵技術基礎。它通過 NVIDIA GPU 的內聯加速,實現了軟件定義的完整 5G Layer1(L1)卸載,同時還實現了所有符合 3GPP 和 O-RAN 標準的接口。由復雜信號處理算法組成的 L1 軟件在 CUDA C/C++中實現,使得優化 L1 算法、實現新功能以及構建具有前瞻性,將推動 5G 演進和 6G 發展的 RAN 應用變得容易。NVIDIA Aerial SDK 以模塊化的微服務形式實現,采用 E2E 云原生架構,并由 Kubernetes 使用符合 ORAN SMO 標準的接口進行管理。
從 CloudRAN 到 RAN-in-the-Cloud
最近有很多關于 CloudRAN 的討論。作為加速計算平臺和云計算的行業領導者,NVIDIA 一直走在 CloudRAN 的創新前列。許多行業領導者都在使用 CloudRAN 這一術語表示無線接入網(RAN)的云原生實現。
雖然云原生技術至關重要,但關鍵問題在于 CloudRAN 是否等同于使用云原生技術?答案是否定的,因為一個真正的云 RAN 是將所有計算元素(vDU、vCU 和 dUPF)部署在云中,因此應該稱之為云中 RAN(RAN-in-the-Cloud),即一個在多租戶云基礎設施中完全作為服務托管的 5G 無線接入網絡。
為什么二者的區別很重要?提出 RAN-in-the-Cloud 的動機又是什么?首先,RAN 是電信運營商最大的資本支出和運營支出項,同時也是利用率最低的資源,大多數無線基站的使用率通常低于 50%。將 RAN 計算遷移到云中能夠享受云計算帶來的眾多好處。在一個共享的云基礎設施中匯集并提高利用率可以幫助電信運營商最大程度地減少資本支出和運營支出。
帶有 GPU 加速器的 COTS 平臺不僅可以加速 5G RAN,還可以加速邊緣 AI 應用。電信運營商和企業正越來越多地使用 NVIDIA GPU 服務器來加速邊緣 AI 應用,這給使用相同 GPU 資源加速 5G RAN 連接以及 AI 應用提供了一條捷徑。這又反過來降低了總擁有成本,提供了一條建立企業 5G 網絡的最佳途徑。
云軟件、工具和技術多年來已經成熟。除了可靠性、可觀測性和服務保障外,還提供了大規模自動化、降低能耗、彈性計算、按需自動擴展等好處。
圖 1 統一加速數據中心
值得注意的是,一些廠商正在為 RAN L1 卸載設計基于特定應用集成電路(ASIC)的固定功能加速器卡。建立在這些基于 ASIC 的加速器上的 RAN 類似于一個固定功能設備,只能進行 RAN L1 的處理,在未被使用時就會成為一種被浪費的資源。
NVIDIA Aerial SDK 與通用 GPU 加速服務器提供了一個真正的多服務、多租戶平臺。它可用于 5G RAN、企業 AI 和其他部署在云端的邊緣應用,并具有上述所有優勢。
云原生是 RAN-in-the-Cloud 的基礎
隨著行業正在加快 5G 的部署,想要挖掘 5G 的全部商業價值需要靈活、可擴展的解決方案。將 RAN 軟件從硬件中分離出來,使軟件可用并可部署在云中能夠推動創新和新增值服務的推出。
云原生 vDU/vCU RAN 軟件套件在設計上實現了完全自動化的部署和統一運行,能夠支持私有、公有或混合云基礎設施上的 3GPP 和 O-RAN 接口。它運用了云原生架構的水平和垂直擴展、自動修復和冗余等優勢,還針對移動網絡演進優化了設計,包括 6G 等新一代無線技術。
NVIDIA Aerial SDK 云原生架構有助于將 RAN 功能作為容器中的微服務實現,并由 Kubernetes 進行編排和管理。該模塊化軟件能夠:
-
提高軟件升級、發布和安裝補丁的粒度和速度
-
提供遵循 DevOps 原則的獨立生命周期管理并具有持續集成和持續交付(CI/CD)功能
-
獨立擴展不同的 RAN 微服務元素
-
提供應用級可靠性、可觀測性和服務保障
-
通過網絡自動化簡化運營和維護
要想獲得真正的云原生 RAN 體驗,云、邊緣平臺和網絡都需要進一步發展。對于云原生容器化 RAN 軟件堆棧的商業部署,許多因素至關重要,包括:
-
時間同步
-
CPU 的親和性和隔離
-
拓撲管理和特征發現
-
多個網絡接口
-
高性能的數據平面和加速硬件
-
低延遲、服務質量(QoS)保證和高吞吐量
-
遠程分布式部署
-
零接觸配置
-
Kubernetes Operator 框架和用于加速設備的生產就緒型算子
NVIDIA GPU Operator 使用 Kubernetes 中的 Operator Framework 自動管理配置 GPU 所需的所有 NVIDIA 軟件組件。這些組件包括設備驅動程序(用于啟用 CUDA)、用于 GPU 的 Kubernetes 設備插件、NVIDIA Container Runtime、自動節點標簽、基于數據中心 GPU 管理器(DCGM)的監控等。
GPU 算子使 Kubernetes 集群的管理員能夠像集群中的 CPU 節點一樣管理 GPU 節點。管理員不需要為 GPU 節點配置特殊的操作系統鏡像,而是可以依靠 CPU 和 GPU 節點的標準操作系統鏡像,然后依靠 GPU 算子為 GPU 配置所需的軟件組件。
借助 Kubernetes CRD 和 OperatorSDK,它可以管理與網絡相關的組件,為 Kubernetes 集群中的工作負載實現與 RDMA 和 NVIDIA GPUDirect 的快速聯網。該網絡算子與 GPU 算子一起在兼容系統上實現 GPU 直接 RDMA。網絡算子的目標是管理網絡相關組件,同時在Kubernetes集群中實現 RDMA 和 GPU 直接 RDMA 工作負載的執行。
NVIDIA Aerial SDK 以微服務和云原生架構為基礎,為構建和部署 5G RAN-in-the-Cloud 奠定了堅實的基礎。
在云中構建、部署和管理
O-RAN 聯盟倡議將傳統的無線基站分解成 RRU、vDU 和 vCU 實例并在它們之間設置了明確的接口,產生了一個提供廠商選擇的更大生態系統。另外,云原生容器化軟件實現了由 Kubernetes 和 SMO 管理的可組合、自動化 RAN。那么將整個 RAN 云化并作為一項服務在云中托管需要什么?
圖 2 云中 RAN 構想
部署 5G 的經濟性一直是個挑戰。與前幾代無線技術相比,5G 正在推動 RAN 資本支出大幅增長。預計在未來 5 年內,基站的數量將增加近一倍。因此,RAN 資本支出在整個 TCO 中的份額逐漸從 45-50%上升到 65%。
另外,眾所周知,傳統上 RAN 是按峰值容量進行配置的,這導致寶貴的計算資源被嚴重浪費。突發性和時間依賴性流量使得許多傳統RAN基站平均容量使用率在 25%以下。如果 RAN 可以被托管在云中,那么池化的益處可以通過節能減少運營支出并提高利用率。而且未使用的資源能夠以真正類似于云的方式重新配置給其他應用和工作負載。
僅在美國,將總共 42 萬個基站中的 50%轉移到 GPU 加速云中就為電信運營商帶來巨大的收入機會。當 RAN 利用率低且 GPU 未被使用時,它們可以在多租戶云環境中用于企業 AI、視頻服務和其他邊緣應用。這可能會在全球創造一個數十億元的新收入機會。
圖 2 展示了由 NVIDIA GPU 的加速計算基礎設施構建的數據中心如何加速眾多應用,實現云經濟性和最佳 TCO。
內置 NVIDIA Base Command Platform 和 NVIDIA Fleet Command 的 NVIDIA AI Enterprise 使企業能夠在 NVIDIA GPU 云中運行 AI 應用,利用所有預先構建和加固的軟件為各個垂直細分市場服務。5G 連接作為一個容器化的解決方案與使用相同基礎設施的其他 AI 應用一起運行,能夠為企業帶來非常強大的效益。這將改變世界對無線連接的看法。5G 將成為一種完全基于云、可以按需部署的服務。這就是 RAN-in-the-Cloud 的本質。
使用 NVIDIA 構建您的 RAN-in-the-Cloud
如圖 3 所示,將 RAN 集中并完全部署在云中有五個關鍵要素。
圖 3 實現 RAN-in-the-Cloud 的五項關鍵技術
全新 NVIDIA Spectrum SN3750-SX 開放式以太網交換機是 RAN-in-the-Cloud 解決方案的關鍵組成部分。它基于 NVIDIA Spectrum-2 以太網ASIC構建,是首款軟件定義的 xHaul 交換機,能夠提供電信數據中心所需的前傳、中傳和回傳網絡。
該交換機的一項關鍵能力是可以通過動態編程,將流量引導至部署在數據中心任何服務器上的任何 vDU,為自動擴展和按需部署 RAN 提供支持。它是第一臺將在同一基礎設施上運行電信和 AI 所有所需功能結合的交換機。SN3750-SX 支持各種高級時間協議,如電信級精確時間協議(PTP)、同步以太網(SyncE)和 PPS(每秒數據包),以及動態 RU/DU 映射。
為了實現 AI 訓練,該交換機支持低延遲的 200G 帶寬以實現最高吞吐量。Spectrum ASIC 帶來了 RoCE(融合以太網的 RDMA)和自適應路由等創新功能,所有這些功能均具有最高的網絡規模。值得注意的是,許多應用(如 Metaverse 和 AR/VR)需要支持 PTP 的數據中心,這將為 RAN-in-the-Cloud 用例鋪平道路。目前一些網絡規模公司已在其數據中心中支持 PTP。
搭載 NVIDIA A100 Tensor Core GPU 和 NVIDIA BlueField DPU 的 NVIDIA A100X 融合加速器支持全內聯 5G RAN 卸載,這為從 4T4R 到大規模 MIMO 32T32R 和 64T64R 的一系列配置提供了以每瓦單元密度和每瓦 MHz 層數衡量的領先性能。
NVIDIA 正在與各生態系統合作伙伴一起確保 SMO(服務管理和編排)、RIC(RAN 智能控制器)、xApps 和rApps 等其他 O-RAN 軟件組件針對 NVIDIA Aerial SDK 進行優化并為 RAN-in-the-Cloud 的部署做好準備。這些組件仍處于早期開發階段,但因為使用 AI 實現了 RAN 自動化和可編程性,它們將成為關鍵的差異化因素。雖然 RAN-in-the-Cloud 需要一些時間才能成熟,但相信NVIDIA將憑借 NVIDIA GPU 加速平臺站在這一創新的最前沿。
總結
RAN-in-the-Cloud 是未來的大勢所趨。它是無線市場的自然演變和下一個發展方向。使用云原生技術構建的 vRAN 是不可或缺的第一步。為了實現 5G RAN 的云經濟性并推動 5G 與邊緣 AI 應用的共同創新,就必須擁抱 RAN-in-the-Cloud。NVIDIA Aerial SDK 提供了一個可擴展的云原生軟件架構作為 RAN-in-the-Cloud 的基礎技術。
最后需要注意的是,RAN 的轉型才剛剛開始。使用 AI 優化復雜的信號處理算法將在未來幾年釋放出一系列全新的創新成果。GPU 加速平臺是讓投資能夠經受未來考驗的最佳途徑。如果想一同構建創新的 RAN-in-the-Cloud 解決方案,請聯系 NVIDIA。
更多詳細信息,點擊閱讀原文,了解 NVIDIA AI-on-5G 平臺。
掃描海報二維碼,即可觀看 NVIDIA 創始人兼首席執行官黃仁勛 GTC23 主題演講重播!
原文標題:RAN-in-the-Cloud:為 5G RAN 帶來云經濟效益
文章出處:【微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉載請注明出處。
-
英偉達
+關注
關注
22文章
3842瀏覽量
91898
原文標題:RAN-in-the-Cloud:為 5G RAN 帶來云經濟效益
文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論