怎样写网络小说,网络小说排行榜,我欲封天

藉由 NVIDIAT4 GPU，通過 Ronda 平臺調用 NVIDIA Triton 以及 TensorRT ，整體提升開發和推理效能，幫助騰訊 PCG 的多個服務整體效能提升 2 倍，吞吐量最大提升 6 倍，同時降低了 40% 的延時。

騰訊平臺與內容事業群（簡稱騰訊 PCG）負責公司互聯網平臺和內容文化生態融合發展，整合 QQ、QQ 空間等社交平臺，和應用寶、瀏覽器等流量平臺，以及新聞資訊、視頻、體育、直播、動漫、影業等內容業務，推動 IP 跨平臺、多形態發展，為更多用戶創造海量的優質數字內容體驗。

騰訊 PCG 機器學習平臺部旨在構建和持續優化符合 PCG 技術中臺戰略的機器學習平臺和系統，提升 PCG 機器學習技術應用效率和價值。建設業務領先的模型訓練系統和算法框架；提供涵蓋數據標注、模型訓練、評測、上線的全流程平臺服務，實現高效率迭代；在內容理解和處理領域，輸出業界領先的元能力和智能策略庫。機器學習平臺部正服務于 PCG 所有業務產品。

而過往在項目執行時，團隊所面挑戰包含：

1. 業務繁多，場景復雜

業務開發語言包括C++/Python

模型格式繁多，包括ONNX、Pytorch、TensorFlow、TensorRT等

模型預處理涉及圖片下載等網絡IO

多模型融合流程比教復雜，涉及循環調用

支持異構推理

2. 模型推理結果異常時，難以方便地調試定位問題

3. 需要與公司內現有協議/框架/平臺進行融合

基于以上挑戰，騰訊 PCG 選擇了采用 NVIDIA Triton 推理服務器，以解決新場景下模型推理引擎面臨的挑戰，在提升用戶研效的同時，大幅降低了服務成本。

NVIDIA Triton 是一款開源軟件，對于所有推理模式都可以簡化模型在任一框架中以及任何 GPU 或 CPU 上的運行方式，從而在生產環境中使用 AI。Triton 支持多模型 ensemble，以及 TensorFlow、PyTorch、ONNX 等多種深度學習模型框架，可以很好的支持多模型聯合推理的場景，構建起視頻、圖片、語音、文本整個推理服務過程，大大降低多個模型服務的開發和維護成本。

基于 C++ 的基礎架構、Dynamic-batch、以及對 TensorRT 的支持，同時配合 T4 的 GPU，將整體推理服務的吞吐能力最大提升 6 倍，延遲最大降低 40%，既滿足了業務的低延時需求，成本也降低了 20%-66%。

通過將 Triton 編譯為動態鏈接庫，可以方便地鏈入公司內部框架，對接公司的平臺治理體系。符合 C 語言規范的 API 也極大降低了用戶的接入成本。

借助 Python Backend 和 Custom Backend，用戶可以自由選擇使用 C++/Python 語言進行二次開發。

Triton 的 Tracing 能力可以方便地捕捉執行過程中的數據流狀態。結合 Metrics 和 Perf Analysis 等組件，可以快速定位開發調試，甚至是線上問題，對于開發和定位問題的效率有很大提升。

NVIDIA DALI 是 GPU 加速的數據增強和圖像加載庫。DALI Backend 可以用于替換掉原來的圖片解碼、resize 等操作。FIL Backend 也可以替代 Python XGBoost 模型推理，進一步提升服務端推理性能。

借助 NVIDIA Triton 推理框架，配合 DALI/FIL/Python 等 Backend，以及 TensorRT，整體推理服務的吞吐能力最大提升 6 倍，延遲最大降低 40%。幫助騰訊 PCG 各業務場景中，以更低的成本構建了高性能的推理服務，同時更低的延遲降低了整條系統鏈路的響應時間，優化了用戶體驗。

審核編輯：彭菁

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

數據

數據

+關注

關注
8

文章
7057

瀏覽量
89098
NVIDIA

NVIDIA

+關注

關注
14

文章
4991

瀏覽量
103136
騰訊

騰訊

+關注

關注
7

文章
1656

瀏覽量
49463

鴻蒙原生頁面高性能解決方案上線OpenHarmony社區助力打造高性能原生應用

隨著HarmonyOS NEXT的正式推出，鴻蒙原生應用開發熱度高漲，數量激增。但在三方應用鴻蒙化進程中，性能問題頻出。為此，HarmonyOS NEXT推出了一整套原生頁面高性能解決方案，包括

發表于 01-02 18:00

Triton編譯器在高性能計算中的應用

高性能計算（High-Performance Computing，HPC）是現代科學研究和工程計算中不可或缺的一部分。隨著計算需求的不斷增長，對計算資源的要求也越來越高。Triton編譯器作為一種

發表于 12-25 09:11 ?226次閱讀

Triton編譯器在機器學習中的應用

1. Triton編譯器概述 Triton編譯器是NVIDIA Triton推理服務平臺的一部分

發表于 12-24 18:13 ?370次閱讀

Wolfspeed碳化硅助力實現高性能功率系統

Wolfspeed碳化硅助力實現高性能功率系統

發表于 10-24 10:51 ?0次下載

澎峰科技高性能大模型推理引擎PerfXLM解析

自ChatGPT問世以來，大模型遍地開花，承載大模型應用的高性能推理框架也不斷推出，大有百家爭鳴之勢。在這種情況下，澎峰科技作為全球領先的智能計算服務提供商，在2023年11月25日發布了針對大語言

發表于 09-29 10:14 ?489次閱讀

澎峰科技<b class='flag-5'>高性能</b>大模型<b class='flag-5'>推理</b>引擎PerfXLM解析

NVIDIA助力提供多樣、靈活的模型選擇

在本案例中，Dify 以模型中立以及開源生態的優勢，為廣大 AI 創新者提供豐富的模型選擇。其集成的 NVIDIAAPI Catalog、NVIDIA NIM和Triton 推理服務器

發表于 09-09 09:19 ?482次閱讀

使用NVIDIA Edify助力的服務創建3D資產和虛擬環境照明

使用 NVIDIA Edify 助力的服務創建 3D 資產和虛擬環境照明，或是減半生成圖像時間。

發表于 08-02 15:22 ?522次閱讀

NVIDIA攜手Meta推出AI服務，為企業提供生成式AI服務

NVIDIA近日宣布了一項重大舉措，正式推出NVIDIA AI Foundry服務與NVIDIA NIM（NVIDIA Inference

發表于 07-25 16:57 ?549次閱讀

英偉達推出全新NVIDIA AI Foundry服務和NVIDIA NIM推理微服務

NVIDIA 宣布推出全新 NVIDIA AI Foundry 服務和 NVIDIA NIM 推理微服務

發表于 07-25 09:48 ?712次閱讀

英偉達推出AI模型推理服務NVIDIA NIM

英偉達近日宣布推出一項革命性的AI模型推理服務——NVIDIA NIM。這項服務將極大地簡化AI模型部署過程，為全球的2800萬英偉達開發者提供前所未有的便利。

發表于 06-04 09:15 ?684次閱讀

英特爾助力京東云用CPU加速AI推理，以大模型構建數智化供應鏈

英特爾助力京東云用CPU加速AI推理，以大模型構建數智化供應鏈

發表于 05-27 11:50 ?547次閱讀

利用NVIDIA組件提升GPU推理的吞吐

本實踐中，唯品會 AI 平臺與 NVIDIA 團隊合作，結合 NVIDIA TensorRT 和 NVIDIA Merlin HierarchicalKV（HKV）將推理的稠密網絡和熱

發表于 04-20 09:39 ?738次閱讀

使用NVIDIA Triton推理服務器來加速AI預測

這家云計算巨頭的計算機視覺和數據科學服務使用 NVIDIA Triton 推理服務器來加速 AI 預測。

發表于 02-29 14:04 ?587次閱讀

基于NVIDIA DOCA 2.6實現高性能和安全的AI云設計

網絡平臺上快速創建應用程序和服務，并啟用 NVIDIA BlueField DPU 和 NVIDIA BlueField SuperNIC 的強大功能，提供突破性的網絡、安全和存儲性能

發表于 02-23 10:02 ?479次閱讀

利用NVIDIA產品技術組合提升用戶體驗

本案例通過利用NVIDIA TensorRT-LLM加速指令識別深度學習模型，并借助NVIDIA Triton推理服務器在

發表于 01-17 09:30 ?702次閱讀

在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

搜索歷史

NVIDIA Triton助力騰訊構建高性能推理服務

評論

鴻蒙原生頁面高性能解決方案上線OpenHarmony社區助力打造高性能原生應用

Triton編譯器在高性能計算中的應用

Triton編譯器在機器學習中的應用

Wolfspeed碳化硅助力實現高性能功率系統

澎峰科技高性能大模型推理引擎PerfXLM解析

NVIDIA助力提供多樣、靈活的模型選擇

使用NVIDIA Edify助力的服務創建3D資產和虛擬環境照明

NVIDIA攜手Meta推出AI服務，為企業提供生成式AI服務

英偉達推出全新NVIDIA AI Foundry服務和NVIDIA NIM推理微服務

英偉達推出AI模型推理服務NVIDIA NIM

英特爾助力京東云用CPU加速AI推理，以大模型構建數智化供應鏈

利用NVIDIA組件提升GPU推理的吞吐

使用NVIDIA Triton推理服務器來加速AI預測

基于NVIDIA DOCA 2.6實現高性能和安全的AI云設計

利用NVIDIA產品技術組合提升用戶體驗