盗墓笔记小说,性爱有声小说在线收听,我欲封天耳根小说零

案例介紹

金山辦公與 NVIDIA 團(tuán)隊合作，通過 NVIDIA Tensor Core GPU、TensorRT 提升圖像文檔識別與理解的推理效率；借助 NVIDIA Triton 推理服務(wù)器的部署，成功優(yōu)化 GPU 利用率，提供高推理吞吐量。

客戶簡介及應(yīng)用背景

金山辦公是一家辦公軟件和服務(wù)提供商，主要從事 WPS Office 辦公軟件產(chǎn)品及服務(wù)的設(shè)計研發(fā)及銷售推?。產(chǎn)品包括 WPS Office 辦公軟件、???檔等協(xié)同辦公產(chǎn)品、圖像文檔識別與理解業(yè)務(wù)，可在 Windows、Linux、macOS、Android、iOS 、Harmony 等眾多主流操作平臺上應(yīng)?，于全球也有越來越多的用戶樂享金山辦公提供的產(chǎn)品和服務(wù)。

在辦公場景中，文檔類型圖像被廣泛使用，比如證件、發(fā)票、合同、保險單、掃描書籍、拍攝的表格等，這類圖像包含了大量的純文本信息，還包含有表格、圖片、印章、手寫、公式等復(fù)雜的版面布局和結(jié)構(gòu)信息。早前這些信息均采用人工來處理，需要耗費大量人力，很大程度上阻礙了企業(yè)的辦公效率。其圖像文檔識別與內(nèi)容理解業(yè)務(wù)就是為了解決此類用戶痛點。

自 2017 年以來的不斷耕耘，金山辦公在圖像文檔識別與理解領(lǐng)域已達(dá)到了國內(nèi)領(lǐng)先水平。其主要使用了 CV（Computer Vision）與 VIE（Visual Information Extraction 視覺信息抽取）等相關(guān)深度學(xué)習(xí)技術(shù)，例如通過 CV 技術(shù)識別發(fā)票和 PDF 大綱并獲取其中的數(shù)據(jù)關(guān)系，其日請求次數(shù)已達(dá)上億次。

客戶挑戰(zhàn)

圖像識別與理解是一個很復(fù)雜的過程，一個任務(wù)的 pipeline 用到的深度學(xué)習(xí)模型多達(dá) 20+ 個，且日請求量級較大（上億級別）需要大量的計算資源。當(dāng)業(yè)務(wù)落地時，團(tuán)隊主要面臨以下兩個挑戰(zhàn)：

1、任務(wù)的絕對耗時不能過長。

2、成本問題。

應(yīng)用方案

為了解決上訴的兩個挑戰(zhàn)，金山辦公采用了 NVIDIA T4 Tensor Core GPU 進(jìn)行推理、NVIDIA TensorRT 8.2.4 進(jìn)行模型加速、NVIDIA Triton 推理服務(wù)器 22.04 在 K8S 上進(jìn)行模型部署與編排。

長鏈路（多達(dá) 20+ 個模型的 pipeline）意味著長耗時，若基于 CPU 推理的話，pipeline 耗時會長達(dá) 15 秒左右，通過 GPU 推理和 TensorRT 加速，成功將耗時降低到了 2.4 秒左右。

模型部署的時候，常見的做法是推理與業(yè)務(wù)代碼（前后處理）放在一個進(jìn)程空間里，每個模型需要在每個進(jìn)程中加載一次，由于顯存的限制，很多時候難以得到較高的單卡 GPU 使用率。就算采用了進(jìn)程池的方式提高了單卡的 GPU 利用率，也會因 CPU 的限制，出現(xiàn)機器整體的 GPU 利用率不高。而在引入了 Triton 推理服務(wù)器進(jìn)行推理部署后，將推理與業(yè)務(wù)代碼解耦，初步實現(xiàn)將 GPU 資源池化調(diào)度。最終在同等業(yè)務(wù)規(guī)模情況下，部署成本節(jié)省了 23%。

模型耗時

表1 模型耗時

模型吞吐量對比圖

WPS 生成式 AI 的最新進(jìn)展

WPS AI 緊跟業(yè)界潮流，再發(fā)布新 AI 能力，覆蓋文字、表格、PPT、PDF 四大辦公組件。這部分 AI 新能力集中在閱讀理解、問答、人機交互等方面。在 PPT 中，WPS AI 現(xiàn)已支持輸入主題，一鍵生成 PPT 演示文稿，并會根據(jù)用戶要求進(jìn)行細(xì)化調(diào)節(jié)，如更改主題風(fēng)格、單頁美化、更改字體、更改配色、生成演講稿等等。

在 PDF 中，WPS 則展示了閱讀分析和理解能力。WPS AI 能夠閱讀包括論文、合同、課件等文檔，用戶以問答方式則可以獲得關(guān)鍵信息。并且，問答助手也會提供文檔溯源功能，確保用戶能夠得知信息來源。

用戶能夠通過手機等移動設(shè)備拍攝相關(guān)文檔，而后 WPS 給出相關(guān)翻譯、概括、分析等功能。

圖 1. WPS-AI 隨手拍與文檔問答

圖 2. WPS-AI 大綱生成

圖 3. WPS-AI PPT 美化

圖 4. WPS-AI PPT 生成

使用效果及影響

金山辦公圖像文檔識別與理解業(yè)務(wù)，通過采用 NVIDIA T4 Tensor Core GPU 及 TensorRT加速，相比于 CPU 其 pipleline 耗時共下降 84%；而采用 NVIDIA Triton 推理服務(wù)器部署，其部署成本節(jié)省了 23% 。

金山辦公 CV 團(tuán)隊總監(jiān)熊龍飛表示：”我們有多個業(yè)務(wù)后邊的 AI 服務(wù)已經(jīng)通過采用該方案提高了速度和資源利用率，不僅給用戶端帶去了更高的速度響應(yīng)，提高了用戶體驗，也為公司節(jié)約了大量的服務(wù)端 GPU 資源，收獲了更高的效益。我們在文檔識別與理解領(lǐng)域的應(yīng)用案例也可以啟發(fā)到 OCR 和版式識別領(lǐng)域的其他公司和學(xué)者，相信隨著更多客戶通過采用 TensorRT 加速會給行業(yè)帶來很大的收益。”

*本文中圖片均來源于金山辦公，如果您有任何疑問或需要使用本文中的圖片，請聯(lián)系金山辦公。

點擊“閱讀原文”，或掃描下方海報二維碼，觀看 NVIDIA 創(chuàng)始人兼 CEO 黃仁勛在 COMPUTEX 2023 的主題演講直播回放，主題演講中文字幕版已上線，了解 AI、圖形及其他領(lǐng)域的最新進(jìn)展！

原文標(biāo)題：NVIDIA GPU 加速 WPS Office AI 服務(wù)，助力打造優(yōu)質(zhì)的用戶體驗

文章出處：【微信公眾號：NVIDIA英偉達(dá)】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

英偉達(dá)

英偉達(dá)

+關(guān)注

關(guān)注
22

文章
3776

瀏覽量
91104

原文標(biāo)題：NVIDIA GPU 加速 WPS Office AI 服務(wù)，助力打造優(yōu)質(zhì)的用戶體驗

文章出處：【微信號：NVIDIA_China，微信公眾號：NVIDIA英偉達(dá)】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

搜索歷史

NVIDIA GPU 加速 WPS Office AI 服務(wù)，助力打造優(yōu)質(zhì)的用戶體驗

評論

GPU加速云服務(wù)器怎么用的

《CST Studio Suite 2024 GPU加速計算指南》

NVIDIA加速AI在日本各行各業(yè)的應(yīng)用

賴耶科技通過NVIDIA AI Enterprise平臺打造超級AI工廠

NVIDIA助力Amdocs打造生成式AI智能體

日本企業(yè)借助NVIDIA產(chǎn)品加速AI創(chuàng)新

NVIDIA與思科合作打造企業(yè)級生成式AI基礎(chǔ)設(shè)施

NVIDIA加速計算和 AI助力數(shù)字銀行揭穿金融欺詐騙局

HPE 攜手 NVIDIA 推出 NVIDIA AI Computing by HPE，加速生成式 AI 變革

NVIDIA推出NVIDIA AI Computing by HPE加速生成式 AI 變革

NVIDIA發(fā)布DeepStream 7.0，助力下一代視覺AI開發(fā)

利用NVIDIA組件提升GPU推理的吞吐

使用NVIDIA Triton推理服務(wù)器來加速AI預(yù)測

HarmonyOS SDK 助力新浪新聞打造精致易用的新聞應(yīng)用

Supermicro推新AI存儲方案，助力AI和ML應(yīng)用加速