在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA GPU 加速 WPS Office AI 服務(wù),助力打造優(yōu)質(zhì)的用戶體驗

NVIDIA英偉達(dá) ? 來源:未知 ? 2023-06-29 21:35 ? 次閱讀

案例介紹

金山辦公與 NVIDIA 團(tuán)隊合作,通過 NVIDIA Tensor Core GPU、TensorRT 提升圖像文檔識別與理解的推理效率;借助 NVIDIA Triton 推理服務(wù)器的部署,成功優(yōu)化 GPU 利用率,提供高推理吞吐量。

客戶簡介及應(yīng)用背景

金山辦公是一家辦公軟件和服務(wù)提供商,主要從事 WPS Office 辦公軟件產(chǎn)品及服務(wù)的設(shè)計研發(fā)及銷售推?。產(chǎn)品包括 WPS Office 辦公軟件、???檔等協(xié)同辦公產(chǎn)品、圖像文檔識別與理解業(yè)務(wù),可在 Windows、Linux、macOS、AndroidiOSHarmony 等眾多主流操作平臺上應(yīng)?,于全球也有越來越多的用戶樂享金山辦公提供的產(chǎn)品和服務(wù)。

在辦公場景中,文檔類型圖像被廣泛使用,比如證件、發(fā)票、合同、保險單、掃描書籍、拍攝的表格等,這類圖像包含了大量的純文本信息,還包含有表格、圖片、印章、手寫、公式等復(fù)雜的版面布局和結(jié)構(gòu)信息。早前這些信息均采用人工來處理,需要耗費大量人力,很大程度上阻礙了企業(yè)的辦公效率 。其圖像文檔識別與內(nèi)容理解業(yè)務(wù)就是為了解決此類用戶痛點。

自 2017 年以來的不斷耕耘,金山辦公在圖像文檔識別與理解領(lǐng)域已達(dá)到了國內(nèi)領(lǐng)先水平。其主要使用了 CV(Computer Vision)與 VIE(Visual Information Extraction 視覺信息抽取) 等相關(guān)深度學(xué)習(xí)技術(shù),例如通過 CV 技術(shù)識別發(fā)票和 PDF 大綱并獲取其中的數(shù)據(jù)關(guān)系,其日請求次數(shù)已達(dá)上億次。

客戶挑戰(zhàn)

圖像識別與理解是一個很復(fù)雜的過程,一個任務(wù)的 pipeline 用到的深度學(xué)習(xí)模型多達(dá) 20+ 個,且日請求量級較大(上億級別)需要大量的計算資源。當(dāng)業(yè)務(wù)落地時,團(tuán)隊主要面臨以下兩個挑戰(zhàn):

1、任務(wù)的絕對耗時不能過長。

2、成本問題。

應(yīng)用方案

為了解決上訴的兩個挑戰(zhàn),金山辦公采用了 NVIDIA T4 Tensor Core GPU 進(jìn)行推理、NVIDIA TensorRT 8.2.4 進(jìn)行模型加速、NVIDIA Triton 推理服務(wù)器 22.04 在 K8S 上進(jìn)行模型部署與編排。

長鏈路(多達(dá) 20+ 個模型的 pipeline)意味著長耗時,若基于 CPU 推理的話,pipeline 耗時會長達(dá) 15 秒左右,通過 GPU 推理和 TensorRT 加速,成功將耗時降低到了 2.4 秒左右。

模型部署的時候,常見的做法是推理與業(yè)務(wù)代碼(前后處理)放在一個進(jìn)程空間里,每個模型需要在每個進(jìn)程中加載一次,由于顯存的限制,很多時候難以得到較高的單卡 GPU 使用率。就算采用了進(jìn)程池的方式提高了單卡的 GPU 利用率,也會因 CPU 的限制,出現(xiàn)機器整體的 GPU 利用率不高。而在引入了 Triton 推理服務(wù)器進(jìn)行推理部署后,將推理與業(yè)務(wù)代碼解耦,初步實現(xiàn)將 GPU 資源池化調(diào)度。最終在同等業(yè)務(wù)規(guī)模情況下,部署成本節(jié)省了 23%。

模型耗時

718fdc70-167e-11ee-962d-dac502259ad0.png

表1 模型耗時

模型吞吐量對比圖

71b7a9d0-167e-11ee-962d-dac502259ad0.png

71ea4c8c-167e-11ee-962d-dac502259ad0.png

721f1700-167e-11ee-962d-dac502259ad0.png

WPS 生成式 AI最新進(jìn)展

WPS AI 緊跟業(yè)界潮流,再發(fā)布新 AI 能力,覆蓋文字、表格、PPT、PDF 四大辦公組件。這部分 AI 新能力集中在閱讀理解、問答、人機交互等方面。在 PPT 中,WPS AI 現(xiàn)已支持輸入主題,一鍵生成 PPT 演示文稿,并會根據(jù)用戶要求進(jìn)行細(xì)化調(diào)節(jié),如更改主題風(fēng)格、單頁美化、更改字體、更改配色、生成演講稿等等。

在 PDF 中,WPS 則展示了閱讀分析和理解能力。WPS AI 能夠閱讀包括論文、合同、課件等文檔,用戶以問答方式則可以獲得關(guān)鍵信息。并且,問答助手也會提供文檔溯源功能,確保用戶能夠得知信息來源。

用戶能夠通過手機等移動設(shè)備拍攝相關(guān)文檔,而后 WPS 給出相關(guān)翻譯、概括、分析等功能。

圖 1. WPS-AI 隨手拍與文檔問答

728779a8-167e-11ee-962d-dac502259ad0.jpg

圖 2. WPS-AI 大綱生成

圖 3. WPS-AI PPT 美化

圖 4. WPS-AI PPT 生成

使用效果及影響

金山辦公圖像文檔識別與理解業(yè)務(wù),通過采用 NVIDIA T4 Tensor Core GPU TensorRT加速,相比于 CPU 其 pipleline 耗時共下降 84%;而采用 NVIDIA Triton 推理服務(wù)器部署,其部署成本節(jié)省了 23% 。

金山辦公 CV 團(tuán)隊總監(jiān)熊龍飛表示:”我們有多個業(yè)務(wù)后邊的 AI 服務(wù)已經(jīng)通過采用該方案提高了速度和資源利用率,不僅給用戶端帶去了更高的速度響應(yīng),提高了用戶體驗,也為公司節(jié)約了大量的服務(wù)端 GPU 資源,收獲了更高的效益。我們在文檔識別與理解領(lǐng)域的應(yīng)用案例也可以啟發(fā)到 OCR 和版式識別領(lǐng)域的其他公司和學(xué)者,相信隨著更多客戶通過采用 TensorRT 加速會給行業(yè)帶來很大的收益。”

*本文中圖片均來源于金山辦公,如果您有任何疑問或需要使用本文中的圖片,請聯(lián)系金山辦公

點擊“閱讀原文”,或掃描下方海報二維碼觀看 NVIDIA 創(chuàng)始人兼 CEO 黃仁勛在 COMPUTEX 2023 的主題演講直播回放,主題演講中文字幕版已上線,了解 AI、圖形及其他領(lǐng)域的最新進(jìn)展!


原文標(biāo)題:NVIDIA GPU 加速 WPS Office AI 服務(wù),助力打造優(yōu)質(zhì)的用戶體驗

文章出處:【微信公眾號:NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 英偉達(dá)
    +關(guān)注

    關(guān)注

    22

    文章

    3776

    瀏覽量

    91104

原文標(biāo)題:NVIDIA GPU 加速 WPS Office AI 服務(wù),助力打造優(yōu)質(zhì)的用戶體驗

文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    GPU加速服務(wù)器怎么用的

    GPU加速服務(wù)器是將GPU硬件與云計算服務(wù)相結(jié)合,通過云服務(wù)提供商的平臺,
    的頭像 發(fā)表于 12-26 11:58 ?45次閱讀

    《CST Studio Suite 2024 GPU加速計算指南》

    - smi啟用或禁用。 - 其他:還介紹了獨占計算模式、顯示鏈接、組合MPI計算和GPU計算、服務(wù)用戶GPU計算使用Windows遠(yuǎn)程桌面、運行多個模擬、視頻卡驅(qū)動、操作條件、最
    發(fā)表于 12-16 14:25

    NVIDIA加速AI在日本各行各業(yè)的應(yīng)用

    企業(yè)借助基于 NVIDIA AI Enterprise 與 Omniverse 工業(yè) AI 構(gòu)建的創(chuàng)新中心和服務(wù)加速
    的頭像 發(fā)表于 11-19 15:45 ?234次閱讀

    賴耶科技通過NVIDIA AI Enterprise平臺打造超級AI工廠

    NVIDIA 技術(shù)團(tuán)隊保持合作。賴耶科技通過NVIDIA AI Enterprise平臺打造的超級 AI 工廠,致力于
    的頭像 發(fā)表于 11-19 14:55 ?383次閱讀

    NVIDIA助力Amdocs打造生成式AI智能體

    正在使用NVIDIA DGX Cloud 與 NVIDIA AI Enterprise軟件開發(fā)和交付基于商用大語言模型(LLM)和領(lǐng)域適配模型的解決方案。該公司還在使用NVIDIA
    的頭像 發(fā)表于 11-19 14:48 ?345次閱讀

    日本企業(yè)借助NVIDIA產(chǎn)品加速AI創(chuàng)新

    日本領(lǐng)先企業(yè)和大學(xué)正在使用 NVIDIA NeMo、NIM 微服務(wù)NVIDIA Isaac 加速 AI 創(chuàng)新。
    的頭像 發(fā)表于 11-19 14:34 ?304次閱讀

    NVIDIA與思科合作打造企業(yè)級生成式AI基礎(chǔ)設(shè)施

    NVIDIA 加速計算平臺、NVIDIA AI Enterprise 軟件和 NVIDIA NIM 推理微
    的頭像 發(fā)表于 10-10 09:35 ?354次閱讀

    NVIDIA加速計算和 AI助力數(shù)字銀行揭穿金融欺詐騙局

    Bunq 利用 NVIDIA AI 將其欺詐檢測模型的訓(xùn)練速度提高近百倍。 ? 歐洲新型銀行 Bunq 正在 NVIDIA 加速計算和 AI
    的頭像 發(fā)表于 06-27 17:41 ?854次閱讀

    HPE 攜手 NVIDIA 推出 NVIDIA AI Computing by HPE,加速生成式 AI 變革

    by HPE 包含了可持續(xù)的加速計算產(chǎn)品組合以及全生命周期服務(wù),將簡化 AI 創(chuàng)造價值的過程,加速生成式 AI 的發(fā)展步伐。
    的頭像 發(fā)表于 06-21 14:39 ?370次閱讀

    NVIDIA推出NVIDIA AI Computing by HPE加速生成式 AI 變革

    作為極具開創(chuàng)性的一站式“交鑰匙”私有云人工智能(private-cloud AI)解決方案,NVIDIA AI Computing by HPE 包含了可持續(xù)的加速計算產(chǎn)品組合以及全生
    的頭像 發(fā)表于 06-20 17:36 ?728次閱讀

    NVIDIA發(fā)布DeepStream 7.0,助力下一代視覺AI開發(fā)

    NVIDIA DeepStream 是一款功能強大的 SDK,能夠提供用于構(gòu)建端到端視覺 AI 管線的 GPU 加速構(gòu)建模塊。
    的頭像 發(fā)表于 05-23 10:09 ?670次閱讀
    <b class='flag-5'>NVIDIA</b>發(fā)布DeepStream 7.0,<b class='flag-5'>助力</b>下一代視覺<b class='flag-5'>AI</b>開發(fā)

    利用NVIDIA組件提升GPU推理的吞吐

    本實踐中,唯品會 AI 平臺與 NVIDIA 團(tuán)隊合作,結(jié)合 NVIDIA TensorRT 和 NVIDIA Merlin HierarchicalKV(HKV)將推理的稠密網(wǎng)絡(luò)和熱
    的頭像 發(fā)表于 04-20 09:39 ?727次閱讀

    使用NVIDIA Triton推理服務(wù)器來加速AI預(yù)測

    這家云計算巨頭的計算機視覺和數(shù)據(jù)科學(xué)服務(wù)使用 NVIDIA Triton 推理服務(wù)器來加速 AI 預(yù)測。
    的頭像 發(fā)表于 02-29 14:04 ?585次閱讀

    HarmonyOS SDK 助力新浪新聞打造精致易用的新聞應(yīng)用

    信號不佳及離線場景下,AI 朗讀能力依然能夠繼續(xù)使用;此外,通過應(yīng)用服務(wù)領(lǐng)域開放的 Location Kit,新浪新聞還能夠準(zhǔn)確快速獲取用戶所在地的新聞,讓用戶隨時隨地縱享流暢絲滑的聽
    發(fā)表于 02-07 15:51

    Supermicro推新AI存儲方案,助力AI和ML應(yīng)用加速

    Supermicro首席執(zhí)行官梁見后先生高瞻遠(yuǎn)矚地指出:針對AI和ML應(yīng)用的加速處理,我們推薦配置以每機柜20 PB高速閃存為主,配備四個NVIDIA HGX H100系列優(yōu)化版8-GPU
    的頭像 發(fā)表于 02-03 14:46 ?636次閱讀
    主站蜘蛛池模板: 视频 在线| 爽好舒服快小柔小说| 日本一区二区三区欧美在线观看| 午夜肉伦伦影院在线观看| 六月色婷婷| 欧美在线视频7777kkkk| 污污视频在线免费看| 日本网站黄色| 国产精品久久久久免费| 青娱乐99| 午夜免费福利在线| 神马午夜51| 日本不卡一区视频| 欧美色视频网| 日本一级大片| 最近的中文字幕免费动漫视频| 美女拍拍拍爽爽爽爽爽爽| 欧美天天爽| 亚洲欧美日韩色图| 国产高清成人mv在线观看| 222aaa免费国产在线观看| 李丽莎尤物福利视频| 免费看日本黄色片| 免费精品美女久久久久久久久| 在线成人免费| 国产国产人免费人成成免视频| 日本人xxxxxxxxxⅹ69| 色多多www网站| 日日干夜夜操视频| 永久免费看毛片| 成zzzwww日本免费| 亚洲深夜| 寄宿日记免费看| 亚洲综合色dddd26| 日韩欧美一区二区三区不卡视频 | 色欧美综合| 亚洲国产精品久久网午夜| 亚洲国产网| 国内精品视频在线| 免费在线视频播放| 麻豆三级在线播放|