完美世界辰东,完美世界,完结小说

案例簡介

本案例通過利用NVIDIA TensorRT-LLM加速指令識別深度學(xué)習(xí)模型，并借助NVIDIA Triton推理服務(wù)器在NVIDIA V100 GPU上進(jìn)行高效部署，幫助必優(yōu)科技的文檔智能體 UTalk-Doc 將用戶指令識別服務(wù)吞吐量提升了 5 倍，單個請求響應(yīng)時間縮減了三分之一，大幅提升服務(wù)運(yùn)行效率，提升資源利用率。Triton 模型分析能力還協(xié)助必優(yōu)科技，將尋找最佳推理配置所需的時間從數(shù)周減少到數(shù)小時。

智能體迭代和

用戶增長的并發(fā)壓力

必優(yōu)科技旗下 UTalk-Doc 是新一代協(xié)助用戶進(jìn)行表達(dá)的辦公產(chǎn)品。其中“用戶指令識別”能力是產(chǎn)品組成中十分重要的一環(huán)。目前該能力主要由底層指令識別深度學(xué)習(xí)模型提供服務(wù)支持。

深度學(xué)習(xí)模型在運(yùn)行過程中需要較大的計算量，在用 Pytorch 進(jìn)行模型的推理時，一方面時延特別大，導(dǎo)致用戶體驗(yàn)受損；另一方面，顯存占用很大，導(dǎo)致推理請求的并發(fā)數(shù)上不去，請求失敗的概率太高，只能通過增加機(jī)器的方式來提高并發(fā)能力，業(yè)務(wù)部署成本較高；再次，使用的模型經(jīng)常變化，而業(yè)務(wù)需要更換后的模型能夠快速地加速和上線部署。NVIDIA GPU 硬件和軟件框架的強(qiáng)大性能幫助企業(yè)解決了海量計算需求，滿足了必優(yōu)科技多模態(tài) office 智能體的迭代和用戶幾何倍增長的并發(fā)壓力。

利用 NVIDIA產(chǎn)品技術(shù)組合

提升用戶體驗(yàn)

基于以上挑戰(zhàn)，必優(yōu)科技選擇了采用 NVIDIA 的 TensorRT-LLM SDK 對模型進(jìn)行推理加速，并利用 NVIDIA Triton推理服務(wù)器在 V100 GPU 上進(jìn)行在線部署，在提升用戶體驗(yàn)的同時，大幅降低了服務(wù)成本。

通過使用 TensorRT-LLM 對指令識別深度學(xué)習(xí)模型進(jìn)行加速，在都使用 FP32 的情況下，與 Pytorch 相對，時延降低 50% 左右。

使用 TensorRT-LLM 結(jié)合 NVIDIA V100 GPU 的 FP16 Tensor Core，在保證精度的同時，模型推理的時延進(jìn)一步降低了 40%。

Triton 的 dynamic batch 及多實(shí)例特性，在滿足時延要求的同時，提高了系統(tǒng)整體的并發(fā)能力。

TensorRT-LLM 可以對模型進(jìn)行快速地加速，Triton 則可以對加速后的模型進(jìn)行快速地部署，滿足了業(yè)務(wù)對修改后的模型進(jìn)行快速部署的需求，同時也大大減少了工程人員的工作量。

NVIDIA 賦能文檔智能體

在 NVIDIA 技術(shù)和初創(chuàng)加速生態(tài)的加持中，必優(yōu)科技旗下應(yīng)用產(chǎn)品 ChatPPT（UTalk-Doc）在短短幾個月內(nèi)自然注冊用戶破 100 萬，同時通過內(nèi)容表達(dá)場景（如 PPT 演示），賦能了如金融、教育、醫(yī)療等垂直行業(yè)領(lǐng)域客戶，并且在硬件生態(tài)合作等方面也做了更多的探索，共同推進(jìn)整個 AI 行業(yè)的快速發(fā)展。

“NVIDIA 提供的 GPU 解決方案，解決了深度學(xué)習(xí)和機(jī)器學(xué)習(xí)的技術(shù)難題，是我們公司在人工智能道路上一路狂飆所不可或缺的一環(huán)?！北貎?yōu)科技創(chuàng)始人兼 CTO 陳潤天博士表示。

必優(yōu)科技成立于 2020 年，是國內(nèi)較早期就專注于人工智能領(lǐng)域的智能內(nèi)容生成技術(shù)的科技型公司，公司目前主要圍繞智慧辦公場景做相關(guān)業(yè)務(wù)開發(fā)服務(wù)，如 2023 年 3 月上線的 Chatppt（AI 生成 PPT）6 個月用戶過百萬；全新下一代產(chǎn)品 UTalk-Doc——不拘泥于格式、自由切換文檔格式的產(chǎn)品，將徹底顛覆、改變和引領(lǐng)下一代 office 產(chǎn)品，幫助用戶更好地進(jìn)行表達(dá)。

NVIDIA 初創(chuàng)加速計劃

必優(yōu)科技是 NVIDIA 初創(chuàng)加速計劃 (NVIDIA Inception) 會員企業(yè)。NVIDIA 初創(chuàng)加速計劃為免費(fèi)會員制，旨在培養(yǎng)顛覆行業(yè)格局的優(yōu)秀創(chuàng)業(yè)公司。該計劃聯(lián)合國內(nèi)外知名的風(fēng)投機(jī)構(gòu)，創(chuàng)業(yè)孵化器，創(chuàng)業(yè)加速器，行業(yè)合作伙伴以及科技創(chuàng)業(yè)媒體等，打造創(chuàng)業(yè)加速生態(tài)系統(tǒng)。能夠提供產(chǎn)品折扣，技術(shù)支持，市場宣傳，融資對接，業(yè)務(wù)推薦等一系列服務(wù)，加速創(chuàng)業(yè)公司的發(fā)展。

審核編輯：湯梓紅

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

NVIDIA

NVIDIA

+關(guān)注

關(guān)注
14

文章
4986

瀏覽量
103058
gpu

gpu

+關(guān)注

關(guān)注
28

文章
4740

瀏覽量
128949
深度學(xué)習(xí)

深度學(xué)習(xí)

+關(guān)注

關(guān)注
73

文章
5503

瀏覽量
121162

原文標(biāo)題：NVIDIA GPU 解決方案加速必優(yōu)科技新一代文檔智能體

文章出處：【微信號：NVIDIA_China，微信公眾號：NVIDIA英偉達(dá)】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

借助NVIDIA GPU提升魯班系統(tǒng)CAE軟件計算效率

本案例中魯班系統(tǒng)高性能 CAE 軟件利用 NVIDIA 高性能 GPU，實(shí)現(xiàn)復(fù)雜產(chǎn)品的快速仿真，加速產(chǎn)品開發(fā)和設(shè)計迭代，縮短開發(fā)周期，提升

發(fā)表于 12-27 16:24 ?88次閱讀

NVIDIA推出全新生成式AI模型Fugatto

NVIDIA 開發(fā)了一個全新的生成式 AI 模型。利用輸入的文本和音頻，該模型可以創(chuàng)作出包含任意的音樂、人聲和聲音組合的作品。

發(fā)表于 11-27 11:29 ?357次閱讀

全球大型電子產(chǎn)品制造商利用 Omniverse 和 AI 制定計劃

ikan 全球大型電子產(chǎn)品制造商利用基于 NVIDIA Omniverse 構(gòu)建的數(shù)字孿生和工業(yè) AI 使工廠快速虛擬化。為了滿足目前已全面投產(chǎn)的 Blackwell 的需求，全球大型電子產(chǎn)

發(fā)表于 11-23 14:57 ?534次閱讀

金融科技公司利用NVIDIA技術(shù)加強(qiáng)金融服務(wù)應(yīng)用

通過 NVIDIA NIM 微服務(wù)和加速計算，Ntropy、Contextual AI、NayaOne 和 Securiti 增強(qiáng)了用于欺詐檢測、財務(wù)規(guī)劃等領(lǐng)域的 AI 應(yīng)用。

發(fā)表于 10-31 15:20 ?870次閱讀

Foxconn利用NVIDIA AI和Omniverse訓(xùn)練機(jī)器人

全球最大電子制造商 Foxconn 正準(zhǔn)備制造 NVIDIA 最復(fù)雜的產(chǎn)品之一，并開始使用 NVIDIA Omniverse 和 Isaac 平臺驅(qū)動的數(shù)字孿生。

發(fā)表于 10-10 09:40 ?409次閱讀

利用NVIDIA RAPIDS加速DolphinDB Shark平臺提升計算性能

DolphinDB 是一家高性能數(shù)據(jù)庫研發(fā)企業(yè)，也是 NVIDIA 初創(chuàng)加速計劃成員，其開發(fā)的產(chǎn)品基于高性能分布式時序數(shù)據(jù)庫，是支持復(fù)雜計算和流數(shù)據(jù)分析的實(shí)時計算平臺，適用于金融、電力、物聯(lián)網(wǎng)和零售等行業(yè)。

發(fā)表于 09-09 09:57 ?467次閱讀

初創(chuàng)公司SEA.AI利用NVIDIA邊緣AI和計算機(jī)視覺技術(shù)變革航海安全系統(tǒng)

總部位于奧地利林茨的初創(chuàng)公司正在利用 NVIDIA 邊緣 AI 和計算機(jī)視覺技術(shù)變革航海安全系統(tǒng)，讓每一次出海變得更安全。

發(fā)表于 09-09 09:32 ?510次閱讀

NVIDIA賦能理想汽車共同推進(jìn)智能駕駛和智能座艙技術(shù)創(chuàng)新

智能化已成為汽車行業(yè)發(fā)展的新引擎，NVIDIA 正在賦能理想汽車共同推進(jìn)智能駕駛和智能座艙技術(shù)創(chuàng)新。 ? 作為中國新能源汽車制造商和造車新勢力頭部企業(yè)之一，理想汽車深耕智能駕駛領(lǐng)域。通過利用

發(fā)表于 07-01 18:21 ?1726次閱讀

NVIDIA 通過 Holoscan 為 NVIDIA IGX 提供企業(yè)軟件支持

Enterprise-IGX軟件現(xiàn)已在NVIDIA IGX平臺上正式可用，以滿足工業(yè)邊緣對實(shí)時 AI 計算日益增長的需求。它們將共同幫助醫(yī)療、工業(yè)和科學(xué)計算領(lǐng)域的解決方案提供商利用企業(yè)級軟件和支持來加快開發(fā)

發(fā)表于 06-04 10:21 ?507次閱讀

沃爾沃利用英偉達(dá)的SoC和AI來提升自動駕駛的安全性

在2024年英偉達(dá)GPU技術(shù)大會（NVIDIA GTC 2024）上，沃爾沃介紹了如何利用人工智能和日益提升的算力來提升自動駕駛的安全性。

發(fā)表于 05-08 14:38 ?1180次閱讀

利用NVIDIA組件提升GPU推理的吞吐

本實(shí)踐中，唯品會 AI 平臺與 NVIDIA 團(tuán)隊(duì)合作，結(jié)合 NVIDIA TensorRT 和 NVIDIA Merlin HierarchicalKV（HKV）將推理的稠密網(wǎng)絡(luò)和熱 Embedding 全置于 GPU 上進(jìn)行

發(fā)表于 04-20 09:39 ?727次閱讀

SAP與NVIDIA攜手加速生成式AI在企業(yè)應(yīng)用中的普及

SAP SE 和 NVIDIA 宣布深化合作，致力于加速企業(yè)客戶在 SAP 云解決方案和應(yīng)用組合中利用數(shù)據(jù)和生成式 AI 的變革力量。

發(fā)表于 03-22 10:02 ?607次閱讀

如何選擇NVIDIA GPU和虛擬化軟件的組合方案呢？

NVIDIA vGPU 解決方案能夠?qū)?NVIDIA GPU 的強(qiáng)大功能帶入虛擬桌面、應(yīng)用程序和工作站，加速圖形和計算，使在家辦公或在任何地方工作的創(chuàng)意和技術(shù)專業(yè)人員能夠訪問虛擬化工作空間。

發(fā)表于 01-12 09:26 ?1127次閱讀

AMD升級視頻技術(shù)，提升畫質(zhì)應(yīng)用FSR

去年10月，NVIDIA已向全體RTX顯卡用戶推出了利用AI技術(shù)實(shí)現(xiàn)更高清晰度的RTX視訊超解析功能（簡稱RTXVSR），該項(xiàng)技術(shù)可消除原生

發(fā)表于 01-11 14:20 ?829次閱讀

如何提升單片機(jī)開發(fā)技術(shù)？

單片機(jī)開發(fā)是現(xiàn)代電子技術(shù)中的重要分支，其在各個領(lǐng)域都有著廣泛的應(yīng)用。單片機(jī)開發(fā)技術(shù)的提升不僅可以提高工作效率，還可以提高工作質(zhì)量和創(chuàng)新能力。那么，如何提升單片機(jī)開發(fā)

發(fā)表于 01-05 10:14

在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

搜索歷史

利用NVIDIA產(chǎn)品技術(shù)組合提升用戶體驗(yàn)

評論

借助NVIDIA GPU提升魯班系統(tǒng)CAE軟件計算效率

NVIDIA推出全新生成式AI模型Fugatto

全球大型電子產(chǎn)品制造商利用 Omniverse 和 AI 制定計劃

金融科技公司利用NVIDIA技術(shù)加強(qiáng)金融服務(wù)應(yīng)用

Foxconn利用NVIDIA AI和Omniverse訓(xùn)練機(jī)器人

利用NVIDIA RAPIDS加速DolphinDB Shark平臺提升計算性能

初創(chuàng)公司SEA.AI利用NVIDIA邊緣AI和計算機(jī)視覺技術(shù)變革航海安全系統(tǒng)

NVIDIA賦能理想汽車共同推進(jìn)智能駕駛和智能座艙技術(shù)創(chuàng)新

NVIDIA 通過 Holoscan 為 NVIDIA IGX 提供企業(yè)軟件支持

沃爾沃利用英偉達(dá)的SoC和AI來提升自動駕駛的安全性

利用NVIDIA組件提升GPU推理的吞吐

SAP與NVIDIA攜手加速生成式AI在企業(yè)應(yīng)用中的普及

如何選擇NVIDIA GPU和虛擬化軟件的組合方案呢？

AMD升級視頻技術(shù)，提升畫質(zhì)應(yīng)用FSR

如何提升單片機(jī)開發(fā)技術(shù)？