豆豆小说阅读网,小说网,完美世界txt下载

Microsoft 的目標(biāo)是，通過結(jié)合使用 Azure 與 NVIDIA GPU 和 Triton 推理軟件，率先將一系列強(qiáng)大的 AI Transformer 模型投入生產(chǎn)用途。

如果您的軟件能喚起人們喜悅的淚水，您就是在傳播歡樂。

Translator 是一項(xiàng) Microsoft Azure 認(rèn)知服務(wù)，通過應(yīng)用一些規(guī)模龐大的 AI 模型來幫助更多人進(jìn)行交流。

“有太多精彩的故事可以講了!” Translator 開發(fā)經(jīng)理 Vishal Chowdhary 表示。

比如，在 2010 年海地遭受 7.0 級地震后，在短短 5 天的沖刺期里為相關(guān)應(yīng)用緊急添加海地克里奧爾語支持，進(jìn)而為救援人員提供幫助。再比如，祖父母在使用這款軟件，與講著他們不懂的語言的遠(yuǎn)方孫輩進(jìn)行第一次實(shí)時交流時，感動到哽咽。

雄心勃勃的目標(biāo)

“我們的愿景是，讓成千上萬的開發(fā)者都已經(jīng)在使用的這個 API，能打破不同語言、不同模式之間的阻礙。” Chowdhary 說。

考量全球現(xiàn)行的語言大約有 7000 種，這真的是個雄心勃勃的目標(biāo)。

因此，團(tuán)隊(duì)采用了一種強(qiáng)大而復(fù)雜的工具，即是混合專家系統(tǒng)(MoE)AI 方法。

在推動自然語言處理快速發(fā)展進(jìn)步的 Transformer 模型中，這是非常先進(jìn)的一種。它具有 50 億個參數(shù)，其規(guī)模比團(tuán)隊(duì)在生產(chǎn)過程中用于自然語言處理的最大模型大了 80 倍。

MoE 模型涉及到龐大的計(jì)算量，很難找到能將其投入生產(chǎn)環(huán)境中使用的用戶。在初始測試中，基于 CPU 的服務(wù)器無法滿足團(tuán)隊(duì)要在一秒鐘內(nèi)完成翻譯一個文檔的要求。

27 倍的提速

隨后，該團(tuán)隊(duì)使用 NVIDIA Triton 推理服務(wù)器(本周 GTC 大會上宣布的 NVIDIA AI Enterprise 2.0 平臺的其中一部分)在加速系統(tǒng)上進(jìn)行了測試。

Chowdhary 說：“借助 NVIDIA GPU 和 Triton，我們得以實(shí)現(xiàn)這一目標(biāo)，且非常高效。”

事實(shí)上，相較于未經(jīng)優(yōu)化的 GPU 運(yùn)行時，該團(tuán)隊(duì)實(shí)現(xiàn)了高達(dá) 27 倍的提速。

“這讓我們可以構(gòu)建一個模型來執(zhí)行不同的語言理解任務(wù)，例如匯總、生成文本和翻譯等，而不必為每個任務(wù)開發(fā)單獨(dú)的模型。” 負(fù)責(zé)監(jiān)督測試的 Microsoft 首席研究員 Hanny Hassan Awadalla 表示。

Triton 如何提供幫助

Microsoft 的模型能將大型任務(wù)(如翻譯多個文檔)拆分為許多個小任務(wù)，在每個小任務(wù)中翻譯幾百個句子。Triton 的動態(tài)批處理功能將諸多此類請求整合起來，從而充分利用 GPU 的強(qiáng)大功能。

對于 Triton 使用 CPU、GPU 或其他加速器在各種模式下運(yùn)行各種模型的能力，讓該團(tuán)隊(duì)贊不絕口。

Chowdhary 的團(tuán)隊(duì)十多年來一直在開發(fā)大規(guī)模分布式系統(tǒng)。Chowdhary 表示：“這種解決方案周到地考慮了我的工作場景，提供了我想要的各種功能，就像是我給自己親手定制的解決方案一樣。

在幕后，有兩個軟件組件是 Triton 取得成功的關(guān)鍵。一個是 NVIDIA 擴(kuò)展型 FasterTransformer，這是一個處理推理計(jì)算的軟件層，可支持 MoE 模型。另一個是 CUTLASS，這是一個 NVIDIA 數(shù)學(xué)庫，有助于高效實(shí)現(xiàn)模型。

在四周內(nèi)提供已驗(yàn)證的原型

盡管測試十分復(fù)雜，但該團(tuán)隊(duì)通過與 NVIDIA 工程師合作并運(yùn)用 Triton 的強(qiáng)大力量，在不到一個月的時間內(nèi)就獲得了可投入正常運(yùn)轉(zhuǎn)的端到端原型。

“在如此之短的時間內(nèi)制作出一款達(dá)到可發(fā)布程度的產(chǎn)品，這樣的效率實(shí)在令人印象深刻，對此我真的非常感激。” Awadalla 這樣說道。

雖然這是該團(tuán)隊(duì)第一次使用 Triton，但 “我們使用它來發(fā)布 MoE 模型，不用花費(fèi)太多力氣就重新構(gòu)建了運(yùn)行時環(huán)境，現(xiàn)在我衷心希望在我們的長期托管系統(tǒng)中納入這款解決方案。” Chowdhary 補(bǔ)充表示。

采取后續(xù)措施

加速后的服務(wù)將采用審慎的步驟實(shí)施，初期會用于少數(shù)幾種主要語言的文檔翻譯。

Chowdhary 表示：“我們的最終目標(biāo)是，讓客戶能在所有場景中通過透明的方式獲享這些新模型的優(yōu)點(diǎn)。”

這項(xiàng)工作是 Microsoft 的一項(xiàng)涉獵更廣泛的計(jì)劃的一部分。其目的是推動 Office 和 Teams 等眾多產(chǎn)品的進(jìn)步，幫助各類開發(fā)者與客戶(從專注于打造一款應(yīng)用的小型公司到財(cái)富 500 強(qiáng)企業(yè))取得發(fā)展。

為了給這一計(jì)劃鋪平道路，Awadalla 的團(tuán)隊(duì)于去年 9 月發(fā)表了一項(xiàng)研究成果，介紹如何在 NVIDIA A100 Tensor Core GPU 上訓(xùn)練具有多達(dá) 2 千億個參數(shù)的 MoE 模型。自那之后，該團(tuán)隊(duì)還在具有超過 3 千億個參數(shù)的模型上使用 80G 版本的 A100 GPU，將性能提升了 8 倍。

Adawalla 表示：“為了更好地表示更多的語言，尤其是我們手頭沒有太多數(shù)據(jù)的語言，模型必定會越來越大。”

原文標(biāo)題：GTC22 | 促進(jìn)人際交流：微軟使用 NVIDIA Triton 改善 Translator 翻譯工具的 AI 質(zhì)量和效率

文章出處：【微信公眾號：NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

審核編輯：湯梓紅

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報(bào)投訴

NVIDIA

NVIDIA

+關(guān)注

關(guān)注
14

文章
4986

瀏覽量
103067
gpu

gpu

+關(guān)注

關(guān)注
28

文章
4740

瀏覽量
128951
AI

AI

+關(guān)注

關(guān)注
87

文章
30896

瀏覽量
269110
Microsoft

Microsoft

+關(guān)注

關(guān)注
0

文章
214

瀏覽量
6863

原文標(biāo)題：GTC22 | 促進(jìn)人際交流：微軟使用 NVIDIA Triton 改善 Translator 翻譯工具的 AI 質(zhì)量和效率

文章出處：【微信號：NVIDIA_China，微信公眾號：NVIDIA英偉達(dá)】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

Triton編譯器在機(jī)器學(xué)習(xí)中的應(yīng)用

1. Triton編譯器概述 Triton編譯器是NVIDIA Triton推理服務(wù)平臺的一部分，它負(fù)責(zé)將深度學(xué)習(xí)模型轉(zhuǎn)換為優(yōu)化的格式，以便

發(fā)表于 12-24 18:13 ?342次閱讀

NVIDIA推出全新生成式AI模型Fugatto

NVIDIA 開發(fā)了一個全新的生成式 AI 模型。利用輸入的文本和音頻，該模型可以創(chuàng)作出包含任意的音樂、人聲和聲音組合的作品。

發(fā)表于 11-27 11:29 ?357次閱讀

Transformer模型的具體應(yīng)用

如果想在 AI 領(lǐng)域引領(lǐng)一輪新浪潮，就需要使用到 Transformer。

發(fā)表于 11-20 09:28 ?438次閱讀

<b class='flag-5'>Transformer</b><b class='flag-5'>模型</b>的具體應(yīng)用

NVIDIA AI正加速推進(jìn)藥物研發(fā)

在當(dāng)前的醫(yī)療健康領(lǐng)域，AI 的重要性愈發(fā)凸顯。NVIDIA AI 正加速推進(jìn)藥物研發(fā)，致力于減少藥物的研發(fā)時間和成本，使更多的老年患者能夠更快獲得關(guān)鍵治療。

發(fā)表于 11-19 16:07 ?236次閱讀

NVIDIA加速AI在日本各行各業(yè)的應(yīng)用

企業(yè)借助基于 NVIDIA AI Enterprise 與 Omniverse 工業(yè) AI 構(gòu)建的創(chuàng)新中心和服務(wù)加速 AI 轉(zhuǎn)型。

發(fā)表于 11-19 15:45 ?235次閱讀

日本企業(yè)借助NVIDIA產(chǎn)品加速AI創(chuàng)新

日本領(lǐng)先企業(yè)和大學(xué)正在使用 NVIDIA NeMo、NIM 微服務(wù)和 NVIDIA Isaac 加速 AI 創(chuàng)新。

發(fā)表于 11-19 14:34 ?304次閱讀

NVIDIA助力提供多樣、靈活的模型選擇

在本案例中，Dify 以模型中立以及開源生態(tài)的優(yōu)勢，為廣大 AI 創(chuàng)新者提供豐富的模型選擇。其集成的 NVIDIAAPI Catalog、NVIDIA NIM和

發(fā)表于 09-09 09:19 ?473次閱讀

NVIDIA AI Foundry 為全球企業(yè)打造自定義 Llama 3.1 生成式 AI 模型

借助 NVIDIA AI Foundry，企業(yè)和各國現(xiàn)在能夠使用自有數(shù)據(jù)與 Llama 3.1 405B 和 NVIDIA Nemotron 模型配對，來構(gòu)建“超級

發(fā)表于 07-24 09:39 ?713次閱讀

<b class='flag-5'>NVIDIA</b> <b class='flag-5'>AI</b> Foundry 為全球企業(yè)打造自定義 Llama 3.1 生成式 <b class='flag-5'>AI</b> <b class='flag-5'>模型</b>

使用PyTorch搭建Transformer模型

Transformer模型自其問世以來，在自然語言處理（NLP）領(lǐng)域取得了巨大的成功，并成為了許多先進(jìn)模型（如BERT、GPT等）的基礎(chǔ)。本文將深入解讀如何使用PyTorch框架搭建Trans

發(fā)表于 07-02 11:41 ?1632次閱讀

HPE 攜手 NVIDIA 推出 NVIDIA AI Computing by HPE，加速生成式 AI 變革

by HPE 包含了可持續(xù)的加速計(jì)算產(chǎn)品組合以及全生命周期服務(wù)，將簡化 AI 創(chuàng)造價值的過程，加速生成式 AI 的發(fā)展步伐。 NVIDIA

發(fā)表于 06-21 14:39 ?370次閱讀

NVIDIA推出NVIDIA AI Computing by HPE加速生成式 AI 變革

作為極具開創(chuàng)性的一站式“交鑰匙”私有云人工智能（private-cloud AI）解決方案，NVIDIA AI Computing by HPE 包含了可持續(xù)的加速計(jì)算產(chǎn)品組合以及全生

發(fā)表于 06-20 17:36 ?728次閱讀

NVIDIA與微軟擴(kuò)展合作，幫助開發(fā)者更快構(gòu)建和部署AI應(yīng)用

NVIDIA 在 Microsoft Build 開發(fā)者大會上展示了與 Microsoft Azure 和 Windows PC 的集成解決方案，簡化了 AI

發(fā)表于 05-23 10:14 ?418次閱讀

NVIDIA加速微軟最新的Phi-3 Mini開源語言模型

NVIDIA 宣布使用 NVIDIA TensorRT-LLM 加速微軟最新的 Phi-3 Mini 開源語言模型。TensorRT-LLM 是一個開源庫，用于優(yōu)化從 PC 到云端的

發(fā)表于 04-28 10:36 ?567次閱讀

NVIDIA在加速識因智能AI大模型落地應(yīng)用方面的重要作用介紹

本案例介紹了 NVIDIA 在加速識因智能 AI 大模型落地應(yīng)用方面的重要作用。生成式大模型已廣泛應(yīng)用于各領(lǐng)域，通過學(xué)習(xí)人類思維方式，能快速

發(fā)表于 03-29 15:28 ?634次閱讀

使用NVIDIA Triton推理服務(wù)器來加速AI預(yù)測

這家云計(jì)算巨頭的計(jì)算機(jī)視覺和數(shù)據(jù)科學(xué)服務(wù)使用 NVIDIA Triton 推理服務(wù)器來加速 AI 預(yù)測。

發(fā)表于 02-29 14:04 ?585次閱讀

在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

搜索歷史

Microsoft使用NVIDIA Triton加速AI Transformer模型應(yīng)用

評論

Triton編譯器在機(jī)器學(xué)習(xí)中的應(yīng)用

NVIDIA推出全新生成式AI模型Fugatto

Transformer模型的具體應(yīng)用

NVIDIA AI正加速推進(jìn)藥物研發(fā)

NVIDIA加速AI在日本各行各業(yè)的應(yīng)用

日本企業(yè)借助NVIDIA產(chǎn)品加速AI創(chuàng)新

NVIDIA助力提供多樣、靈活的模型選擇

NVIDIA AI Foundry 為全球企業(yè)打造自定義 Llama 3.1 生成式 AI 模型

使用PyTorch搭建Transformer模型

HPE 攜手 NVIDIA 推出 NVIDIA AI Computing by HPE，加速生成式 AI 變革

NVIDIA推出NVIDIA AI Computing by HPE加速生成式 AI 變革

NVIDIA與微軟擴(kuò)展合作，幫助開發(fā)者更快構(gòu)建和部署AI應(yīng)用

NVIDIA加速微軟最新的Phi-3 Mini開源語言模型

NVIDIA在加速識因智能AI大模型落地應(yīng)用方面的重要作用介紹

使用NVIDIA Triton推理服務(wù)器來加速AI預(yù)測