英偉達GTC25亮點：NVIDIA Dynamo開源庫加速并擴展AI推理模型

NVIDIA Dynamo 提高了推理性能，同時降低了擴展測試時計算 (Scaling Test-Time Compute) 的成本；在 NVIDIA Blackwell 上的推理優(yōu)化將 DeepSeek-R1 上的吞吐量提高了 30 倍

NVIDIA 發(fā)布了開源推理軟件 NVIDIA Dynamo，旨在以高效率、低成本加速并擴展 AI 工廠中的 AI 推理模型。

作為 NVIDIA Triton 推理服務(wù)器的后續(xù)產(chǎn)品，NVIDIA Dynamo 是一款全新的 AI 推理服務(wù)軟件，旨在為部署推理 AI 模型的 AI 工廠最大化其 token 收益。它協(xié)調(diào)并加速數(shù)千個 GPU 之間的推理通信，并使用分離服務(wù)將大語言模型 (LLM) 的處理階段和生成階段在不同 GPU 上分離開來。這使得每個階段的特定需求可以進行單獨優(yōu)化，并確保更大程度地利用 GPU 資源。

NVIDIA Dynamo 完全開源并支持 PyTorch、SGLang、NVIDIA TensorRT-LLM 和 vLLM，使企業(yè)、初創(chuàng)公司和研究人員能夠開發(fā)和優(yōu)化在分離推理時部署 AI 模型的方法。

“全世界各行業(yè)都在訓(xùn)練 AI 模型以不同的方式進行思考和學(xué)習(xí)，從而使模型復(fù)雜度持續(xù)升級。” NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛表示，“為了實現(xiàn)自定義推理 AI 的未來，NVIDIA Dynamo 可以在這些模型上進行規(guī)模化部署，從而為 AI 工廠實現(xiàn)降本增效”。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

NVIDIA

NVIDIA

+關(guān)注

關(guān)注
14

文章
5140

瀏覽量
104730
AI

AI

+關(guān)注

關(guān)注
87

文章
32687

瀏覽量
272118

原文標(biāo)題：GTC25 | NVIDIA Dynamo 開源庫加速并擴展 AI 推理模型

文章出處：【微信號：NVIDIA_China，微信公眾號：NVIDIA英偉達】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

英偉達GTC2025亮點：NVIDIA認(rèn)證計劃擴展至企業(yè)存儲領(lǐng)域，加速AI工廠部署

，現(xiàn)在已將企業(yè)存儲納入其中，旨在通過加速計算、網(wǎng)絡(luò)、軟件和存儲，助力企業(yè)更高效地部署 AI 工廠。在企業(yè)構(gòu)建 AI 工廠的過程中，獲取高質(zhì)量數(shù)據(jù)對于確保 AI

發(fā)表于 03-21 19:38 ?488次閱讀

英偉達GTC2025亮點：NVIDIA、Alphabet 和谷歌攜手開啟代理式與物理AI的未來

聯(lián)合計劃涵蓋基礎(chǔ)設(shè)施和開源模型優(yōu)化，在機器人、藥物研發(fā)等領(lǐng)域取得巨大進展具有長期合作伙伴關(guān)系的 NVIDIA、Alphabet 和谷歌宣布了多項新計劃，旨在推動 AI 發(fā)展、普及

發(fā)表于 03-21 15:10 ?382次閱讀

<b class='flag-5'>英偉</b><b class='flag-5'>達</b><b class='flag-5'>GTC</b>2025<b class='flag-5'>亮點</b>：<b class='flag-5'>NVIDIA</b>、Alphabet 和谷歌攜手開啟代理式與物理<b class='flag-5'>AI</b>的未來

英偉達GTC2025亮點：Oracle與NVIDIA合作助力企業(yè)加速代理式AI推理

Oracle 數(shù)據(jù)庫與 NVIDIA AI 相集成，使企業(yè)能夠更輕松、快捷地采用代理式 AI Oracle 和 NVIDIA 宣布，

發(fā)表于 03-21 12:01 ?261次閱讀

<b class='flag-5'>英偉</b><b class='flag-5'>達</b><b class='flag-5'>GTC</b>2025<b class='flag-5'>亮點</b>：Oracle與<b class='flag-5'>NVIDIA</b>合作助力企業(yè)<b class='flag-5'>加速</b>代理式<b class='flag-5'>AI</b><b class='flag-5'>推理</b>

英偉達GTC2025亮點 NVIDIA推出Cosmos世界基礎(chǔ)模型和物理AI數(shù)據(jù)工具的重大更新

推理模型，讓開發(fā)者以前所未有的方式控制世界生成。 NVIDIA 還推出了兩款由 NVIDIA Omniverse 和 Cosmos 平臺提供支持的新藍圖，為開發(fā)者提供用于機

發(fā)表于 03-20 19:01 ?315次閱讀

英偉達GTC25亮點：NVIDIA Blackwell Ultra 開啟 AI 推理新時代

英偉達GTC25亮點：NVIDIA Blackwell Ultra 開啟 AI

發(fā)表于 03-20 15:35 ?305次閱讀

Oracle 與 NVIDIA 合作助力企業(yè)加速代理式 AI 推理

Oracle 數(shù)據(jù)庫與 NVIDIA AI 相集成，使企業(yè)能夠更輕松、快捷地采用代理式 AI ? ? ? 美國加利福尼亞州圣何塞 —— GTC

發(fā)表于 03-19 15:24 ?166次閱讀

NVIDIA 推出開放推理 AI 模型系列，助力開發(fā)者和企業(yè)構(gòu)建代理式 AI 平臺

由 NVIDIA 后訓(xùn)練的全新 Llama Nemotron 推理模型，為代理式 AI 提供業(yè)務(wù)就緒型基礎(chǔ) 埃森哲、Amdocs、Atlassian、Box、Cadence、CrowdStrike

發(fā)表于 03-19 09:31 ?112次閱讀

智譜推出深度推理模型GLM-Zero預(yù)覽版

近日，智譜公司正式發(fā)布了其深度推理模型GLM-Zero的預(yù)覽版——GLM-Zero-Preview。這款模型標(biāo)志著智譜在擴展強化學(xué)習(xí)技術(shù)訓(xùn)練推理模型方面的重大突破，成為其首個專注于增強

發(fā)表于 01-03 10:42 ?299次閱讀

智譜GLM-Zero深度推理模型預(yù)覽版正式上線

近日，智譜公司宣布其深度推理模型GLM-Zero的初代版本——GLM-Zero-Preview已正式上線。這款模型是智譜首個基于擴展強化學(xué)習(xí)技術(shù)訓(xùn)練的推理模型，標(biāo)志著智譜在

發(fā)表于 01-02 10:55 ?301次閱讀

阿里云發(fā)布開源多模態(tài)推理模型QVQ-72B-Preview

近日，阿里云宣布了一項重大技術(shù)突破，正式發(fā)布了業(yè)界首個開源多模態(tài)推理模型——QVQ-72B-Preview。這一模型的問世，標(biāo)志著阿里云在AI技術(shù)領(lǐng)域的又一次重要飛躍

發(fā)表于 12-27 10:28 ?350次閱讀

阿里云開源推理大模型QwQ

近日，阿里云通義團隊宣布推出全新AI推理模型QwQ-32B-Preview，并同步實現(xiàn)了開源。這一舉措標(biāo)志著阿里云在AI推理領(lǐng)域邁出了重要一

發(fā)表于 11-29 11:30 ?829次閱讀

英偉達推出全新NVIDIA AI Foundry服務(wù)和NVIDIA NIM推理微服務(wù)

NVIDIA 宣布推出全新 NVIDIA AI Foundry 服務(wù)和 NVIDIA NIM 推理微服務(wù)，與同樣剛推出的 Llama 3.1

發(fā)表于 07-25 09:48 ?866次閱讀

英偉達推出AI模型推理服務(wù)NVIDIA NIM

英偉達近日宣布推出一項革命性的AI模型推理服務(wù)——NVIDIA NIM。這項服務(wù)將極大地簡化

發(fā)表于 06-04 09:15 ?820次閱讀

進一步解讀英偉達 Blackwell 架構(gòu)、NVlink及GB200 超級芯片

計算工作負(fù)載、釋放百億億次計算能力和萬億參數(shù)人工智能模型的全部潛力提供關(guān)鍵基礎(chǔ)。 NVLink釋放數(shù)萬億參數(shù)AI模型的加速性能，顯著提升大型多GPU系統(tǒng)的可

發(fā)表于 05-13 17:16

NVIDIA加速微軟最新的Phi-3 Mini開源語言模型

NVIDIA 宣布使用 NVIDIA TensorRT-LLM 加速微軟最新的 Phi-3 Mini 開源語言模型。TensorRT-LLM

發(fā)表于 04-28 10:36 ?726次閱讀

NVIDIA英偉達
專欄

0 文章 0 閱讀 0 粉絲 0 點贊

關(guān)注個人主頁

Hot VR、AR與MR的發(fā)展歷史以及商業(yè)應(yīng)用實例
Hot NVIDIA RTX與GTX的區(qū)別是什么？

New 英偉達GTC2025亮點 NVIDIA推出Cosmos世界基礎(chǔ)模型和物理AI數(shù)據(jù)工具的重大更新
New NVIDIA GTC2025 亮點 NVIDIA推出 DGX Spark個人AI計算機

发布文章

精選推薦
更多

文章

資料

帖子

AI SoC#全志T527八核工業(yè)級高性能人工智能芯片解讀

eeDesigner
1天前

350 閱讀

方波信號的頻譜與帶寬

張飛實戰(zhàn)電子官方
2天前

390 閱讀

V821 4M高集成無線視頻SoC技術(shù)參數(shù)介紹和開發(fā)指南

eeDesigner
1天前

261 閱讀

11kW 雙向 DCDC 轉(zhuǎn)換器系統(tǒng)方案(原理圖+BOM+PCB)

eeDesigner
2天前

894 閱讀

TDR測試中曲線上飄現(xiàn)象解析

羅德與施瓦茨中國
2天前

508 閱讀

新型多功能電話機實例維修技巧

159520
5.44 MB

免費

1181下載

docker-book Docker與Kubernetes開源書

廉鼎琮
45.71 MB

免費

0下載

Gifski將視頻轉(zhuǎn)換為高質(zhì)量Gif圖像

王蘭
3.08 MB

免費

0下載

帶反向電流保護的無帽NMOS 400 mA低壓差穩(wěn)壓器TPS736xx數(shù)據(jù)表

王尚岱
1.4MB

免費

0下載

AN-1267: 使用ADSP-CM408F ADC控制器的電機控制反饋采樣時序

hsdou月半
1.41MB

免費

5下載

【「芯片通識課：一本書讀懂芯片技術(shù)」閱讀體驗】初識芯片樣貌

jf_87445960
1天前

481 閱讀

克拉克變換&帕克變換：電機界的“變形金剛”雙人組

李旭昂
2天前

447 閱讀

【幸狐Omni3576邊緣計算套件試用體驗】DeepSeek 部署及測試

jf_07365693
3天前

971 閱讀

《電子發(fā)燒友電子設(shè)計周報》聚焦硬科技領(lǐng)域核心價值第4期：2025.03.17--2025.03.21

電子人steve
3天前

1090 閱讀

每周推薦！開關(guān)電源電路原理圖、電機控制等資料集合

ElecFans小喇叭
3天前

1393 閱讀

推薦專欄
更多