在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
电子发烧友
开通电子发烧友VIP会员 尊享10大特权
海量资料免费下载
精品直播免费看
优质内容免费畅学
课程9折专享价
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

英偉達GTC25亮點:NVIDIA Dynamo開源庫加速并擴展AI推理模型

NVIDIA英偉達 ? 來源: NVIDIA英偉達 ? 2025-03-20 15:03 ? 次閱讀

NVIDIA Dynamo 提高了推理性能,同時降低了擴展測試時計算 (Scaling Test-Time Compute) 的成本;在 NVIDIA Blackwell 上的推理優(yōu)化將 DeepSeek-R1 上的吞吐量提高了 30 倍

NVIDIA 發(fā)布了開源推理軟件 NVIDIA Dynamo,旨在以高效率、低成本加速并擴展 AI 工廠中的 AI 推理模型。

作為 NVIDIA Triton 推理服務(wù)器的后續(xù)產(chǎn)品,NVIDIA Dynamo 是一款全新的 AI 推理服務(wù)軟件,旨在為部署推理 AI 模型的 AI 工廠最大化其 token 收益。它協(xié)調(diào)并加速數(shù)千個 GPU 之間的推理通信,并使用分離服務(wù)將大語言模型 (LLM) 的處理階段和生成階段在不同 GPU 上分離開來。這使得每個階段的特定需求可以進行單獨優(yōu)化,并確保更大程度地利用 GPU 資源。

NVIDIA Dynamo 完全開源并支持 PyTorch、SGLang、NVIDIA TensorRT-LLM 和 vLLM,使企業(yè)、初創(chuàng)公司和研究人員能夠開發(fā)和優(yōu)化在分離推理時部署 AI 模型的方法。

“全世界各行業(yè)都在訓(xùn)練 AI 模型以不同的方式進行思考和學(xué)習(xí),從而使模型復(fù)雜度持續(xù)升級。” NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛表示,“為了實現(xiàn)自定義推理 AI 的未來,NVIDIA Dynamo 可以在這些模型上進行規(guī)模化部署,從而為 AI 工廠實現(xiàn)降本增效”。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5140

    瀏覽量

    104730
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    32687

    瀏覽量

    272118

原文標(biāo)題:GTC25 | NVIDIA Dynamo 開源庫加速并擴展 AI 推理模型

文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 0人收藏

    評論

    相關(guān)推薦

    英偉GTC2025亮點NVIDIA認(rèn)證計劃擴展至企業(yè)存儲領(lǐng)域,加速AI工廠部署

    ,現(xiàn)在已將企業(yè)存儲納入其中,旨在通過加速計算、網(wǎng)絡(luò)、軟件和存儲,助力企業(yè)更高效地部署 AI 工廠。 在企業(yè)構(gòu)建 AI 工廠的過程中,獲取高質(zhì)量數(shù)據(jù)對于確保 AI
    的頭像 發(fā)表于 03-21 19:38 ?488次閱讀

    英偉GTC2025亮點NVIDIA、Alphabet 和谷歌攜手開啟代理式與物理AI的未來

    聯(lián)合計劃涵蓋基礎(chǔ)設(shè)施和開源模型優(yōu)化,在機器人、藥物研發(fā)等領(lǐng)域取得巨大進展 具有長期合作伙伴關(guān)系的 NVIDIA、Alphabet 和谷歌宣布了多項新計劃,旨在推動 AI 發(fā)展、普及
    的頭像 發(fā)表于 03-21 15:10 ?382次閱讀
    <b class='flag-5'>英偉</b><b class='flag-5'>達</b><b class='flag-5'>GTC</b>2025<b class='flag-5'>亮點</b>:<b class='flag-5'>NVIDIA</b>、Alphabet 和谷歌攜手開啟代理式與物理<b class='flag-5'>AI</b>的未來

    英偉GTC2025亮點:Oracle與NVIDIA合作助力企業(yè)加速代理式AI推理

    Oracle 數(shù)據(jù)NVIDIA AI 相集成,使企業(yè)能夠更輕松、快捷地采用代理式 AI Oracle 和 NVIDIA 宣布,
    的頭像 發(fā)表于 03-21 12:01 ?261次閱讀
    <b class='flag-5'>英偉</b><b class='flag-5'>達</b><b class='flag-5'>GTC</b>2025<b class='flag-5'>亮點</b>:Oracle與<b class='flag-5'>NVIDIA</b>合作助力企業(yè)<b class='flag-5'>加速</b>代理式<b class='flag-5'>AI</b><b class='flag-5'>推理</b>

    英偉GTC2025亮點 NVIDIA推出Cosmos世界基礎(chǔ)模型和物理AI數(shù)據(jù)工具的重大更新

    推理模型,讓開發(fā)者以前所未有的方式控制世界生成。 NVIDIA 還推出了兩款由 NVIDIA Omniverse 和 Cosmos 平臺提供支持的新藍圖,為開發(fā)者提供用于機
    的頭像 發(fā)表于 03-20 19:01 ?315次閱讀

    英偉GTC25亮點NVIDIA Blackwell Ultra 開啟 AI 推理新時代

    英偉GTC25亮點NVIDIA Blackwell Ultra 開啟 AI
    的頭像 發(fā)表于 03-20 15:35 ?305次閱讀

    Oracle 與 NVIDIA 合作助力企業(yè)加速代理式 AI 推理

    Oracle 數(shù)據(jù)NVIDIA AI 相集成,使企業(yè)能夠更輕松、快捷地采用代理式 AI ? ? ? 美國加利福尼亞州圣何塞 —— GTC
    發(fā)表于 03-19 15:24 ?166次閱讀
    Oracle 與 <b class='flag-5'>NVIDIA</b> 合作助力企業(yè)<b class='flag-5'>加速</b>代理式 <b class='flag-5'>AI</b> <b class='flag-5'>推理</b>

    NVIDIA 推出開放推理 AI 模型系列,助力開發(fā)者和企業(yè)構(gòu)建代理式 AI 平臺

    NVIDIA 后訓(xùn)練的全新 Llama Nemotron 推理模型,為代理式 AI 提供業(yè)務(wù)就緒型基礎(chǔ) 埃森哲、Amdocs、Atlassian、Box、Cadence、CrowdStrike
    發(fā)表于 03-19 09:31 ?112次閱讀
    <b class='flag-5'>NVIDIA</b> 推出開放<b class='flag-5'>推理</b> <b class='flag-5'>AI</b> <b class='flag-5'>模型</b>系列,助力開發(fā)者和企業(yè)構(gòu)建代理式 <b class='flag-5'>AI</b> 平臺

    智譜推出深度推理模型GLM-Zero預(yù)覽版

    近日,智譜公司正式發(fā)布了其深度推理模型GLM-Zero的預(yù)覽版——GLM-Zero-Preview。這款模型標(biāo)志著智譜在擴展強化學(xué)習(xí)技術(shù)訓(xùn)練推理模型方面的重大突破,成為其首個專注于增強
    的頭像 發(fā)表于 01-03 10:42 ?299次閱讀

    智譜GLM-Zero深度推理模型預(yù)覽版正式上線

    近日,智譜公司宣布其深度推理模型GLM-Zero的初代版本——GLM-Zero-Preview已正式上線。這款模型是智譜首個基于擴展強化學(xué)習(xí)技術(shù)訓(xùn)練的推理模型,標(biāo)志著智譜在
    的頭像 發(fā)表于 01-02 10:55 ?301次閱讀

    阿里云發(fā)布開源多模態(tài)推理模型QVQ-72B-Preview

    近日,阿里云宣布了一項重大技術(shù)突破,正式發(fā)布了業(yè)界首個開源多模態(tài)推理模型——QVQ-72B-Preview。這一模型的問世,標(biāo)志著阿里云在AI技術(shù)領(lǐng)域的又一次重要飛躍
    的頭像 發(fā)表于 12-27 10:28 ?350次閱讀

    阿里云開源推理模型QwQ

    近日,阿里云通義團隊宣布推出全新AI推理模型QwQ-32B-Preview,并同步實現(xiàn)了開源。這一舉措標(biāo)志著阿里云在AI推理領(lǐng)域邁出了重要一
    的頭像 發(fā)表于 11-29 11:30 ?829次閱讀

    英偉推出全新NVIDIA AI Foundry服務(wù)和NVIDIA NIM推理微服務(wù)

    NVIDIA 宣布推出全新 NVIDIA AI Foundry 服務(wù)和 NVIDIA NIM 推理微服務(wù),與同樣剛推出的 Llama 3.1
    的頭像 發(fā)表于 07-25 09:48 ?866次閱讀

    英偉推出AI模型推理服務(wù)NVIDIA NIM

    英偉近日宣布推出一項革命性的AI模型推理服務(wù)——NVIDIA NIM。這項服務(wù)將極大地簡化
    的頭像 發(fā)表于 06-04 09:15 ?820次閱讀

    進一步解讀英偉 Blackwell 架構(gòu)、NVlink及GB200 超級芯片

    計算工作負(fù)載、釋放百億億次計算能力和萬億參數(shù)人工智能模型的全部潛力提供關(guān)鍵基礎(chǔ)。 NVLink釋放數(shù)萬億參數(shù)AI模型加速性能,顯著提升大型多GPU系統(tǒng)的可
    發(fā)表于 05-13 17:16

    NVIDIA加速微軟最新的Phi-3 Mini開源語言模型

    NVIDIA 宣布使用 NVIDIA TensorRT-LLM 加速微軟最新的 Phi-3 Mini 開源語言模型。TensorRT-LLM
    的頭像 發(fā)表于 04-28 10:36 ?726次閱讀
    主站蜘蛛池模板: 二十年等一人小说在线观看 | 99久久综合给久久精品 | 国产哺乳期奶水avav | 夜夜夜夜爽| 35qao强力打造免费上线高清 | 一级中文字幕乱码免费 | 人人做人人看 | 91视频毛片| 精品噜噜噜噜久久久久久久久 | 国产精品理论片在线观看 | 欧美一级色视频 | 国产在线高清精品二区色五郎 | 8888四色奇米在线观看不卡 | 亚洲第一免费播放区 | 韩国电影天堂 | 成人免费一区二区三区 | 好大好硬好爽免费视频 | 欧美日本不卡 | 日韩精品一卡二卡三卡四卡2021 | 四虎成人在线视频 | 四虎精品影院在线观看视频 | 日本黄色免费大片 | 欧美日韩色图 | 成年男人永久免费看片 | 好黄好硬好爽好刺激 | bt天堂在线最新版在线 | 免费在线观看a视频 | 欧美.成人.综合在线 | 国产亚洲高清在线精品不卡 | 日本在线不卡视频 | yy8090韩国日本三理论免费 | 五月婷婷六月丁香激情 | 大香交伊人| 国产hs免费高清在线观看 | 欧美综合国产精品日韩一 | 免费看黄色一级毛片 | 亚洲丰满熟妇毛片在线播放 | 999伊人| 免费观看黄视频 | 色清片| 天天干天天操天天射 |

    電子發(fā)燒友

    中國電子工程師最喜歡的網(wǎng)站

    • 2931785位工程師會員交流學(xué)習(xí)
    • 獲取您個性化的科技前沿技術(shù)信息
    • 參加活動獲取豐厚的禮品