在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
电子发烧友
开通电子发烧友VIP会员 尊享10大特权
海量资料免费下载
精品直播免费看
优质内容免费畅学
课程9折专享价
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

GTC23 | NVIDIA 推出用于大型語言模型和生成式 AI 工作負載的推理平臺

NVIDIA英偉達企業(yè)解決方案 ? 來源:未知 ? 2023-03-23 06:55 ? 次閱讀

谷歌云、D-ID、Cohere 將新平臺用于各種生成式 AI 服務,包括聊天機器人、文本生成圖像內(nèi)容、AI 視頻

加利福尼亞州圣克拉拉 - GTC - 太平洋時間 2023 年 3 月 21 日 – NVIDIA 于今日推出四款推理平臺。這些平臺針對各種快速興起的生成式 AI 應用進行了優(yōu)化,能夠幫助開發(fā)人員快速構建用于提供新服務和洞察的 AI 驅(qū)動的專業(yè)應用。

這些平臺將 NVIDIA 的全棧推理軟件與最新的 NVIDIA Ada、Hopper 和 Grace Hopper 處理器相結合,包括今天推出的 NVIDIA L4 Tensor Core GPU 和 NVIDIA H100 NVL GPU。各平臺針對 AI 視頻、圖像生成、大型語言模型部署、推薦系統(tǒng)推理等需求激增的工作負載進行了優(yōu)化。

NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛表示:“生成式 AI 的興起需要更加強大的推理計算平臺。生成式 AI 應用的數(shù)量是無限的,它唯一的限制就是人類的想象力。為開發(fā)人員提供最強大、靈活的推理計算平臺將加快新服務的創(chuàng)造速度,這些新服務將以前所未有的方式改善我們的生活。”

加速生成式 AI 的各種推理工作負載集

每個平臺都包含一個為特定生成式 AI 推理工作負載而優(yōu)化的 NVIDIA GPU 和專用的軟件:

  • 適用于 AI 視頻的 NVIDIA L4 可提供比 CPU 高出 120 倍的 AI 視頻性能,同時能效提高了 99%。這款適用于幾乎所有工作負載的通用 GPU 提供更加強大的視頻解碼和轉碼能力、視頻流式傳輸、增強現(xiàn)實、生成式 AI 視頻等。

  • 適用于圖像生成的 NVIDIA L40 針對圖形以及 AI 支持的 2D、視頻和 3D 圖像生成進行了優(yōu)化。L40 平臺是 NVIDIA Omniverse(一個用于在數(shù)據(jù)中心構建和運行元宇宙應用的平臺)的引擎,與上一代產(chǎn)品相比,其 Stable Diffusion 推理性能提高了 7 倍,Omniverse 性能提高了 12 倍。

  • 適用于大型語言模型部署的 NVIDIA H100 NVL 是規(guī)模化部署像 ChatGPT 這樣的大型語言模型(LLMs)的理想平臺。這款新的 H100 NVL 擁有 94GB 內(nèi)存和 Transformer 引擎加速,在數(shù)據(jù)中心規(guī)模,與上一代 A100 相比,GPT-3 上的推理性能提高了多達 12 倍。

  • 適用于推薦模型的 NVIDIA Grace Hopper 是圖形推薦模型、矢量數(shù)據(jù)庫和圖神經(jīng)網(wǎng)絡的理想平臺。通過 NVLink-C2C 以 900 GB/s 的速度連接 CPU 和 GPU,Grace Hopper 的數(shù)據(jù)傳輸和查詢速度比 PCIe 5.0 快了 7 倍。

這些平臺的軟件層采用 NVIDIA AI Enterprise 軟件套件,包括用于高性能深度學習推理的軟件開發(fā)套件 NVIDIA TensorRT,以及幫助實現(xiàn)模型部署標準化的開源推理服務軟件 NVIDIA Triton Inference Server。

早期采用者與支持

谷歌云是 NVIDIA 推理平臺的重要云合作伙伴和早期客戶。該公司正在將 L4 平臺整合到其機器學習平臺 Vertex AI 中,并且是第一家提供 L4 實例的云服務提供商,其 G2 虛擬機的私人預覽版已于今天推出。

NVIDIA 和谷歌今天分別宣布了首批在谷歌云上使用 L4 的兩家機構——Descript 和 WOMBO,前者使用生成式 AI 幫助創(chuàng)作者制作視頻和播客,后者提供 “Dream” 這一 AI 驅(qū)動的文本-數(shù)字藝術轉換應用程序。

另一個早期采用者快手提供了一個短視頻應用程序,利用 GPU 對傳入的實時流媒體視頻進行解碼、捕捉關鍵幀并優(yōu)化音視頻。然后,它使用一個基于 Transformer 的大型模型理解多模態(tài)內(nèi)容,從而提高全球數(shù)億用戶的點擊率。

快手高級副總裁于越表示:“快手推薦系統(tǒng)所服務的社區(qū)每天的用戶人數(shù)超過 3.6 億,他們每天貢獻 3000 萬條 UGC 視頻。在相同的總體擁有成本下,相較于 CPU,NVIDIA GPU 將系統(tǒng)的端到端吞吐量提高了 11 倍,將延遲降低了 20%。”

領先的生成式 AI 技術平臺 D-ID,通過使用 NVIDIA L40 GPU 從文本中生成逼真的數(shù)字人,支持任何內(nèi)容來生成人臉,不僅幫助專業(yè)人士改進視頻內(nèi)容,同時減少了大規(guī)模視頻制作的成本和麻煩。

D-ID 研發(fā)副總裁 Or Gorodissky 表示:“L40 的性能十分驚人。有了它,我們將推理速度提高了一倍。D-ID 十分高興能夠?qū)⑦@個新硬件作為我們產(chǎn)品的一部分,以前所未有的性能和分辨率實現(xiàn) AI 人的實時流傳輸,并降低我們的計算成本。”

領先的 AI 制作工作室 Seyhan Lee 使用生成式 AI 為電影、廣播和娛樂行業(yè)開發(fā)沉浸式體驗和迷人的創(chuàng)意內(nèi)容。

Seyhan Lee 聯(lián)合創(chuàng)始人 Pinar Demirdag 表示:“L40 GPU 為我們的生成式 AI 應用帶來了驚人的性能提升。憑借 L40 的推理能力和內(nèi)存容量,我們可以部署非常先進的模型,并以驚人的速度和精度向客戶提供創(chuàng)新的服務。”

語言 AI 領域的先鋒 Cohere 所運行的平臺使得開發(fā)人員能夠在保護數(shù)據(jù)隱私和安全的情況下,構建自然語言模型。

Cohere 首席執(zhí)行官 Aidan Gomez 表示:“憑借 NVIDIA 的全新高性能 H100 推理平臺,我們可以使用先進的生成式模型為客戶提供更加優(yōu)質(zhì)、高效的服務,推動對話式 AI、多語言企業(yè)搜索、信息提取等各種 NLP 應用的發(fā)展。”

供應情況

NVIDIA L4 GPU 私人預覽版現(xiàn)已通過谷歌云平臺以及 30 多家計算機制造商所組成的全球網(wǎng)絡提供。

NVIDIA L40 GPU 現(xiàn)已通過全球領先的系統(tǒng)提供商提供,并且合作伙伴平臺的數(shù)量將在今年持續(xù)增加。

Grace Hopper 超級芯片已開始樣品供貨,預計下半年將全面投產(chǎn)。H100 NVL GPU 也將于下半年面市。

NVIDIA AI Enterprise 現(xiàn)在通過各大云市場以及數(shù)十家系統(tǒng)提供商和合作伙伴提供。NVIDIA AI Enterprise 為客戶提供 NVIDIA 企業(yè)級支持、定期安全審查以及 NVIDIA Triton Inference Server、TensorRT 和 50 多個預訓練模型與框架的 API 穩(wěn)定性。

NVIDIA LaunchPad 上免費提供的動手實驗室可以試用用于生成式 AI 的 NVIDIA 推理平臺。樣品實驗室的內(nèi)容包括訓練和部署一個客服聊天機器人、部署一個端到端 AI 工作負載、在 H100 上調(diào)整和部署一個語言模型以及使用 NVIDIA Triton 部署一個欺詐檢測模型。

掃描海報二維碼,或點擊“閱讀原文”即可觀看 NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛 GTC23 主題演講重播!

ef9782d0-c903-11ed-bfe3-dac502259ad0.gif ?

百里挑一!

3 月 23 日不可錯過的演講!

GTC23 | 黃仁勛與 Ilya Sutskever 的爐邊談話重磅來襲!— 看 AI 的現(xiàn)狀和未來


原文標題:GTC23 | NVIDIA 推出用于大型語言模型和生成式 AI 工作負載的推理平臺

文章出處:【微信公眾號:NVIDIA英偉達企業(yè)解決方案】歡迎添加關注!文章轉載請注明出處。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 英偉達
    +關注

    關注

    22

    文章

    3899

    瀏覽量

    92832

原文標題:GTC23 | NVIDIA 推出用于大型語言模型和生成式 AI 工作負載的推理平臺

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業(yè)解決方案】歡迎添加關注!文章轉載請注明出處。

收藏 0人收藏

    評論

    相關推薦

    英偉達GTC2025亮點 NVIDIA推出Cosmos世界基礎模型和物理AI數(shù)據(jù)工具的重大更新

    推理模型,讓開發(fā)者以前所未有的方式控制世界生成NVIDIA推出了兩款由 NVIDIA Omniverse 和 Cosmos
    的頭像 發(fā)表于 03-20 19:01 ?724次閱讀

    英偉達GTC25亮點:NVIDIA Blackwell Ultra 開啟 AI 推理新時代

    英偉達GTC25亮點:NVIDIA Blackwell Ultra 開啟 AI 推理新時代
    的頭像 發(fā)表于 03-20 15:35 ?495次閱讀

    Oracle 與 NVIDIA 合作助力企業(yè)加速代理式 AI 推理

    ——Oracle 和 NVIDIA 今日宣布,NVIDIA 加速計算和推理軟件與 Oracle 的 AI 基礎設施以及生成
    發(fā)表于 03-19 15:24 ?265次閱讀
    Oracle 與 <b class='flag-5'>NVIDIA</b> 合作助力企業(yè)加速代理式 <b class='flag-5'>AI</b> <b class='flag-5'>推理</b>

    NVIDIA 與行業(yè)領先的存儲企業(yè)共同推出面向 AI 時代的新型企業(yè)基礎設施

    3 月 18 日 —— NVIDIA 今日推出NVIDIA AI 數(shù)據(jù)平臺 —— 一項可自定義的參考設計,領先的存儲提供商可用來構建全
    發(fā)表于 03-19 10:11 ?156次閱讀
    <b class='flag-5'>NVIDIA</b> 與行業(yè)領先的存儲企業(yè)共同<b class='flag-5'>推出</b>面向 <b class='flag-5'>AI</b> 時代的新型企業(yè)基礎設施

    NVIDIA 推出開放推理 AI 模型系列,助力開發(fā)者和企業(yè)構建代理式 AI 平臺

    、德勤、IQVIA、微軟、SAP 和 ServiceNow 與 NVIDIA 合作,率先推出推理 AI 智能體,改變工作方式 ? ? ? 美
    發(fā)表于 03-19 09:31 ?162次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>推出</b>開放<b class='flag-5'>推理</b> <b class='flag-5'>AI</b> <b class='flag-5'>模型</b>系列,助力開發(fā)者和企業(yè)構建代理式 <b class='flag-5'>AI</b> <b class='flag-5'>平臺</b>

    使用NVIDIA推理平臺提高AI推理性能

    NVIDIA推理平臺提高了 AI 推理性能,為零售、電信等行業(yè)節(jié)省了數(shù)百萬美元。
    的頭像 發(fā)表于 02-08 09:59 ?499次閱讀
    使用<b class='flag-5'>NVIDIA</b><b class='flag-5'>推理</b><b class='flag-5'>平臺</b>提高<b class='flag-5'>AI</b><b class='flag-5'>推理</b>性能

    NVIDIA推出多個生成AI模型和藍圖

    NVIDIA 宣布推出多個生成 AI 模型和藍圖,將 NV
    的頭像 發(fā)表于 01-08 10:48 ?387次閱讀

    NVIDIA Cosmos世界基礎模型平臺發(fā)布

    NVIDIA 宣布推出NVIDIA Cosmos,該平臺由先進的生成世界基礎
    的頭像 發(fā)表于 01-08 10:39 ?387次閱讀

    NVIDIA推出全新生成AI模型Fugatto

    NVIDIA 開發(fā)了一個全新的生成 AI 模型。利用輸入的文本和音頻,該模型可以創(chuàng)作出包含任意
    的頭像 發(fā)表于 11-27 11:29 ?641次閱讀

    NVIDIA助力Amdocs打造生成AI智能體

    正在使用NVIDIA DGX Cloud 與 NVIDIA AI Enterprise軟件開發(fā)和交付基于商用大語言模型(LLM)和領域適配
    的頭像 發(fā)表于 11-19 14:48 ?663次閱讀

    NVIDIA攜手Meta推出AI服務,為企業(yè)提供生成AI服務

    NVIDIA近日宣布了一項重大舉措,正式推出NVIDIA AI Foundry服務與NVIDIA NIM(
    的頭像 發(fā)表于 07-25 16:57 ?711次閱讀

    英偉達推出全新NVIDIA AI Foundry服務和NVIDIA NIM推理微服務

    NVIDIA 宣布推出全新 NVIDIA AI Foundry 服務和 NVIDIA NIM 推理
    的頭像 發(fā)表于 07-25 09:48 ?922次閱讀

    NVIDIA AI Foundry 為全球企業(yè)打造自定義 Llama 3.1 生成 AI 模型

    Foundry 提供從數(shù)據(jù)策管、合成數(shù)據(jù)生成、微調(diào)、檢索、防護到評估的全方位生成 AI 模型服務,以便部署自定義 Llama 3.1
    發(fā)表于 07-24 09:39 ?811次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>AI</b> Foundry 為全球企業(yè)打造自定義 Llama 3.1 <b class='flag-5'>生成</b><b class='flag-5'>式</b> <b class='flag-5'>AI</b> <b class='flag-5'>模型</b>

    英偉達推出AI模型推理服務NVIDIA NIM

    英偉達近日宣布推出一項革命性的AI模型推理服務——NVIDIA NIM。這項服務將極大地簡化AI
    的頭像 發(fā)表于 06-04 09:15 ?858次閱讀

    【大語言模型:原理與工程實踐】揭開大語言模型的面紗

    。這一過程的不斷迭代使大語言模型語言理解和生成能力逐步提升。大語言模型在自然
    發(fā)表于 05-04 23:55
    主站蜘蛛池模板: 久久国产综合 | 久久久久久国产精品免费 | 国产欧美日韩综合精品一区二区 | 狠狠综合 | 夜夜天天干 | 免费视频你懂得 | 夜夜骚视频 | 一级在线观看 | 视频一区视频二区在线观看 | 特级深夜a级毛片免费观看 特级生活片 | 一级特黄性生活大片免费观看 | 精品国产三级a∨在线 | 亚洲一区二区三区免费观看 | 99涩涩| 日韩一区二区三区免费 | 阿v视频在线观看免费播放 爱爱视频天天干 | 一色屋成人免费精品网站 | 六月婷婷激情 | 天天性综合| 精品午夜久久影视 | 美女被猛男躁免费视频网站 | 黄色天天影视 | 1000部啪啪未满十八勿入 | 亚洲成人精品在线 | 97综合久久 | 激情欧美一区二区三区中文字幕 | 视频一本大道香蕉久在线播放 | 97色在线播放 | 午夜国产在线 | 一区二区三区免费视频播放器 | 午夜爱爱免费视频 | 欧美天天| 国产乱辈通伦影片在线播放亚洲 | 1024你懂的国产精品 | 人人爽影院 | 国内久久精品 | 欧美作爱福利免费观看视频 | 女人张腿让男桶免费视频观看 | 六月色婷婷 | 国产免费一区二区三区 | 成人18毛片 |

    電子發(fā)燒友

    中國電子工程師最喜歡的網(wǎng)站

    • 2931785位工程師會員交流學習
    • 獲取您個性化的科技前沿技術信息
    • 參加活動獲取豐厚的禮品