在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

NVIDIA Blackwell平臺帶來性能躍升

NVIDIA英偉達企業解決方案 ? 來源:NVIDIA英偉達企業解決方案 ? 2024-11-19 14:24 ? 次閱讀

Blackwell 完成的每一項測試,都為各項 AI 應用樹立了訓練性能新標桿。

對于使用文本、計算機代碼、蛋白質鏈、摘要、視頻甚至 3D 圖形的生成式 AI 應用,它們需要數據中心規模的加速計算來高效地訓練其背后的大語言模型(LLM)。

在 MLPerf Training 4.1 行業基準測試中,NVIDIA Blackwell 平臺在所有參與測試的工作負載上都取得了令人贊嘆的測試結果。在 LLM 基準測試中,每塊 GPU 的性能提高了 2.2 倍,其中包括 Llama 2 70B 微調和 GPT-3 175B 預訓練。

此外,NVIDIA 提交的 NVIDIA Hopper 平臺測試結果繼續在所有基準測試上保持了規模級的記錄,包括使用 11,616 塊 Hopper GPU 進行的 GPT-3 175B 基準測試。

Blackwell 帶來性能躍升

這是 NVIDIA 首次向 MLCommons 聯盟提交 Blackwell 的訓練測試結果,其結果突顯了該架構是如何提高生成式 AI 訓練性能的。MLCommons 聯盟為業內公司創建了標準化、公正且經過嚴格的同行評審的測試。

例如,Blackwell 架構包括新的核函數,它們可以更高效地使用 Tensor Core。這些核函數執行優化的專用數學運算,例如矩陣乘,是許多深度學習算法的主要計算。

Blackwell 擁有更高的每塊 GPU 計算吞吐量以及更大、更快的高帶寬內存,使其能夠在更少的 GPU 上運行 GPT-3 175B 基準測試,同時實現出色的每塊 GPU 性能。

通過利用容量更大、帶寬更高的 HBM3e 內存,僅僅 64 塊 Blackwell GPU 就能夠運行 GPT-3 LLM 基準測試,并且不損失每塊 GPU 性能。使用 Hopper 進行相同的基準測試時則需要 256 塊 GPU。

在提交 Blackwell 的訓練測試結果之前,NVIDIA 還提交了 MLPerf Inference 4.1 推理測試結果。在該測試中,Blackwell 的 LLM 推理性能比 Hopper 高出 4 倍。測試結果顯示,通過利用 Blackwell 架構的 FP4 精度以及 NVIDIA QUASAR 量化系統,Blackwell 在滿足基準測試的精度要求的同時展現出了強大的性能。

持續優化

經過持續的軟件開發,NVIDIA 平臺在各種框架、模型和應用的訓練和推理方面獲得了性能提升和功能改進。

在本輪提交的 MLPerf 訓練測試結果中,當使用 GPT-3 175B 進行訓練時,Hopper 的每塊 GPU 訓練性能比上次提交該基準測試時提高了 1.3 倍。

NVIDIA 還提交了 GPT-3 175B 基準測試的大規模測試結果,該測試使用了 11,616 塊 Hopper GPU,這些 GPU 通過 NVIDIA NVLink 和 NVSwitch 高帶寬 GPU 間通信以及 NVIDIA Quantum-2 InfiniBand 網絡連接在一起。

自去年以來,NVIDIA Hopper GPU 在 GPT-3 175B 基準測試中的規模和性能提升了三倍多。此外,在 Llama 2 70B LoRA 微調基準測試中,NVIDIA 在使用相同數量的 Hopper GPU 的情況下將性能提高了 26%,這體現了軟件方面的持續優化。

NVIDIA 持續優化加速計算平臺的努力,使其 MLPerf 測試結果得以不斷提升——提高了容器化軟件的性能,為使用現有平臺的合作伙伴和客戶帶來更強大的算力,并讓他們從平臺投資中獲得更高的回報。

攜手合作

NVIDIA 的合作伙伴——包括華碩、Azure、思科、戴爾、富士通、Giga Computing、Lambda Labs、聯想、Oracle Cloud、云達科技和超微等系統制造商和云服務提供商——也在最新一輪 MLPerf 測試中提交了令人印象深刻的測試結果。

作為 MLCommons 的創始成員,NVIDIA 認為,行業標準的基準測試和基準測試最佳實踐對于 AI 計算而言至關重要。通過獲取經過同行評審、精簡的 AI 和 HPC 各個平臺的對比信息,企業可以跟上最新的 AI 計算創新步伐,并獲得有助于指導其重大平臺投資決策的關鍵數據。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    4986

    瀏覽量

    103056
  • gpu
    gpu
    +關注

    關注

    28

    文章

    4740

    瀏覽量

    128949
  • 計算機
    +關注

    關注

    19

    文章

    7494

    瀏覽量

    87955
  • LLM
    LLM
    +關注

    關注

    0

    文章

    288

    瀏覽量

    335

原文標題:巔峰的訓練性能:Blackwell 在 MLPerf 測試中將訓練性能帶到新高度

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業解決方案】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    臺積電計劃在美生產BLACKWELL芯片

    人工智能芯片。 BLACKWELL芯片作為NVIDIA在人工智能領域的重要產品,其性能卓越,廣受市場好評。此次臺積電與NVIDIA的會談,預示著BL
    的頭像 發表于 12-06 10:54 ?438次閱讀

    Supermicro推出直接液冷優化的NVIDIA Blackwell解決方案

    ,宣布推出高性能的SuperCluster。這一端對端AI數據中心解決方案采用NVIDIA Blackwell平臺,專為兆級參數規模的生成式AI時代所設計。全新SuperCluster
    發表于 11-25 10:39 ?345次閱讀
    Supermicro推出直接液冷優化的<b class='flag-5'>NVIDIA</b> <b class='flag-5'>Blackwell</b>解決方案

    NVIDIA向開放計算項目捐贈Blackwell平臺設計

    近日,在美國加利福尼亞州舉行的 OCP 全球峰會上,NVIDIA 宣布已把 NVIDIA Blackwell 加速計算平臺的一些基礎元素捐贈給開放計算項目(OCP),并擴大
    的頭像 發表于 11-19 15:30 ?199次閱讀

    NVIDIA未來1年的Blackwell訂單已全部售罄

    10月12日資訊顯示,Blackwell無疑已成為NVIDIA歷史上極為成功的產品典范,其市場需求量已攀升至前所未有的高峰。   憑借在全球AI算力領域的領先地位,Blackwell吸引了微軟、Meta、Oracle、Op
    的頭像 發表于 10-12 16:20 ?644次閱讀

    NVIDIA 在 Hot Chips 大會展示提升數據中心性能和能效的創新技術

    來源: NVIDIA 在此次大會期間舉行的四場演講中,NVIDIA 工程師詳細介紹了 NVIDIA Blackwell 平臺、新的液冷研究成
    的頭像 發表于 08-28 16:38 ?378次閱讀
    <b class='flag-5'>NVIDIA</b> 在 Hot Chips 大會展示提升數據中心<b class='flag-5'>性能</b>和能效的創新技術

    NVIDIA AI芯片Blackwell推遲發布引熱議,公司強調Hopper需求強勁

    據8月5日最新消息,NVIDIA新款AI芯片Blackwell因被曝存在設計缺陷而推遲發布的消息,迅速在業界引發了廣泛討論與關注。面對這一市場傳聞,NVIDIA官方迅速作出回應,強調其旗艦產品
    的頭像 發表于 08-05 15:05 ?575次閱讀

    NVIDIA CEO黃仁勛在 SIGGRAPH 2024 主題演講中或將首次亮相消費級GPU Blackwell

    ABSTRACT摘要NVIDIA首席執行官黃仁勛將在2024年Siggraph上發表主題演講,主題為“面向新計算革命的圖形”——消費級Blackwell即將到來?JAEALOT2024年6月20日
    的頭像 發表于 06-21 08:26 ?477次閱讀
    <b class='flag-5'>NVIDIA</b> CEO黃仁勛在 SIGGRAPH 2024 主題演講中或將首次亮相消費級GPU <b class='flag-5'>Blackwell</b>

    英偉達Blackwell架構,行業首選

    的半導體技術路徑圖,首度公開了即將面世的下一代芯片——Rubin平臺,旨在接替現有的Blackwell。   回顧過往,NVIDIA始終保持著每兩年發布一次全新架構的傳統,從2020年的Ampere
    的頭像 發表于 06-05 15:28 ?645次閱讀

    NVIDIA Blackwell平臺推動科學計算突破發展

    最新加速器和網絡平臺提升高級模擬、AI、量子計算、數據分析等方面的性能
    的頭像 發表于 05-15 09:45 ?381次閱讀

    進一步解讀英偉達 Blackwell 架構、NVlink及GB200 超級芯片

    人工智能模型在規模和復雜性上呈指數級增長,對先進計算能力和內存容量的需求變得至關重要。Blackwell圖形處理器架構通過在性能和效率方面實現大幅躍升,解決了這些需求。 HGX B200 訓練
    發表于 05-13 17:16

    超微電腦借助英偉達Blackwell架構,打造頂尖生成式AI系統

    超微電腦Supermicro近日宣布,其全新一代人工智能系統已正式問世,該系統基于NVIDIA的革命性Blackwell架構,展現了前所未有的人工智能性能。該系列新品包括NVIDIA
    的頭像 發表于 03-25 10:27 ?622次閱讀

    NVIDIA推出搭載GB200 Grace Blackwell超級芯片的NVIDIA DGX SuperPOD?

    NVIDIA 于太平洋時間 3 月 18 日發布新一代 AI 超級計算機 —— 搭載 NVIDIA GB200 Grace Blackwell 超級芯片的 NVIDIA DGX Sup
    的頭像 發表于 03-21 09:49 ?703次閱讀

    NVIDIA宣布推出NVIDIA Blackwell平臺以賦能計算新時代

    全新 Blackwell GPU、NVLink 和可靠性技術賦能萬億參數規模的 AI 模型
    的頭像 發表于 03-20 09:44 ?620次閱讀

    NVIDIA 推出 Blackwell 架構 DGX SuperPOD,適用于萬億參數級的生成式 AI 超級計算

    基于先進的 NVIDIA 網絡、NVIDIA 全棧 AI 軟件和存儲技術,可將集群中 Grace Blackwell 超級芯片的數量擴展至數萬個,通過 NVIDIA NVLink可將多
    發表于 03-19 10:56 ?425次閱讀
    <b class='flag-5'>NVIDIA</b> 推出 <b class='flag-5'>Blackwell</b> 架構 DGX SuperPOD,適用于萬億參數級的生成式 AI 超級計算

    基于NVIDIA DOCA 2.6實現高性能和安全的AI云設計

    網絡平臺上快速創建應用程序和服務,并啟用 NVIDIA BlueField DPU 和 NVIDIA BlueField SuperNIC 的強大功能,提供突破性的網絡、安全和存儲性能
    的頭像 發表于 02-23 10:02 ?476次閱讀
    主站蜘蛛池模板: 热之国产| 欧美黑人巨大xxxx猛交| 中文字幕123| 婷婷综合激六月情网| 狠狠色噜狠狠狠狠色综合久| 色视频免费| 男人的j桶女人的j视频| 日韩美女拍拍免费视频网站| 在线视频影院| semimi亚洲综合在线观看| 天天看影院| 18女毛片| 亚洲精品视频专区| 欧美一级在线观看| 深夜视频在线免费| 久久99热精品免费观看无卡顿| 欧美人与禽交| 免费一级片视频| 亚洲一卡二卡三卡| 爱爱免费视频网站| 六月丁香深爱六月综合激情| 三级毛片免费看| 天天操夜夜逼| 9久热久re爱免费精品视频| 久久久久久综合| а中文在线天堂| 日韩欧美一区二区三区视频| 天天插综合| 99热最新在线观看| 国产亚洲视频在线播放大全| 26uuu欧美日本| 日韩毛片免费视频| 日日拍拍| 天天精品视频在线观看资源| 午夜无遮挡怕怕怕免费视频| 久久精品国产亚洲5555| 国产亚洲精品aaa大片| 特毛片| 天天摸天天操天天干| 中文天堂在线最新版在线www| 国产精品久久久久aaaa|