在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
电子发烧友
开通电子发烧友VIP会员 尊享10大特权
海量资料免费下载
精品直播免费看
优质内容免费畅学
课程9折专享价
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

NVIDIA 在 MLPerf 測試中將推理帶到新高度

NVIDIA英偉達 ? 來源:未知 ? 2023-04-08 00:30 ? 次閱讀

在最新 MLPerf 基準測試中,NVIDIA H100 和 L4 GPU 將生成式 AI 和所有其他工作負載帶到了新的水平,Jetson AGX Orin 則在性能和效率方面都有所提升。

作為獨立的第三方基準測試,MLPerf 仍是衡量 AI 性能的權威標準。自 MLPerf 誕生以來,NVIDIA 的 AI 平臺在訓練和推理這兩個方面一直展現出領先優勢,包括最新發布的 MLPerf Inference 3.0 基準測試。

NVIDIA 創始人兼首席執行官黃仁勛表示:“三年前我們推出 A100 時,AI 世界由計算機視覺主導。如今,生成式 AI 已經到來。”

“這正是我們打造 Hopper 的原因,其通過 Transformer 引擎專為 GPT 進行了優化。最新的 MLPerf 3.0 凸顯了 Hopper 的性能比 A100 高出 4 倍。”

“下一階段的生成式 AI 需要高能效的新的 AI 基礎設施來訓練大型語言模型。客戶正在大規模采用 Hopper,以構建由數萬顆通過 NVIDIA NVLink 和 InfiniBand 連接的 Hopper GPU 組成的 AI 基礎設施。”

“業界正努力推動安全、可信的生成式 AI 取得新的進展。而 Hopper 正在推動這項重要的工作。”

最新 MLPerf 結果顯示,NVIDIA 將從云到邊緣的 AI 推理性能和效率帶到了一個新的水平。

具體而言,在 DGX H100 系統中運行的 NVIDIA H100 Tensor Core GPU 在每項 AI 推理測試(即在生產中運行神經網絡)中均展現出最高的性能。得益于軟件優化,該 GPU 在 9 月首次亮相時就實現了高達 54%的性能提升。

針對醫療領域,H100 GPU 在 3D-UNet(MLPerf 醫學影像基準測試)中的性能相比 9 月提高了 31%。

06856d9a-d561-11ed-bfe3-dac502259ad0.jpg

在 Transformer 引擎的加持下,基于 Hopper 架構的 H100 GPU 在 BERT 上的表現十分優異。BERT 是一個基于 transformer 的大型語言模型,它為如今已經得到廣泛應用的生成式 AI 奠定了基礎。

生成式 AI 使用戶可以快速創建文本、圖像、3D 模型等。從初創公司到云服務提供商,企業都在迅速采用這一能力,以實現新的業務模式和加速現有業務。

數億人現在正在使用 ChatGPT(同樣是一個 transformer 模型)等生成式 AI 工具,以期得到即時響應。

在這個 AI 的 iPhone 時刻,推理性能至關重要。深度學習的部署幾乎無處不在,這推動了從工廠車間到在線推薦系統等對推理性能的無盡需求。

L4 GPU 精彩亮相

NVIDIA L4 Tensor Core GPU 在本次 MLPerf 測試中首次亮相,其速度是上一代 T4 GPU 的 3 倍以上。這些加速器具有扁平的外形,可在幾乎所有的服務器中提供高吞吐量和低延遲。

L4 GPU 運行了所有 MLPerf 工作負載。憑借對關鍵的 FP8 格式的支持,其在對性能要求很高的 BERT 模型上取得了非常驚人的結果。

除了出色的 AI 性能外,L4 GPU 的圖像解碼速度快了 10 倍,視頻處理速度快了 3.2 倍,同時圖形和實時渲染性能提高了 4 倍以上。

這些加速器兩周前在 GTC 上發布并已通過各大系統制造商和云服務提供商提供。L4 GPU 是 NVIDIA 在 GTC 上發布的 AI 推理平臺產品組合中的最新成員。

069b91ce-d561-11ed-bfe3-dac502259ad0.jpg ?

軟件和網絡在系統測試中大放異彩

NVIDIA 的全棧式 AI 平臺在一項全新 MLPerf 測試中展現了其領先優勢。

被稱之為 Network-division 的基準測試將數據傳輸至一個遠程推理服務器。它反映了企業用戶將數據存儲在企業防火墻后面、在云上運行 AI 作業的熱門場景。

在 BERT 測試中,遠程 NVIDIA DGX A100 系統提供高達 96%的最大本地性能,其性能下降的原因之一是因為它們需要等待 CPU 完成部分任務。在單純依靠 GPU 進行處理的 ResNet-50 計算機視覺測試中,它們達到了 100%的性能。

這兩個結果在很大程度上要歸功于 NVIDIA Quantum InfiniBand 網絡、NVIDIA ConnectX SmartNIC 以及 NVIDIA GPUDirect 等軟件。

Orin 在邊緣的性能提升 3.2 倍

另外,相較于一年前的結果,NVIDIA Jetson AGX Orin 模塊化系統的能效提高了 63%,性能提高了 81%。Jetson AGX Orin 可在需要 AI 的狹小空間內以低功率進行推理,包括在由電池供電的系統上。

專為需要更小模塊、更低功耗的應用而開發的 Jetson Orin NX 16G 在本次基準測試中首次亮相便大放異彩。其性能是上一代 Jetson Xavier NX 處理器的 3.2 倍。

廣泛的 NVIDIA AI 生態

MLPerf 結果顯示,NVIDIA AI 得到了業內最廣泛的機器學習生態系統的支持。

在這一輪測試中,有十家公司在 NVIDIA 平臺上提交了結果,包括華碩、戴爾科技、技嘉、新華三、聯想、寧暢、超微和超聚變等系統制造商和微軟 Azure 云服務。

他們所提交的結果表明,無論是在云端還是在自己的數據中心運行的服務器中,用戶都可以通過 NVIDIA AI 獲得出色的性能。

NVIDIA 的眾多合作伙伴也參與了 MLPerf,因為他們知道這是一個幫助客戶評估 AI 平臺和廠商的很有價值的工具。最新一輪結果表明,他們今天所提供的性能將隨著 NVIDIA 平臺的發展而不斷提升。

用戶需要的是“多面手”

NVIDIA AI 是唯一能夠在數據中心和邊緣計算中運行所有 MLPerf 推理工作負載和場景的平臺。其全面的性能和效率讓用戶能夠成為真正的贏家。

用戶在實際應用中通常會采用許多不同類型的神經網絡,這些網絡往往需要實時提供答案。

例如,一個 AI 應用可能需要先理解用戶的語音請求,對圖像進行分類、提出建議,然后以人聲作為語音來回答用戶。每個步驟都需要用到不同類型的 AI 模型。

MLPerf 基準測試涵蓋了這些以及其他流行的 AI 工作負載,所以這些測試能夠確保 IT 決策者獲得可靠且可以靈活部署的性能。

06b4db66-d561-11ed-bfe3-dac502259ad0.jpg

用戶可以根據 MLPerf 的結果做出明智的購買決定,因為這些測試是透明的、客觀的。該基準測試得到了包括 Arm、百度、Facebook AI、谷歌、哈佛大學、英特爾、微軟、斯坦福大學和多倫多大學在內的廣泛支持。

可以使用的軟件

NVIDIA AI 平臺的軟件層 NVIDIA AI Enterprise 確保用戶能夠從他們的基礎設施投資中獲得最佳的性能以及在企業數據中心運行 AI 所需的企業級支持、安全性和可靠性。

這些測試所使用的所有軟件都可以從 MLPerf 庫中獲得,因此任何人都可以獲得這些領先的結果。

各項優化措施不斷地被整合到 NGC(NVIDIA 的 GPU 加速軟件目錄)上的容器中。本輪測試中提交的每項工作均使用了該目錄中的 NVIDIA TensorRT 優化 AI 推理性能。

掃描海報二維碼,或點擊“閱讀原文”,即可觀看 NVIDIA 創始人兼首席執行官黃仁勛 GTC23 主題演講重播!


原文標題:NVIDIA 在 MLPerf 測試中將推理帶到新高度

文章出處:【微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉載請注明出處。


聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 英偉達
    +關注

    關注

    22

    文章

    3894

    瀏覽量

    92745

原文標題:NVIDIA 在 MLPerf 測試中將推理帶到新高度

文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉載請注明出處。

收藏 0人收藏

    評論

    相關推薦

    1.9倍性能提升!英特爾至強6MLPerf基準測試中表現卓越

    與第五代至強處理器相比,英特爾至強6性能核的性能平均提高了1.9倍。 今日,MLCommons公布了最新的MLPerf推理v5.0基準測試結果,其中,英特爾??至強??6性能核處理器
    的頭像 發表于 04-07 10:58 ?92次閱讀

    陶瓷圍壩:解鎖電子封裝領域防護新高度的關鍵

    電子封裝技術作為電子產業發展的基石,其防護性能直接關乎電子設備的可靠性與穩定性。陶瓷圍壩憑借其獨特的材料特性和結構優勢,電子封裝防護領域嶄露頭角,成為解鎖防護新高度的關鍵要素。本文深入剖析陶瓷圍壩電子封裝中的作用、優勢及發展
    的頭像 發表于 03-24 17:10 ?78次閱讀

    英偉達GTC25亮點:NVIDIA Blackwell Ultra 開啟 AI 推理新時代

    英偉達GTC25亮點:NVIDIA Blackwell Ultra 開啟 AI 推理新時代
    的頭像 發表于 03-20 15:35 ?428次閱讀

    英偉達GTC25亮點:NVIDIA Dynamo開源庫加速并擴展AI推理模型

    NVIDIA Dynamo 提高了推理性能,同時降低了擴展測試時計算 (Scaling Test-Time Compute) 的成本; NVIDI
    的頭像 發表于 03-20 15:03 ?450次閱讀

    黑芝麻智能引領人形機器人技術邁向新高度

    ,基于黑芝麻智能領先的芯片及算法方案,致力于為“天問”賦予更強大的智能“大腦”與“小腦”。同時,雙方也正在圍繞人形機器人量產的芯片解決方案展開深入合作,共同引領人形機器人技術邁向新高度
    的頭像 發表于 03-12 18:00 ?480次閱讀

    海伯森技術推動機器人感知能力邁向新高度

    的“感知神經元”,公司自主研發的六維力扭矩傳感器已批量應用于20余家頭部機器人企業,為人形機器人、協作機器人及高端工業場景提供克級力控精度,推動機器人感知能力邁向新高度
    的頭像 發表于 03-10 11:07 ?356次閱讀

    使用NVIDIA推理平臺提高AI推理性能

    NVIDIA推理平臺提高了 AI 推理性能,為零售、電信等行業節省了數百萬美元。
    的頭像 發表于 02-08 09:59 ?461次閱讀
    使用<b class='flag-5'>NVIDIA</b><b class='flag-5'>推理</b>平臺提高AI<b class='flag-5'>推理</b>性能

    ?憶聯企業級測試驗證平臺介紹

    SSD產品從概念設計到市場投放的復雜過程中,產品測試驗證環節不僅是確保產品質量的堅固防線,更是推動SSD性能邁向新高度的核心驅動力。
    的頭像 發表于 01-23 18:19 ?520次閱讀

    鋰電池充放電老化柜:技術創新引領新能源產業質量檢測新高度

    設備,正以其技術創新引領新能源產業質量檢測的新高度,成為行業內的熱點話題。 技術革新,提升檢測精度與效率 鋰電池充放電老化柜是一種專門用于對鋰電池進行充放電老化測試和評估的設備。它通過模擬電池實際使用中的
    的頭像 發表于 01-16 16:53 ?235次閱讀

    解鎖光伏發電新高度:探秘 400V 轉 660V 升壓變壓器核心力量

    解鎖光伏發電新高度:探秘 400V 轉 660V 升壓變壓器核心力量 追求綠色能源變革的征程中,光伏發電已然成為耀眼的明星,而 400V 轉 660V 升壓變壓器則是隱藏在幕后、默默發力的關鍵
    的頭像 發表于 12-27 10:27 ?314次閱讀
    解鎖光伏發電<b class='flag-5'>新高度</b>:探秘 400V 轉 660V 升壓變壓器核心力量

    智能數顯,掌控壓力新高度

    行業資訊
    shchuanganqi
    發布于 :2024年11月18日 10:03:34

    浪潮信息AS13000G7榮獲MLPerf? AI存儲基準測試五項性能全球第一

    眾,3D-UNet和CosmoFlow兩個模型共計八項測試中,斬獲五項冠軍。 MLPerf? Storage v1.0 AI存儲基準測試成績 ML
    的頭像 發表于 09-28 16:46 ?319次閱讀
    浪潮信息AS13000G7榮獲<b class='flag-5'>MLPerf</b>? AI存儲基準<b class='flag-5'>測試</b>五項性能全球第一

    英偉達推出全新NVIDIA AI Foundry服務和NVIDIA NIM推理微服務

    NVIDIA 宣布推出全新 NVIDIA AI Foundry 服務和 NVIDIA NIM 推理微服務,與同樣剛推出的 Llama 3.1 系列開源模型一起,為全球企業的生成式 AI
    的頭像 發表于 07-25 09:48 ?905次閱讀

    ZR執行器:智能制造的得力干將,提升生產新高度

    ZR執行器:智能制造的得力干將,提升生產新高度 ZR執行器以其精準的控制能力和高效的執行效率,智能制造領域發揮了重要作用。傳統的執行器往往存在控制不精確、反應速度慢等問題,難以滿足現代生產對于高效
    的頭像 發表于 05-10 11:15 ?751次閱讀

    利用NVIDIA組件提升GPU推理的吞吐

    本實踐中,唯品會 AI 平臺與 NVIDIA 團隊合作,結合 NVIDIA TensorRT 和 NVIDIA Merlin HierarchicalKV(HKV)將推理的稠密網絡和熱
    的頭像 發表于 04-20 09:39 ?960次閱讀
    主站蜘蛛池模板: a网站免费| 亚洲欧美色视频 | 一区二区三区四区在线 | 9久热久re爱免费精品视频 | 性色a| 亚洲系列_1页_mmyy11 | xxxxx69日本老师hd | 久久国产免费福利永久 | 狠狠色噜噜狠狠狠狠狠色综合久久 | 一久久 | 男人j桶进女人免费视频 | 亚洲免费小视频 | 日本永久免费 | 午夜国产福利在线 | 免费任我爽橹视频在线观看 | 亚洲人毛茸茸bbxx | 色老头成人免费综合视频 | 六月丁香婷婷天天在线 | 55夜色66夜色国产精品站 | 新版天堂中文在线8官网 | aaa一级最新毛片 | 免费看男女下面日出水视频 | 免费免费啪视频视频观看 | 日韩a无吗一区二区三区 | 欧美日韩精品乱国产538 | 男人天堂久久 | av网址在线看| 日韩免费三级电影 | www.九九热 | 玖玖在线| 69自拍视频 | 亚洲激情视频网 | 一区精品视频 | 亚洲一区二区三区网站 | 久综合色 | 日本免费色网站 | 黄色午夜网站 | 久久久久久国产精品免费免费 | 欧美日本一道免费一区三区 | 国产精品毛片天天看片 | 精品乱码一区二区三区四区 |

    電子發燒友

    中國電子工程師最喜歡的網站

    • 2931785位工程師會員交流學習
    • 獲取您個性化的科技前沿技術信息
    • 參加活動獲取豐厚的禮品