盗墓笔记同人小说,欢乐颂小说txt,好看的言情小说

本文作者：

Ashraf EassaNVIDIA 加速計算部門高級產品營銷經理

Chris PorterNVIDIA HPC & AI 高級技術營銷經理

高性能計算（HPC）已經成為必不可少的科學研究工具。

無論是研發出拯救生命的新藥，還是抵御氣候變化，或是精確模擬我們的世界，這些解決方案都需要強大的處理能力，而且這一需求正在快速增長，日益超出傳統計算方法能夠應對的范疇。

因此，業界紛紛采用 NVIDIA 的 GPU 進行加速計算。結合 AI，它能帶來數百萬倍的性能加速，推動科學的進步。如今，已有 2700 個應用受益于 NVIDIA GPU 加速，而在日益增長的 300 萬開發者共同組成的社區支持下，這一數字仍在不斷攀升。

HPC 應用性能提升

為將所有 HPC 應用的速度提升數倍，我們需要在堆棧的每個層面進行不斷的創新，包括芯片、系統以及應用框架本身。

隨著架構和 NVIDIA 軟件棧整體上的不斷進步， NVIDIA 平臺的性能每年都會顯著提高。與六年前發布的 P100 相比， H100 Tensor Core GPU 的性能提高 26 倍，比摩爾定律快 3 倍以上。

NVIDIA 平臺的核心是一個功能豐富的高性能軟件堆棧。為了方便各種 HPC 應用實現 GPU 加速，該平臺加入了 NVIDIA HPC SDK。SDK 使開發者能夠使用標準語言、導語指令以及 CUDA 來編寫和移植 GPU 加速應用，為開發者帶來了無與倫比的靈活性。

NVIDIA HPC SDK 的強大之處在于其龐大且高度優化的 GPU 加速數學庫，使用戶能夠充分發揮 NVIDIA GPU 的性能潛力。為了實現最佳的多 GPU 和多節點擴展性能， NVIDIA HPC SDK 還提供強大的通信庫：

NVSHMEM 為跨多個 GPU 內存的數據創建了一個全局地址空間。

NVIDIA 集合通信庫（NCCL）優化了 GPU 之間的通信。

總之，該平臺提供最高的性能和靈活性，為龐大的、不斷增長的 GPU 加速 HPC 應用提供支持。

HPC 的性能和能效

為了展示 NVIDIA 全棧創新如何助力加速 HPC 實現最高性能，我們將一臺配備 4 顆 NVIDIA GPU 的慧與（HPE）服務器與一臺配備另一家廠商同等數量加速器模塊且配置相似的服務器進行了性能比較。

我們使用多種算例測試了廣泛使用的五個 HPC 應用。盡管在各個行業中有約 2700 個應用基于 NVIDIA 平臺實現了加速，但由于另一家廠商的加速器只支持部分軟件和應用版本，我們在此次比較中所能使用的應用有限。

對于除 NAMD （用于分子動力學模擬的軟件）以外的所有應用，我們首先獲得多個算例的結果，然后使用它們的幾何平均值作為計算結果，這樣可以將異常值的影響最小化并反映客戶的體驗。

我們還在多 GPU 和單 GPU 場景下測試了這些應用。

在多 GPU 場景中，測試系統中的所有加速器都被用來運行一個模擬，基于 A100 Tensor Core GPU 的服務器所提供的性能比起另一臺服務器高出 2.1 倍。

得益于計算性能的持續進步，分子動力學領域正朝著模擬更大的原子體系和更長的時間的方向發展。這使研究者能夠模擬越來越多的生物化學機制，例如光合電子傳遞和視覺信號轉導。對于此類過程，由于模擬這一主要驗證方式耗時過長，之前無法通過模擬來對其進行驗證，導致這類過程也一直引發科學界的爭論。

但我們認識到，并非所有用戶都會在每次模擬時使用多個 GPU 運行。為了獲得最佳吞吐量，最好的方法往往是為每次模擬分配一個 GPU。

當在單一加速器模塊（ NVIDIA A100 上一個的完整 GPU 和另一款產品上的兩個計算芯片）上運行這些應用時，基于 NVIDIA A100 的系統提供了高達 1.9 倍的性能。

電力成本占據了數據中心和超級計算中心總擁有成本（TCO）中的很大一部分，這突出了高能效計算平臺的重要性。根據我們的測試， NVIDIA 平臺的每瓦吞吐量比其他產品高 2.8 倍。

多年來，我們為了最大限度地提高應用性能和效率而堅持不懈地進行軟硬件協同優化，最終打造出具有卓越性能和能效的 NVIDIA A100 GPU。欲進一步了解 NVIDIA Ampere 架構，請參見 NVIDIA A100 Tensor Core GPU 白皮書。

A100 在操作系統中也表現為一個單一的處理器，只需要啟動一個 MPI 線程就可以充分發揮它的性能。而且由于一個節點中所有 GPU 之間都采用 600-GB/s NVLink 互聯，因此 A100 可以提供出色的擴展性能。

AI 與 HPC 的融合

正如加速計算將模擬和仿真應用的速度提高了數倍， AI 和 HPC 的結合也將進一步提升性能，推動下一波科學研究的發展。

從我們首次提交 MLPerf 訓練結果到最近一次提交，已有三年的時間。在這三年里， NVIDIA 平臺在這套由同行評審的行業標準基準測試中將深度學習性能提高了 20 倍。這些成果來自于芯片、軟件和規模上的全面提高。

科學家和研究者已在使用 AI 大幅提升性能，加快科學研究的速度。

使識別引力波所需的時間減少為原來 10 萬分之一。

對呼吸道飛沫中的 Delta SARS-CoV-2 病毒（原子數超過 10 億）進行模擬的速度提高 1000 倍。

加速清潔聚變能源的發展。

為余熱鍋爐（HRSG）工廠創建預測性數字孿生。

世界各地的超級計算中心都在持續使用加速 AI 超級計算機。

阿貢領導力計算設施（ALCF）的 Polaris 超級計算機、美國國家能源研究科學計算中心（NERSC）的 Perlmutter、意大利多所大學組建的 CINECA 聯盟建設的 Leonardo，均采用 A100 Tensor Core GPU 加速。

即將在 2023 年上線的 Alps 超級計算機基于 NVIDIA 的 Grace Hopper 超級芯片打造而成。

計劃于 2023 年交付的洛斯阿拉莫斯國家實驗室的 Venado 系統，將包含 Grace Hopper 超級芯片以及 Grace CPU 超級芯片節點。

原文標題：NVIDIA 通過全棧創新推動高性能計算的發展

文章出處：【微信公眾號：NVIDIA英偉達企業解決方案】歡迎添加關注！文章轉載請注明出處。

審核編輯：湯梓紅

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

NVIDIA

NVIDIA

+關注

關注
14

文章
5039

瀏覽量
103316
HPC

HPC

+關注

關注
0

文章
318

瀏覽量
23814
高性能計算

高性能計算

+關注

關注
0

文章
83

瀏覽量
13404

原文標題：NVIDIA 通過全棧創新推動高性能計算的發展

文章出處：【微信號：NVIDIA-Enterprise，微信公眾號：NVIDIA英偉達企業解決方案】歡迎添加關注！文章轉載請注明出處。

借助NVIDIA GPU提升魯班系統CAE軟件計算效率

本案例中魯班系統高性能 CAE 軟件利用 NVIDIA 高性能 GPU，實現復雜產品的快速仿真，加速產品開發和設計迭代，縮短開發周期，

發表于 12-27 16:24 ?174次閱讀

《CST Studio Suite 2024 GPU加速計算指南》

問題，但會降低舊GPU硬件性能，可通過NVIDIA控制面板或命令行工具nvidia - smi管理。 - TCC模式（Windows only）：某些

發表于 12-16 14:25

《算力芯片高性能 CPUGPUNPU 微架構分析》第3篇閱讀心得：GPU革命：從圖形引擎到AI加速器的蛻變

對卷積核優化的思考。 GPU的存儲體系采用了獨特的倒金字塔結構，在我看來這是其計算性能的關鍵。大容量寄存器設計破解了傳統馮諾依曼架構的內存瓶頸，合并訪存機制巧妙解決了內存帶寬限制。NVIDIA

發表于 11-24 17:12

AMD與NVIDIA GPU優缺點

在圖形處理單元（GPU）市場，AMD和NVIDIA是兩大主要的競爭者，它們各自推出的產品在性能、功耗、價格等方面都有著不同的特點和優勢。一、性能

發表于 10-27 11:15 ?839次閱讀

NVIDIA CorrDiff生成式AI模型能夠精準預測臺風

在 NVIDIA GPU 上運行的一個擴散模型向天氣預報工作者展示了加速計算如何實現新的用途并提升能效。

發表于 09-13 17:13 ?727次閱讀

利用NVIDIA RAPIDS加速DolphinDB Shark平臺提升計算性能

DolphinDB 是一家高性能數據庫研發企業，也是 NVIDIA 初創加速計劃成員，其開發的產品基于高性能分布式時序數據庫，是支持復雜計算和流數據分析的實時計算平臺，適用于金融、電力

發表于 09-09 09:57 ?490次閱讀

帶你了解什么是高性能計算（HPC）

受益于HPC更高的速度處理大量數據的能力，全球正在進入HPC大周期，高性能計算的發展水平已經成為衡量一個國家綜合實力和高科技發展水平的重要標志，美國、歐盟、日本、英國都高度重視高性能計

發表于 07-20 08:28 ?627次閱讀

NVIDIA突破美國禁令,將在中東部署其高性能AI/HPC GPU加速卡

Ooredoo達成合作協議，將在中東地區部署其高性能AI/HPC GPU加速卡。這一舉動不僅標志著NVIDIA在中東市場的戰略布局取得了重大

發表于 06-24 14:47 ?871次閱讀

助力科學發展，NVIDIA AI加速HPC研究

科學家和研究人員正在利用 NVIDIA 技術將生成式 AI 應用于代碼生成、天氣預報、遺傳學和材料科學領域的 HPC 工作。

發表于 05-14 09:17 ?430次閱讀

進一步解讀英偉達 Blackwell 架構、NVlink及GB200 超級芯片

1.8TB的GPU到GPU互連速度、InfiniBand網絡和NVIDIA Magnum IO?軟件的第五代NVLink技術，GB200 NVL72性能顯著

發表于 05-13 17:16

NVIDIA加速微軟最新的Phi-3 Mini開源語言模型

NVIDIA 宣布使用 NVIDIA TensorRT-LLM 加速微軟最新的 Phi-3 Mini 開源語言模型。TensorRT-LLM 是一個開源庫，用于優化從 PC 到云端的 NVID

發表于 04-28 10:36 ?594次閱讀

利用NVIDIA組件提升GPU推理的吞吐

本實踐中，唯品會 AI 平臺與 NVIDIA 團隊合作，結合 NVIDIA TensorRT 和 NVIDIA Merlin HierarchicalKV（HKV）將推理的稠密網絡和熱 Embedding 全置于

發表于 04-20 09:39 ?773次閱讀

搭載英偉達GPU，全球領先的向量數據庫公司Zilliz發布Milvus2.4向量數據庫

基于GPU的向量索引和搜索加速能力，性能可提升 50 倍。 Milvus 2.4 的 GPU 加速

發表于 04-01 14:33 ?503次閱讀

英偉達發布超強AI加速卡，性能大幅提升，可支持1.8萬億參數模的訓練

得益于NVIDIA每兩年進行一次GPU架構升級以提高性能的策略，全新的基于Blackwell的加速卡比之前的H100更為強大，尤其適用于AI相關任務。

發表于 03-19 12:04 ?842次閱讀

利用NVIDIA產品技術組合提升用戶體驗

本案例通過利用NVIDIA TensorRT-LLM加速指令識別深度學習模型，并借助NVIDIA Triton推理服務器在NVIDIA V100 G

發表于 01-17 09:30 ?722次閱讀

在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

搜索歷史

采用NVIDIA GPU加速HPC應用性能提升

評論

借助NVIDIA GPU提升魯班系統CAE軟件計算效率

《CST Studio Suite 2024 GPU加速計算指南》

《算力芯片高性能 CPUGPUNPU 微架構分析》第3篇閱讀心得：GPU革命：從圖形引擎到AI加速器的蛻變

AMD與NVIDIA GPU優缺點

NVIDIA CorrDiff生成式AI模型能夠精準預測臺風

利用NVIDIA RAPIDS加速DolphinDB Shark平臺提升計算性能

帶你了解什么是高性能計算（HPC）

NVIDIA突破美國禁令,將在中東部署其高性能AI/HPC GPU加速卡

助力科學發展，NVIDIA AI加速HPC研究

進一步解讀英偉達 Blackwell 架構、NVlink及GB200 超級芯片

NVIDIA加速微軟最新的Phi-3 Mini開源語言模型

利用NVIDIA組件提升GPU推理的吞吐

搭載英偉達GPU，全球領先的向量數據庫公司Zilliz發布Milvus2.4向量數據庫

英偉達發布超強AI加速卡，性能大幅提升，可支持1.8萬億參數模的訓練

利用NVIDIA產品技術組合提升用戶體驗