手机推荐排行榜,怎样写网络小说,小说阅读网站

高性能計算（HPC）已成為科學發現的基本工具。

無論是發現新的拯救生命的藥物，對抗氣候變化，還是創建精確的世界模擬，這些解決方案都需要巨大且快速增長的處理能力。它們越來越超出傳統計算方法的范圍。

這就是為什么業界接受 NVIDIA GPU 加速計算的原因。與人工智能相結合，它為科學進步帶來了性能上百萬倍的飛躍。如今，2700個應用程序可以從 NVIDIA GPU 的加速中受益，而且這個數字在不斷增長的300萬開發者社區的支持下繼續上升。

HPC 應用程序性能改進

要在整個 HPC 應用程序范圍內實現數倍的加速，需要在堆棧的各個級別進行不懈的創新。這從芯片和系統開始，一直到應用程序框架本身。

NVIDIA 平臺每年都在繼續提供顯著的性能改進，在體系結構和整個 NVIDIA 軟件堆棧方面都取得了不懈的進步。與六年前發布的 P100 相比， H100 Tensor Core GPU 預計性能將提高 26 倍，比摩爾定律快 3 倍多。

圖 1 NVIDIA HPC + AI 平臺性能從 P100 到 H100

圖 2 NVIDIA HPC SDK 為每個功能提供了開發人員資產。

NVIDIA 平臺的核心是功能豐富且高性能的軟件堆棧。為了促進 GPU 在最廣泛的 HPC 應用中的加速，該平臺包括 NVIDIA HPC SDK 。 SDK 提供了無與倫比的開發人員靈活性，支持使用標準語言、指令和 CUDA 創建和移植 GPU 加速的應用程序。

NVIDIA HPC SDK 的強大功能在于一整套高度優化的 GPU 加速數學庫，使您能夠充分發揮 NVIDIA GPU 的性能潛力。為了獲得最佳的多 GPU 和多節點性能， NVIDIA HPC SDK 還提供了功能強大的通信庫：

NVSHMEM 為跨越多個 GPU 內存的數據創建全局地址空間。

NVIDIA 集體通信庫（ NCCL ）優化了 GPU 之間的通信。

總之，該平臺提供了最高的性能和靈活性，以支持不斷增長的 GPU 加速 HPC 應用程序。

HPC 性能和能效

為了展示 NVIDIA 全棧創新如何轉化為 accelerated HPC 的最高性能，我們比較了 HPE 服務器與四個 NVIDIA GPU 服務器的性能，以及基于其他供應商同等數量加速器模塊的類似配置服務器的性能。

我們使用各種數據集測試了一組五個廣泛使用的 HPC 應用程序。雖然 NVIDIA 平臺可以加速 2700 個跨行業的應用程序，但我們在比較中可以使用的應用程序受到其他供應商加速器可用軟件和應用程序版本選擇的限制。

對于除分子動力學模擬軟件 NAMD 以外的所有工作負載，我們的結果是使用多個數據集的結果幾何平均值計算的，以最小化異常值的影響，并代表客戶體驗。

我們還在多 GPU 和單 GPU 場景中測試了這些應用程序。

在多 GPU 場景中，測試系統中的所有加速器都用于運行單個模擬，基于 A100 Tensor Core GPU 的服務器提供的性能比備選方案高出 2.1 倍。

圖 3 NVIDIA A100 four- GPU 性能比較

在計算性能不斷進步的推動下，分子動力學領域正朝著在更長的模擬時間內模擬更大的原子系統的方向發展。這些進展使研究人員能夠模擬越來越多的生化機制，如光合電子傳遞和視覺信號轉導。這些和其他過程長期以來一直是科學辯論的主題，因為它們已經超出了模擬的范圍，模擬是驗證的主要工具。這是由于完成模擬所需的時間過長。

然而，我們認識到，并非所有這些應用程序的用戶在每次模擬時都使用多個 GPU 來運行它們。為了獲得最佳吞吐量，最佳執行方法通常是為每個模擬分配一個 GPU 。

當在 NVIDIA A100上的單個加速器模塊上運行這些相同的應用程序時，基于 NVIDIA A100的系統的性能提高了1.9倍。

圖 4 NVIDIA A100 單 – GPU 性能比較

能源成本占數據中心和超級計算中心總體擁有成本（ TCO ）的很大一部分，這突出了節能計算平臺的重要性。我們的測試表明， NVIDIA 平臺提供的每瓦吞吐量比其他產品高出 2.8 倍。

圖 5 NVIDIA A100 能效比較

顯示 A100 與 MI250 的效率比– NVIDIA 的效率越高越好。對每個應用程序的多個數據集（不同）進行 Geomean 。效率是指 GPU 使用 NVIDIA SMI 和 ROCm 中的等效功能測量的性能/功耗（瓦特）|

AMD MI250 在千兆字節 M262-HD5-00 上測量，具有（ 2 ）個 AMD EPYC 7763 和 4 個 AMD Instinct ? MI250 OAM （ 128 GB HBM2e ） 500W GPU 帶 AMD Infinity 結構? 技術 NVIDIA 在 ProLiant XL645d Gen10 Plus 上運行，使用雙 EPYC 7713 CPU 和 4x A100 （ 80 GB ） SXM4

LAMMPS develop \ u db00b49 （ AMD ） develop \ u 2a35ec2 （ NVIDIA ）數據集 ReaxFF / c 、 Tersoff 、 Leonard Jones 、 SNAP | NAMD 3.0alpha9 數據集 STMV \ u NVE | OpenMM 7.7.0 數據集的集成運行： amber20 STMV 、 amber20 Cellular 、 apoa1pme 、 pme |

GROMACS 2021.1 （ AMD ） 2022 （ NVIDIA ）數據集 ADH-Dodec （氫鍵）， STMV （氫鍵）|琥珀色 20 。 xx \ U rocm \ U mr \ U 202108 （ AMD ）和 20.12-AT \ U 21.12 （ NVIDIA ）數據集 Cellular \ u NVE 、 STMV \ u NVE | 1x MI250 有 2x GCD

NVIDIA A100 GPU 卓越的性能和電源效率是多年不懈的軟硬件協同優化的結果，以最大限度地提高應用程序性能和效率。

A100 還以單處理器的形式出現在操作系統中，只需要啟動一個 MPI 列即可充分利用其性能。而且，由于節點中所有 GPU 之間的 600 GB / s NVLink 連接， A100 在規模上提供了優異的性能。

AI 和 HPC 融合

正如加速計算為建模和仿真應用帶來了數倍的加速一樣， AI 和 HPC 的結合將帶來性能的下一步功能提升，開啟下一波科學發現。

關于作者

Ashraf Eassa 是NVIDIA 加速計算集團內部的高級產品營銷經理。

Chris 是 NVIDIA HPC 和 AI 的高級技術營銷經理。此前，他在 IBM 擔任聚合 HPC 和 AI 的產品經理，將 HPC 、 AI 和優化產品推向市場，專注于電子設計、航空航天和汽車行業。 Chris 擁有航空工程碩士學位，專注于設計優化。

審核編輯：郭婷

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

電源

電源

+關注

關注
184

文章
17779

瀏覽量
250843
處理器

處理器

+關注

關注
68

文章
19349

瀏覽量
230312
NVIDIA

NVIDIA

+關注

關注
14

文章
5025

瀏覽量
103270

曙光云開啟全棧智能時代

近日，“全棧可信云中生智”曙光云戰略發布會召開。曙光云從首創“城市云”進化到實現“全棧智能云”，打造“云智、云安、云算、云數”四位一體能力體系，深度賦能千行百業數智化轉型升級。

發表于 12-19 15:11 ?279次閱讀

深度解析研華全棧式AI產品布局

在人工智能邁向邊緣智能化的浪潮中，研華科技通過“Edge AI+生態協同”戰略推動AIoT 2.0時代的產業落地。本文專訪研華科技產品總監邱柏儒，深度解析研華全棧式AI產品布局、差異化

發表于 12-05 09:51 ?294次閱讀

AI高性能計算平臺是什么

AI高性能計算平臺不僅是AI技術發展的基石，更是推動AI應用落地、加速產業升級的重要工具。以下，是對AI高性能計算平臺的介紹，由AI部落小編

發表于 11-11 09:56 ?228次閱讀

HPC云計算前景

高性能計算（HPC）與云計算的結合，正逐步成為推動科技創新和產業升級的重要引擎。隨著數據規模的不斷擴大和

發表于 10-16 10:17 ?248次閱讀

如何理解云計算？

的問題。 **提供高性能的計算資源：**云服務提供商通常會部署大規模的服務器集群，用戶可以通過云平臺來使用這些服務器提供的高性能計算能力，從

發表于 08-16 17:02

IaaS+on+DPU(IoD)+下一代高性能算力底座技術白皮書

AWS 與阿里云在 DPU 的應用方面也有成功案例，借助其軟硬件全棧自研的優勢，快速完成了云計算系統的改造工作，實現了 DPU 大規模落地部署，在降低自身運營成本的同時為客戶提供更好的使用體驗，并產生

發表于 07-24 15:32

帶你了解什么是高性能計算（HPC）

受益于HPC更高的速度處理大量數據的能力，全球正在進入HPC大周期，高性能計算的發展水平已經成為衡量一個國家綜合實力和高科技發展水平的重要標志，美國、歐盟、日本、英國都高度重視高性能計算

發表于 07-20 08:28 ?621次閱讀

得瑞領新參編《高性能計算助推分布式存儲發展白皮書》正式發布，助力推動產業生態發展

近日，得瑞領新參編的《高性能計算助推分布式存儲發展白皮書》正式發布，展示了其在企業級存儲解決方案方面的領先優勢，也標志著得瑞在推動技術創新和產業發展方面邁出了重要一步。

發表于 06-27 10:33 ?342次閱讀

讓全棧AI的旗幟獵獵作響：“逆行者”華為云

全棧AI創新，雖艱難卻必要

發表于 06-23 09:47 ?2.8w次閱讀

寧暢推出“全棧全液”AI基礎設施方案

近日，寧暢科技正式發布其“全棧全液”AI基礎設施方案，這一創新舉措旨在全面支持大模型落地所需的各項技術需求。該方案集成了計算、存儲、網絡、建

發表于 05-31 09:18 ?633次閱讀

高性能計算集群的能耗優化

高性能計算（HighPerformanceComputing，HPC）是指利用大規模并行計算機集群來解決復雜的科學和工程問題的技術。高性能計算

發表于 05-25 08:27 ?454次閱讀

構建高性能計算芯片

計算的異構多核架構，對整個芯片行業的高性能 CPU 開發產生了影響。這些芯片都不太可能進行商業銷售。它們針對特定的數據類型和工作負載進行了優化，設計預算龐大，但可以通過提高性能和降低

發表于 04-25 10:23 ?1340次閱讀

北京大學高性能計算綜合能力競賽圓滿結束

22名。第一屆北京大學高性能計算綜合能力競賽面向全國高校在校同學，致力于激發同學們的創新意識，培養運用高性能計算技術解決復雜問題的能力，以全

發表于 04-14 08:34 ?838次閱讀

什么是HPC高性能計算

高性能計算（HighPerformanceComputing，簡稱HPC），是指利用集群、網格、超算等計算機技術，通過合理地組織計算機資源以

發表于 02-19 13:27 ?884次閱讀

湯谷智能發布全棧RISC-V硬件仿真加速系統方案

面向高性能計算、IoT、無線接入、音頻、多媒體、消費類電子、邊緣計算等迅速擴展的RISC-V使用場景，湯谷智能發布了基于自研Logic Giant原型驗證硬件平臺的全

發表于 01-25 10:29 ?1357次閱讀