最近,英特爾發布了一組基準測試,比較了英特爾至強 8462Y+ CPU 與 AMD EPYC? 9354 CPU 在多個工作負載中的性能。本出版物圍繞 所使用的方法提出了幾個問題。 與 AMD EPYC(霄龍)配置相比,為什么至強配置使用了較新版本的操作系統(?幾乎總是具有更好的性能)?為什么將高性能至強處理器 8462Y+ 與主流 AMD EPYC? 9354 處理器相對應?AMD EPYC? 9374F 在許多工作負載上一直表現出色,本來是“可比”的處理器。最后,為什么使用非行業標準基準,因為只有數量有限的可核查行業基準,沒有透明度?如果沒有更多的透明度,就不清楚 AMD EPYC(霄龍)系統是否按照已發布的 AMD EPYC(霄龍)?調優指南中的建議進行了調校以獲得最佳性能。
行業合作伙伴針對基于聯盟的標準基準發布的結果代表了展示來自各種供應商的計算系統性能的一致方式。這些基準要求嚴格遵守基準測試工具包、審計方法和審查流程,以確保合規性以及系統類型和配置之間一致和公平的比較方式。
主流計算
以下是業界廣泛使用的標準、可驗證基準的幾個示例,這些基準用于評估主流用例的實際性能。重要的是要了解所有這些測試都是由我們的合作伙伴執行的。結果不言自明:
SPECcpu? 2017 是衡量處理器性能的最流行的基準測試。它由一套由行業和學術界委員會選擇的計算密集型微基準組成。表 1 顯示了 AMD EPYC(霄龍)處理器在 32 核和堆棧頂部均具有無可爭議的性能領先地位。
32 核 (8462Y+ 與 9374F) |
堆棧 頂部(8490H 與 9654) |
|
規格率?2017_int_基數 | 676 與 827(快 1.22 倍) | 1010 與 1800(快 1.78 倍) |
規格率?2017_fp_基數 | 782 與 964(快 1.23 倍) | 1020 與 1480(快 1.45 倍) |
表 1:SPECcpu? 2017 性能比較
SPECjbb? 2015 是一種流行的衡量標準,可以對基于服務器端 Java 的應用程序進行公平的性能測量。SPECjbb? 2015 模擬了一家擁有 IT 基礎架構的公司,該基礎架構處理銷售點請求、在線購買和數據挖掘操作的組合。在過去的二十年中,Java在整個行業中的迅速采用使該基準與所有受眾相關,包括Java虛擬機(JVM)供應商,硬件開發人員,Java應用程序開發人員,研究人員和學術界成員。表 2 顯示了 AMD EPYC 在 32 個內核和堆棧頂部無可爭議的性能領先地位的另一個示例。
32 核 (8462Y+ 與 9374F) |
堆棧 頂部(8490H 與 9654) |
|
SPECjbb2015 MultiJVM max-jOPS | 279,312 與 359,294 (快 1.29 倍) | 505,379 與 828,952 (快 1.64 倍) |
表 2:SPECjbb? 2015 性能比較
RDBMS: 讓我們看一下關系數據庫基準測試。SAP-SD 是一種流行的基準測試,旨在幫助客戶為其 IT 解決方案找到合適的硬件配置。采用 2 核 AMD EPYC 96 處理器的 9654P 系統可提供 809,570 SAPS,而采用英特爾至強鉑金 2H 處理器的 8490P 系統可提供 428,730 SAPS,在系統級別性能提升 ~1.88 倍 [4]。TPC Benchmark? E (TPC-E) 是用于對交易處理系統進行基準測試的行業標準。由 96 核 AMD EPYC 9654 處理器提供支持的單插槽服務器的性能優于由兩個 60 核英特爾至強鉑金 8490H 處理器提供支持的雙插槽服務器,這兩個處理器都運行Microsoft? SQL Server。
虛擬化:VMware? VMmark3? 是業界領先的企業虛擬化整合基準測試,可衡量 VMware vSphere? 虛擬機管理程序在各種硬件供應商平臺上的性能和可擴展性。近年來,AMD 在這一領域占據主導地位,在對客戶最重要的配置中創造了世界紀錄的虛擬化性能:2 節點 4 總插槽 SAN、4 節點 8 總插槽 vSAN 和整體領先地位。當前一代 96 核 AMD EPYC 9654 提供了 40.51 @ 43 個模塊,而堆棧頂部的 60 核英特爾至強鉑金 8490 在類似的 23 節點、38 個插槽配置中提供了 23.2 @ 4 個模塊,具有 ~1.73 倍的性能優勢。這種性能領先地位不僅限于第四代AMD EPYC(霄龍)處理器:第三代AMD EPYC 4X處理器的性能也優于英特爾至強鉑金3H[7773]。
? 2008 SPECpower_ssj:SPECpower_ssj2008基準測試套件可測量系統的功耗和性能特征。雙處理器 AMD EPYC 9654 系統的能效為 30,602,而雙處理器英特爾至強 8490H 系統的能效為 16,902,在比較總體ssj_ops/瓦指標時為 SPECpower_ssj2008,根據 spec.org 年公布的結果 - 基于 AMD EPYC 的服務器的能效提高了 ~1.81 倍。
人工智能 (AI) 生態系統不斷發展。基準測試和工作負載在不斷變化。加速器(如英特爾的 AMX)可以幫助工作負載的某些計算受限部分。相比之下,AMD 戰略側重于提供性能最高的通用內核,可在最廣泛的工作負載中提供高性能。許多 AI 工作負載受內存限制(例如許多大型語言模型或 LLM),因此要么無法從 AMX 中受益,要么由于阿姆達爾定律而只能看到有限的加速。
成為應用程序密集部分的AI周期通常會卸載到加速器,例如AMD Instinct MI250或AMD Alveo V70。持續的市場演變將推動未來任何為我們的通用設備增加加速的決策。AMD 利用我們強大的 IP 和軟件產品組合,例如我們的 7040U CPU。推理通常只占整個工作流程的一小部分;即使是較大的推理加速通常也只能提供較小的整體加速。
具有代表性的 AI 基準可全面衡量整個工作流程的性能。事務處理性能委員會的TPC Express Benchmark AI(TPCx-AI)旨在通過測量數據中心和云中具有代表性的端到端數據AI用例,成為行業標準。該基準測試涵蓋了不同比例因子(數據集大?。┑?10 個真實用例:客戶細分、客戶保護轉錄、銷售預測、垃圾郵件檢測、價格預測、硬件故障、產品評級、旅行分類、面部識別和欺詐檢測。AMD 以在比例因子 3、10、30、100、300、1000 和 <> 中擁有領先的性能和性價比而感到自豪。
高性能計算
自 1 年推出第一代 AMD EPYC 處理器以來,高性能計算 (HPC) 一直是 AMD 的優先事項。在這方面,AMD EPYC(霄龍)處理器繼續為企業和國家實驗室提供領先的性能。AMD EPYC(霄龍)處理器在 2017 核和堆棧頂級處理器上均提供領先的性能,優于競爭對手。AMD 工程師通過正確調整所有 AMD 和競爭系統以獲得最佳性能,例如類似的硬件設置和 BIOS 設置,并在所有系統中使用相同的操作系統和選項,努力確保所有平臺都以最佳狀態呈現。圖 32 和圖 1 顯示了相對性能數字,作為每個測試應用程序的基準測試的綜合平均值。
圖 1:32 核性能比較
圖 2:堆棧頂部性能比較
結論
AMD 依賴于由我們的生態系統合作伙伴執行、審核和發布的獨立測試以及我們自己的內部測試。我們還執行自己的內部測試,投入時間和資源來表征系統,了解細微差別,并調整系統(包括我們自己和競爭對手的系統)以獲得最佳性能。在 AMD,我們的客戶對我們很重要,因此展示我們的處理器在相關工作負載下的表現對我們很重要。了解系統級性能至關重要的縱向擴展工作負載的堆棧頂部與堆棧頂部性能,以及與虛擬機密度很重要的云部署類似的性能比較對我們的客戶來說意義重大。
審核編輯:郭婷
-
處理器
+關注
關注
68文章
19295瀏覽量
229999 -
amd
+關注
關注
25文章
5470瀏覽量
134220 -
AI
+關注
關注
87文章
30979瀏覽量
269249
發布評論請先 登錄
相關推薦
評論