企業(yè)每天都會產(chǎn)生大量互連的結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)。大數(shù)據(jù)分析是檢查這些數(shù)據(jù)以發(fā)現(xiàn)信息(例如隱藏模式、相關(guān)性、市場趨勢和客戶偏好)的通常復(fù)雜的過程,這些信息可以幫助組織做出明智的業(yè)務(wù)決策。
AMD 一直與我們的合作伙伴生態(tài)系統(tǒng)合作,為大數(shù)據(jù)分析創(chuàng)建最佳基礎(chǔ)架構(gòu)解決方案。這包括流行的 Apache? Hadoop? 框架,該框架有助于對大型數(shù)據(jù)集進(jìn)行分布式處理。我們有幾個客戶已經(jīng)在基于 AMD EPYC? 的服務(wù)器上實(shí)施了大數(shù)據(jù)分析部署,因?yàn)樗鼈兺ㄟ^行業(yè)標(biāo)準(zhǔn)基準(zhǔn)測試證明了其持續(xù)的性能、可擴(kuò)展性和總擁有成本優(yōu)勢。
TPC Express Benchmark? HS (TPCx-HS) 是一種流行的行業(yè)標(biāo)準(zhǔn),用于對基于 Hadoop 的大數(shù)據(jù)分析系統(tǒng)進(jìn)行基準(zhǔn)測試,以技術(shù)上嚴(yán)格、直接可比和供應(yīng)商中立的方式進(jìn)行性能和性價比比較。TPCx-HS 強(qiáng)調(diào)硬件和軟件堆棧,包括執(zhí)行引擎和 Hadoop 文件系統(tǒng) API 兼容層。TPCx-HS 可以評估廣泛的系統(tǒng)拓?fù)浜蛯?shí)施方法,并產(chǎn)生與大數(shù)據(jù)和分析硬件和軟件系統(tǒng)高度相關(guān)的結(jié)果。
今天,AMD EPYC(霄龍)7003 系列處理器在每個比例因子上都主導(dǎo)著性能世界紀(jì)錄,如圖 1 和AMD EPYC(霄龍)處理器世界紀(jì)錄頁面所示。圖 1 中的結(jié)果是使用 Supermicro 集群獲得的。
圖 1:第三代 AMD EPYC 處理器的性能和性價比排名
我還想展示這些結(jié)果如何與競爭對手相抗衡。圖 2 顯示基于 AMD EPYC 的系統(tǒng)在 1TB、3TB 和 100TB 時的性價比分別提高了 78%、70% 和 116%。需要注意的是,每個 AMD EPYC-基于服務(wù)器的服務(wù)器僅包含一個處理器,而其他服務(wù)器各包含兩個處理器。這證明了單插槽服務(wù)器為您提供最佳解決方案的可行性。
圖 2:CDP 私有云上的 1 倍 AMD EPYC 75F3 TPCx-HS 性能與 2 倍英特爾? 至強(qiáng)? 6262V
TPC Express Benchmark BB (TPCx-BB) 是另一個流行的基于 Hadoop 的大數(shù)據(jù)系統(tǒng)的基準(zhǔn)。該基準(zhǔn)測試通過在實(shí)體店和在線店的零售商環(huán)境中執(zhí)行 30 個經(jīng)常執(zhí)行的分析查詢來衡量硬件和軟件組件的性能。結(jié)構(gòu)化數(shù)據(jù)的查詢以 SQL 表示,半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)的查詢以機(jī)器學(xué)習(xí)算法表示。SQL 查詢可以使用 Hive 或 Spark,而機(jī)器學(xué)習(xí)算法使用機(jī)器學(xué)習(xí)庫、用戶定義的函數(shù)和過程程序。如圖 3 所示,基于 AMD EPYC 的單插槽系統(tǒng)以 3000GB 的比例因子提供了最佳結(jié)果。 [6] 由 AMD EPYC 7763處理器驅(qū)動的 Dell EMC PowerEdge 7515 服務(wù)器集群以 487.5 美元/燒烤每分鐘的價格提供了 1,533.13 次燒烤。
圖 3:TPCx-BB 基準(zhǔn)測試中的單路 AMD EPYC 7763 性能
我還想提一下用于 IoT 網(wǎng)關(guān)系統(tǒng)的 TPC Express Benchmark IoT (TPCx-IOT)。隨著越來越多的智能設(shè)備連接到互聯(lián)網(wǎng),該基準(zhǔn)在當(dāng)今的互聯(lián)世界中非常重要。TPCx-IoT 是業(yè)界第一個允許直接比較物聯(lián)網(wǎng)網(wǎng)關(guān)不同軟件和硬件解決方案的基準(zhǔn)。網(wǎng)關(guān)系統(tǒng)位于邊緣架構(gòu)和后端數(shù)據(jù)中心之間,它們在其中執(zhí)行數(shù)據(jù)聚合、實(shí)時分析和持久存儲等功能。TPCx-IoT 專門設(shè)計(jì)用于為商用系統(tǒng)提供可驗(yàn)證的性能、性價比和可用性指標(biāo),這些系統(tǒng)通常在運(yùn)行實(shí)時分析查詢時從大量設(shè)備中攝取大量數(shù)據(jù)。工作負(fù)載代表在商用硬件和軟件平臺上運(yùn)行的典型 IoT 網(wǎng)關(guān)活動。我很高興地說,基于 AMD EPYC 的系統(tǒng)提供了一流的性能和性價比,如圖 4 所示。
圖 4:基于 AMD EPYC 的系統(tǒng)在物聯(lián)網(wǎng)工作負(fù)載上提供頂級性能和性價比
這些結(jié)果表明,基于 AMD EPYC 的服務(wù)器是您的大數(shù)據(jù)分析部署的理想選擇。
審核編輯:郭婷
-
amd
+關(guān)注
關(guān)注
25文章
5485瀏覽量
134437 -
物聯(lián)網(wǎng)
+關(guān)注
關(guān)注
2912文章
44876瀏覽量
375663 -
服務(wù)器
+關(guān)注
關(guān)注
12文章
9277瀏覽量
85837
發(fā)布評論請先 登錄
相關(guān)推薦
評論