電子發(fā)燒友網(wǎng)報(bào)道(文/周凱揚(yáng))相信對(duì)超算市場(chǎng)有過一定了解的朋友,都對(duì)曾經(jīng)的第一名富岳超算不陌生。這臺(tái)2021年正式啟用的超算,是全球首臺(tái)登頂TOP500的Arm架構(gòu)超算。富岳采用了富士通設(shè)計(jì)A64FX SoC,整個(gè)超算集群的峰值性能可以達(dá)到537.21PFlop/s。如此強(qiáng)大的性能,甚至于日本東京工業(yè)大學(xué)、日本東北大學(xué)等都宣布將借助富岳來開發(fā)日語生成式AI。
然而在最新的TOP500排行榜上,隨著更新的英特爾Xeon和AMD EPYC處理器紛紛到位,如今的富岳已經(jīng)降至第四名的位置。為此,富士通也在開發(fā)A64FX的繼任者,并計(jì)劃用于下一代超算的開發(fā)中去。
Monaka,A64FX的繼任者
作為一直在超算領(lǐng)域發(fā)力的頭部廠商之一,富士通此前一直選擇SPARC作為其計(jì)算處理器的架構(gòu),直到A64FX的出現(xiàn)。A64FX面世之時(shí)一度被稱為最強(qiáng)Arm處理器,也讓不少人對(duì)Arm在數(shù)據(jù)中心和HPC的前景有了新的改觀。
然而這種眾核處理器,除非經(jīng)過特殊的架構(gòu)優(yōu)化,否則并不適合用于通用服務(wù)器,國產(chǎn)的申威26010服務(wù)器也是類似的設(shè)計(jì)思路。但不可否認(rèn)在HPC應(yīng)用下,眾核處理器可以發(fā)揮出媲美甚至超越傳統(tǒng)x86旗艦處理器的實(shí)力。
近日,富士通宣布了他們?cè)谘械南乱淮姾薃rm處理器Monaka,該處理器除了改用Armv9架構(gòu),引入了SVE2之外,還采用了云原生的3D眾核設(shè)計(jì),專為數(shù)據(jù)中心做了能效優(yōu)化。Monaka采用了3D Chiplet的設(shè)計(jì)方案,其中處理器核心die基于2nm工藝打造,而SRAM和IO die基于5nm工藝打造,通過TSV與核心die相連。
然而在最新的TOP500排行榜上,隨著更新的英特爾Xeon和AMD EPYC處理器紛紛到位,如今的富岳已經(jīng)降至第四名的位置。為此,富士通也在開發(fā)A64FX的繼任者,并計(jì)劃用于下一代超算的開發(fā)中去。
Monaka,A64FX的繼任者
作為一直在超算領(lǐng)域發(fā)力的頭部廠商之一,富士通此前一直選擇SPARC作為其計(jì)算處理器的架構(gòu),直到A64FX的出現(xiàn)。A64FX面世之時(shí)一度被稱為最強(qiáng)Arm處理器,也讓不少人對(duì)Arm在數(shù)據(jù)中心和HPC的前景有了新的改觀。
然而這種眾核處理器,除非經(jīng)過特殊的架構(gòu)優(yōu)化,否則并不適合用于通用服務(wù)器,國產(chǎn)的申威26010服務(wù)器也是類似的設(shè)計(jì)思路。但不可否認(rèn)在HPC應(yīng)用下,眾核處理器可以發(fā)揮出媲美甚至超越傳統(tǒng)x86旗艦處理器的實(shí)力。
近日,富士通宣布了他們?cè)谘械南乱淮姾薃rm處理器Monaka,該處理器除了改用Armv9架構(gòu),引入了SVE2之外,還采用了云原生的3D眾核設(shè)計(jì),專為數(shù)據(jù)中心做了能效優(yōu)化。Monaka采用了3D Chiplet的設(shè)計(jì)方案,其中處理器核心die基于2nm工藝打造,而SRAM和IO die基于5nm工藝打造,通過TSV與核心die相連。
Monaka 3D眾核架構(gòu) / 富士通
據(jù)富士通透露,2nm的核心die區(qū)域僅僅占了整個(gè)芯片面積的不到30%,從而帶來極高的能效表現(xiàn),只需用到風(fēng)冷。同時(shí)3D眾核架構(gòu)使其可以塞入雙插槽144個(gè)核心,實(shí)現(xiàn)極低的延遲和更高的帶寬。
至于在軟件支持上,富士通除了持續(xù)開發(fā)Linux OS中行業(yè)標(biāo)準(zhǔn)軟件的支持外,也會(huì)參與發(fā)展與Arm相關(guān)的開源軟件生態(tài),加強(qiáng)在Python、Java、LLVM等標(biāo)準(zhǔn)工具上的性能表現(xiàn)。Monaka預(yù)計(jì)將于2027年正式亮相,考慮到其流片時(shí)間,富士通既有可能選擇臺(tái)積電、英特爾等現(xiàn)有的先進(jìn)晶圓代工廠,也可能考慮正在建設(shè)2nm工廠的Rapidus。
HPC轉(zhuǎn)向AI主導(dǎo)?
作為目前最有利可圖的市場(chǎng),AI正在驅(qū)動(dòng)GPGPU聚焦在低精度計(jì)算的算力升級(jí)上。在CUDA平臺(tái)的助力下,HPC生態(tài)的門檻也在持續(xù)降低。從這幾年發(fā)布的新品來看,無論是FP16、FP8的算力都在成倍增長(zhǎng),然而在FP64這種傳統(tǒng)HPC應(yīng)用需要用到的高精度數(shù)據(jù)格式上,性能提升卻相當(dāng)有限。
更重要的是,要想通過堆量來提高HPC集群的FP64性能也不再現(xiàn)實(shí)了,因?yàn)镚PU的TDP提升幅度甚至更高。為此,富士通的看法是,將更多的FP64單元放在CPU端,而將更多的HBM和低精度矩陣單元放在GPU端,這樣構(gòu)建HPC系統(tǒng)的客戶就不再需要為GPU的巨額成本和巨量功耗買單,卻可以利用其在深度學(xué)習(xí)上的卓越性能。同時(shí),開發(fā)更多HPL-MxP應(yīng)用,利用混合精度計(jì)算來提高效率。當(dāng)然了,也可以施壓GPU廠商進(jìn)一步改善其FP64性能,只不過在生成式AI依舊火熱的當(dāng)下,讓GPU廠商放棄這個(gè)搖錢樹并不現(xiàn)實(shí)。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。
舉報(bào)投訴
-
ARM
+關(guān)注
關(guān)注
134文章
9097瀏覽量
367560 -
超算
+關(guān)注
關(guān)注
1文章
115瀏覽量
9077 -
富士通
+關(guān)注
關(guān)注
2文章
195瀏覽量
54575
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
《富士通綜合報(bào)告(Fujitsu Integrated Report 2024)》帶你全面了解富士通
利益相關(guān)者分享富士通的現(xiàn)狀和未來愿景。 我們的企業(yè)目標(biāo)是什么?我們?nèi)绾涡袆?dòng)?我們希望實(shí)現(xiàn)怎樣的未來?我們從《富士通綜合報(bào)告》中摘錄了一些重點(diǎn)信息,希望能幫助您更全面、更立體地了解富士通
MicroBlaze V軟核處理器的功能特性
本指南提供了有關(guān) AMD Vivado Design Suite 中包含的 32 位和 64 位 MicroBlaze V 軟核處理器的信息。該文檔旨在用作為處理器硬件架構(gòu)的指南,隨附《RISC-V 指令集手冊(cè)》
ARM處理器的尋址方式
ARM處理器的尋址方式是處理器在執(zhí)行指令時(shí),根據(jù)指令中給出的地址信息來尋找物理地址的方法。ARM處理器支持多種尋址方式,以滿足不同的編程需求
ARM處理器和CPU有什么區(qū)別
ARM處理器和CPU(中央處理器)之間的關(guān)系及區(qū)別,可以從多個(gè)維度進(jìn)行深入探討。首先,需要明確的是,ARM處理器并非
ARM處理器的寄存器組織及功能
ARM處理器的寄存器組織是其核心架構(gòu)的重要組成部分,對(duì)于理解ARM處理器的運(yùn)行機(jī)制和性能特點(diǎn)具有重要意義。以下是對(duì)
ARM處理器和CISC處理器的區(qū)別
ARM處理器和CISC(復(fù)雜指令集計(jì)算機(jī))處理器在多個(gè)方面存在顯著的區(qū)別。這些區(qū)別主要體現(xiàn)在架構(gòu)原理、性能與功耗、設(shè)計(jì)目標(biāo)、應(yīng)用領(lǐng)域以及市場(chǎng)生態(tài)等方面。
ARM處理器的結(jié)構(gòu)和特點(diǎn)
ARM處理器,全稱Advanced RISC Machines,是一種基于精簡(jiǎn)指令集(RISC)架構(gòu)的微處理器。其結(jié)構(gòu)和特點(diǎn)在嵌入式系統(tǒng)、移動(dòng)設(shè)備、物聯(lián)網(wǎng)等多個(gè)領(lǐng)域具有顯著優(yōu)勢(shì)。以下將
ARM處理器概述和發(fā)展歷程
ARM處理器是一種基于RISC(精簡(jiǎn)指令集計(jì)算機(jī))架構(gòu)的高性能微處理器,由英國公司ARM(Advanced RISC Machines)開發(fā)
富士通發(fā)布2024財(cái)年第一季度財(cái)報(bào)
富士通于昨日發(fā)布了2024財(cái)年第一季度財(cái)報(bào)。根據(jù)財(cái)報(bào)顯示,2024財(cái)年第一季度整體營收為8,300億日元,較上一年度同期增長(zhǎng)3.8%。
實(shí)測(cè)分享,瑞芯微RK3588八核國產(chǎn)處理器性能測(cè)評(píng)!確實(shí)“遙遙領(lǐng)先”!
ARM Cortex-A76@2.4GHz + 四核ARM Cortex-A55@1.8GHz大小核架構(gòu),有國產(chǎn)“至強(qiáng)嵌入式處理器”之稱,可
發(fā)表于 07-17 10:49
采用144核,能效提升66%!英特爾至強(qiáng)6處理器震撼上市,加速數(shù)據(jù)中心升級(jí)
6能效核處理器基于Intel 3制程工藝,憑借高核心密度及出色的每瓦性能,可在提供高效算力的同時(shí)顯著降低能源成本。英特爾至強(qiáng)6700E采用144核
富士通發(fā)布《富士通技術(shù)與服務(wù)愿景2024》
富士通近日發(fā)布了《富士通技術(shù)與服務(wù)愿景2024(Fujitsu Technology and Service Vision 2024,簡(jiǎn)稱FT&SV 2024)》,闡述了對(duì)未來商業(yè)和社會(huì)的愿景。
富士通使用富岳超級(jí)計(jì)算機(jī)訓(xùn)練LLM
盡管富士通的富岳超級(jí)計(jì)算機(jī)不再是超級(jí)計(jì)算機(jī)500強(qiáng)名單中最快的機(jī)器,但它仍然是一個(gè)非常強(qiáng)大的系統(tǒng),A64FX處理器的多功能性允許將其用于各種工作負(fù)載,例如AI。
實(shí)測(cè)分享,瑞芯微RK3588八核國產(chǎn)處理器性能測(cè)評(píng)!確實(shí)“遙遙領(lǐng)先”
RK3588處理器優(yōu)勢(shì) RK3588是瑞芯微最新一代旗艦工業(yè)處理器,它具有如下卓越優(yōu)勢(shì): ? 超強(qiáng)運(yùn)算能力: 四核ARM Cortex-A7
國產(chǎn)ARM超算建設(shè)歷程 Arm計(jì)算在超算領(lǐng)域的實(shí)踐
ARM 指令集兼容架構(gòu)已成為HPC 主流技術(shù)與未來發(fā)展的重要趨勢(shì),可滿足大型超算系統(tǒng)與商用HPC 系統(tǒng)的技術(shù)需求。
評(píng)論