在法蘭克福舉辦的全球超級(jí)計(jì)算大會(huì)上,重磅消息傳來,NVIDIA宣布CUDA支持Arm CPU,為高性能計(jì)算開辟全新途徑,以構(gòu)建具有極高能效水平的百萬兆級(jí)AI超級(jí)計(jì)算機(jī)。北京時(shí)間6月17日下午四點(diǎn),NVIDIA與媒體召開電話會(huì)議。下文將詳解雙方合作始末,以及<電子發(fā)燒友>獨(dú)家求證后獲知的信息。
NVIDIA攜手Arm意欲何在?
隨著傳統(tǒng)計(jì)算規(guī)模擴(kuò)展步伐的停止,功率將成為所有超級(jí)計(jì)算機(jī)的限制因素。對(duì)于與Arm的攜手,NVIDIA創(chuàng)始人兼首席執(zhí)行官黃仁勛表示:“NVIDIA CUDA加速的計(jì)算和Arm的高能效CPU架構(gòu)的相結(jié)合,將助力HPC社區(qū)實(shí)現(xiàn)大幅提升,以達(dá)到百萬兆級(jí)。”雙方合作的原因主要有兩方面:首先,客戶需要更多選擇,一旦完成堆棧優(yōu)化,Nvidia將加速所有主要CPU架構(gòu),包括x86、Power和ARM;其次,通過將NVIDIA軟件棧引入Arm生態(tài)系統(tǒng),將進(jìn)一步助推在HPC服務(wù)器市場(chǎng)的創(chuàng)新。
年底前,NVIDIA將向Arm生態(tài)系統(tǒng)提供全堆棧的AI和HPC軟件,該堆棧為600多個(gè)HPC應(yīng)用程序和所有AI框架提供加速,其中包括了所有NVIDIA CUDA-X AI和HPC庫、GPU加速的AI框架和軟件開發(fā)工具,如支持OpenACC的PGI編譯器和性能分析器。
NVIDIA解決方案架構(gòu)與工程團(tuán)隊(duì)副總裁Marc Hamilton透露,NVIDIA和Arm已為這個(gè)計(jì)劃準(zhǔn)備了兩年左右,認(rèn)為現(xiàn)在是最佳的發(fā)布時(shí)機(jī)。建立在雙方超過10年的合作基礎(chǔ)之上,此前,NVIDIA幾款用于便攜式游戲、自動(dòng)駕駛汽車、機(jī)器人和嵌入式AI計(jì)算的系統(tǒng)級(jí)芯片產(chǎn)品都采用了Arm。全球眾多涉及超級(jí)計(jì)算的項(xiàng)目或單位都在尋求Arm的加入,包括歐洲處理器計(jì)劃(European Processor Initiative)、日本先進(jìn)情報(bào)項(xiàng)目中心 (RIKEN)、美國能源部的先鋒項(xiàng)目(DOE Vanguard project)等。
合作僅止于HPC軟件方面?還是會(huì)進(jìn)一步影響到某些應(yīng)用市場(chǎng)?NVIDIA表示,合作同時(shí)也是對(duì)于其他平臺(tái)的補(bǔ)充,例如Jetson Xavier,并將進(jìn)一步拓展在數(shù)據(jù)中心和HPC平臺(tái)的合作。
超算競(jìng)爭(zhēng)再加劇
在超級(jí)計(jì)算機(jī)中使用基于Arm的體系結(jié)構(gòu)是值得注意的,和其他架構(gòu)相比,Arm的一大特色在于出色的能效,能夠?yàn)槌?jí)計(jì)算提供開放式架構(gòu),用戶可以實(shí)現(xiàn)更為高度的集成。對(duì)于需要快速處理和分析大型數(shù)據(jù)集的研究密集型任務(wù),能夠滿足內(nèi)存容量和可擴(kuò)展性需求。Arm已經(jīng)在世界各地的許多HPC中心獲得了越來越多的關(guān)注,NVIDIA支持Arm CPU后,將為研發(fā)超算的研究人員們提供了除英特爾和IBM外的第三種選擇,并使得研發(fā)者可以通過這種方式獲得更多的自主控制能力。對(duì)于已經(jīng)選擇了Arm CPU的用戶來說,他們同時(shí)可以獲得NVIDIA GPU加速計(jì)算選項(xiàng)。CUDA強(qiáng)大的軟件能力,將能夠和Arm的軟件生態(tài)無縫銜接,強(qiáng)強(qiáng)聯(lián)合。
一直以來,Arm并沒有放棄將其處理器擴(kuò)展至高性能計(jì)算領(lǐng)域的堅(jiān)持。近年來大的舉動(dòng)有:2016年8月宣布將與日本富士通公司合作,開發(fā)一個(gè)以64位ARMv8-A驅(qū)動(dòng)的Post K超級(jí)計(jì)算機(jī),并于當(dāng)年12月宣布收購Allinea Software公司,后者主要為超級(jí)計(jì)算機(jī)提供性能分析工具。在2018年11月的TOP500列表上,首次出現(xiàn)了Arm的身影,而且是安裝在大名鼎鼎的美國桑迪亞國家實(shí)驗(yàn)室。與此同時(shí),Cray于2018年11月在英國氣象局交付了一臺(tái)基于Arm的超級(jí)計(jì)算機(jī)"Isambard",而日本的下一代超級(jí)計(jì)算機(jī)"Post-K"也同樣基于Arm架構(gòu)。
超算未來將更為注重能耗
超算屆有兩個(gè)重要排名:TOP500和Green500。TOP500主要按照性能基準(zhǔn),提供通用高端應(yīng)用的系統(tǒng)排名。而相比TOP500,Green500除了追求運(yùn)算速度,更加重視超算的能耗問題。根據(jù)今年剛剛發(fā)布的Green500排行榜,在全球最節(jié)能的25款超級(jí)計(jì)算機(jī)中,有22款都得益于NVIDIA的支持。關(guān)鍵因素在于:采用NVIDIA GPU的超級(jí)計(jì)算機(jī)能夠?qū)⒎敝氐奶幚碜鳂I(yè)卸載至更為節(jié)能的并行處理CUDA GPU之上;NVIDIA與Mellanox合作優(yōu)化整體超級(jí)計(jì)算集群的處理;以及NVIDIA發(fā)明的SXM 3D封裝和可實(shí)現(xiàn)極密集型擴(kuò)展節(jié)點(diǎn)的NVIDIA NVLink互連技術(shù)。
攜手打造超豪華“朋友圈”
包括超算中心和系統(tǒng)提供商以及系統(tǒng)級(jí)芯片制造商等在內(nèi)的眾多HPC行業(yè)及Arm生態(tài)系統(tǒng)中的全球領(lǐng)先企業(yè),都表達(dá)了其對(duì)于NVIDIA攜手Arm的支持。對(duì)于超算百萬兆級(jí)時(shí)代的愿景,Cray認(rèn)為主要在于將AI和分析與建模、仿真相結(jié)合的系統(tǒng),這些系統(tǒng)能夠支持、也經(jīng)常需要為科學(xué)、工程和數(shù)字化轉(zhuǎn)型所需的數(shù)據(jù)密集型工作負(fù)載構(gòu)建的多種處理器架構(gòu)和系統(tǒng)。Cray系統(tǒng)管理和編程環(huán)境(編譯器、庫和工具)已經(jīng)能夠在XC和未來的Shasta超級(jí)計(jì)算機(jī)上支持Arm處理器,將CUDA和CUDA-X HPC和AI軟件堆棧用于Arm平臺(tái),并將其與Cray系統(tǒng)管理和編程環(huán)境緊密集成,能夠助力其超級(jí)計(jì)算機(jī)實(shí)現(xiàn)最終愿景。
“歐洲處理器計(jì)劃(European Processor Initiative,EPI)總經(jīng)理Philippe Notton則表示,打造歐盟自己的高端、低功耗、通用和加速器解決方案,EPI和其工業(yè)合作伙伴SiPearl非常看好NVIDIA所帶來的全新可能性。將EPI基于Arm的微處理器與NVIDIA加速器相結(jié)合,能夠匹配未來歐洲百萬兆級(jí)模塊化超級(jí)計(jì)算機(jī)中的構(gòu)建模塊。”
考慮到未來幾年內(nèi)百萬兆級(jí)系統(tǒng)和大規(guī)模AI計(jì)算的興起,Jülich超算中心負(fù)責(zé)人Thomas Lippert表示, NVIDIA對(duì)Arm處理器的支持是非常令人興奮的發(fā)展,對(duì)于實(shí)現(xiàn)未來超級(jí)計(jì)算機(jī)和可組合數(shù)據(jù)中心的真正模塊化至關(guān)重要。
在HPC網(wǎng)絡(luò)方面處于領(lǐng)先地位的Mellanox Technologies,其InfiniBand和以太網(wǎng)技術(shù)連接了全球多款大型的超級(jí)計(jì)算機(jī),其中就包括第一代基于Arm的各系統(tǒng)。該公司創(chuàng)始人兼首席執(zhí)行官Eyal Waldman希望通過持續(xù)合作,部署200Gb/s HDR和計(jì)算網(wǎng)絡(luò)技術(shù),以優(yōu)化HPC和AI工作負(fù)載,并實(shí)現(xiàn)新一代基于Arm的超級(jí)計(jì)算機(jī)的超級(jí)連接。
百萬兆級(jí)意義何在?
全球超級(jí)計(jì)算機(jī)競(jìng)賽正朝著“百萬兆級(jí)計(jì)算”這個(gè)里程碑似的目標(biāo)前進(jìn)著。百萬兆級(jí)意味著什么?一個(gè)百萬兆級(jí)的計(jì)算機(jī)一瞬間進(jìn)行的計(jì)算量,相當(dāng)于地球上所有人每天每秒都不停地計(jì)算四年。
這種非凡的力量將使研究人員能夠進(jìn)行大規(guī)模復(fù)雜的模擬,從而在許多領(lǐng)域取得進(jìn)展,從氣候科學(xué)到基因組學(xué)、可再生能源和人工智能。田納西大學(xué)的超級(jí)計(jì)算機(jī)專家Jack Dongarra曾說過:“百萬兆級(jí)的計(jì)算機(jī)是一項(xiàng)有力的科學(xué)工具,就像粒子對(duì)撞機(jī)或巨型望遠(yuǎn)鏡一樣。”這些機(jī)器在工業(yè)上也很有用,它們可以被用于加速產(chǎn)品設(shè)計(jì)和識(shí)別新材料。軍方和情報(bào)機(jī)構(gòu)也渴望這樣的超級(jí)計(jì)算機(jī)能夠?qū)⒈挥糜诰S護(hù)國家安全。超級(jí)計(jì)算機(jī)是促進(jìn)科學(xué)發(fā)現(xiàn)的重要工具,建立百萬兆級(jí)超級(jí)計(jì)算將能夠極大地?cái)U(kuò)展人類知識(shí)的邊界。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。
舉報(bào)投訴
-
ARM
+關(guān)注
關(guān)注
134文章
9143瀏覽量
368322 -
NVIDIA
+關(guān)注
關(guān)注
14文章
5059瀏覽量
103413 -
超級(jí)計(jì)算
+關(guān)注
關(guān)注
1文章
39瀏覽量
11304 -
HPC
+關(guān)注
關(guān)注
0文章
320瀏覽量
23819 -
CUDA
+關(guān)注
關(guān)注
0文章
121瀏覽量
13649
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
NVIDIA發(fā)布個(gè)人超算利器project digital,標(biāo)志著ai元年的開啟
的projectdigital發(fā)布之后,這些設(shè)想都在被世人一一實(shí)現(xiàn)。NVIDIA發(fā)布的最新個(gè)人超算projectdigital將云AI轉(zhuǎn)變成了本地AI,通過強(qiáng)大的硬件解
NVIDIA加速全球大多數(shù)超級(jí)計(jì)算機(jī)推動(dòng)科技進(jìn)步
HPCwire 讀者和編輯選擇獎(jiǎng)。 自 2006 年發(fā)布 CUDA 以來,NVIDIA 不斷推動(dòng) AI 和加速計(jì)算的進(jìn)步,最新發(fā)布的全球最強(qiáng)超級(jí)計(jì)算機(jī) TOP500 榜單突顯了該公司在超算
【「算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗(yàn)】--了解算力芯片GPU
方式可以提高處理器的吞吐量。并行計(jì)算模式(而非圖形模式下)GPGPU的流水線是針對(duì)線程束進(jìn)行管理的,也就是NVIDIA所說的 CUDA環(huán)境下的 warp 或者AMD 所說的 OpenCL 環(huán)境下
發(fā)表于 11-03 12:55
iQOO 13首發(fā)電競(jìng)芯片Q2,獨(dú)家支持2K分辨率
10月23日,iQOO正式揭曉,其最新款iQOO 13將獨(dú)家首發(fā)自研電競(jìng)芯片Q2,此舉突破了電競(jìng)視效的極限,樹立了新的行業(yè)標(biāo)桿。
憑借Q2芯片的卓越性能,iQOO 13實(shí)現(xiàn)了行業(yè)前所未有的2K 144FPS超分超幀并發(fā)
預(yù)定下代超算第一?富士通144核Arm處理器公開
電子發(fā)燒友網(wǎng)報(bào)道(文/周凱揚(yáng))相信對(duì)超算市場(chǎng)有過一定了解的朋友,都對(duì)曾經(jīng)的第一名富岳超算不陌生。這臺(tái)2021年正式啟用的超
鴻海再獲AI領(lǐng)域大單,獨(dú)家供貨英偉達(dá)GB200 NVLink交換器
在人工智能(AI)領(lǐng)域的激烈競(jìng)爭(zhēng)中,鴻海集團(tuán)再次傳來捷報(bào)。繼成功獲得英偉達(dá)(NVIDIA)GB200 AI服務(wù)器代工訂單的大份額后,鴻海又獨(dú)家攬獲了GB200關(guān)鍵元件——被譽(yù)為“提升算
NVIDIA 通過 Holoscan 為 NVIDIA IGX 提供企業(yè)軟件支持
Enterprise-IGX軟件現(xiàn)已在NVIDIA IGX平臺(tái)上正式可用,以滿足工業(yè)邊緣對(duì)實(shí)時(shí) AI 計(jì)算日益增長的需求。它們將共同幫助醫(yī)療、工業(yè)和科學(xué)計(jì)算領(lǐng)域的解決方案提供商利用企業(yè)級(jí)軟件和支持來加快開發(fā)
QPU與GPU,經(jīng)典超算和量子計(jì)算的協(xié)同
電子發(fā)燒友網(wǎng)報(bào)道(文/李寧遠(yuǎn))不久前在國際超算大會(huì)ISC上, NVIDIA宣布將通過開源的 NVIDIA CUDA-Q量子計(jì)算平臺(tái),助力全球
英偉達(dá)CUDA-Q平臺(tái)推動(dòng)全球量子計(jì)算研究
與經(jīng)典超算的深度整合。該平臺(tái)的重要特性在于其支持量子計(jì)算與AI人工智能的完美結(jié)合,為解決量子比特噪聲問題提供了新思路,并有助于開發(fā)出更加高效的算法。
最新Top500超算榜單公布:Frontier再奪魁首,Aurora破百億大關(guān)
此次Top500排行榜中只有一個(gè)顯著變動(dòng):瑞士國家超級(jí)計(jì)算機(jī)中心的Alps超算憑借270 PFlop/s的Rmax LINPACK FP64算力排名上升至第六,超過了IBM POWER9處理器和
NVIDIA 通過 CUDA-Q 平臺(tái)為全球各地的量子計(jì)算中心提供加速
—— NVIDIA 于今日宣布將通過開源的 NVIDIA CUDA-Q? 量子計(jì)算平臺(tái),助力全球各地的國家級(jí)超
發(fā)表于 05-13 15:21
?212次閱讀
寧德時(shí)代、比亞迪正向新能源車細(xì)分領(lǐng)域探索,推進(jìn)百萬級(jí)車型電動(dòng)化
寧德時(shí)代和比亞迪正默契地向新能源車細(xì)分領(lǐng)域探索,越野、超跑等百萬級(jí)車型的高端市場(chǎng)逐漸成為他們提高市占率的新“戰(zhàn)場(chǎng)”。
“捷智算”正式入駐國家超算互聯(lián)網(wǎng)平臺(tái)
ABSTRACT摘要2024年4月2日,本公司旗下算力服務(wù)品牌“捷智算”正式入駐國家超算互聯(lián)網(wǎng)平臺(tái),開設(shè)云gpu旗艦店。我們將借助國家超
深度解讀Nvidia AI芯片路線圖
Nvidia是一個(gè)同時(shí)擁有 GPU、CPU和DPU的計(jì)算芯片和系統(tǒng)公司。Nvidia通過NVLink、NVSwitch和NVLink C2C技術(shù)將CPU、GPU進(jìn)行靈活連接組合形成統(tǒng)一的硬件架構(gòu),并于CUDA一起形成完整的軟硬件
發(fā)表于 03-13 09:25
?991次閱讀
國產(chǎn)ARM超算建設(shè)歷程 Arm計(jì)算在超算領(lǐng)域的實(shí)踐
ARM 指令集兼容架構(gòu)已成為HPC 主流技術(shù)與未來發(fā)展的重要趨勢(shì),可滿足大型超算系統(tǒng)與商用HPC 系統(tǒng)的技術(shù)需求。
評(píng)論