電子發(fā)燒友網(wǎng)報(bào)道(文/周凱揚(yáng))根據(jù)EvansData全球開發(fā)調(diào)查報(bào)告22.1公布的數(shù)據(jù),有48%的開發(fā)者著手的都是使用不止一種處理器的異構(gòu)系統(tǒng),因?yàn)樗麄冃枰咝У亩嗉軜?gòu)編程方案來提高負(fù)載的應(yīng)用范圍。然而,像CUDA之類的專用編程模型,雖然生態(tài)成熟度更高,但缺乏移植性,所以英特爾就拿出了oneAPI這一統(tǒng)一開放的編程模型。
oneAPI將最大化利用英特爾的新一代硬件
去年12月,英特爾發(fā)布了全新的InteloneAPI工具2023版本,新版本的工具將支持第4代XeonScalable處理器、XeonCPU Max系列,以及英特爾的數(shù)據(jù)中心GPU,包括Flex和Max兩大系列。
oneAPI對(duì)英特爾產(chǎn)品線的支持/英特爾
在英特爾AMX、AQT、AVX-512和矢量引擎等硬件特性的支持下,oneAPI進(jìn)一步提高了這些英特爾硬件的深度學(xué)習(xí)處理性能和效率。比如在oneAPI的深度神經(jīng)網(wǎng)絡(luò)神經(jīng)庫下,XeonMaxCPU在MLPerfDeepCAM深度學(xué)習(xí)和推理下的性能,都要高出AMD的EPYC CPU,甚至高于英偉達(dá)的A100 GPU。在OpenMC、miniBUDE等計(jì)算負(fù)載下,英特爾的Max系列GPU也能實(shí)現(xiàn)兩倍于英偉達(dá)A100 GPU的性能。
英特爾也開始聯(lián)合開發(fā)社區(qū),針對(duì)Tensorflow、PyTorch、Anaconda等常用框架進(jìn)行優(yōu)化。根據(jù)Tensorflow官方公布的數(shù)據(jù),在英特爾和谷歌對(duì)oneAPI的oneDNN優(yōu)化下,他們得以充分利用第四代XeonScalable處理器的性能,在使用該處理內(nèi)置的AMX擴(kuò)展后,相較上一代處理器,不少AI模型的運(yùn)行速度實(shí)現(xiàn)了至高19倍的提升。隨著oneAPI的oneDNN庫均已被集成到最新版的TensorFlow和PyTorch中,相信更多開發(fā)者會(huì)選擇轉(zhuǎn)投英特爾的懷抱。
對(duì)第三方GPU的支持
對(duì)于軟件開發(fā)人員來說,擺脫專有接口而轉(zhuǎn)用開放標(biāo)準(zhǔn)的話,無疑可以兼容更廣泛的平臺(tái)和架構(gòu),但實(shí)現(xiàn)這一點(diǎn)需要的開發(fā)成本并不低。在英特爾收購了Codeplay之后,其軟件開發(fā)進(jìn)度也逐步加快。去年年底,Codeplay宣布擴(kuò)展oneAPI對(duì)第三方API的支持,讓多架構(gòu)多供應(yīng)商的編程變得更加簡單,于是對(duì)于英偉達(dá)GPU和AMD GPU的oneAPI插件也就面世了。
提供給第三方GPU的oneAPI可以與英特爾的oneAPI DPC++/C++編譯器,以及諸多流行的庫無縫銜接,這樣就能將不同的處理器的編程統(tǒng)一到開放標(biāo)準(zhǔn)上來。但同樣需要注意的是,oneAPI對(duì)第三方GPU的支持還不算很完善,比如對(duì)于AMD GPU的支持仍處于beta測(cè)試階段。而且當(dāng)下oneAPI對(duì)已知的GPU支持相當(dāng)有限,比如英偉達(dá)GPU正式支持的型號(hào)有RTX2060和A100,AMD GPU正式支持的型號(hào)只有Radeon Pro W6800。
雖然Codeplay稱第一版oneAPI應(yīng)該可以支持到更多的英偉達(dá)和AMD GPU,但他們并沒有在這些硬件平臺(tái)上進(jìn)行測(cè)試,所以不能保證正確的運(yùn)行。而且對(duì)于英偉達(dá)GPU來說,目前僅支持通用Linux系統(tǒng),因?yàn)镃UDA并不支持macOS,而支持Windows的版本將在未來推出。同樣的兼容性說明也適用于AMD的GPU,而且Codeplay已經(jīng)在AMD MI50、MI100和RadeonRX6700XT這些GPU上進(jìn)行了測(cè)試,但AMD的HIP目前并不支持Windows或macOS,所以只有Linux一種操作系統(tǒng)選項(xiàng)。
小結(jié)
對(duì)于英特爾來說,直接與聲勢(shì)浩大的CUDA正面交鋒無疑不是一個(gè)明智的選擇,可有了oneAPI這個(gè)開放編程標(biāo)準(zhǔn),繞過乃至實(shí)現(xiàn)CUDA移植可以為開發(fā)者提供更大的吸引力。畢竟如今的數(shù)據(jù)中心市場(chǎng)硬件換代速度快,又紛紛采用了異構(gòu)集成設(shè)計(jì),如果英特爾堅(jiān)持只為自己的硬件提供支持的話,那么非英特爾的CPU、GPU、FPGA和AI加速器都將繼續(xù)選擇自研或是公開的編程方案。而開放的oneAPI,在為其他硬件提供支持的前提下,充分利用英特爾硬件的核心優(yōu)勢(shì),才能做到異軍突起。
-
處理器
+關(guān)注
關(guān)注
68文章
19314瀏覽量
230073 -
英特爾
+關(guān)注
關(guān)注
61文章
9978瀏覽量
171879
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論