科技界被一個(gè)“快”字裹挾很久了。更高的生產(chǎn)效率和毫不妥協(xié)的性能,成為任何一家科技公司的追求。
隨著邁入以數(shù)據(jù)為中心的時(shí)代,我們看到的不僅是數(shù)據(jù)量的爆發(fā),更是有數(shù)據(jù)形態(tài)的巨大變化:從傳統(tǒng)的文本、圖形數(shù)據(jù),到現(xiàn)在的視頻、音頻、社交等非結(jié)構(gòu)化數(shù)據(jù),未來(lái)還有包括聯(lián)網(wǎng)汽車數(shù)據(jù)、神經(jīng)網(wǎng)絡(luò)數(shù)據(jù)、基因數(shù)據(jù)等更多形態(tài)的數(shù)據(jù)。
這種海量數(shù)據(jù)的多樣性,首先對(duì)計(jì)算能力提出了巨大的挑戰(zhàn),由此帶來(lái)了數(shù)據(jù)處理方式和計(jì)算架構(gòu)的延伸。未來(lái)十年我們將看到比過(guò)去五十年中多得多的架構(gòu)。
與此同時(shí),軟件的重要性被提到了前所未有的高度。英特爾曾提出,對(duì)于全新硬件架構(gòu)的每一個(gè)數(shù)量級(jí)的性能提升潛力,軟件能帶來(lái)兩個(gè)數(shù)量級(jí)的性能提升。
為了簡(jiǎn)化編程流程、提升效率,英特爾于去年12月宣布推出oneAPI項(xiàng)目,并將于今年第四季度發(fā)布開(kāi)發(fā)者測(cè)試版本。日前,<電子發(fā)燒友>在英特爾的溝通會(huì)上,率先了解了oneAPI的技術(shù)細(xì)節(jié)和戰(zhàn)略意義。
oneAPI:跨架構(gòu)、跨廠商,向全行業(yè)開(kāi)放
在解決計(jì)算問(wèn)題時(shí),過(guò)去幾代產(chǎn)品的答案幾乎一直是晶體管密度,并且摩爾定律發(fā)揮主導(dǎo)作用。但隨著制程節(jié)點(diǎn)發(fā)展速度相較于過(guò)去幾十年呈現(xiàn)出減緩的態(tài)勢(shì),現(xiàn)代計(jì)算又提出更多更新的需求,需要結(jié)合晶體管、架構(gòu)研究、連接性提升、更快速的內(nèi)存系統(tǒng)和軟件等眾多因素,共同推動(dòng)創(chuàng)新。“oneAPI既是英特爾的一種產(chǎn)品,同時(shí)又是一種行業(yè)規(guī)范”, 英特爾架構(gòu)、圖形與軟件部副總裁兼計(jì)算性能與開(kāi)發(fā)者產(chǎn)品部門(mén)總經(jīng)理Bill Savage介紹,“oneAPI是從軟件層面來(lái)簡(jiǎn)化和統(tǒng)一跨SVMS架構(gòu)的創(chuàng)新。它可以簡(jiǎn)化并且統(tǒng)一跨不同架構(gòu)、跨不同廠商之間的編程,是一個(gè)鼓勵(lì)社區(qū)和行業(yè)支持的一種開(kāi)放、標(biāo)準(zhǔn)的解決方案。”
為什么底層接口如此重要?Bill Savage表示,數(shù)百萬(wàn)的開(kāi)發(fā)者在最上層創(chuàng)造越來(lái)越多的應(yīng)用,他們所使用的大量中間件以及框架來(lái)自數(shù)萬(wàn)的中間件開(kāi)發(fā)者。oneAPI在最接近硬件的底層,對(duì)整個(gè)軟件堆棧會(huì)產(chǎn)生更大的影響,針對(duì)硬件使用統(tǒng)一接口,對(duì)軟件開(kāi)發(fā)者來(lái)講這也是一個(gè)很好的價(jià)值主張。oneAPI所能發(fā)揮的價(jià)值在于——通過(guò)跨CPU、GPU、AI加速器和FPGA產(chǎn)品架構(gòu),統(tǒng)一并簡(jiǎn)化編程,被廣泛的生態(tài)系統(tǒng)采用,為開(kāi)發(fā)者帶來(lái)更高的生產(chǎn)效率和性能。
全新編程語(yǔ)言DPC++專門(mén)針對(duì)多元化架構(gòu)
在一個(gè)多元化的架構(gòu)中進(jìn)行編程的話,很可能需要多種不同工具以及不同語(yǔ)言。這就意味著在軟件開(kāi)發(fā)過(guò)程中需要多支團(tuán)隊(duì),他們各自要學(xué)習(xí)很多不同專業(yè)的技能,這顯然不是一種最高效的軟件開(kāi)發(fā)方式。在oneAPI項(xiàng)目中,英特爾攜手行業(yè)開(kāi)發(fā)了一種叫做Data Parallel C++(DPC++)的全新語(yǔ)言,以支持實(shí)現(xiàn)橫跨SVMS架構(gòu)的數(shù)據(jù)并行編程。這是一種基于標(biāo)準(zhǔn)的開(kāi)放式跨行業(yè)語(yǔ)言,可替代單一架構(gòu)專有語(yǔ)言。
為什么需要一種全新的語(yǔ)言呢?畢竟這個(gè)世界上已經(jīng)有這么多語(yǔ)言了。英特爾架構(gòu)、圖形與軟件部副總裁兼編譯器與語(yǔ)言部門(mén)總經(jīng)理Alice Chan指出,現(xiàn)有的眾多語(yǔ)言各有局限所在:例如眾所周知的C++,它雖然是可移植的,而且底層性能非常好,但是本身缺乏了一些并行語(yǔ)言的特征,很難很好地用于并行架構(gòu);MATLAB更多集中在頂層,如果想在底層得到很好的性能較難;英偉達(dá)的CUDA能夠進(jìn)行并行架構(gòu)的編程,也可以把負(fù)載轉(zhuǎn)移到加速器,但是它只能用在英偉達(dá)自己的硬件上;還有其他語(yǔ)言例如OpenCL也能實(shí)現(xiàn)并行編程,但是圍繞它的社群和整體行業(yè)的活躍度并不高。
高性能庫(kù)如何推動(dòng)人工智能的發(fā)展?
人工智能的發(fā)展進(jìn)一步推動(dòng)了對(duì)算力的渴求,硬件架構(gòu)的世界已經(jīng)發(fā)生了極大的顛覆,英特爾自身就有SVMS架構(gòu),華為、阿里、百度以及非常多的AI初創(chuàng)公司各有自己的芯片戰(zhàn)略。對(duì)此,英特爾架構(gòu)、圖形與軟件部首席工程師Eric Lin表示,沒(méi)有軟件芯片無(wú)法使用,需要大量的開(kāi)發(fā)者去將它表達(dá)為用戶真正所需。這其中需要非常深厚的經(jīng)驗(yàn),英特爾希望將硬件能力抽象出來(lái),把最重要的算法融于oneAPI,使開(kāi)發(fā)者不再需要針對(duì)硬件做開(kāi)發(fā),更容易發(fā)揮出硬件的所有潛力。這是英特爾提供計(jì)算庫(kù)的根本原因。
由此看來(lái),一個(gè)計(jì)算庫(kù)服務(wù)數(shù)萬(wàn)個(gè)框架開(kāi)發(fā)者,服務(wù)數(shù)百萬(wàn)甚至更多的數(shù)據(jù)科學(xué)家,打通了從硬件到應(yīng)用的道路。
oneAPI集成的計(jì)算庫(kù)堪稱業(yè)內(nèi)“豪華配置“,包括快速、使用廣泛的數(shù)學(xué)函數(shù)庫(kù)MKL、使用經(jīng)典機(jī)器學(xué)習(xí)算法的英特爾數(shù)據(jù)分析加速庫(kù)DAAL,以及面向深度神經(jīng)網(wǎng)絡(luò)的英特爾數(shù)學(xué)核心函數(shù)庫(kù)MKL-DNN等。
OpenVINO——oneAPI在深度學(xué)習(xí)方面的“小現(xiàn)實(shí)”
對(duì)于深度學(xué)習(xí)來(lái)說(shuō),數(shù)據(jù)分析過(guò)程基本包括四步:第一,獲取數(shù)據(jù);第二,建立數(shù)學(xué)模型,并且用這些數(shù)據(jù)去訓(xùn)練;第三,根據(jù)部署場(chǎng)景有針對(duì)性地優(yōu)化模型;第四是推理,真正地讓各種各樣的開(kāi)發(fā)者,把他們的服務(wù)、產(chǎn)品推向用戶。如何讓這個(gè)工作流程的所有開(kāi)發(fā)者、參與者更有效率,是英特爾當(dāng)前的重點(diǎn)之一。去年8月,英特爾面向中國(guó)市場(chǎng)推出了專注于加速深度學(xué)習(xí)的OpenVINO工具包,能夠幫助企業(yè)在邊緣側(cè)快速實(shí)現(xiàn)高性能計(jì)算機(jī)視覺(jué)與深度學(xué)習(xí)的開(kāi)發(fā)。作為為客戶解決問(wèn)題的優(yōu)化推理引擎,OpenVINO補(bǔ)充了深度學(xué)習(xí)框架,支持應(yīng)用程序開(kāi)發(fā)者以統(tǒng)一接口跨SVMS架構(gòu)進(jìn)行開(kāi)發(fā)。據(jù)Eric介紹:“OpenVINO就是目前的一個(gè)商業(yè)部署,它所做的事情就是讓開(kāi)發(fā)者直接用一個(gè)統(tǒng)一的API,幫開(kāi)發(fā)者完成簡(jiǎn)單的開(kāi)發(fā)、簡(jiǎn)單的維護(hù)、并帶來(lái)高性能,它展示了oneAPI愿景的現(xiàn)實(shí)。”
在沒(méi)有OpenVINO之前,開(kāi)發(fā)者如何進(jìn)行部署?以英特爾自己為例,各種各樣的庫(kù),有針對(duì)CPU的、顯卡的、計(jì)算棒的、FPGA的……每一次開(kāi)發(fā)的時(shí)候,各個(gè)庫(kù)API不一樣,性能調(diào)優(yōu)不一樣,Debug不一樣,數(shù)據(jù)的預(yù)處理不一樣,開(kāi)發(fā)成本非常高。OpenVINO實(shí)現(xiàn)了無(wú)論是哪種類型的硬件,讓開(kāi)發(fā)者用一個(gè)統(tǒng)一API。
根據(jù)已公布的應(yīng)用來(lái)看,云從的人臉識(shí)別智能設(shè)備、中科英泰的智能零售方案、阿里巴巴在AliOS 互聯(lián)網(wǎng)汽車道路感知算法優(yōu)化方面、宇視科技的全融合智能解決方案UniAI等,都基于OpenVINO工具包。
對(duì)標(biāo)英偉達(dá)CUDA?
NVIDIA公司于2007年正式發(fā)布的CUDA(Compute Unified Device Architecture,統(tǒng)一計(jì)算架構(gòu)),是第一種不需借助圖形學(xué)API就可以使用類C語(yǔ)言進(jìn)行通用計(jì)算的開(kāi)發(fā)環(huán)境和軟件體系,是建立在GPU基礎(chǔ)之上的通用計(jì)算開(kāi)發(fā)平臺(tái)。由于在性能、成本和開(kāi)發(fā)時(shí)間上較傳統(tǒng)的CPU解決方案有顯著優(yōu)勢(shì),當(dāng)時(shí)在學(xué)術(shù)界和產(chǎn)業(yè)界引起了熱烈反響。現(xiàn)在,CUDA已經(jīng)在金融、石油、天文學(xué)、流體力學(xué)、信號(hào)處理、電磁仿真、模式識(shí)別、圖像處理、視頻壓縮等領(lǐng)域獲得廣泛應(yīng)用,并取得了豐碩的成果。oneAPI的推出,似有異曲同工之妙。對(duì)此,Bill Savage表示,oneAPI開(kāi)放給所有包括英偉達(dá)在內(nèi)的硬件廠商,行業(yè)也需要這樣一種開(kāi)放的、對(duì)于現(xiàn)有解決方案之外的另一種選擇。英特爾致力于向所有的、多樣的架構(gòu)來(lái)提供支持,使它們能夠很好地一起協(xié)作。
英特爾已對(duì)DPC++一些開(kāi)源項(xiàng)目在GitHub上進(jìn)行托管,但一個(gè)顯然存在的問(wèn)題是,GitHub一些開(kāi)源項(xiàng)目都是基于原有的如英偉達(dá)的GPU而實(shí)施,如果現(xiàn)在用oneAPI,開(kāi)發(fā)者將會(huì)面臨重新學(xué)習(xí)的問(wèn)題。對(duì)此,Bill Savage表示,英特爾在設(shè)計(jì)DPC++的時(shí)候,語(yǔ)言本身已經(jīng)和CUDA非常接近,對(duì)于開(kāi)發(fā)人員來(lái)講學(xué)習(xí)相對(duì)比較容易。至于程序員的遷移問(wèn)題,英特爾會(huì)在年底發(fā)布測(cè)試版本的時(shí)候分享更多工具,來(lái)幫助遷移更容易。
-
英特爾
+關(guān)注
關(guān)注
61文章
9999瀏覽量
172056 -
CUDA
+關(guān)注
關(guān)注
0文章
121瀏覽量
13649 -
英偉達(dá)
+關(guān)注
關(guān)注
22文章
3823瀏覽量
91557 -
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5511瀏覽量
121355
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論