華為全場(chǎng)景AI方案構(gòu)建完成!
在今天深圳的發(fā)布會(huì)上,華為副董事長(zhǎng)、輪值董事長(zhǎng)徐直軍發(fā)布了最新商用AI芯片昇騰910(Ascend 910),以及首款國(guó)產(chǎn)的全場(chǎng)景AI計(jì)算框架——MindSpore計(jì)算框架。
至此,從去年發(fā)布“五大AI戰(zhàn)略”,短短一年時(shí)間,在各方壓力下的華為,已經(jīng)迅速完成了全場(chǎng)景AI方案的全部部件構(gòu)建。華為表示,接下來(lái)會(huì)專(zhuān)注于各部件的優(yōu)化和升級(jí)。
在答記者問(wèn)的環(huán)節(jié)徐直軍也提到,“516事件”(美國(guó)商務(wù)部以國(guó)家安全為由,將華為公司及其70家附屬公司列入出口管制「實(shí)體名單」)對(duì)華為戰(zhàn)略推薦和全場(chǎng)景產(chǎn)品研發(fā)沒(méi)有任何影響,盡管外部環(huán)境發(fā)生了很多變化,但是整個(gè)AI戰(zhàn)略和產(chǎn)品商用依然在穩(wěn)步推進(jìn),也達(dá)到了預(yù)期結(jié)果。
而對(duì)于華為在計(jì)算框架生態(tài)的構(gòu)建上,如何與谷歌和Facebook等已經(jīng)長(zhǎng)期耕耘的公司競(jìng)爭(zhēng)的問(wèn)題,徐直軍表示,華為的優(yōu)勢(shì)在于有自己的移動(dòng)終端產(chǎn)品,并且利用算力和計(jì)算框架結(jié)合,可以打造很多其他框架不能實(shí)現(xiàn)的功能。
其實(shí)在8月21日開(kāi)幕的第31屆Hot Chips大會(huì)上,華為作為主角之一與AMD、Intel、ARM等巨頭同臺(tái)亮相時(shí),就推出了AI芯片所用的“Da Vinci(達(dá)芬奇)”架構(gòu),以及昇騰310、昇騰910芯片和麒麟810芯片。
昇騰310、昇騰910芯片早在去年10月10日的華為全鏈接2018大會(huì)上就已首次亮相。
聚焦低功耗的昇騰310已經(jīng)量產(chǎn)商用,那今天發(fā)布的昇騰910(Ascend 910)AI處理器和MindSpore計(jì)算框架又有什么新的亮點(diǎn)呢?
最新商用AI芯片昇騰910發(fā)布
先看昇騰910,據(jù)華為介紹,這款芯片在算力方面超過(guò)了預(yù)期,同等規(guī)格下,昇騰910達(dá)到并超過(guò)了C級(jí)規(guī)格,能在一個(gè)時(shí)鐘周期下完成4096次計(jì)算。
這個(gè)成績(jī)得益于基于達(dá)芬奇架構(gòu)的AI核的計(jì)算核心,除了標(biāo)量和矢量計(jì)算單元,AI核集成了3D立方體計(jì)算引擎,與CPU和GPU相比,有兩個(gè)數(shù)量級(jí)上的提升。
昇騰910更是集成了32個(gè)立方體計(jì)算引擎,能夠輸出256TFLOPS(每秒256萬(wàn)億次浮點(diǎn)指令),所以昇騰910不僅是一個(gè)AI芯片,更是一個(gè)高度集成的片上系統(tǒng),集成了CPU、DVBP及任務(wù)管理器。
同時(shí)昇騰910擁有自治能力,使其可以獨(dú)立完成整個(gè)AI訓(xùn)練流程,最小化和Host的交互,從而發(fā)揮其強(qiáng)大的算力。
再看昇騰910的通信機(jī)制,昇騰910集成了HCCS、PCLe和RoCE三種高速接口,其中自研的HCCS可以提供單接口240Gbps的傳輸,從而實(shí)現(xiàn)芯片構(gòu)建訓(xùn)練系統(tǒng)的性能和靈活性的大幅提升。
華為也表示,將繼續(xù)面向未來(lái)投資,針對(duì)不同場(chǎng)景進(jìn)行研發(fā),提供更強(qiáng)大經(jīng)濟(jì)的算力需求。昇騰310、昇騰910僅僅是一個(gè)開(kāi)始,未來(lái)將推出昇騰920。
在價(jià)格上,華為也表示,這款芯片的售價(jià)還沒(méi)有確定,但是絕不會(huì)高于同性能芯片的售價(jià)。
發(fā)布首款國(guó)產(chǎn)全場(chǎng)景AI計(jì)算框架——MindSpore
接下來(lái),華為還發(fā)布了一款全場(chǎng)景AI計(jì)算框架——MindSpore。
徐直軍表示,目前國(guó)內(nèi)還沒(méi)有一款能夠?qū)?biāo)Tensorflow的全場(chǎng)景AI計(jì)算框架,MindSpore希望能夠彌補(bǔ)國(guó)內(nèi)的這一空白。
在性能上,MindSpore對(duì)開(kāi)發(fā)者非常友好,能夠有效減少模型開(kāi)發(fā)時(shí)間,降低開(kāi)發(fā)門(mén)檻。相同場(chǎng)景需求下,減少模型代碼量20%,效率能夠整體提升50%以上。
具體來(lái)說(shuō),MindSpore自動(dòng)微分采用Source 2 Source方式實(shí)現(xiàn),在性能和可編程性上,明顯優(yōu)于業(yè)界圖和運(yùn)算符重載方式,同時(shí)能夠?qū)崿F(xiàn)任意算子的微分表達(dá)和編譯優(yōu)化,實(shí)現(xiàn)反向算子自動(dòng)生成,從而極大方便模型開(kāi)發(fā)。
隨著數(shù)據(jù)集和模型規(guī)模越來(lái)越大,模型并行成為必然,手工切分的模型并行存在門(mén)檻高、效率低、調(diào)優(yōu)難的缺陷,而MindSpore只需要定義單機(jī)模型,即可實(shí)現(xiàn)多機(jī)混合并行運(yùn)行,無(wú)需了解AI集群細(xì)節(jié)。
MindSpore同時(shí)支持靜態(tài)圖和動(dòng)態(tài)圖,且可用一條語(yǔ)句實(shí)現(xiàn)無(wú)縫切換,從而讓調(diào)試也變得簡(jiǎn)單而高效。
不僅有開(kāi)發(fā)態(tài)的高效,運(yùn)行態(tài)的友好同樣是MindSpore的追求目標(biāo)。MindSpore大大提高了運(yùn)算性能,并且除了支持華為的昇騰910外,也支持其他業(yè)界其他CPU、GPU。
MindSpore還提供了Ascend Native運(yùn)行技術(shù),助力昇騰算力最佳發(fā)揮。主從控制模式中,CPU和GPU交互,引入內(nèi)存和數(shù)據(jù)開(kāi)銷(xiāo),在芯片上完成神經(jīng)網(wǎng)絡(luò)模型所需要的所有控制和執(zhí)行。
至于很多人問(wèn)為什么有了TensorFlow還要開(kāi)發(fā)MindSpore,徐直軍表示:目前沒(méi)有任何一個(gè)國(guó)產(chǎn)框架支持全場(chǎng)景。華為目前的業(yè)務(wù)包括云、端、邊,這些都需要全場(chǎng)景支持的AI框架。在不同的運(yùn)行環(huán)境中,架構(gòu)上支持可大可小,適應(yīng)全部場(chǎng)景部署。
在隱私保護(hù)方面,MindSpore不帶有隱私信息的梯度模型,能夠在保證保護(hù)用戶隱私的前提下,跨場(chǎng)景協(xié)同。
總的來(lái)說(shuō),支持端、邊、云獨(dú)立和協(xié)同的統(tǒng)一訓(xùn)練和推理的MindSpore計(jì)算框架,降低了AI的開(kāi)發(fā)和使用門(mén)檻,釋放AI生產(chǎn)力,最大程度發(fā)揮AI芯片算力潛力,從而鼓勵(lì)開(kāi)發(fā)人員共同打造AI生態(tài),推動(dòng)AI產(chǎn)業(yè)落地。
華為稱,MindSpore將在明年一季度開(kāi)源,讓更多開(kāi)發(fā)者參與將MindSpore打造好。
華為全場(chǎng)景AI構(gòu)建方案完成
最后,讓我們?cè)倩仡櫼幌氯A為去年發(fā)布的AI五大戰(zhàn)略:
投資基礎(chǔ)研究:在計(jì)算視覺(jué)、自然語(yǔ)言處理、決策推理等領(lǐng)域構(gòu)筑數(shù)據(jù)高效(更少的數(shù)據(jù)需求)、能耗高效(更低的算力和能耗),安全可信、自動(dòng)自治的機(jī)器學(xué)習(xí)基礎(chǔ)能力
打造全棧方案:打造面向云、邊緣和端等全場(chǎng)景的、獨(dú)立的以及協(xié)同的、全棧解決方案,提供充裕的、經(jīng)濟(jì)的算力資源,簡(jiǎn)單易用、高效率、全流程的AI平臺(tái)
投資開(kāi)放生態(tài)和人才培養(yǎng):面向全球,持續(xù)與學(xué)術(shù)界、產(chǎn)業(yè)界和行業(yè)伙伴廣泛合作,打造人工智能開(kāi)放生態(tài),培養(yǎng)人工智能人才
解決方案增強(qiáng):把AI思維和技術(shù)引入現(xiàn)有產(chǎn)品和服務(wù),實(shí)現(xiàn)更大價(jià)值、更強(qiáng)競(jìng)爭(zhēng)力
內(nèi)部效率提升:應(yīng)用AI優(yōu)化內(nèi)部管理,對(duì)準(zhǔn)海量作業(yè)場(chǎng)景,大幅度提升內(nèi)部運(yùn)營(yíng)效率和質(zhì)量
而今年芯片和計(jì)算架構(gòu)的發(fā)布,也是華為對(duì)這一戰(zhàn)略的落地實(shí)踐。這也標(biāo)志著華為全場(chǎng)景AI構(gòu)建方案完成。
目前從世界范圍來(lái)看,在桌面CPU上,Intel和AMD處于絕對(duì)的統(tǒng)治地位;GPU方面,則是英偉達(dá)在領(lǐng)跑;至于手機(jī)處理器,則基本握在了ARM手中。盡管華為有備胎計(jì)劃,但是性能方面預(yù)計(jì)很難超過(guò)這些技術(shù)成熟、人才資本雄厚的企業(yè)。
深圳半導(dǎo)體協(xié)會(huì)秘書(shū)長(zhǎng)常軍鋒曾指出,國(guó)外半導(dǎo)體巨頭通過(guò)國(guó)際標(biāo)準(zhǔn)、行業(yè)標(biāo)準(zhǔn)、專(zhuān)利保護(hù)建立了技術(shù)壁壘。
AI芯片,則成為了國(guó)產(chǎn)芯片彎道超車(chē)的絕佳機(jī)會(huì)。
AI芯片從發(fā)育到成熟落地,國(guó)內(nèi)基本和國(guó)外大廠處于同一起跑線上,并且如今華為昇騰系列已經(jīng)商業(yè)化,昇騰910作為是目前單芯片計(jì)算密度最大的芯片,計(jì)算力也超過(guò)了谷歌及英偉達(dá)競(jìng)品。
-
華為
+關(guān)注
關(guān)注
216文章
34438瀏覽量
251758 -
AI
+關(guān)注
關(guān)注
87文章
30897瀏覽量
269111 -
AI芯片
+關(guān)注
關(guān)注
17文章
1887瀏覽量
35027
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論