長遠(yuǎn)來看,英特爾豪賭167億美元收購FPGA制造商Altera的舉動(dòng)是一筆好買賣。現(xiàn)在,F(xiàn)PGA已經(jīng)成為深層神經(jīng)網(wǎng)絡(luò)中GPU的強(qiáng)力競爭對手;英偉達(dá)應(yīng)該也已經(jīng)發(fā)現(xiàn)了,微軟新的實(shí)時(shí)云AI/深度學(xué)習(xí)平臺(tái)“BrainWave”項(xiàng)目正在采用英特爾的Stratix 10 FPGA;在微軟早期進(jìn)行的測試中,其基于Stratix 10的“BrainWave”項(xiàng)目中的FPGA系統(tǒng)在FP8持續(xù)計(jì)算上達(dá)到39.5萬億次每秒的運(yùn)算速度;微軟計(jì)劃向需要實(shí)時(shí)人工智能服務(wù)的Azure客戶推介搭載英特爾計(jì)算平臺(tái)的“Brain Brain”項(xiàng)目。
預(yù)計(jì)英特爾的FPGA將減緩英偉達(dá)數(shù)據(jù)中心/汽車業(yè)務(wù)板塊的增長速度。
英特爾收購Altera時(shí)豪擲的167億美金終于見到回報(bào)了。現(xiàn)在,Altera的FPGA(現(xiàn)場可編程門陣列)產(chǎn)品成為英特爾對抗英偉達(dá)基于GPU的深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)平臺(tái)的利器。與CPU(中央處理單元)相比,GPU(圖形處理單元)在并行計(jì)算方面存在優(yōu)勢,GPU專家英偉達(dá)借此躋身為深度學(xué)習(xí)計(jì)算領(lǐng)域的公認(rèn)領(lǐng)導(dǎo)者。
然而,英偉達(dá)的投資者們應(yīng)該注意到,微軟新的實(shí)時(shí)人工智能云平臺(tái)“BrainWave項(xiàng)目”搭載了英特爾的Stratix 10 FPGA。微軟在選擇深度神經(jīng)網(wǎng)絡(luò)[DNN]處理單元或DPU時(shí),沒有選擇英偉達(dá)的Tesla或者Volta GPU,反而選擇了Stratix 10。 英特爾將從微軟在全球各個(gè)數(shù)據(jù)中心大規(guī)模部署“BrainWave”項(xiàng)目中獲得顯著的經(jīng)濟(jì)效益。英特爾沒有任何獨(dú)立的GPU產(chǎn)品,但它擁有的FPGA足以加強(qiáng)其未來在超大型深度神經(jīng)網(wǎng)絡(luò)中的作用。
為什么這很重要
現(xiàn)在,以人工智能為中心的數(shù)據(jù)中心和汽車業(yè)務(wù)板塊為英偉達(dá)貢獻(xiàn)的季度收入已經(jīng)超過5億美金。微軟在向Azure客戶提供的Brainwave項(xiàng)目中使用FPGA后,也可以為英特爾貢獻(xiàn)同等規(guī)模的季度收入。我估計(jì),除了微軟之外,其它涉足人工智能的公司也會(huì)在其GPU加速的深度學(xué)習(xí)平臺(tái)中使用英特爾的FPGA。
英偉達(dá)股價(jià)上升到目前的高度,部分原因來自于它在深度學(xué)習(xí)計(jì)算方面的先發(fā)優(yōu)勢。微軟采用英特爾的FPGA加速其深度神經(jīng)網(wǎng)絡(luò)也可以幫助提升其股價(jià)表現(xiàn)。專注AI的投資者們現(xiàn)在應(yīng)該正視英特爾,它的Stratix 10產(chǎn)品讓英特爾一躍成為深層神經(jīng)網(wǎng)絡(luò)的硬件供應(yīng)商巨頭。
過去三年中,英偉達(dá)的股票大幅跑贏了英特爾。未來,應(yīng)用在微軟Azure服務(wù)業(yè)務(wù)中的Stratix FPGA將成為英特爾進(jìn)入企業(yè)AI市場的遲到的船票。
通過GPU加速的Azure產(chǎn)品,微軟與英偉達(dá)公司建立了合作伙伴關(guān)系。另一方面,BrainWave項(xiàng)目是微軟使用FPGA加速器推進(jìn)其實(shí)時(shí)人工智能商業(yè)服務(wù)的舉措。
訓(xùn)練深度學(xué)習(xí)計(jì)算機(jī)是一個(gè)需要高吞吐量的計(jì)算密集型過程,GPU優(yōu)異的并行計(jì)算性能使其成為理想選擇。然而,GPU能夠并行處理復(fù)雜的訓(xùn)練輸入,F(xiàn)PGA則對加速推理很有效。
加速推理的主要目的是改善服務(wù)器與最終用戶之間的延遲。 微軟對“BrainWave”項(xiàng)目的推廣定位是實(shí)時(shí)(零延遲)AI平臺(tái)。因此,英特爾的FPGA比英偉達(dá)的GPU更加適合做微軟BrainWave項(xiàng)目的DPU。
BrainWave項(xiàng)目最終可能用在微軟為百度自主駕駛汽車定制的云框架/解決方案上。微軟是百度自主駕駛汽車業(yè)務(wù)上的合作伙伴。和微軟一樣,百度也在其數(shù)據(jù)中心上使用FPGA。基于FPGA的BrainWave項(xiàng)目被標(biāo)榜為針對計(jì)算機(jī)視覺、機(jī)器學(xué)習(xí)和深度學(xué)習(xí),它可以滿足未來自動(dòng)駕駛汽車的云基礎(chǔ)設(shè)施需求。
GPU和FPGA是目前雖小但正在快速增長的人工智能服務(wù)行業(yè)的關(guān)鍵元件。 根據(jù)Tractica的報(bào)告,到2025年,與AI相關(guān)的產(chǎn)品和服務(wù)市場規(guī)模將增長到368億美元。FPGA可以幫助英特爾在這個(gè)利基市場上更好地競爭。
未來,英特爾真的需要更多FPGA產(chǎn)品客戶。它需要這塊收入來幫助支付它在以167億美元收購Altera時(shí)發(fā)行的70億美元債券。每個(gè)新收入來源都可以幫助英特爾恢復(fù)因大舉投資Altera而拉下的饑荒。
為什么英特爾的FPGA對微軟至關(guān)重要
Stratix 10的F32峰值性能仍然明顯低于英偉達(dá)的Pascal GPU。 然而,市場正日趨采用緊湊型低精度數(shù)據(jù)類型(低于32位或FP32)。 TensorFlow和Caffe等DNN軟件框架支持低精度FP16(16位)和FP8(8位)數(shù)據(jù)類型。在這些不需要FP32級性能的深入學(xué)習(xí)/機(jī)器學(xué)習(xí)任務(wù)中,F(xiàn)PGA可以大行其道。
對于非常低精度的2位和1位DNN的持續(xù)改進(jìn)和FPGA在FP8和FP9 DNN框架上的出色表現(xiàn)相輔相成。人工智能/深度學(xué)習(xí)并不完全依賴于英偉達(dá)GPU所擅長的傳統(tǒng)密集FP32和FP64運(yùn)算。微軟的Brainwave項(xiàng)目并沒有使用GPU,是因?yàn)樗€希望能夠通過低精度FPGA實(shí)現(xiàn)更節(jié)能的DNN。不像可以深度定制的FPGA,當(dāng)涉及到低精度、稀疏、不規(guī)則的DNN時(shí),GPU的表現(xiàn)很差。
在早期測試中,基于Stratix 10的Brainwave項(xiàng)目中的FPGA硬件持續(xù)計(jì)算性能達(dá)到39.5萬億次每秒,這個(gè)測試是微軟在定制的低精度8位浮點(diǎn)格式下完成的。隨著繼續(xù)優(yōu)化完善Brainwave項(xiàng)目,預(yù)計(jì)性能還可以進(jìn)一步提高。
結(jié)論
微軟長期以來對FPGA的興趣是英特爾大舉押注Altera的原因之一。BrainWave項(xiàng)目是微軟2011年推出的 Catapult項(xiàng)目的延續(xù)。六年前,微軟就已經(jīng)在其數(shù)據(jù)中心中配備了Altera FPGA加速板。現(xiàn)在,微軟正在使用英特爾最新的Stratix 10 FPGA來加速基于云的深度學(xué)習(xí)任務(wù),而不僅僅是傳統(tǒng)的企業(yè)計(jì)算工作負(fù)載。
微軟早在2011年就知道,傳統(tǒng)的Xeon CPU無法勝任AI計(jì)算任務(wù)。英特爾迅速收購Altera的舉措表明,它已準(zhǔn)備好適應(yīng)微軟轉(zhuǎn)向FPGA加速超大型數(shù)據(jù)中心的巨大轉(zhuǎn)變。我認(rèn)為,英特爾從來都沒有考慮過購買英偉達(dá)這樣的GPU廠商,它看中的是微軟大力推動(dòng)FPGA加速云計(jì)算背后的趨勢,投資的是Altera的潛力和FPGA的未來。
在數(shù)據(jù)中心硬件產(chǎn)品上,英特爾不需要拿出自己的GPU來與英偉達(dá)競爭,它手中的利器是基于14nm工藝、面向數(shù)據(jù)中心加速應(yīng)用的Stratix 10。英特爾將繼續(xù)向數(shù)據(jù)中心運(yùn)營商兜售Xeon處理器,同時(shí)也會(huì)努力爭取為其FPGA獲得新的訂單。
評論
查看更多