寒武紀(jì)Cambricon-1A:核心的核心
寒武紀(jì)科技的Cambricon-1A是一款深度學(xué)習(xí)專用處理器芯片(NPU),其高性能硬件架構(gòu)及軟件支持Caffe、Tensorflow、MXnet等主流AI開發(fā)平臺。據(jù)稱這是國際上首個成功商用的深度學(xué)習(xí)處理器IP產(chǎn)品,可廣泛應(yīng)用于計算機(jī)視覺、語音識別、自然語言處理等智能處理關(guān)鍵領(lǐng)域。專注于人工智能產(chǎn)業(yè)發(fā)展的美國權(quán)威媒體CB Insights最新發(fā)布全球AI 100榜單,寒武紀(jì)以其深度學(xué)習(xí)專用處理器入選,是中國大陸唯一一家上榜的AI硬件創(chuàng)業(yè)公司。
寒武紀(jì)目前有三條產(chǎn)品線:首先是智能終端處理器IP授權(quán),智能IP指令集可授權(quán)集成到手機(jī)、安防、可穿戴設(shè)備等終端芯片中,客戶包括國內(nèi)頂尖SoC廠商,現(xiàn)已開始投入市場。其次,在智能云服務(wù)器芯片領(lǐng)域,作為PCIE加速卡插在云服務(wù)器上,客戶主要是國內(nèi)的知名服務(wù)器廠商。第三,家用智能服務(wù)機(jī)器人芯片:從智能玩具、智能助手入手,使服務(wù)機(jī)器人獨(dú)立具備看聽說的能力??蛻羰歉黝愊掠螜C(jī)器人廠商,產(chǎn)品的推出將比智能云服務(wù)器芯片更晚一些。
華為麒麟970:號稱全球首款A(yù)I處理器
華為聲稱麒麟970是全球第一款人工智能系統(tǒng)級芯片,Kirin 970選擇了異構(gòu)計算架構(gòu)來大幅提升AI的運(yùn)算能力,內(nèi)置獨(dú)立的神經(jīng)網(wǎng)絡(luò)處理單元。據(jù)說這種專用硬件處理單元源自寒武紀(jì)NPU IP授權(quán),專門用于機(jī)器學(xué)習(xí)和一般的AI應(yīng)用程序。
Kirin970采用臺積電10ns芯片組制程技術(shù)(耗電量減少20%,體積減少 40%),主要規(guī)格如下:8 核心 CPU(時脈最高達(dá)2.4GHz),新世代12核心GPU(Mali G72MP12)、Kirin NPU(1.92T FP16 OPS)、Image DSP(512bit SIMD)、Dual Camera ISP(具備臉部、動作偵測)、HiFi Audio(32bit/384k)、UFS 2.1、安全引擎(inSE&TEE)、全球通用4.5G數(shù)據(jù)機(jī)(1.2Gbps@LTE Cat 18)、4K影像(HDR10)、LPDDR 4X、i7感應(yīng)處理器。
華為宣布將在美國上市的Huawei Mate 10 Pro會搭載麒麟970芯片,另外華為榮耀(Honor V10)也會采用。相較之下,高通驍龍845也把大部分焦點(diǎn)集中在AI,而普及率無疑會比麒麟970高,驍龍845支持眾多Android 旗艦智能手機(jī),當(dāng)中包括三星、Sony、LG 和小米的高端產(chǎn)品。
與華為麒麟970芯片不同的是,高通是在通用平臺內(nèi)做內(nèi)核優(yōu)化,它沒有獨(dú)立的神經(jīng)網(wǎng)絡(luò)引擎單元,而是更彈性的機(jī)器學(xué)習(xí)架構(gòu),分布在CPU、GPU、DPS等每個單元上,從而可以針對不同移動終端彈性調(diào)用各個處理單元。
對于兩者方向的不同,高通方面認(rèn)為集成更加有效。但華為認(rèn)為,鑒于手機(jī)對能耗的要求,獨(dú)立NPU處理單元未來一定是手機(jī)處理器的必由之路,從現(xiàn)在看只有蘋果和華為做了獨(dú)立的NPU。
最近從微博流出Kirin 970與Snapdragon 845跑分對比,聲稱前者跑分比后者還要高出7%,但麒麟970、驍龍845的差異其實不大,且網(wǎng)絡(luò)還只秀出幾個獨(dú)立測試結(jié)果,并非完整跑分的平均值,顯示差距甚至可能比表面看來還小。同樣地,就算處理器的跑分很高,實地運(yùn)作的績效還是不一定,尤其在差距如此微小的情況下。話雖如此,外泄的跑分結(jié)果依舊暗示華為旗艦處理器的運(yùn)算能力有可能很快會追上高通。
高通驍龍845:今年將在高端Android手機(jī)中廣泛應(yīng)用
驍龍845采用最新的八核Kryo 385定制架構(gòu),性能比驍龍835的Kryo 280提升25%,三星第二代10nm工藝制程,主頻最高為2.8GHz;其次驍龍845集成的Adreno 630 GPU性能比驍龍835的Adreno 540提升30%,功耗降低30%。另外,驍龍845集成了第二代千兆級LTE Modem——X20調(diào)制解調(diào)器,比驍龍835的X16速度提升20%,其集成的全新Hexagon 685 DSP與Spectra 280 ISP全面提升拍照功能。
從微博發(fā)布的驍龍845和麒麟970參數(shù)規(guī)格對比看出,驍龍845核心發(fā)生巨大升級,采用全新高端大核心A75與A53組合,GPU升級為Adreno 630,三星10nm LPE制程工藝。而麒麟970繼續(xù)采用A73核心與A53核心,GPU型號未知,同樣采用10nm工藝,由臺積電代工。
三星Exynos 9810:蘋果A11的最強(qiáng)對手?
三星Exynos9810處理器采用其第三代自研M3架構(gòu),擁有4個2.9GHz的M3大核和4個1.9GHz的A55小核,依然是10nm(FinFET)的制程工藝。10nm也是目前蘋果A11、驍龍845和麒麟970都在采用的制程工藝。
GPU方面,Exynos9810采用最新的Mali-G72,采用了18顆核心(MP18),預(yù)計工作頻率在700MHz。Mali-G72是ARM去年發(fā)布的基于Bifrost架構(gòu)的圖形處理器,在更小面積與更低功耗的基礎(chǔ)上,提供更強(qiáng)大的效能。采用Mali-G72的設(shè)備,整體圖形性能是前一代的1.4倍。能效提升25%,芯片面積效能提升20%,機(jī)器學(xué)習(xí)效率提升17%。
在人工智能方面,支持人臉檢測的Bixby變得更加聰明?;谏窠?jīng)網(wǎng)絡(luò)的深度學(xué)習(xí),新的處理器能夠通過快速圖像搜索和分類精確識別照片中的人或物,以進(jìn)行快速圖像搜索或分類,或者通過深度感測,在3D中掃描用戶的臉部以進(jìn)行混合式人臉檢測。通過利用硬件和軟件,混合式人臉檢測功能可以實現(xiàn)真實的人臉跟蹤檢測,從而在使用人臉進(jìn)行設(shè)備解鎖時候更加安全。
英偉達(dá)DRIVE Xavier:為自動駕駛提供強(qiáng)勁驅(qū)動力
在CES會展上搶盡風(fēng)頭的英偉達(dá)展示了DRIVE Xavier,這個AI芯片由一個特別定制的8核CPU、一個全新的512核Volta GPU、一個全新深度學(xué)習(xí)加速器、全新計算機(jī)視覺加速器、以及全新8K HDR視頻處理器而打造。DRIVE Xavier可以提供更高的處理能力,運(yùn)行功率更低,每秒可運(yùn)行30 萬億次計算,功耗卻僅為30瓦,能效比上一代架構(gòu)高出15倍。TensorCore、視頻識別和流處理、物體定位、路徑規(guī)劃等所有AI計算任務(wù)都能在上面飛快跑起來,據(jù)稱首批樣品2018年第一季度就可以交付給客戶。英偉達(dá)CEO黃仁勛表示,中國市場是全球最大市場,所有的系統(tǒng)在設(shè)計時都考慮到了本地化和中國客戶的需求,比如百度的每輛自動駕駛車輛都搭載了Drive Xavier。
Intel Loihi:挑戰(zhàn)神經(jīng)擬態(tài)計算難題
為了抵御NVIDIA在人工智能領(lǐng)域的強(qiáng)勢進(jìn)攻,Intel先后收購了FPGA芯片巨頭Altera、AI初創(chuàng)公司Nervana Systems,以及以色列自動駕駛芯片公司Mobileye等。Intel在CES上向各界展示了其自主學(xué)習(xí)神經(jīng)擬態(tài)芯片“Loihi”,這是在收購以上技術(shù)公司并匯集眾多研究成果后推出的神經(jīng)擬態(tài)芯片。
AI芯片可以分為兩類,一類為人工神經(jīng)網(wǎng)絡(luò),而另一類為神經(jīng)擬態(tài)計算,理論上來說神經(jīng)擬態(tài)計算效能更好,但芯片開發(fā)難度更大,Intel的Loihi采用神經(jīng)擬態(tài)計算這條更難的道路可以看出它希望逆襲NVIDIA的野心。
Loihi采用了架構(gòu)到芯片建模、異步設(shè)計流程以及基于FPGA仿真的圓形算法驗證,具有非常節(jié)能的特點(diǎn),擁有128個核+3個低功耗X86核、可編程的學(xué)習(xí)規(guī)則等特點(diǎn)。
Intel介紹Loihi芯片擁有自主學(xué)習(xí)功能,并且可以利用數(shù)據(jù)來學(xué)習(xí)和推斷,隨著時間延長能變得更加智能,可以應(yīng)用于汽車和工業(yè)生產(chǎn)等領(lǐng)域,不過說了這么多優(yōu)點(diǎn),這一切還需要在現(xiàn)實中應(yīng)用以證明它是否具有這些能力,這恰恰是Intel相較NVIDIA的弱點(diǎn),因為當(dāng)前在全球的神經(jīng)網(wǎng)絡(luò)訓(xùn)練系統(tǒng)大多數(shù)都采用NVIDIA的芯片,Intel需要加大力度推廣以在市場份額上趕上NVIDIA。
瑞芯微RK3399Pro:首次采用CPU+GPU+NPU硬件結(jié)構(gòu)設(shè)計
瑞芯微電子(Rockchip)在CES上發(fā)布旗下首款性能超強(qiáng)的AI處理器RK3399Pro,為人工智能領(lǐng)域提供一站式Turnkey解決方案,其NPU運(yùn)算性能高達(dá)2.4TOPs,具高性能、低功耗、開發(fā)易等優(yōu)勢。
RK3399Pro AI芯片采用big.LITTLE大小核CPU架構(gòu),雙核Cortex-A72+四核Cortex-A53,在整體性能、功耗方面具技術(shù)領(lǐng)先性;四核ARM高端GPU Mali-T860,集成更多帶寬壓縮技術(shù),整體性能優(yōu)異。RK3399Pro具備極強(qiáng)的AI運(yùn)算性能,是瑞芯微首次采用CPU+GPU+NPU硬件結(jié)構(gòu)設(shè)計的AI芯片,其集成的NPU融合了瑞芯微在機(jī)器視覺、語音處理、深度學(xué)習(xí)等領(lǐng)域的多年經(jīng)驗。相較傳統(tǒng)芯片,典型深度神經(jīng)網(wǎng)絡(luò)Inception V3、ResNet34、VGG16等模型在RK3399Pro芯片上的運(yùn)行效果表現(xiàn)出眾。
聯(lián)發(fā)科NeuroPilot:廣泛用于消費(fèi)性產(chǎn)品
聯(lián)發(fā)科在CES發(fā)布了NeuroPilot人工智能(AI)平臺,主攻智能手機(jī)、智能家庭、自駕車的終端邊緣運(yùn)算。聯(lián)發(fā)科表示,目前1年約有15億臺消費(fèi)電子產(chǎn)品采用聯(lián)發(fā)科芯片,2018年將整合AI處理器與NeuroPilot SDK軟件開發(fā)套件技術(shù),將AI帶入廣泛的消費(fèi)性產(chǎn)品中。
聯(lián)發(fā)科已在2018年新款Helio手機(jī)芯片中加入AI運(yùn)算核心,現(xiàn)在已為智能語音助理、智能電視、自駕車打造AI解決方案,并在CES中展示具體跨平臺應(yīng)用,包括Amazon Echo智能語音助理、Android O智能電視、BelkinWemo智能型插座、以及聯(lián)發(fā)科全網(wǎng)覆蓋家庭路由器等。
華夏芯“北極星”:完全自主知識產(chǎn)權(quán)的AI芯片平臺
華夏芯發(fā)布全自主IP的AI芯片平臺——“北極星”,這是國內(nèi)首次發(fā)布的CPU、DSP和AI全部具有自主知識產(chǎn)權(quán)的平臺型人工智能芯片?!氨睒O星”是一款面向多種應(yīng)用的SoC芯片,不但有負(fù)責(zé)神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)的AI專用處理器,還集成了高性能的CPU/DSP,其能力可以延伸到多個產(chǎn)品領(lǐng)域,諸如智能輔助駕駛、智能安防監(jiān)控、機(jī)器人、計算機(jī)視覺、車載和商用雷達(dá)探測、語音識別等嵌入式人工智能應(yīng)用。此外,還能延伸到工業(yè)4.0、現(xiàn)場控制、邊緣計算、智能硬件、智慧家居等在內(nèi)的多個其它領(lǐng)域,是一款市場適應(yīng)性極強(qiáng)的異構(gòu)計算和人工智能平臺型芯片。
“北極星”可以在單芯片上采用編程擴(kuò)展的方法實現(xiàn)復(fù)雜度很高的現(xiàn)場控制與決策、數(shù)字信號處理、圖像信號處理、基于神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)和特征提取、多線程并行計算等多種功能。“北極星”芯片采用臺積電28nm工藝制程,將于2018年上半年量產(chǎn)。
地平線“征程”和“旭日”:嵌入式人工智能視覺芯片
去年獲得Intel一億美元投資的地平線推出了征程(Journey)和旭日(Sunrise)兩款處理器,都屬于嵌入式人工智能視覺芯片,分別面向智能駕駛和智能攝像頭。
這兩款芯片性能可達(dá)到1Tops,實時處理1080P@30幀,每幀可同時對200個目標(biāo)進(jìn)行檢測、跟蹤、識別。典型功耗做到1.5W。兩款芯片采用關(guān)注模型(Attention Engine)+認(rèn)知模型(Cognition Engine)的數(shù)據(jù)處理流模式。通過這一個組合算法,芯片的計算速度可以10倍以上。通過邊緣學(xué)習(xí),模型可以不斷提升自己,錯誤率降低在50%以上。此外,兩款芯片利用彈性張量計算核,地平線人工智能處理器的乘法器利用率接近100%。
征程1.0處理器具備同時對形容、機(jī)動車、非機(jī)動車、車道線、交通標(biāo)志牌、紅綠燈等多類目標(biāo)進(jìn)行精準(zhǔn)實時檢測與識別的處理能力,可支持L2級別的輔助駕駛系統(tǒng)旭日1.0系列處理器集合了深度學(xué)習(xí)算法,支持在前段實現(xiàn)大規(guī)模人臉檢測跟蹤、視頻結(jié)構(gòu)化,可應(yīng)用于智能城市、智能商業(yè)等場景。
-
AI
+關(guān)注
關(guān)注
87文章
30894瀏覽量
269085 -
英偉達(dá)
+關(guān)注
關(guān)注
22文章
3776瀏覽量
91103 -
寒武紀(jì)
+關(guān)注
關(guān)注
11文章
186瀏覽量
73890
原文標(biāo)題:寒武紀(jì)/華為/高通等十款A(yù)I處理器對比,誰更強(qiáng)?
文章出處:【微信號:mcu168,微信公眾號:硬件攻城獅】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論