穿越小说完本 ,千年殇,玄幻小说完本

【AI對算力的需求劇增，芯片是算力的基礎(chǔ)】

AI的三大關(guān)鍵基礎(chǔ)要素是 數(shù)據(jù)、算法和算力 。隨著云計算的廣泛應(yīng)用，特別是深度學(xué)習(xí)成為當(dāng)前AI研究和運用的主流方式，AI對于算力的要求不斷快速提升。隨著邊緣計算的發(fā)展，AI在邊緣端的形式越來越多樣化，數(shù)量越來越多。

數(shù)據(jù)是AI算法的“飼料”

在如今這個時代，無時無刻不在產(chǎn)生數(shù)據(jù)（包括語音、文本、影像等等），AI產(chǎn)業(yè)的飛速發(fā)展，也萌生了大量垂直領(lǐng)域的數(shù)據(jù)需求。在AI技術(shù)當(dāng)中，數(shù)據(jù)相當(dāng)于AI算法的“飼料”。

目前，數(shù)據(jù)標(biāo)注是AI的上游基礎(chǔ)產(chǎn)業(yè)，以人工標(biāo)注為主，機器標(biāo)注為輔。最常見的數(shù)據(jù)標(biāo)注類型有五種：屬性標(biāo)注（給目標(biāo)對象打標(biāo)簽）、框選標(biāo)注（框選出要識別的對象）、輪廓標(biāo)注（比框選標(biāo)注更加具體，邊緣更加精確）、描點標(biāo)注（標(biāo)注出目標(biāo)對象上細(xì)致的特征點）、其他標(biāo)注（除以上標(biāo)注外的數(shù)據(jù)標(biāo)注類型）。AI算法需要通過數(shù)據(jù)訓(xùn)練不斷完善，而數(shù)據(jù)標(biāo)注是大部分AI算法得以有效運行的關(guān)鍵環(huán)節(jié)。

算法是AI的背后“推手”

AI算法是數(shù)據(jù)驅(qū)動型算法，是AI背后的推動力量。

今天“AI熱潮”的出現(xiàn)主要由于機器學(xué)習(xí)，尤其是機器學(xué)習(xí)中的深度學(xué)習(xí)技術(shù)取得了巨大進(jìn)展，并在大數(shù)據(jù)和大算力的支持下發(fā)揮巨大的威力。

當(dāng)前最具代表性深度學(xué)習(xí)算法模型有深度神經(jīng)網(wǎng)絡(luò)（Deep Neural Network，簡稱DNN）、循環(huán)神經(jīng)網(wǎng)絡(luò)（Recurrent Neural Network，簡稱RNN）、卷積神經(jīng)網(wǎng)絡(luò)（Convolutional Neural Network，簡稱CNN）。談到深度學(xué)習(xí)，DNN和RNN就是深度學(xué)習(xí)的基礎(chǔ)。DNN內(nèi)部的神經(jīng)網(wǎng)絡(luò)層可以分為三類，輸入層，隱藏層和輸出層, 一般來說第一層是輸入層，最后一層是輸出層，而中間的層數(shù)都是隱藏層。DNN可以理解為有很多隱藏層的神經(jīng)網(wǎng)絡(luò)，是非常龐大的系統(tǒng)，訓(xùn)練出來需要很多數(shù)據(jù)、很強的算力進(jìn)行支撐。

算力是基礎(chǔ)設(shè)施

AI算法模型對于算力的巨大需求，推動了今天芯片業(yè)的發(fā)展。據(jù)OpenAI測算,2012年開始,全球AI訓(xùn)練所用的計算量呈現(xiàn)指數(shù)增長,平均每3.43個月便會翻一倍,目前計算量已擴大30萬倍,遠(yuǎn)超算力增長速度。

在AI技術(shù)當(dāng)中，算力是算法和數(shù)據(jù)的基礎(chǔ)設(shè)施，支撐著算法和數(shù)據(jù)，進(jìn)而影響著AI的發(fā)展，算力的大小代表著對數(shù)據(jù)處理能力的強弱。

算力源于芯片，通過基礎(chǔ)軟件的有效組織，最終釋放到終端應(yīng)用上，作為算力的關(guān)鍵基礎(chǔ)，AI芯片的性能決定著AI產(chǎn)業(yè)的發(fā)展。

AI運算指以“深度學(xué)習(xí)” 為代表的神經(jīng)網(wǎng)絡(luò)算法，需要系統(tǒng)能夠高效處理大量非結(jié)構(gòu)化數(shù)據(jù)（文本、視頻、圖像、語音等）。 需要硬件具有高效的線性代數(shù)運算能力 ，計算任務(wù)具有：單位計算任務(wù)簡單，邏輯控制難度要求低，但并行運算量大、參數(shù)多的特點。對于芯片的多核并行運算、片上存儲、帶寬、低延時的訪存等提出了較高的需求。

自2012年以來，人工智能訓(xùn)練任務(wù)所需求的算力每 3.43 個月就會翻倍，大大超越了芯片產(chǎn)業(yè)長期存在的摩爾定律（每 18個月芯片的性能翻一倍）。針對不同應(yīng)用場景，AI芯片還應(yīng)滿足：對主流AI算法框架兼容、可編程、可拓展、低功耗、體積及價格等需求。

【AI芯片包括：GPU、FPGA、ASIC、類腦芯片】

從技術(shù)架構(gòu)來看，AI芯片主要分為圖形處理器（GPU）、現(xiàn)場可編程門陣列（FPGA）、專用集成電路（ASIC）、類腦芯片四大類。其中，GPU是較為成熟的通用型人工智能芯片，F(xiàn)PGA和ASIC則是針對人工智能需求特征的半定制和全定制芯片，類腦芯片顛覆傳統(tǒng)馮諾依曼架構(gòu)，是一種模擬人腦神經(jīng)元結(jié)構(gòu)的芯片，類腦芯片的發(fā)展尚處于起步階段。

GPU 通用性強、速度快、效率高，特別適合用在深度學(xué)習(xí)訓(xùn)練方面，但是性能功耗比較低。
FPGA 具有低能耗、高性能以及可編程等特性，相對于 CPU 與 GPU 有明顯的性能或者能耗優(yōu)勢，但對使用者要求高。
ASIC 可以更有針對性地進(jìn)行硬件層次的優(yōu)化，從而獲得更好的性能、功耗比。但是ASIC 芯片的設(shè)計和制造需要大量的資金、較長的研發(fā)周期和工程周期，而且深度學(xué)習(xí)算法仍在快速發(fā)展，若深度學(xué)習(xí)算法發(fā)生大的變化，F(xiàn)PGA 能很快改變架構(gòu)，適應(yīng)最新的變化，ASIC 類芯片一旦定制則難于進(jìn)行修改。

CPU (CentralProcessing Unit)能不能算？為什么CPU不能勝任？

中央處理器作為計算機系統(tǒng)的運算和控制核心，是信息處理、程序運行的最終執(zhí)行單元，CPU 是對計算機的所有硬件資源（如存儲器、輸入輸出單元）進(jìn)行控制調(diào)配、執(zhí)行通用運算的核心硬件單元。

優(yōu)點：CPU有大量的緩存和復(fù)雜的邏輯控制單元，非常擅長邏輯控制、串行的運算

缺點：不擅長復(fù)雜算法運算和處理并行重復(fù)的操作。

對于AI芯片來說，算力最弱的是cpu。雖然cpu主頻最高，但是單顆也就8核,16核的樣子，一個核3.5g,16核也就56g，再考慮指令周期，每秒最多也就30g次乘法。

intel、AMD、還有眾多運用ARM內(nèi)核的芯片廠家。

1、GPU (GraphicsProcessing Unit)

圖形處理器，又稱顯示核心、視覺處理器、顯示芯片，是一種專門在個人電腦、工作站、游戲機和一些移動設(shè)備（如平板電腦、智能手機等）上做圖像和圖形相關(guān)運算工作的微處理器。

目前， GPU 已經(jīng)發(fā)展到較為成熟的階段。谷歌、 FACEBOOK、微軟、 Twtter和百度等公司都在使用GPU 分析圖片、視頻和音頻文件，以改進(jìn)搜索和圖像標(biāo)簽等應(yīng)用功能。此外，很多汽車生產(chǎn)商也在使用GPU芯片發(fā)展無人駕駛。不僅如此， GPU也被應(yīng)用于VR/AR 相關(guān)的產(chǎn)業(yè)。

但是 GPU也有一定的局限性。深度學(xué)習(xí)算法分為訓(xùn)練和推斷兩部分， GPU 平臺在算法訓(xùn)練上非常高效。但在推斷中對于單項輸入進(jìn)行處理的時候，并行計算的優(yōu)勢不能完全發(fā)揮出來。

優(yōu)點：提供了多核并行計算的基礎(chǔ)結(jié)構(gòu)，且核心數(shù)非常多，可以支撐大量數(shù)據(jù)的并行計算，擁有更高的浮點運算能力。

缺點：管理控制能力（最弱），功耗（最高）。

生產(chǎn)廠商：NVIDIA（英偉達(dá)）、AMD

當(dāng)前國產(chǎn)GPU產(chǎn)業(yè)鏈進(jìn)口替代：設(shè)計環(huán)節(jié)的一些公司，景嘉微、芯動科技、摩爾線程、沐曦科技等企業(yè)正在不斷追趕。

2、FPGA（Field Programmable Gate Array）

FPGA是在PAL、GAL等可編程器件的基礎(chǔ)上進(jìn)一步發(fā)展的產(chǎn)物。它是作為專用集成電路（ASIC）領(lǐng)域中的一種半定制電路而出現(xiàn)的，既解決了定制電路的不足，又克服了原有可編程器件門電路數(shù)有限的缺點。

優(yōu)點：可以無限次編程，延時性比較低，同時擁有流水線并行和數(shù)據(jù)并行（GPU只有數(shù)據(jù)并行）、實時性最強、靈活性最高。

FPGA可同時進(jìn)行數(shù)據(jù)并行和任務(wù)并行計算，在處理特定應(yīng)用時有更加明顯的效率提升。對于某個特定運算，通用 CPU可能需要多個時鐘周期，而 FPGA 可以通過編程重組電路，直接生成專用電路，僅消耗少量甚至一次時鐘周期就可完成運算。

此外，由于 FPGA的靈活性，很多使用通用處理器或 ASIC難以實現(xiàn)的底層硬件控制操作技術(shù)，利用 FPGA 可以很方便地實現(xiàn)。這個特性為算法的功能實現(xiàn)和優(yōu)化留出了更大空間。同時FPGA 一次性成本(光刻掩模制作成本)遠(yuǎn)低于ASIC，在芯片需求還未成規(guī)模、深度學(xué)習(xí)算法暫未穩(wěn)定，需要不斷迭代改進(jìn)的情況下，利用 FPGA 芯片具備可重構(gòu)的特性來實現(xiàn)半定制的人工智能芯片是最佳選擇之一。

功耗方面，從體系結(jié)構(gòu)而言， FPGA 也具有天生的優(yōu)勢。傳統(tǒng)的馮氏結(jié)構(gòu)中，執(zhí)行單元(如 CPU 核)執(zhí)行任意指令，都需要有指令存儲器、譯碼器、各種指令的運算器及分支跳轉(zhuǎn)處理邏輯參與運行，而FPGA每個邏輯單元的功能在重編程(即燒入)時就已經(jīng)確定，不需要指令，無需共享內(nèi)存，從而可以極大的降低單位執(zhí)行的功耗，提高整體的能耗比。

缺點：開發(fā)難度大、只適合定點運算、價格比較昂貴

生產(chǎn)廠商：Altera（Intel收購）、Xilinx（AMD收購）

當(dāng)前國產(chǎn)FPGA廠家，復(fù)旦微、紫光同創(chuàng)、安路等公司。AI應(yīng)用對FPGA的速率、規(guī)模等都有很高的要求，國產(chǎn)廠家還在努力中。

3、ASIC（Application Specific IntegratedCircuit）

ASIC,即專用集成電路，指應(yīng)特定用戶要求和特定電子系統(tǒng)的需要而設(shè)計、制造的集成電路。目前用CPLD（復(fù)雜可編程邏輯器件）和 FPGA（現(xiàn)場可編程邏輯陣列）來進(jìn)行ASIC設(shè)計是最為流行的方式之一。

目前以深度學(xué)習(xí)為代表的人工智能計算需求，主要采用GPU、FPGA等已有的適合并行計算的通用芯片來實現(xiàn)加速。在產(chǎn)業(yè)應(yīng)用沒有大規(guī)模興起之時，使用這類已有的通用芯片可以避免專門研發(fā)定制芯片(ASIC)的高投入和高風(fēng)險。但是，由于這類通用芯片設(shè)計初衷并非專門針對深度學(xué)習(xí)，因而天然存在性能、功耗等方面的局限性。隨著人工智能應(yīng)用規(guī)模的擴大，這類問題日益突顯。

GPU作為圖像處理器，設(shè)計初衷是為了應(yīng)對圖像處理中的大規(guī)模并行計算。因此，在應(yīng)用于深度學(xué)習(xí)算法時，有三個方面的局限性：

第一：應(yīng)用過程中無法充分發(fā)揮并行計算優(yōu)勢。深度學(xué)習(xí)包含訓(xùn)練和推斷兩個計算環(huán)節(jié)， GPU 在深度學(xué)習(xí)算法訓(xùn)練上非常高效，但對于單一輸入進(jìn)行推斷的場合，并行度的優(yōu)勢不能完全發(fā)揮。
第二：無法靈活配置硬件結(jié)構(gòu)。GPU 采用 SIMT 計算模式，硬件結(jié)構(gòu)相對固定。目前深度學(xué)習(xí)算法還未完全穩(wěn)定，若深度學(xué)習(xí)算法發(fā)生大的變化， GPU 無法像 FPGA 一樣可以靈活的配制硬件結(jié)構(gòu)。
第三：運行深度學(xué)習(xí)算法能效低于FPGA。

盡管 FPGA 倍受看好，甚至類似百度大腦這樣的一些云計算平臺，也是基于 FPGA 平臺研發(fā)，但其畢竟不是專門為了適用深度學(xué)習(xí)算法而研發(fā)，實際應(yīng)用中也存在諸多局限：

第一：基本單元的計算能力有限。為了實現(xiàn)可重構(gòu)特性， FPGA 內(nèi)部有大量極細(xì)粒度的基本單元，但是每個單元的計算能力(主要依靠 LUT 查找表)都遠(yuǎn)遠(yuǎn)低于 CPU 和 GPU 中的 ALU 模塊。
第二：計算資源占比相對較低。為實現(xiàn)可重構(gòu)特性， FPGA 內(nèi)部大量資源被用于可配置的片上路由與連線。
第三：速度和功耗相對專用定制芯片(ASIC)仍然存在不小差距。
第四，：FPGA 價格較為昂貴。在規(guī)模放量的情況下單塊 FPGA 的成本要遠(yuǎn)高于專用定制芯片。

因此，隨著人工智能算法和應(yīng)用技術(shù)的日益發(fā)展，以及人工智能專用芯片 ASIC產(chǎn)業(yè)環(huán)境的逐漸成熟，全定制化人工智能 ASIC也逐步體現(xiàn)出自身的優(yōu)勢

優(yōu)點:它作為集成電路技術(shù)與特定用戶的整機或系統(tǒng)技術(shù)緊密結(jié)合的產(chǎn)物，與通用集成電路相比具有體積更小、重量更輕、功耗更低、可靠性提高、性能提高、保密性增強、成本降低等優(yōu)點。

缺點：靈活性不夠，通用性不夠。

主要性能指標(biāo)：功耗、速度、成本

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴