SoC 設(shè)計(jì)與應(yīng)用技術(shù)領(lǐng)導(dǎo)廠商Socionext Inc.(以下“公司”)宣布成功發(fā)開一款集成有量化深度神經(jīng)網(wǎng)絡(luò)(DNN)技術(shù)的原型芯片,可為小型、低功耗邊緣計(jì)算設(shè)備提供先進(jìn)的AI處理。
受日本新能源與產(chǎn)業(yè)技術(shù)綜合開發(fā)機(jī)構(gòu)(NEDO)委托,Socionext參與了以《先進(jìn)的低功耗AI-Edge LSI技術(shù)開發(fā)》為課題的項(xiàng)目研究,成功完成了結(jié)合量化DNN技術(shù)的芯片測(cè)試,并確認(rèn)了其運(yùn)行和性能。該測(cè)試芯片搭載有“量化DNN引擎”,能以高速、低功耗執(zhí)行深度學(xué)習(xí)推理處理。
目前,基于通用GPU的邊緣計(jì)算處理器無(wú)法滿足日益增長(zhǎng)的人工智能處理需求。以搭載有圖像識(shí)別和分析功能的邊緣計(jì)算設(shè)備為例,其系統(tǒng)功耗和發(fā)熱量與通用GPU相比有明顯增加,不得不通過(guò)提升成本擴(kuò)容設(shè)備等方式滿足AI處理需求。
量化DNN引擎
為提高AI處理性能并減少系統(tǒng)功耗,Socionext開發(fā)了一款采用“量化DNN技術(shù)”的專有體系架構(gòu),它減少了深度學(xué)習(xí)所需的參數(shù)和激活位。該體系架構(gòu)將1-bit (binary)、2-bit (ternary) 低比特率技術(shù)、傳統(tǒng)8-bit技術(shù)及公司獨(dú)創(chuàng)的參數(shù)壓縮技術(shù)結(jié)合,以較少的計(jì)算資源執(zhí)行大量計(jì)算處理,并減少數(shù)據(jù)量。
除此以外,Socionext還開發(fā)了一種新穎的片上存儲(chǔ)技術(shù),可提供高效的數(shù)據(jù)傳輸,從而減少深度學(xué)習(xí)通常所需的大容量片上或外部存儲(chǔ)器。
通過(guò)結(jié)合上述新技術(shù),Socionext將AI芯片及“DNN引擎”原型化,并確認(rèn)了其功能和性能。 原型化芯片通過(guò)“YOLO v3”以不到5W的低功耗及30fps的速度實(shí)現(xiàn)了目標(biāo)檢測(cè),其效率是通用GPU的10倍。 此外,該芯片還配備了高性能、低功耗的Arm Cortex-A系列CPU,無(wú)需外部處理器即可以單芯片執(zhí)行整個(gè)AI處理。
深度學(xué)習(xí)軟件開發(fā)環(huán)境
除硬件開發(fā)外,Socionext還構(gòu)建了深度學(xué)習(xí)軟件開發(fā)環(huán)境,通過(guò)結(jié)合TensorFlow作為基本框架,允許開發(fā)人員用原始低bit位進(jìn)行量化感知訓(xùn)練(Quantization Aware Training)和訓(xùn)練后量化(Post Training Quantization)。 開發(fā)新芯片時(shí),用戶可以選擇最佳量化技術(shù)并將其應(yīng)用于各種神經(jīng)網(wǎng)絡(luò)中執(zhí)行高精度處理,例如在小型低功耗邊緣設(shè)備上增設(shè)最先進(jìn)的計(jì)算機(jī)視覺功能,應(yīng)用于高級(jí)駕駛員輔助系統(tǒng)(ADAS)、監(jiān)控?cái)z像頭和工廠自動(dòng)化等場(chǎng)景。
Socionext目前正在通過(guò)對(duì)該原型芯片進(jìn)行評(píng)估進(jìn)一步調(diào)整電路優(yōu)化其性能。公司將繼續(xù)與合作伙伴一起共同開發(fā)并交付AI-Edge LSI最終產(chǎn)品,完成NEDO的委托項(xiàng)目。
-
AI
+關(guān)注
關(guān)注
87文章
31054瀏覽量
269408 -
dnn
+關(guān)注
關(guān)注
0文章
60瀏覽量
9058
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論