隨著消費(fèi)電子、生物醫(yī)學(xué)和物聯(lián)網(wǎng)/工業(yè)物聯(lián)網(wǎng)市場(chǎng)中始終監(jiān)聽設(shè)備的爆炸式增長(zhǎng),似乎每個(gè)人都在嘗試使用模擬來(lái)節(jié)省設(shè)計(jì)中的功耗。隨著使用“模擬內(nèi)存計(jì)算”來(lái)降低處理器功耗的新型機(jī)器學(xué)習(xí)(ML)數(shù)字芯片,半導(dǎo)體供應(yīng)商正在發(fā)明新的方法來(lái)利用模擬計(jì)算的固有功耗和計(jì)算效率。那么,有什么障礙呢?事實(shí)是,盡管這些芯片利用模擬電路的固有優(yōu)勢(shì)來(lái)節(jié)省芯片內(nèi)的功耗以進(jìn)行神經(jīng)網(wǎng)絡(luò)處理,但它們最終是在數(shù)字域中對(duì)數(shù)字?jǐn)?shù)據(jù)運(yùn)行的數(shù)字處理芯片,這意味著它們只能為系統(tǒng)提供有限的節(jié)能效果。幸運(yùn)的是,一種更全面地使用模擬計(jì)算的新系統(tǒng)級(jí)方法(模擬機(jī)器學(xué)習(xí) (analogML) 內(nèi)核)現(xiàn)在可以在系統(tǒng)級(jí)別實(shí)現(xiàn)更高的電源效率。
雖然模擬內(nèi)存計(jì)算和模擬ML有時(shí)都被標(biāo)記為“模擬計(jì)算”,但它們絕不是一回事。設(shè)計(jì)人員需要了解模擬內(nèi)存計(jì)算和 analogML 內(nèi)核之間的區(qū)別,以便創(chuàng)建更節(jié)能的終端設(shè)備?
內(nèi)存模擬計(jì)算的芯片級(jí)效率
模擬內(nèi)存計(jì)算通常是指在數(shù)字機(jī)器學(xué)習(xí)處理器的神經(jīng)網(wǎng)絡(luò)中使用模擬電路,以便以較低的功耗執(zhí)行乘法累加 (MAC) 功能。但是,利用這種方法的芯片仍然是在標(biāo)準(zhǔn)數(shù)字處理范式中運(yùn)行的時(shí)鐘處理器,需要立即將所有模擬傳感器數(shù)據(jù)數(shù)字化,無(wú)論是否相關(guān)。事實(shí)上,使用模擬內(nèi)存計(jì)算的芯片實(shí)際上需要在確定數(shù)據(jù)的重要性之前進(jìn)行三次單獨(dú)的數(shù)據(jù)轉(zhuǎn)換。傳感器數(shù)據(jù)立即轉(zhuǎn)換為數(shù)字以進(jìn)行初始處理(數(shù)字化優(yōu)先架構(gòu)),然后在芯片內(nèi)轉(zhuǎn)換為模擬以用于MAC功能,最后,它們?cè)谛酒瑑?nèi)轉(zhuǎn)換為數(shù)字,用于推理,分類和其他功能所需的額外數(shù)字處理。因此,大量的數(shù)據(jù)轉(zhuǎn)換,但實(shí)際的模擬處理并不多。
雖然模擬內(nèi)存計(jì)算可能會(huì)降低單個(gè)推理芯片的功耗,但它僅以非常有限的方式使用模擬,因此它只能為整個(gè)系統(tǒng)提供同樣有限的功耗降低。
通過(guò)模擬機(jī)器學(xué)習(xí)實(shí)現(xiàn)系統(tǒng)級(jí)效率
相比之下,analogML 內(nèi)核完全在模擬域內(nèi)運(yùn)行,無(wú)需時(shí)鐘,并在數(shù)字化任何數(shù)據(jù)之前使用原始模擬傳感器數(shù)據(jù)進(jìn)行推理和分類。analogML 內(nèi)核集成到始終偵聽的設(shè)備中,在花費(fèi)任何功率進(jìn)行單次數(shù)據(jù)轉(zhuǎn)換之前確定數(shù)據(jù)的重要性。我們稱之為“先分析”,因?yàn)槟MML內(nèi)核使數(shù)字系統(tǒng)保持關(guān)閉,除非檢測(cè)到相關(guān)數(shù)據(jù)。
與集成模擬內(nèi)存計(jì)算的 ML 芯片相比,analogML 內(nèi)核處理模擬傳感器數(shù)據(jù)的更簡(jiǎn)化方法對(duì)系統(tǒng)級(jí)效率具有重大影響。
例如,在典型的語(yǔ)音優(yōu)先系統(tǒng)中,analogML 內(nèi)核在 100% 的時(shí)間內(nèi)處于開啟狀態(tài),在始終監(jiān)聽模式下僅消耗 10μA 的電流,以確定哪些數(shù)據(jù)是重要的(分析優(yōu)先架構(gòu)),然后再在數(shù)字化上花費(fèi)任何功率。這使系統(tǒng)的其余部分保持睡眠狀態(tài),直到檢測(cè)到相關(guān)數(shù)據(jù)。與在數(shù)字域中 100% 運(yùn)行(數(shù)字化優(yōu)先架構(gòu))并消耗高達(dá) 3000-4000μA 的更傳統(tǒng)的 ML 芯片相比,使用 analogML 的分析優(yōu)先方法可將電池壽命延長(zhǎng)多達(dá) 10 倍。這就是可持續(xù)使用數(shù)天而不是數(shù)小時(shí)的智能耳塞與一次電池充電可持續(xù)數(shù)年而不是數(shù)月的聲控電視遙控器之間的區(qū)別。
AnalogML 核心中有什么?
深入了解 analogML 內(nèi)核的幕后,可以揭示模擬內(nèi)存計(jì)算與 analogML 內(nèi)核之間的區(qū)別,模擬內(nèi)存計(jì)算僅用于神經(jīng)網(wǎng)絡(luò),后者由多個(gè)軟件控制的模擬處理塊組成,我們可以為各種分析優(yōu)先應(yīng)用程序啟用、重新配置和調(diào)整。這些模塊可以在需要時(shí)獨(dú)立供電,可實(shí)現(xiàn)一系列功能。
傳感器接口—可以為特定傳感器類型(麥克風(fēng)、加速度計(jì)等)合成接口電路
模擬特征提取 — 從原始模擬傳感器數(shù)據(jù)中挑選出顯著特征,大大減少進(jìn)入神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)量
模擬神經(jīng)網(wǎng)絡(luò) — 高效、占用空間小、可編程的模擬推理模塊
模擬數(shù)據(jù)壓縮—連續(xù)收集和壓縮模擬傳感器數(shù)據(jù)支持低功耗數(shù)據(jù)緩沖
模擬范式轉(zhuǎn)變
AnalogML 遠(yuǎn)遠(yuǎn)超出了使用一點(diǎn)模擬計(jì)算來(lái)節(jié)省整個(gè) ML 芯片計(jì)算的一小部分,以節(jié)省功耗。它是一個(gè)完整的模擬前端解決方案,在數(shù)據(jù)仍然是模擬數(shù)據(jù)的情況下,使用接近零的功耗來(lái)確定信號(hào)鏈中最早點(diǎn)的數(shù)據(jù)的重要性,以最大限度地減少流經(jīng)系統(tǒng)的數(shù)據(jù)量和數(shù)字系統(tǒng)(ADC/MCU/DSP)的開啟時(shí)間。在某些應(yīng)用中,例如玻璃破碎檢測(cè),事件可能每十年發(fā)生一次(或永遠(yuǎn)不會(huì)發(fā)生),使用 analogML 內(nèi)核使數(shù)字系統(tǒng)在 99+% 的時(shí)間內(nèi)保持關(guān)閉,可以將電池壽命延長(zhǎng)數(shù)年。這開辟了一類新的持久遠(yuǎn)程應(yīng)用程序,如果所有數(shù)據(jù)(無(wú)論是否相關(guān))在處理之前都已數(shù)字化,則無(wú)法實(shí)現(xiàn)這些應(yīng)用程序。
底線是所有模擬計(jì)算都不相等。無(wú)論芯片中包含多少模擬處理以降低其功耗,除非該芯片在模擬域中運(yùn)行,在模擬數(shù)據(jù)上,它不會(huì)做我們知道在系統(tǒng)中節(jié)省最多功耗的一件事 - 數(shù)字處理更少的數(shù)據(jù)。
審核編輯:郭婷
-
處理器
+關(guān)注
關(guān)注
68文章
19313瀏覽量
230052 -
物聯(lián)網(wǎng)
+關(guān)注
關(guān)注
2909文章
44704瀏覽量
374019 -
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8422瀏覽量
132723
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論