盗墓笔记小说,武道至尊帝临小说,管理书籍排行榜

IBM正在研制一種可兼顧高精度學(xué)習(xí)和低精度推理的深度學(xué)習(xí)芯片。

深度學(xué)習(xí)領(lǐng)域仍在不斷發(fā)展，特別地，專家們認(rèn)識(shí)到如果芯片能夠使用低精度的計(jì)算方式得出近似答案，神經(jīng)網(wǎng)絡(luò)就可以用很少的資源完成大量的計(jì)算。這在移動(dòng)設(shè)備和其他功率受限的設(shè)備中尤其有用。但對(duì)某些任務(wù)，尤其是訓(xùn)練神經(jīng)網(wǎng)絡(luò)去完成某些事情的任務(wù)來說，精確性仍然是必需的。IBM最近在IEEE VLSI研討會(huì)上展示了其最新的解決方案（目前仍然是原型）：一款在上述兩方面都有良好表現(xiàn)的芯片。

訓(xùn)練神經(jīng)網(wǎng)絡(luò)與使用該網(wǎng)絡(luò)執(zhí)行其功能（稱為推理）的需求之間存在脫節(jié)，這對(duì)那些從事于設(shè)計(jì)芯片以加速AI功能的人來說是一個(gè)巨大的挑戰(zhàn)。IBM的新型AI加速器芯片能夠滿足該公司提出的所謂范圍精度（scaled precision）要求。也就是說，它可以在32位、16位，甚至1位或2位模式下進(jìn)行訓(xùn)練和推理。

IBM約克鎮(zhèn)高地（Yorktown Heights）研究中心的杰出技術(shù)人員、該項(xiàng)工作的領(lǐng)導(dǎo)者Kailash Gopalakrishnan解釋說：“在訓(xùn)練中，你能夠使用的最好精度是16位，而在推理中可以應(yīng)用的最好精度是2位。這個(gè)芯片可能涵蓋了目前已知的最佳訓(xùn)練和最好推理。”

該芯片能夠獲得上述表現(xiàn)的原因來自于兩項(xiàng)創(chuàng)新，而這兩項(xiàng)創(chuàng)新的目標(biāo)都是實(shí)現(xiàn)相同的結(jié)果——保持所有處理器組件能夠得到數(shù)據(jù)和工作。

Gopalakrishnan說：“在深度學(xué)習(xí)方面，傳統(tǒng)芯片架構(gòu)面臨的挑戰(zhàn)之一是利用率一般非常低。”也就是說，即使芯片可能具有非常高的峰值性能，通常只有20％到30％的資源能夠被用于解決問題。IBM始終將所有任務(wù)的目標(biāo)定為90％。

利用率低通常是因?yàn)榇嬖谟谛酒車臄?shù)據(jù)流瓶頸。為了突破這些信息障礙，Gopalakrishnan的團(tuán)隊(duì)開發(fā)了一個(gè)“定制”的數(shù)據(jù)流系統(tǒng)。該數(shù)據(jù)流系統(tǒng)是一種網(wǎng)絡(luò)方案，可以加速數(shù)據(jù)從一個(gè)處理引擎到下一個(gè)處理引擎的傳輸過程。它還針對(duì)要處理的是學(xué)習(xí)任務(wù)還是推理任務(wù)以及不同的精度進(jìn)行了優(yōu)化。

第二項(xiàng)創(chuàng)新是使用專門設(shè)計(jì)的“便箋本”形式的片上存儲(chǔ)器，而不是CPU或GPU上的傳統(tǒng)高速緩沖存儲(chǔ)器。構(gòu)建高速緩存是為了遵守某些對(duì)一般計(jì)算有意義的規(guī)則，但會(huì)導(dǎo)致深度學(xué)習(xí)的延遲。例如，在某些情況下，緩存會(huì)將一大塊數(shù)據(jù)推送到計(jì)算機(jī)的主存儲(chǔ)器（強(qiáng)制推送），但如果神經(jīng)網(wǎng)絡(luò)的推理或?qū)W習(xí)過程需要用到該數(shù)據(jù)，則系統(tǒng)將不得不保持等待狀態(tài)，直到可以從主存儲(chǔ)器中檢索到該數(shù)據(jù)。

便箋本遵循不同的規(guī)則。構(gòu)建它的目標(biāo)是為了保持?jǐn)?shù)據(jù)流經(jīng)芯片的處理引擎，并確保數(shù)據(jù)在恰當(dāng)?shù)臅r(shí)間處于正確的位置。為了獲得90％的利用率，IBM必須使設(shè)計(jì)出的便箋本具有巨大的讀/寫帶寬（每秒192千兆字節(jié)）。

由此產(chǎn)生的芯片可以執(zhí)行當(dāng)前所有的三種主要深度學(xué)習(xí)AI：卷積神經(jīng)網(wǎng)絡(luò)（CNN）、多層感知器（MLP）和長-短期記憶（LSTM）。Gopalakrishnan解釋說，這些技術(shù)共同主導(dǎo)了語言、視覺和自然語言處理。在16位精度（尤其是針對(duì)訓(xùn)練）情況下，IBM的新芯片能夠在每秒鐘內(nèi)執(zhí)行1.5萬億次浮點(diǎn)運(yùn)算；在2位精度下（推理的最佳設(shè)置）則躍升到每秒12萬億次運(yùn)算。

Gopalakrishnan指出，由于芯片是采用先進(jìn)的硅CMOS工藝（GlobalFoundries的14納米工藝）制造的，每秒鐘內(nèi)發(fā)生的所有這些操作都被限制在一個(gè)相當(dāng)小的區(qū)域內(nèi)。為了推理出一個(gè)CNN網(wǎng)絡(luò)，該芯片可以在每平方毫米內(nèi)每秒執(zhí)行平均1.33萬億次操作。這個(gè)數(shù)字很重要，“因?yàn)樵诤芏鄳?yīng)用中，你的成本受到尺寸的限制，”他說。

新的架構(gòu)也證明了IBM研究人員幾年來一直在探索的東西：如果以高得多的精度訓(xùn)練神經(jīng)網(wǎng)絡(luò)，真正低精度的推理就無法正常進(jìn)行。Gopalakrishnan說：“當(dāng)?shù)陀?位時(shí)，訓(xùn)練與推理將開始直接相互影響。一個(gè)在16位模式下訓(xùn)練但以1位模式部署的神經(jīng)網(wǎng)絡(luò)系統(tǒng)將出現(xiàn)無法接受的重大錯(cuò)誤。因此，以與最終部署方式類似的精度訓(xùn)練網(wǎng)絡(luò)將帶來最好的結(jié)果。”

尚無任何消息披露這項(xiàng)技術(shù)什么時(shí)候可能以Watson或其他形式進(jìn)行商業(yè)化，但Gopalakrishnan的領(lǐng)導(dǎo)、IBM半導(dǎo)體研究所的副總裁Mukesh Khare表示希望它能夠發(fā)展和改進(jìn)。他說：“這只是冰山一角，我們正在進(jìn)行更多創(chuàng)新。”

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報(bào)投訴

IBM

IBM

+關(guān)注

關(guān)注
3

文章
1760

瀏覽量
74760
深度學(xué)習(xí)

深度學(xué)習(xí)

+關(guān)注

關(guān)注
73

文章
5510

瀏覽量
121334

原文標(biāo)題：IBM正在研制通用型深度學(xué)習(xí)芯片

文章出處：【微信號(hào)：AI_News，微信公眾號(hào)：人工智能快報(bào)】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

評(píng)論

相關(guān)推薦

ADS7142如果保證其高精度呢？

從ADS7142的Datasheet來看，應(yīng)該是一個(gè)16位的高精度AD，但參考的基準(zhǔn)電壓卻是用的電源，那么如果保證其高精度呢？因?yàn)槌Ｓ玫腖DO的精度普遍大于1%且存在溫漂，可如果用基

發(fā)表于 12-16 07:07

GPU深度學(xué)習(xí)應(yīng)用案例

能力，可以顯著提高圖像識(shí)別模型的訓(xùn)練速度和準(zhǔn)確性。例如，在人臉識(shí)別、自動(dòng)駕駛等領(lǐng)域，GPU被廣泛應(yīng)用于加速深度學(xué)習(xí)模型的訓(xùn)練和推理過程。二、自然語言處理自然語言處理（NLP）是深度

發(fā)表于 10-27 11:13 ?435次閱讀

AI大模型與深度學(xué)習(xí)的關(guān)系

人類的學(xué)習(xí)過程，實(shí)現(xiàn)對(duì)復(fù)雜數(shù)據(jù)的學(xué)習(xí)和識(shí)別。AI大模型則是指模型的參數(shù)數(shù)量巨大，需要龐大的計(jì)算資源來進(jìn)行訓(xùn)練和推理。深度學(xué)習(xí)算法為AI大模型

發(fā)表于 10-23 15:25 ?1003次閱讀

物聯(lián)網(wǎng)系統(tǒng)中高精度RTK定位方案的實(shí)現(xiàn)_高精度定位模塊

物聯(lián)網(wǎng)系統(tǒng)中為什么要使用高精度定位模塊物聯(lián)網(wǎng)系統(tǒng)中使用高精度定位模塊的原因主要體現(xiàn)在以下幾個(gè)方面：提高定位精度厘米級(jí)高精度：高精度定位

發(fā)表于 09-26 17:53 ?1429次閱讀

物聯(lián)網(wǎng)系統(tǒng)中<b class='flag-5'>高精度</b>RTK定位方案的實(shí)現(xiàn)_<b class='flag-5'>高精度</b>定位模塊

VS高精度電壓傳感器

? ? ? ? VS系列電壓傳感器是一種量程覆蓋35kV及以下的直流、交流、周期性脈沖以及各種不規(guī)則波形的電壓傳感器，精度高達(dá)0.05%FS、帶寬高達(dá)100kHz，可滿足寬頻帶、高精度電壓測試需求

發(fā)表于 09-19 15:55 ?412次閱讀

深度學(xué)習(xí)編譯器和推理引擎的區(qū)別

深度學(xué)習(xí)編譯器和推理引擎在人工智能領(lǐng)域中都扮演著至關(guān)重要的角色，但它們各自的功能、應(yīng)用場景以及優(yōu)化目標(biāo)等方面存在顯著的差異。以下是對(duì)兩者區(qū)別的詳細(xì)探討。

發(fā)表于 07-17 18:12 ?1298次閱讀

深度神經(jīng)網(wǎng)絡(luò)模型量化的基本方法

深度神經(jīng)網(wǎng)絡(luò)模型量化是深度學(xué)習(xí)領(lǐng)域中的一種重要優(yōu)化技術(shù)，旨在通過減少模型參數(shù)的精度（即從高精度浮點(diǎn)數(shù)如32位浮點(diǎn)數(shù)FP32降低到

發(fā)表于 07-15 11:26 ?721次閱讀

深度學(xué)習(xí)模型量化方法

深度學(xué)習(xí)模型量化是一種重要的模型輕量化技術(shù)，旨在通過減少網(wǎng)絡(luò)參數(shù)的比特寬度來減小模型大小和加速推理過程，同時(shí)盡量保持模型性能。從而達(dá)到把模型部署到邊緣或者低算力設(shè)備上，實(shí)現(xiàn)降本增效的目

發(fā)表于 07-15 11:01 ?518次閱讀

<b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>模型量化方法

什么是高精度定位平板？

高精度定位平板是一種結(jié)合了高精度定位技術(shù)和強(qiáng)大計(jì)算能力的平板電腦，廣泛應(yīng)用于測繪、地理信息系統(tǒng)（GIS）、精準(zhǔn)農(nóng)業(yè)、工程建設(shè)和公共安全等領(lǐng)域。其核心特點(diǎn)在于能夠提供亞米級(jí)甚至厘米級(jí)的定位精度，遠(yuǎn)超

發(fā)表于 06-12 17:53 ?843次閱讀

北斗高精度定位終端的工作原理和精度范圍

北斗高精度定位終端的工作原理主要基于北斗衛(wèi)星導(dǎo)航系統(tǒng)，通過衛(wèi)星信號(hào)的接收、處理和計(jì)算，實(shí)現(xiàn)了對(duì)目標(biāo)位置的精確測量。以下是關(guān)于北斗高精度定位終端工作原理的引文：北斗高精度定位終端?北斗高精度

發(fā)表于 05-28 11:15 ?709次閱讀

幾款高精度時(shí)鐘芯片的規(guī)格選型分析

幾款高精度時(shí)鐘芯片，幾乎很多應(yīng)用都需要精確的計(jì)時(shí)例如銀行系統(tǒng)，安全系統(tǒng)和電能表等。獲得高精度實(shí)時(shí)時(shí)鐘芯片的關(guān)鍵在于:精確頻率振蕩設(shè)備，以及用于控制它們的集成

發(fā)表于 05-13 11:50 ?0次下載

深度解析深度學(xué)習(xí)下的語義SLAM

隨著深度學(xué)習(xí)技術(shù)的興起，計(jì)算機(jī)視覺的許多傳統(tǒng)領(lǐng)域都取得了突破性進(jìn)展，例如目標(biāo)的檢測、識(shí)別和分類等領(lǐng)域。近年來，研究人員開始在視覺SLAM算法中引入深度學(xué)習(xí)技術(shù)，使得

發(fā)表于 04-23 17:18 ?1333次閱讀

友思特應(yīng)用 | 高精度呈現(xiàn)：PCB多類型缺陷檢測系統(tǒng)

高精度呈現(xiàn)！友思特PCB多類型缺陷檢測系統(tǒng)，借由深度學(xué)習(xí)自動(dòng)標(biāo)注功能排查全部微小缺陷，為工業(yè) PCB生產(chǎn)制造提供了先進(jìn)可靠的質(zhì)量保障。

發(fā)表于 04-10 17:51 ?945次閱讀

優(yōu)可測新能源高精度檢測應(yīng)用指南

。這本《新能源高精度檢測應(yīng)用指南》包含了涂布檢測、電池檢測、硅片檢測、鈣鈦礦檢測等應(yīng)用，涵蓋了由微米級(jí)至亞納米級(jí)精度的檢測方案，一本在手，幫您解決新能源高精度檢測

發(fā)表于 03-06 10:30 ?0次下載

電感多少精度算高精度

電感作為電子電路中非常重要的電子元器件之一，我們在選擇電感時(shí)候會(huì)考慮它的精度。電感精度其實(shí)指的是電感值的公差或者容差，這個(gè)參數(shù)對(duì)于確保電路性能的穩(wěn)定性很重要。那么，你知道電感多少精度的算高精度

發(fā)表于 01-23 09:21 ?596次閱讀

在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

搜索歷史

IBM研制可兼顧高精度學(xué)習(xí)和低精度推理的深度學(xué)習(xí)芯片

評(píng)論

ADS7142如果保證其高精度呢？

GPU深度學(xué)習(xí)應(yīng)用案例

AI大模型與深度學(xué)習(xí)的關(guān)系

物聯(lián)網(wǎng)系統(tǒng)中高精度RTK定位方案的實(shí)現(xiàn)_高精度定位模塊

VS高精度電壓傳感器

深度學(xué)習(xí)編譯器和推理引擎的區(qū)別

深度神經(jīng)網(wǎng)絡(luò)模型量化的基本方法

深度學(xué)習(xí)模型量化方法

什么是高精度定位平板？

北斗高精度定位終端的工作原理和精度范圍

幾款高精度時(shí)鐘芯片的規(guī)格選型分析

深度解析深度學(xué)習(xí)下的語義SLAM

友思特應(yīng)用 | 高精度呈現(xiàn)：PCB多類型缺陷檢測系統(tǒng)

優(yōu)可測新能源高精度檢測應(yīng)用指南

電感多少精度算高精度