在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

一款采用單位元精度的深度學習推論(inference)芯片原型

dKBf_eetop_1 ? 來源:未知 ? 作者:李倩 ? 2018-05-31 17:18 ? 次閱讀

比利時研究機構Imec在近日舉行的年度技術論壇(ITF BELGIUM 2018)上透露,該機構正在打造一款采用單位元精度的深度學習推論(inference)芯片原型;Imec并期望在明年收集采用創新資料型態與架構──采用存儲器內處理器(processor-in-memory,PIM),或是Analog存儲器結構(analog memory fabric)──的客戶端裝置有效性資料。

學術界已經研究PIM架構數十年,而該架構越來越受到資料密集的機器演算法歡迎,例如新創公司Mythic以及IBM Research都有相關開發成果。許多學術研究機構正在實驗1~4位元的資料型別(data type),以減輕深度學習所需的沉重存儲器需求;到目前為止,包括Arm等公司的AI加速器商用芯片設計都集中在8位元或更大容量的資料型別,部分原因是編程工具例如Google的TensorFlow缺乏對較小資料型別的支援。

Imec擁有在一家晶圓代工廠制作的40nm制程加速器邏輯部份,而現在是要在自家晶圓廠添加一個MRAM層;該機構利用SRAM模擬此設計的性能,并且評估5nm節點的設計規則。此研究是Imec與至少兩家匿名IDM業者伙伴合作、仍在開發階段的專案,從近兩年前展開,很快制作了采用某種電阻式存儲器(ReRAM)的65nmPIM設計原型。

該65nm芯片并非鎖定深度學習演算法,雖然Imec展示了利用它啟動一段迷人的電腦合成音樂;其學習模式是利用了根據以音樂形式呈現、從感測器所串流之資料的時間序列分析(time-series analysis)。而40nm低功耗神經網路加速器(Low-Energy Neural Network Accelerator,LENNA)則會鎖定深度學習,在相對較小型的MRAM單元中運算與儲存二進位權重。

Imec技術團隊的杰出成員Diederik Verkest接受EE Times采訪時表示:「我們的任務是定義出我們應該利用新興存儲器為機器學習開發什么樣的半導體技術──或許我們會需要制程上的調整,」以取得最佳化結果。該機構半導體技術與系統部門執行副總裁An Steegen則表示:「AI會是制程技術藍圖演化的推手,因此Imec會在AI (以及PIM架構)方面下很多功夫──這方面的工作成果將會非常重要。」

Imec聲稱其LENNA芯片在推論任務上的表現將超越現有的CPUGPU

確實,如來自英國的新創公司Graphcore執行長Nigel Toon所言,AI標志著「運算技術的根本性轉變」;該公司將于今年稍晚推出首款芯片。Toon在Imec年度技術論壇上發表專題演說時表示:「今日的硬體限制了我們,我們需要某種更靈活的方案…我們想看到能根據經驗調整的(神經網路)模型;」他舉例指出,兩年前Google實習生總共花了25萬美元電費,只為了在該公司采用傳統x86處理器或Nvidia GPU的資料中心嘗試最佳化神經網路模型。

實現復雜的折衷平衡

Imec希望LENNA能在關于PIM或Analog存儲器架構能比需要存取外部存儲器的傳統架構節省多少能量方面提供經驗;此外該機構的另一個目標,是量化采用二進制方案在精確度、成本與處理量方面的折衷(tradeoff)。

加速器芯片通常能在一些熱門的測試上提供約90%的精確度,例如ImageNet競賽;Verkest表示,單位元資料型別目前有10%左右的精度削減,「但如果你調整你的神經網路,可以達到最高85%~87%的精確度。」他原本負責督導Imec的邏輯制程微縮技術藍圖,在Apple挖腳該機構的第一個AI專案經理之后,又兼管AI專案。

Verkest表示,理論上Analog存儲器單元應該能以一系列數值來儲存權重(weights),但是「那些存儲器元件的變異性有很多需要考量之處;」他指出,Imec的開發專案將嘗試找出能提供最佳化精度、處理量與可靠度之間最佳化平衡的精度水準。

而Toon則認為聚焦于資料型別是被誤導了:「低精度并沒有某些人想得那么嚴重,存儲器存取是我們必須修正之處;」他并未詳細介紹Graphcore的解決方案,但聲稱該公司技術可提供比目前采用HBM2存儲器的最佳GPU高40倍的存儲器頻寬。

在芯片架構方面,Imec的研究人員還未決定他們是要設計PIM或采用Analog存儲器結構;后者比較像是一種Analog SoC,計算是在Analog區塊處理,可因此減少或免除數位-Analog轉換。不同種類的神經網路會有更適合的不同架構,例如卷積神經網路(CNN)會儲存與重復使用權重,通常能以傳統GPU妥善運作;歸遞神經網路(RNN)以及長短期記憶模型(long short-term memories,LSTMs)則傾向于在使用過后就拋棄權重,因此更適合運算式存儲器結構

Imec可能會以存儲器結構來打造LENNA,讓運算留在Analog功能區塊

新的平行架構非常難編程,因此大多數供應商正在嘗試建立在TensorFlow等現有架構中攝取程式碼的途徑。而Graphcore則是打造了一種名為Poplar的軟體層,旨在以C++Python語言來完成這項工作;Toon表示:「我們把在處理器中映射圖形(graphs)的復雜性推到編譯器(也就是扮演該角色的Poplar)。」

Graphcore的客戶很快就會發現該程序會有多簡單或是多困難;這家新創公司預計在年中將第一款產品出貨給一線大客戶,預期他們會在今年底采用該款芯片執行大型云端供應商的服務。Toon聲稱,其加速器芯片將能把CNN的速度提升五至十倍,同時間采用RNN或LSTM的更復雜模型則能看到100倍的效能提升。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 存儲器
    +關注

    關注

    38

    文章

    7517

    瀏覽量

    164070
  • 加速器
    +關注

    關注

    2

    文章

    804

    瀏覽量

    37967
  • AI芯片
    +關注

    關注

    17

    文章

    1898

    瀏覽量

    35121

原文標題:Imec等多家公司正力促AI芯片設計最佳化

文章出處:【微信號:eetop-1,微信公眾號:EETOP】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    Tractica:預計2025年深度學習芯片銷量達到29億單位

    Tractica預測,AI市場的這種增長和演變將推動深度學習芯片組的出貨量從2018年的1.649億增長到2025年的29億單位以上。屆時,深度
    的頭像 發表于 06-09 23:39 ?7412次閱讀

    一款用于無線音箱的電源芯片

    `面對生活中的壓力,曲優美的音樂,總會讓人舒緩身心,忘卻煩惱。無線音箱的快捷方便,深受人們青睞。近期銀聯寶公司推出一款5V1A的開關電源芯片TB5806,專門適用于無線音箱方面。有效縮短了其充電
    發表于 10-10 10:14

    一款新的化學傳感器原型

    一款新的化學傳感器原型能夠在距離100英尺以外的地方檢測到“指紋痕量”的化學物質和其它物質,其開發者正在努力將其尺寸縮小到鞋盒大小。
    發表于 08-19 06:05

    一款采用TL494芯片的開關電源電路分析

    一款采用TL494芯片的開關電源電路分析
    發表于 04-26 06:23

    如何挑選一款不錯的高精度授時模塊呢?

    如何挑選一款不錯的高精度授時模塊呢?
    發表于 05-17 07:04

    一款精度降壓型大功率 LED 恒流驅動芯片

    `AP5161 寬電壓 LED 降壓型恒流芯片概述AP5161 是一款精度降壓型大功率LED 恒流驅動芯片。適用于輸入電壓 100V以內的大功率 LED 恒流驅動電源。專利的高端電流
    發表于 07-06 10:20

    一款精度降壓型大功率 LED 恒流驅動芯片

    `AP5161 寬電壓 LED 降壓型恒流芯片概述AP5161 是一款精度降壓型大功率LED 恒流驅動芯片。適用于輸入電壓 100V以內的大功率 LED 恒流驅動電源。專利的高端電流
    發表于 07-14 17:47

    怎么快速設計一款智能溫控器產品原型

    我主要從開發角度講講怎么快速設計一款智能溫控器產品原型吧。溫濕度傳感器作為基礎傳感類別,在智能家居領域應用廣泛。通過溫濕度傳感器采集溫度和濕度,可以實現多樣化的智能場景聯動。比如在炎熱的夏季,溫濕度
    發表于 11-04 08:29

    如何開發一款自己的App

    新手些建議。、誤區在講如何開發一款app之前,先說下定要避免的些誤區。借鑒與copy表面與原理效果與
    發表于 12-17 06:10

    什么是深度學習?使用FPGA進行深度學習的好處?

    延遲,這對深度學習推理也很有效。上述圖像識別的深度學習有望應用于自動駕駛等對精度要求較高的系統中。然而,由于它也是
    發表于 02-17 16:56

    拆解深度學習生態系的五個層級

    淺談深度學習的架構,主要可分為訓練(Training)與推論(Inference)兩個階段。簡單來說,就是訓練機器學習,以及讓機器展現
    發表于 02-09 08:48 ?3032次閱讀

    IBM研制可兼顧高精度學習和低精度推理的深度學習芯片

    深度學習領域仍在不斷發展,特別地,專家們認識到如果芯片能夠使用低精度的計算方式得出近似答案,神經網絡就可以用很少的資源完成大量的計算。
    的頭像 發表于 07-10 08:56 ?2414次閱讀

    亞馬遜推出了一款名為Inferentia的新型專用機器學習芯片

    據報道,在拉斯維加斯舉行的AWS re:Invent上,亞馬遜宣布了一款名為Inferentia的新型專用機器學習芯片
    發表于 11-29 14:19 ?1791次閱讀

    Socionext成功開發了一款集成有量化深度神經網絡技術的原型芯片

    為提高邊緣計算處理器AI處理性能并減少系統功耗,Socionext成功開發了一款集成有量化深度神經網絡(DNN)技術的原型芯片,通過“YOLOv3”它能以不到5W的低功耗及30fps的
    的頭像 發表于 11-04 16:27 ?1569次閱讀

    傳蘋果正在測試一款完全沒有“劉海”的iPhone原型

    13 的原型看起來很像 iPhone 12,但現在另位爆料者聲稱,蘋果正在測試一款完全沒有“劉海”的原型機。 大量生產高端設備的公司在決定批量生產
    的頭像 發表于 01-29 16:31 ?1579次閱讀
    主站蜘蛛池模板: 扒开双腿猛进湿润18p| 国产午夜精品福利| 特级aaa毛片| 天天透天天干| 国产毛片一区二区三区精品| 色免费在线观看| 亚洲伊人久久大香线蕉啊| 亚洲丝袜一区二区| 在线观看黄网| 二区久久国产乱子伦免费精品| 性欧美xxxxhd| 能在线观看的一区二区三区| 欧美成人免费夜夜黄啪啪| 免费看国产一级片| 欧美特黄一免在线观看| 天天色天天射天天操| 91久久另类重口变态| 国产经典三级| 国产成人精品1024在线| 国产特级毛片aaaaaa毛片| 久久综合婷婷| 久久国产乱子伦精品免费强| 免费黄色福利视频| 免费欧洲美女与动zooz| 国产激情视频一区二区三区| 亚洲日本久久久午夜精品| 五月天婷婷网亚洲综合在线| 亚洲福利视频网址| 欧美另类bbw| 黄色网免费观看| 中文字幕精品一区二区2021年| 午夜性福| 亚洲444kkk| 国产婷婷综合在线精品尤物| 综合免费一区二区三区| 亚洲第一页视频| 日本不卡在线观看| 国产叼嘿免费视频网站| 亚洲香蕉影视在线播放| 拍拍拍成人免费高清视频| 欧美日韩看片|