在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

寒武紀(jì)歷代深度學(xué)習(xí)處理器的各種參數(shù)信息

倩倩 ? 來源:我是天邊飄過一朵云 ? 2020-04-17 09:04 ? 次閱讀

寒武紀(jì)神經(jīng)網(wǎng)絡(luò)處理器是中科院計(jì)算技術(shù)研究所發(fā)布的能運(yùn)行深度神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)人工智能算法的處理器硬件架構(gòu),下面是小編整理的寒武紀(jì)歷代深度學(xué)習(xí)處理器的各種參數(shù)信息,大家不妨來看看。

1. 寒武紀(jì)1號(hào):DianNao

陳天石等人提出的DianNao是寒武紀(jì)系列的第一個(gè)原型處理器結(jié)構(gòu),包含一個(gè)處理器核,主頻為0.98GHz,峰值性能達(dá)每秒4520億次神經(jīng)網(wǎng)絡(luò)基本運(yùn)算(如加法、乘法等),65mm工藝下功耗為0.485W,面積3.02平方毫米。在若干代表性神經(jīng)網(wǎng)絡(luò)上的實(shí)驗(yàn)結(jié)果表明,DianNao的平均性能超過主流CPU核的100倍,面積和功耗僅為CPU核的1/30~1/5,效能提升達(dá)三個(gè)數(shù)量級(jí);DianNao的平均性能與主流通用圖形處理器(NVIDIA K20M)相當(dāng),但面積和功耗僅為后者的百分之一量級(jí)。

DianNao要解決的核心問題是如何使有限的內(nèi)存帶寬滿足運(yùn)算功能部件的需求,使運(yùn)算和訪存之間達(dá)到平衡,從而實(shí)現(xiàn)高效能比。其難點(diǎn)在于選取運(yùn)算功能部件的數(shù)量、組織策略以及片上隨機(jī)存儲(chǔ)器(RAM)的結(jié)構(gòu)參數(shù)。由于整個(gè)結(jié)構(gòu)參數(shù)空間有上千萬種選擇,而模擬器運(yùn)行速度不及真實(shí)芯片的十萬分之一,我們不可能蠻力嘗試各種可能的設(shè)計(jì)參數(shù)。為解決此問題,提出了一套基于機(jī)器學(xué)習(xí)的處理器性能建模方法,并基于該模型最終為DianNao選定了各項(xiàng)設(shè)計(jì)參數(shù),在運(yùn)算和訪存間實(shí)現(xiàn)了平衡,顯著提升了執(zhí)行神經(jīng)網(wǎng)絡(luò)算法時(shí)的效能。

即使數(shù)據(jù)已經(jīng)從內(nèi)存移到了片上,搬運(yùn)的能耗依然非常高。英偉達(dá)公司首席科學(xué)家史蒂夫·凱科勒(Steve Keckler)曾經(jīng)出,在40m工藝下,將64位數(shù)據(jù)搬運(yùn)20毫米的能耗是做64位浮點(diǎn)乘法的數(shù)倍。因此,要降低處理器功耗,僅僅降低運(yùn)算功耗是不夠的,必須對(duì)片上數(shù)據(jù)搬運(yùn)進(jìn)行優(yōu)化。我們提出了對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行分塊處理,將不同類型的數(shù)據(jù)塊存放在不同的片上隨機(jī)存儲(chǔ)器中,并建立理論模型來刻畫隨機(jī)存儲(chǔ)器與隨機(jī)存儲(chǔ)器、隨機(jī)存儲(chǔ)器與運(yùn)算部件、隨機(jī)存儲(chǔ)器與內(nèi)存之間的搬運(yùn)次數(shù),進(jìn)而優(yōu)化神經(jīng)網(wǎng)絡(luò)運(yùn)算所需的數(shù)據(jù)搬運(yùn)次數(shù)。相對(duì)于CPU/GPU上基于緩存層次的數(shù)據(jù)搬運(yùn),DianNao可將數(shù)據(jù)搬運(yùn)次數(shù)減少至前者的1/30~1/10。

2. 寒武紀(jì)2號(hào):DaDianNao

近年來興起的深度神經(jīng)網(wǎng)絡(luò)在模式識(shí)別領(lǐng)域取得了很好的應(yīng)用效果,但這類神經(jīng)網(wǎng)絡(luò)的隱層數(shù)量和突觸數(shù)量遠(yuǎn)多于傳統(tǒng)神經(jīng)網(wǎng)絡(luò)。例如,著名的谷歌大腦包括了100多億個(gè)突觸。百度采用的大規(guī)模深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)包含200多億個(gè)突觸。急劇增長(zhǎng)的神經(jīng)網(wǎng)絡(luò)規(guī)模給神經(jīng)網(wǎng)絡(luò)處理器帶來了挑戰(zhàn)。單個(gè)核已經(jīng)難以滿足不斷增長(zhǎng)的應(yīng)用需求。將神經(jīng)網(wǎng)絡(luò)處理器擴(kuò)展至多核成為自然之選。DaDianNao在DianNao的基礎(chǔ)上進(jìn)一步擴(kuò)大了處理器的規(guī)模,包含16個(gè)處理器核和更大的片上存儲(chǔ),并支持多處理器芯片間直接高速互連,避免了高昂的內(nèi)存訪問開銷。在28nm工藝下,DaDianNao的主頻為606MHz,面積67.7平方毫米,功耗約16W。單芯片性能超過了主流GPU的21倍,而能耗僅為主流GPU的1/330。64芯片組成的計(jì)算系統(tǒng)的性能較主流GPU提升450倍,但總能耗僅為后者的1/150。

3. 寒武紀(jì)3號(hào):PuDianNao

神經(jīng)網(wǎng)絡(luò)已成為模式識(shí)別等領(lǐng)域的主流算法,但用戶很多時(shí)候可能更傾向于使用其他一些經(jīng)典的機(jī)器學(xué)習(xí)算法。例如程序化交易中經(jīng)常使用線性回歸這類可解釋性好、復(fù)雜度低的算法。在此背景下,我們研發(fā)了寒武紀(jì)3號(hào)多用途機(jī)器學(xué)習(xí)處理器---PuDianNao,可支持k-最近鄰、k-均值、樸素貝葉斯、線性回歸、支持向量機(jī)、決策樹、神經(jīng)網(wǎng)絡(luò)等近10種代表性機(jī)器學(xué)習(xí)算法。在65nm工藝下,PuDianNao的主頻為1GHz,峰值性能達(dá)每秒10560億次基本操作,面積3.51平方毫米,功耗為0.596W。PuDianNao運(yùn)行上述機(jī)器學(xué)習(xí)算法吋的平均性能與主流通用圖形處理器相當(dāng),但面積和功耗僅為后者的百分之一量級(jí)。PuDianNao的結(jié)構(gòu)設(shè)計(jì)主要有兩個(gè)難點(diǎn):運(yùn)算單元設(shè)計(jì)和存儲(chǔ)層次設(shè)計(jì),分別對(duì)應(yīng)于機(jī)器學(xué)習(xí)的運(yùn)算特征和結(jié)構(gòu)特征。其中運(yùn)算單元設(shè)計(jì)的出發(fā)點(diǎn)是高效實(shí)現(xiàn)機(jī)器學(xué)習(xí)最頻繁的運(yùn)算操作,而存儲(chǔ)層次設(shè)計(jì)則主要根據(jù)訪存特征提高各機(jī)器學(xué)習(xí)算法中數(shù)據(jù)的片內(nèi)重用,降低片外訪存帶寬的需求,充分發(fā)揮運(yùn)算單元的計(jì)算能力,避免片外訪存成為性能瓶頸。在運(yùn)算單元設(shè)計(jì)方面,提出了一種機(jī)器學(xué)習(xí)運(yùn)算單元(Machine Learning Unit, MLU)來支持各種機(jī)器學(xué)習(xí)方法中共有的核心運(yùn)算,包括:點(diǎn)積(線性回歸、支持向量機(jī)、神經(jīng)網(wǎng)絡(luò))、距離計(jì)算(k-最近鄰、k-均值)計(jì)數(shù)(決策樹和樸素貝葉斯)、排序(k-最近鄰、k-均值)和非線性函數(shù)計(jì)算(支持向量機(jī)和神經(jīng)網(wǎng)絡(luò))等。機(jī)器學(xué)習(xí)運(yùn)算單元被分成了計(jì)數(shù)器、加法器、乘法器、加法樹、Acc和Misc6個(gè)流水線階段。

在存儲(chǔ)層次設(shè)計(jì)方面,設(shè)計(jì)了HotBuf(HB)、ColdBuf(CB)和OutputBuf(OB)3個(gè)片上數(shù)據(jù)緩存HotBuf存儲(chǔ)輸入數(shù)據(jù),具有最短重用距離的數(shù)據(jù)。ColdBuf存放相對(duì)較長(zhǎng)重用距離的輸入數(shù)據(jù)。OutputBuf存儲(chǔ)輸出數(shù)據(jù)或者臨時(shí)結(jié)果。這樣設(shè)計(jì)的原因有兩個(gè):第一,在各種機(jī)器學(xué)習(xí)算法中,數(shù)據(jù)的重用距離通常可以分為兩類或三類,因此設(shè)計(jì)了3個(gè)片上數(shù)據(jù)緩存;第二,機(jī)器學(xué)習(xí)算法中不同類型的數(shù)據(jù)讀取寬度不同,因此設(shè)置了分開的緩存來降低不同的寬度帶來的開銷。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4777

    瀏覽量

    100974
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4625

    瀏覽量

    93129
  • 寒武紀(jì)
    +關(guān)注

    關(guān)注

    11

    文章

    189

    瀏覽量

    73913
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    寒武紀(jì)發(fā)布2024年度業(yè)績(jī)預(yù)告

    昨日晚間,國(guó)內(nèi)領(lǐng)先的智能芯片設(shè)計(jì)企業(yè)寒武紀(jì)發(fā)布了其2024年度的業(yè)績(jī)預(yù)告。據(jù)公告顯示,公司預(yù)計(jì)全年?duì)I業(yè)收入將在10.7億元至12億元之間,與去年同期相比,實(shí)現(xiàn)了50.83%至69.16%的顯著增長(zhǎng)
    的頭像 發(fā)表于 01-15 10:30 ?104次閱讀

    NPU與傳統(tǒng)處理器的區(qū)別是什么

    和GPU相比,NPU在處理深度學(xué)習(xí)任務(wù)時(shí)展現(xiàn)出了顯著的優(yōu)勢(shì)。 1. 設(shè)計(jì)目的 傳統(tǒng)處理器: CPU(中央處理單元): CPU是通用
    的頭像 發(fā)表于 11-15 09:29 ?480次閱讀

    NPU在深度學(xué)習(xí)中的應(yīng)用

    設(shè)計(jì)的硬件加速,它在深度學(xué)習(xí)中的應(yīng)用日益廣泛。 1. NPU的基本概念 NPU是一種專門針對(duì)深度學(xué)習(xí)算法優(yōu)化的
    的頭像 發(fā)表于 11-14 15:17 ?742次閱讀

    GPU深度學(xué)習(xí)應(yīng)用案例

    能力,可以顯著提高圖像識(shí)別模型的訓(xùn)練速度和準(zhǔn)確性。例如,在人臉識(shí)別、自動(dòng)駕駛等領(lǐng)域,GPU被廣泛應(yīng)用于加速深度學(xué)習(xí)模型的訓(xùn)練和推理過程。 二、自然語言處理 自然語言處理(NLP)是
    的頭像 發(fā)表于 10-27 11:13 ?444次閱讀

    深度學(xué)習(xí)GPU加速效果如何

    圖形處理器(GPU)憑借其強(qiáng)大的并行計(jì)算能力,成為加速深度學(xué)習(xí)任務(wù)的理想選擇。
    的頭像 發(fā)表于 10-17 10:07 ?222次閱讀

    FPGA做深度學(xué)習(xí)能走多遠(yuǎn)?

    并行計(jì)算的能力,可以在硬件層面并行處理大量數(shù)據(jù)。這種并行處理能力使得 FPGA 在執(zhí)行深度學(xué)習(xí)算法時(shí)速度遠(yuǎn)超傳統(tǒng)處理器,能夠提供更低的延遲和
    發(fā)表于 09-27 20:53

    算力概念股寒武紀(jì)20cm漲停市值重回千億

    7月16日整個(gè)算力概念板塊上漲;寒武紀(jì)(688256)上漲達(dá)20%,股價(jià)創(chuàng)年內(nèi)新高,成交額超42億,寒武紀(jì)的總市值重回千億大關(guān)。 此外,紫光股份(000938)、海光信息(688041)等概念股同步
    的頭像 發(fā)表于 07-17 15:30 ?644次閱讀

    細(xì)數(shù)各種音頻處理器

    HiFi音頻系統(tǒng)需要具備高質(zhì)量的音頻處理器,以保證音頻信號(hào)在處理和傳輸過程中能夠盡可能地保持原始音質(zhì)和細(xì)節(jié)。每種處理器的選擇和配置應(yīng)根據(jù)具體的音頻設(shè)備、使用場(chǎng)景和個(gè)人偏好來進(jìn)行優(yōu)化和調(diào)整。這些
    的頭像 發(fā)表于 07-10 16:36 ?1154次閱讀
    細(xì)數(shù)<b class='flag-5'>各種</b>音頻<b class='flag-5'>處理器</b>

    深度學(xué)習(xí)的模型優(yōu)化與調(diào)試方法

    深度學(xué)習(xí)模型在訓(xùn)練過程中,往往會(huì)遇到各種問題和挑戰(zhàn),如過擬合、欠擬合、梯度消失或爆炸等。因此,對(duì)深度學(xué)習(xí)模型進(jìn)行優(yōu)化與調(diào)試是確保其性能優(yōu)越的
    的頭像 發(fā)表于 07-01 11:41 ?918次閱讀

    處理器的定義和種類

    處理器,作為計(jì)算機(jī)系統(tǒng)的核心部件,承載著執(zhí)行指令、處理數(shù)據(jù)的重要任務(wù)。隨著信息技術(shù)的飛速發(fā)展,處理器的種類和性能也在不斷提升。本文將對(duì)處理器
    的頭像 發(fā)表于 05-12 18:12 ?2815次閱讀

    嵌入式微處理器有哪幾類 嵌入式微處理器包含哪些重要參數(shù)

    嵌入式微處理器是指特別設(shè)計(jì)用于嵌入式系統(tǒng)的微處理器,它具有小型化、低功耗、高性能和多功能等特點(diǎn)。嵌入式微處理器廣泛應(yīng)用于各種電子設(shè)備中,例如智能手機(jī)、平板電腦、數(shù)字相機(jī)、汽車電子、醫(yī)療
    的頭像 發(fā)表于 05-04 14:58 ?943次閱讀

    寒武紀(jì)2023年報(bào)出爐:營(yíng)收穩(wěn)健虧損收窄 毛利率達(dá)69.16%

    年報(bào)信息顯示,寒武紀(jì)全年實(shí)現(xiàn)收入7.09億元人民幣,其中毛利率達(dá)到69.16%,比去年提高了3.40個(gè)百分點(diǎn)。在經(jīng)歷過上年度寛泛虧損之后,本年度盈利情況明顯改善,向股東返還利潤(rùn)407913000元,降幅達(dá)32.47%。
    的頭像 發(fā)表于 04-30 09:39 ?882次閱讀

    “AI芯片第一股”寒武紀(jì)發(fā)布2023年度業(yè)績(jī)快報(bào) 虧8.36億元!

    “AI芯片第一股”寒武紀(jì)(688256)在2024年2月28日發(fā)布2023年度業(yè)績(jī)快報(bào)。
    的頭像 發(fā)表于 03-04 13:41 ?935次閱讀
    “AI芯片第一股”<b class='flag-5'>寒武紀(jì)</b>發(fā)布2023年度業(yè)績(jī)快報(bào) 虧8.36億元!

    寒武紀(jì)與智象未來聯(lián)手,推動(dòng)視覺大模型的技術(shù)創(chuàng)新與應(yīng)用

    在大模型領(lǐng)域,寒武紀(jì)自底層硬件架構(gòu)至基礎(chǔ)軟件更新,皆針對(duì)大模型的實(shí)際應(yīng)用場(chǎng)景進(jìn)行了細(xì)致優(yōu)化。依托高效的推理引擎MagicMind,寒武紀(jì)思元(MLU)系列云端智能加速卡支持輸入輸出變換、提升算子效率以及圖融合等尖端技術(shù),全力賦能智象未來大模型的應(yīng)用部署。
    的頭像 發(fā)表于 01-24 09:59 ?931次閱讀

    寒武紀(jì)與智象未來達(dá)成戰(zhàn)略合作并完成大模型適配

    1月22日,寒武紀(jì)與智象未來 (HiDream.ai) 在北京簽訂戰(zhàn)略合作協(xié)議,雙方將通過資源共享、優(yōu)勢(shì)互補(bǔ),依托各自在大模型領(lǐng)域的技術(shù)積累,持續(xù)產(chǎn)品適配,攜手推動(dòng)視覺大模型的創(chuàng)新與落地。
    的頭像 發(fā)表于 01-23 13:46 ?595次閱讀
    <b class='flag-5'>寒武紀(jì)</b>與智象未來達(dá)成戰(zhàn)略合作并完成大模型適配
    主站蜘蛛池模板: 精品亚洲综合在线第一区| 久久免费精品国产72精品剧情| 激情五月网站| 久久精品免费看| 四色成人网| 91激情在线| 国产毛片一区二区三区精品| 欧美日韩性高爱潮视频| 四虎永久精品视频在线| 久久是精品| 天天躁夜夜躁狠狠躁躁| 国产成人精品1024在线| 久久大尺度| 欧美videos 另类| 人人乳乳香蕉大免费| 色噜噜狠狠色综合欧洲selulu| 国产成人精品一区| 美女扒开尿口让男人30视频| 亚洲一二三四| h视频免费高清在线观看| 欧美猛交lxxxxxxxxx| 911精品国产91久久久久| 国产无套视频在线观看香蕉| 欧美日操| 久久久久久久国产免费看| 69老司机亚洲精品一区| www激情| 成人剧场| 一区二区三区在线观看免费| h国产| 一级毛片不收费| 性生活一区| 亚洲国产精品综合久久网络| 一级欧美在线的视频| 久久国产精品免费看| 最新天堂| 亚洲成色999久久网站| 欧美啪啪小视频| 在线观看免费视频| 色天天天天综合男人的天堂| 免费观看片|