在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

聚焦 | 什么是AI芯片“存儲墻”的解決方案?

SSDFans ? 來源:YXQ ? 2019-06-18 15:12 ? 次閱讀

在2016年威海參加中國體系結構年會的時候,孫所也說了一句調侃的話:“現在的AI很火,大家都往那邊去,沒有人太關心體系結構了,我要告訴那些追AI熱點的,它都死了三回了!” 的確,作為從小學馬列的中國人,我們最熟悉螺旋式上升的概念。對于計算和I/O來講,和中國經濟調控一樣,都是“ 水多了加面,面多了加水”螺旋式上升。

Google在2017年發布了TPU V1之后,現在已經有越來越多的AI startup的芯片出現,大家基本上都是用標準的Resnet50,Googlenetv3 等網絡為benchmark, 一次一次地刷新性能和功耗比,個人覺得很有可能在一天,AI芯片的性能和功耗比在特定的imagenet的任務上超過人腦,現在AI在準確率和性能上都超過了。對于AI的芯片來講,有一個指標也是大家討論比較多的。Roofline model

Y軸是P,代表算力,用來FLOP/s來表示,現在新出的AI ASIC往往在FLOP/s并不發力,因為從功耗比的角度上,算力肯定不是越高越好,而且大家都很難高過老黃的核彈。

代表了一個特定的計算平臺的peak performance,就是最大算力。

就是特定的計算平臺的I內存/O帶寬,這個和該計算平臺使用的DDR類型有關。

X軸是I,代表計算強度,就是在一個Byte上的計算量。因為對于一個特定的平臺,我可以知道它的最大算力和帶寬,我們就可以知道它的最大的計算強度。

因此,和圖上顯示的一樣,在點(Imax,),這個計算平臺達到了完美。在它的左邊,說明memory受限,在它的右邊說明計算受限。

因此,對于我們之前分析的Alexnet這個網絡,我們就知道了它的總的計算量就是:

內存訪問量 計算量
Conv1 770235 105415200
Maxpool1 430368
Conv2 1057632 223948800
Maxpool2 273152
Conv3 1057792 149520384
Conv4 1521792 112140288
Conv5 1036160 74760192
Maxpool3 61696
FC1 37766144 37748736
FC2 16789504 16777216
FC3 4102096 4096000
SUM 65021158 724406816

因為對于每一次訪存都是32位的Float Point,因此整個內存的占用就是 260MB左右,而計算量是724MFLOPs,因此Alexnet的計算強度就是724/260=2.7 operation/byte。

對于一個特定的平臺,比如老黃家的新的GTX2080Ti 系列來講:

對于計算性能,先不管老黃加各種Tensor Core,RTcore,從CUDA Core本身來講,他是100TLOP/s,

它的內存帶寬如下:

因此,作為2080Ti, 它的Imax就是166Operation/Byte.

可能到這個,就可以看出,對于Alex的2.7 來講,遠遠沒有達到2080ti的計算強度,主要是受限于內存帶寬了。

在Google的TPU中,有一個圖經常被大家引用。

大家基本上可以看到,google的Imax差不多在1000左右,基本上沒有什么網絡可以完全用滿TPU的peak performance。

怎么辦,內存帶寬的解決方案就是HBM,HBM2, HBM3不斷加大帶寬。記得在2017年的CNCC上,謝源教授講,他在2010年左右提出了HBM的概念,他很快就看到了AMD,Nvidia以及Xilinx和Intel都在芯片上使用了HBM,證明了這條道路的正確性。他認為目前應該在AI芯片上擺脫這種”水多了加面,面多了加水“,in-memory 計算應該是下一個方向。

這個就引出了在Memory+會議上來自平頭哥的段立德博士的topic,”Processing Near or In memory for deep learning".

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 芯片
    +關注

    關注

    456

    文章

    51019

    瀏覽量

    425405
  • AI
    AI
    +關注

    關注

    87

    文章

    31262

    瀏覽量

    269627

原文標題:什么是AI芯片“存儲墻”的解決方案?

文章出處:【微信號:SSDFans,微信公眾號:SSDFans】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    AI時代的存儲,哪種存算方案才能打破?

    回顧計算行業幾十年的歷史,芯片算力提升在幾年前,還在遵循摩爾定律。可隨著如今摩爾定律顯著放緩,算力發展已經陷入瓶頸。而且禍不單行,陷入同樣困境的還有存儲。從新標準推進的角度來看,存儲市場依然在朝
    的頭像 發表于 04-21 01:36 ?3592次閱讀
    <b class='flag-5'>AI</b>時代的<b class='flag-5'>存儲</b><b class='flag-5'>墻</b>,哪種存算<b class='flag-5'>方案</b>才能打破?

    黑芝麻智能與RockAI發布AI Agent解決方案

    黑芝麻智能與RockAI聯合發布基于武當C1200家族芯片AI Agent解決方案,該方案將部署于未來的智能座艙應用中。
    的頭像 發表于 01-10 16:33 ?218次閱讀

    企業AI解決方案包括哪些內容

    企業AI解決方案是一種集成了人工智能技術的綜合性方案,旨在提高企業運營效率、降低成本、優化業務流程,并提升企業的整體競爭力。那么,企業AI解決方案
    的頭像 發表于 01-10 10:15 ?80次閱讀

    聚焦AI芯片,角逐芯未來

    國產AI芯片規模壯大 在科技高速發展的今天,算力已成為驅動行業創新與變革的核心引擎。中信證券發布的最新研報,聚焦于國產AI芯片市場的蓬勃發展
    的頭像 發表于 01-08 09:10 ?202次閱讀

    中興通訊推出AI FWA全棧解決方案

    近日,在土耳其伊斯坦布爾舉辦的終端用戶大會上,作為全球領先的綜合信息與通信技術解決方案提供商中興通訊,首次聚焦固定無線接入(FWA)與移動寬帶(MBB)業務領域,并隆重推出了業界首創的AI FWA全
    的頭像 發表于 11-18 17:10 ?649次閱讀

    emc存儲解決方案的優勢

    在當今這個數據驅動的時代,企業對于數據存儲的需求日益增長。EMC,作為全球領先的數據存儲解決方案提供商,以其創新的技術、高性能的產品和全面的服務,幫助企業實現數據的高效管理和利用。 1. 高性能和可
    的頭像 發表于 11-01 15:16 ?409次閱讀

    基于分布式存儲系統醫療影像數據存儲解決方案

    基于分布式存儲系統醫療影像數據存儲解決方案
    的頭像 發表于 09-14 09:53 ?345次閱讀
    基于分布式<b class='flag-5'>存儲</b>系統醫療影像數據<b class='flag-5'>存儲</b><b class='flag-5'>解決方案</b>

    基于CSS融合存儲系統的自動化制造服務平臺存儲解決方案

    基于CSS融合存儲系統的自動化制造服務平臺存儲解決方案
    的頭像 發表于 09-10 10:15 ?373次閱讀
    基于CSS融合<b class='flag-5'>存儲</b>系統的自動化制造服務平臺<b class='flag-5'>存儲</b><b class='flag-5'>解決方案</b>

    憶聯SSD存儲解決方案亮相2024中國國際金融展

    數智化時代的存儲解決方案”為主題發表演講,分享憶聯如何以高效能SSD存儲解決方案助力AI時代下的金融科技產業實現存力飛躍。
    的頭像 發表于 07-22 10:52 ?694次閱讀
    憶聯SSD<b class='flag-5'>存儲</b><b class='flag-5'>解決方案</b>亮相2024中國國際金融展

    瑞薩電子推出Reality AI Explorer Tier,用于開發AI與TinyML解決方案

    全球半導體解決方案供應商瑞薩電子(TSE:6723)宣布推出Reality AI Explorer Tier——作為Reality AI Tools軟件的免費版本,可用于開發工業、汽車和商業應用中的
    的頭像 發表于 07-19 10:03 ?453次閱讀

    EVASH Ultra EEPROM:助力ChatGPT等AI應用的嵌入式存儲解決方案

    EVASH Ultra EEPROM:助力ChatGPT等AI應用的嵌入式存儲解決方案
    的頭像 發表于 06-26 18:13 ?935次閱讀

    MK米客方德的AI智能存儲解決方案

    隨著人工智能(AI)技術的飛速發展,我們正步入一個前所未有的智能時代。AI不僅在改變著我們的生活方式,也在深刻影響著各行各業的發展。在眾多領域中,存儲行業作為數據的承載者,其重要性不言而喻。那么,
    的頭像 發表于 05-27 10:04 ?475次閱讀
    MK米客方德的<b class='flag-5'>AI</b>智能<b class='flag-5'>存儲</b><b class='flag-5'>解決方案</b>

    risc-v多核芯片AI方面的應用

    應用中的成本。 最后,RISC-V多核芯片不僅可以應用于AI邊緣計算領域,還可以擴展到其他領域,如數據中心、云計算、自動駕駛、機器人等,為這些領域提供高效、靈活和安全的解決方案。 總的來說,RISC-V
    發表于 04-28 09:20

    得一微電子:AI時代重新定義存儲主控芯片

    布局,其PCIe Gen4 YS9303主控新品蓄勢待發。作為國內領先的存儲控制芯片解決方案提供商,得一微正積極擁抱生成式AI帶來的智能終端設備的創新浪潮。 ?
    的頭像 發表于 03-29 00:15 ?3669次閱讀
    得一微電子:<b class='flag-5'>AI</b>時代重新定義<b class='flag-5'>存儲</b>主控<b class='flag-5'>芯片</b>

    Supermicro推出適用于AI存儲的機柜級全方位解決方案 加速高性能AI訓練和推理的數據存取

    【2024年2月1日,美國圣何塞訊】Supermicro, Inc.(納斯達克股票代碼:SMCI)作為AI、云端、存儲和5G/邊緣領域的全方位IT解決方案制造商,推出適用于人工智能(AI
    的頭像 發表于 02-01 17:56 ?669次閱讀
    主站蜘蛛池模板: 欧美午夜视频| 亚洲欧美成人| 伊人狼人综合| 亚洲久久草| a天堂影院| 一级毛片免费不卡直观看| 日本黄色高清视频| 色老太视频| 日本一区二区三区视频在线观看| 中文字字幕码一二区| 一区二区三区四区视频在线观看| 中文字幕一区二区三| 女攻各种play男受h| 视频在线观看免费视频| 毛片8| 亚洲黄色一区| 五月天婷婷在线免费观看| 国产国语videosex另类| www成人在线观看| 午夜免费小视频| 一级特黄aaaaaa大片| 天天干天天看| 波多野结衣中文字幕教师| 久久国产影视| 简单视频在线播放jdav| 男人j进女人j的视频一进一出| 91大神视频网站| 国产尤物在线视频| 国产精品久久久香蕉| 午夜免费看片| 亚洲婷婷在线视频| 久久精品re| 深爱五月综合网| 精品一级毛片| 永久免费观看午夜视频在线| 欧美午夜影院| 91中文字幕视频| 亚洲成人高清在线观看| 欧美三级一区| 久久激情综合网| 91一区二区三区四区五区|