在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

一種新型模擬AI芯片,能效提升了1000倍

芯長征科技 ? 來源:quantamagazine ? 作者:quantamagazine ? 2022-11-14 11:08 ? 次閱讀

人工智能算法無法以目前的速度保持增長。像深度神經網絡這樣的算法——它受到大腦的松散啟發,多層人工神經元通過稱為權重的數值相互連接——每年都在變大。但如今,硬件改進已無法跟上運行這些海量算法所需的大量內存和處理能力。很快,人工智能算法的規模可能會碰壁。

即使我們可以不斷擴大硬件以滿足人工智能的需求,也存在另一個問題:在傳統計算機上運行它們會浪費大量能源。運行大型人工智能算法產生的高碳排放已經對環境有害,而且隨著算法變得越來越龐大,情況只會變得更糟。

一種稱為神經形態計算的解決方案從生物大腦中汲取靈感來創建節能設計。不幸的是,雖然這些芯片在節能方面可以超過數字計算機,但它們缺乏運行大型深度神經網絡所需的計算能力。這讓人工智能研究人員很容易忽視它們。

這在 8 月終于改變了,當時Weier Wan , H.-S. Philip Wong、Gert Cauwenberghs和他們的同事展示了一種名為 NeuRRAM 的新型神經形態芯片,其中包括 300 萬個存儲單元和數千個內置于其硬件中的神經元以運行算法。它使用一種相對較新的內存類型,稱為電阻式 RAM 或 RRAM。與以前的 RRAM 芯片不同,NeuRRAM 被編程為以模擬方式運行,以節省更多的能源和空間。雖然數字存儲器是二進制的——存儲 1 或 0——但 NeuRRAM 芯片中的模擬存儲單元可以在一個完全連續的范圍內存儲多個值。這使得芯片可以在相同數量的芯片空間中存儲來自大量 AI 算法的更多信息

因此,新芯片可以在圖像和語音識別等復雜的人工智能任務上與數字計算機一樣執行,作者聲稱它的能效提高了 1000 倍,為微型芯片運行越來越復雜的算法開辟了可能性在以前不適合人工智能的小型設備中,如智能手表和手機

未參與這項工作的研究人員對結果印象深刻。“這篇論文非常獨特,”香港大學長期 RRAM 研究員王中瑞說。“它在不同的層面做出了貢獻——在設備層面、電路架構層面和算法層面。”

創造新的記憶

在數字計算機中,運行 AI 算法時浪費的大量能源是由一個簡單且普遍存在的設計缺陷造成的,該缺陷使每一次計算都效率低下。通常,計算機的內存——它保存計算過程中處理的數據和數值——放置在遠離進行計算的處理器的主板上。

對于通過處理器傳輸的信息,“這有點像你在通勤上花了八個小時,但你做了兩個小時的工作,”曾在斯坦福大學工作的計算機科學家萬說,他最近搬到了人工智能初創公司 Aizip。

將內存和計算放在同一個地方的新型一體化芯片來解決這個問題似乎很簡單。它也更接近于我們的大腦可能如何處理信息,因為許多神經科學家認為計算發生在神經元群體中,而記憶是在神經元之間的突觸加強或削弱它們的連接時形成的。但事實證明,制造這樣的設備很困難,因為目前的內存形式與處理器中的技術不兼容。

幾十年前,計算機科學家開發了這些材料來制造新的芯片,這些芯片在存儲內存的地方執行計算——一種被稱為內存計算的技術。但由于傳統的數字計算機表現如此出色,這些想法被忽視了幾十年。

“這項工作,就像大多數科學工作一樣,被遺忘了,”斯坦福大學教授 Wong 說。

事實上,第一個這樣的設備至少可以追溯到 1964 年,當時斯坦福大學的電氣工程師發現他們可以操縱某些稱為金屬氧化物的材料來打開和關閉其導電能力。這很重要,因為材料在兩種狀態之間切換的能力為傳統內存存儲提供了支柱。通常,在數字存儲器中,高電壓狀態對應于 1,低電壓狀態對應于 0。

為了讓 RRAM 設備切換狀態,您需要在連接到金屬氧化物兩端的金屬電極上施加電壓。通常,金屬氧化物是絕緣體,這意味著它們不導電。但有了足夠的電壓,電流就會積聚起來,最終穿過材料的薄弱環節,形成通往另一側電極的路徑。一旦電流突破,它就可以沿著該路徑自由流動。

Wong 將這個過程比作閃電:當云中積聚了足夠多的電荷時,它會迅速找到一條低電阻路徑并發生雷擊。但與路徑消失的閃電不同,穿過金屬氧化物的路徑仍然存在,這意味著它可以無限期地保持導電。并且可以通過向材料施加另一個電壓來擦除導電路徑。因此研究人員可以在兩種狀態之間切換 RRAM,并使用它們來存儲數字存儲器。

世紀中葉的研究人員沒有認識到節能計算的潛力,他們也不需要使用他們正在使用的更小的算法。直到 2000 年代初,隨著新金屬氧化物的發現,研究人員才意識到這種可能性。

當時在 IBM 工作的 Wong 回憶說,一位從事 RRAM 工作的獲獎同事承認,他并不完全了解所涉及的物理原理。“如果他不理解,”Wong 回憶道,“也許我不應該嘗試去理解它。”

但在 2004 年,三星電子的研究人員宣布他們已經成功地將 RRAM 內存集成在傳統計算芯片之上,這表明內存計算芯片最終可能成為可能。王決定至少嘗試一下。

用于人工智能的內存計算芯片

十多年來,像 Wong 這樣的研究人員一直致力于將 RRAM 技術構建到能夠可靠地處理高性能計算任務的地步。大約在 2015 年左右,計算機科學家開始認識到這些節能設備對于大型 AI 算法的巨大潛力,并開始起飛。那一年,加州大學圣巴巴拉分校的科學家表明,RRAM 設備可以做的不僅僅是以一種新的方式存儲內存。他們可以自己執行基本的計算任務——包括在神經網絡的人工神經元中發生的絕大多數計算,這些都是簡單的矩陣乘法任務。

在 NeuRRAM 芯片中,硅神經元內置于硬件中,RRAM 存儲單元存儲權重——代表神經元之間連接強度的值。由于 NeuRRAM 存儲單元是模擬的,它們存儲的權重代表了設備在低電阻狀態和高電阻狀態之間切換時出現的所有電阻狀態。這實現了比數字 RRAM 存儲器更高的能效,因為該芯片可以并行運行許多矩陣計算,而不是像數字處理版本那樣一個接一個地同步運行。

但由于模擬處理仍落后于數字處理數十年,仍有許多問題需要解決。一是模擬 RRAM 芯片必須異常精確,因為物理芯片上的缺陷會引入可變性和噪聲。(對于只有兩種狀態的傳統芯片,這些缺陷幾乎沒有那么重要。)這使得模擬 RRAM 設備運行 AI 算法變得更加困難,因為識別圖像的準確性會受到影響,如果RRAM 器件的導電狀態并非每次都完全相同。

“當我們查看照明路徑時,每次都不同,”Wong 說。“因此,RRAM 表現出一定程度的隨機性——每次對它們進行編程都會略有不同。” Wong 和他的同事證明,如果對算法進行訓練以適應芯片上遇到的噪音,RRAM 設備可以存儲連續的 AI 權重,并且仍然與數字計算機一樣準確,這一進步使他們能夠生產 NeuRRAM 芯片。

他們必須解決的另一個主要問題涉及支持各種神經網絡所需的靈活性。過去,芯片設計人員必須將微型 RRAM 器件排列在較大的硅神經元旁邊的一個區域中。RRAM 設備和神經元是硬連線的,沒有可編程性,因此只能在一個方向上執行計算。為了支持具有雙向計算的神經網絡,需要額外的電線和電路,從而增加了能量和空間需求。

因此,Wong 的團隊設計了一種新的芯片架構,其中 RRAM 存儲設備和硅神經元混合在一起。這種對設計的微小改動減少了總面積并節省了能源。

瑞士蘇黎世聯邦理工學院的神經形態學研究員梅利卡·佩萬德說:“我認為 [這種安排] 真的很漂亮。” “我絕對認為這是一項開創性的工作。”

幾年來,Wong 的團隊與合作者一起在 NeuRRAM 芯片上設計、制造、測試、校準和運行 AI 算法。他們確實考慮使用其他新興類型的內存,這些內存也可用于內存計算芯片,但 RRAM 具有優勢,因為它在模擬編程方面具有優勢,并且相對容易與傳統計算材料集成。

他們最近的結果代表了第一個可以運行如此龐大而復雜的 AI 算法的 RRAM 芯片——這一壯舉以前只能在理論模擬中實現。德雷塞爾大學的計算機科學家Anup Das說:“當涉及到真正的硅時,這種能力就缺失了。” “這項工作是第一次演示。”

“數字人工智能系統靈活而精確,但效率要低幾個數量級,”Cauwenberghs 說。現在,Cauwenberghs 說,他們靈活、精確和節能的模擬 RRAM 芯片“首次彌合了差距”。

擴大規模

該團隊的設計使 NeuRRAM 芯片很小——只有指甲大小——同時壓縮了 300 萬個可用作模擬處理器的 RRAM 存儲設備。雖然它至少可以像數字計算機一樣運行神經網絡,但該芯片也(并且是第一次)可以運行在不同方向上執行計算的算法。他們的芯片可以按照 RRAM 芯片的標準向 RRAM 陣列的行輸入電壓并從列讀取輸出,但它也可以從列到行反向執行,因此它可以用于運行的神經網絡數據流向不同的方向。

與 RRAM 技術本身一樣,這早已成為可能,但沒有人想過這樣做。“為什么我們以前沒有考慮過這個?” 佩萬德問道。“事后看來,我不知道。”

“這實際上開辟了許多其他機會,”達斯說。作為例子,他提到了一個簡單的系統能夠運行多維物理模擬或自動駕駛汽車所需的大量算法。

然而尺寸是個問題。最大的神經網絡現在包含數十億個權重,而不是新芯片中包含的數百萬個權重。Wong 計劃通過堆疊多個 NeuRRAM 芯片來擴大規模。

在未來的設備中保持較低的能源成本或進一步縮小它們同樣重要。實現這一目標的一種方法是更緊密地復制大腦,以采用真實神經元之間使用的通信信號:電脈沖。這是當細胞內外的電壓差達到臨界閾值時,從一個神經元向另一個神經元發出的信號。

“那里面臨著巨大的挑戰,”倫敦大學學院的納米技術研究員托尼·肯揚說。“但我們可能仍想朝那個方向發展,因為……如果您使用非常稀疏的尖峰,您可能會獲得更高的能源效率。” 然而,Kenyon 指出,要在當前的 NeuRRAM 芯片上運行峰值算法可能需要完全不同的架構。

目前,該團隊在 NeuRRAM 芯片上運行大型 AI 算法時實現的能源效率創造了新的希望,即內存技術可能代表 AI 計算的未來。也許有一天,我們甚至能夠匹配人類大腦的 860 億個神經元和連接它們的數萬億個突觸,而不會耗盡能量。

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 神經網絡
    +關注

    關注

    42

    文章

    4776

    瀏覽量

    100938
  • 人工智能
    +關注

    關注

    1792

    文章

    47477

    瀏覽量

    239160
  • AI芯片
    +關注

    關注

    17

    文章

    1898

    瀏覽量

    35120

原文標題:一種新型模擬AI芯片,能效提升了1000倍

文章出處:【微信號:芯長征科技,微信公眾號:芯長征科技】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    端側AI浪潮已來!炬芯科技發布新代端側AI音頻芯片比和AI算力大幅度提升

    電子發燒友原創 章鷹 ? 11月5日,在深圳會展中心7號館內,炬芯科技董事長兼CEO周正宇博士帶來了《端側AI芯片的未來》演講,他對端側AI趨勢進行精彩的分析,并且宣布炬芯科技推出第
    的頭像 發表于 11-06 09:11 ?2742次閱讀
    端側<b class='flag-5'>AI</b>浪潮已來!炬芯科技發布新<b class='flag-5'>一</b>代端側<b class='flag-5'>AI</b>音頻<b class='flag-5'>芯片</b>,<b class='flag-5'>能</b><b class='flag-5'>效</b>比和<b class='flag-5'>AI</b>算力大幅度<b class='flag-5'>提升</b>

    一種新型電流模式控制集成電路

    電子發燒友網站提供《一種新型電流模式控制集成電路.pdf》資料免費下載
    發表于 10-24 10:20 ?0次下載
    <b class='flag-5'>一種</b><b class='flag-5'>新型</b>電流模式控制集成電路

    NEO推出3D X-AI芯片AI性能飆升百

    近日,半導體行業的創新先鋒NEO Semiconductor震撼發布了項革命性技術——3D X-AI芯片,這項技術旨在徹底顛覆人工智能處理領域的
    的頭像 發表于 08-21 15:45 ?662次閱讀

    安森美引領數據中心革命

    在當今數字化轉型的浪潮中,數據中心作為支撐人工智能、云計算等關鍵技術的基礎設施,其能耗問題日益凸顯。特別是隨著AI計算的蓬勃發展,數據中心對電力的需求急劇增加,傳統搜索引擎請求相比,AI引擎的電力消耗更是高達十以上。因此,
    的頭像 發表于 08-12 11:13 ?508次閱讀

    PGA202 14號引腳怎么接?直接和模擬地相接直處于1000放大狀態是怎么回事?

    PGA202: 14號引腳怎么接,直接和模擬地相接直處于1000放大狀態
    發表于 08-01 07:58

    成都匯陽投資關于跨越帶寬增長極限,HBM 賦AI新紀元

    增長 410 ,而單 GPU 內存僅以每兩年 2 的速度增長;硬件的峰值計算能力 20 年中提升了 60,000 ,但 DRAM 帶寬的增長卻僅提高了 100
    的頭像 發表于 07-04 10:55 ?718次閱讀

    利用AI和加速計算提升天氣預報效率和

    在 NVIDIA GPU 驅動的擴散模型助力下,生成式 AI 在各個領域實現新的應用,大大提升了效率。   當臺灣氣象員得以在臺機器上模擬臺風的細節,他們深感其對預報任務
    的頭像 發表于 06-07 15:06 ?577次閱讀

    AMD披露高效數據中心策略,預計至2027年提升超百

    會議期間,蘇姿豐談論了AMD如何通過實施30x25戰略推動2025年計算節點提升30的目標。她進步透露,AMD已找到2026年至20
    的頭像 發表于 05-24 17:37 ?1042次閱讀

    步解讀英偉達 Blackwell 架構、NVlink及GB200 超級芯片

    2024年3月19日,[英偉達]CEO[黃仁勛]在GTC大會上公布了新AI芯片架構BLACKWELL,并推出基于該架構的超級芯片GB200,將助推數據處理、工程
    發表于 05-13 17:16

    龍芯:自主研發CPU提升性能,單核通用性能提高20

    張戈強調,龍芯CPU的主要IP核均為自主研發,這使得其性價比得到顯著提升。他指出,國產CPU與主流CPU的差距主要體現在單核性能上,而非多核性能。近年來,龍芯CPU的單核通用性能已提升了20,主頻
    的頭像 發表于 04-25 15:26 ?831次閱讀

    最強AI芯片發布,Cerebras推出性能翻倍的WSE-3 AI芯片

    近日,芯片行業的領軍企業Cerebras Systems宣布推出其革命性的產品——Wafer Scale Engine 3,該產品成功將現有最快AI芯片的世界紀錄提升了
    的頭像 發表于 03-19 09:31 ?1167次閱讀
    最強<b class='flag-5'>AI</b><b class='flag-5'>芯片</b>發布,Cerebras推出性能翻倍的WSE-3 <b class='flag-5'>AI</b><b class='flag-5'>芯片</b>

    一種新型超級電容模組充電電源設計

    一種新型超級電容模組充電電源設計超級電容器(Supercapacitors,ultracapacitor),不同于傳統的化學電源,是一種介于傳統電容器與電池之間、具有特殊性能的電源,主要依靠雙電層
    的頭像 發表于 03-11 08:47 ?880次閱讀
    <b class='flag-5'>一種</b><b class='flag-5'>新型</b>超級電容模組充電電源設計

    英偉達新AI芯片預計2025年亮相

    近日,服務器制造商戴爾在業界交流活動中透露了英偉達即將發布的新代人工智能(AI)GPU信息。這款代號為Blackwell的芯片預計將在功耗上達到驚人的1000W,較上
    的頭像 發表于 03-05 10:26 ?857次閱讀

    介紹一種用于絕對定量的微腔式數字PCR微流控芯片

    本文提出一種微腔式數字PCR微流控芯片。作者將兩層微結構背對背堆疊在起使得在不改變芯片平面面積的情況下使腔室數量和試劑容量增加一倍,極大
    的頭像 發表于 03-04 10:15 ?927次閱讀
    介紹<b class='flag-5'>一種</b>用于絕對定量的微腔式數字PCR微流控<b class='flag-5'>芯片</b>

    英偉達:預計下AI芯片B100短缺,計劃擴產并采用新架構

    近期熱門的 H100 芯片運期短縮數天后,英偉達新型 AI 旗艦芯片 B100搭載全新的 Blackwell,有望使 AI 計算性能
    的頭像 發表于 02-25 09:29 ?965次閱讀
    主站蜘蛛池模板: 九九热re| 高颜值大长腿美女啪啪| 四虎tv在线观看884aa| 在线capcom超级碰碰| 男女交性拍拍拍高清视频| 五月亭亭免费高清在线| 天天天天做夜夜夜夜| 高h肉肉视频在线播放观看| 国产精品美乳在线观看| 久久精品亚洲精品国产欧美| 日韩美女三级| 色色色色色色色色色色色色| 亚洲综合色吧| 伊人久久大香线蕉综合bd高清| 亚洲成人毛片| 69xxxx日本老师| 欧美三级网| 欧美黑人性受xxxx精品| 91av视频| re99热| 美女扒开尿口给男人桶动态图 | 国产资源免费观看| 免费看日本黄色片| 日本三级香港三级人妇 m| 手机天堂网| 天使色| 亚洲欧美精品成人久久91| 不卡免费在线视频| 午夜久久免影院欧洲| 亚洲电影免费| 一级爱片| 日本吻胸抓胸激烈视频网站| 狠狠色丁香久久婷婷综合丁香| 好吊操免费视频| 在线观看免费视频片| 国产伦精品一区二区三区网站| 国产亚洲精品美女久久久| 久久久久久久影院| 国内精品网站| 亚洲国产网址| 在线观看视频你懂的|