賓夕法尼亞大學(UPenn)研究人員最近使用新材料展示了模擬內存計算電路如何為人工智能計算提供可編程解決方案。
為了推進人工智能,賓夕法尼亞大學的研究人員最近開發了一種用于數據密集型計算的新型內存計算 (CIM) 架構。CIM 在大數據應用方面具有諸多優勢,UPenn研究小組在生產小型、強大的 CIM 電路方面邁出了第一步。
在本文中,我們將更深入地了解 CIM 的原理以及使研究人員能夠實現無晶體管 CIM 架構的器件物理特性。
為什么要內存中計算?
傳統上,計算主要依賴于基于馮諾依曼架構的互連設備。在此架構的簡化版本中,存在三個計算構建:內存、輸入/輸出 (I/O) 接口和中央處理單元 (CPU)。
馮諾依曼架構,其中內存與CPU不位于同一位置。圖片由Nature提供
每個構建塊都可以根據 CPU 給出的指令與其他構建塊交互。然而,隨著 CPU 速度的提高,內存訪問速度會大大降低整個系統的性能。這在需要大量數據的人工智能等數據密集型用例中更為復雜。此外,如果內存未與處理器位于同一位置,則由于光速限制會進一步降低性能。
所有這些問題都可以通過 CIM 系統來解決。在 CIM 系統中,內存塊和處理器之間的距離大大縮短,內存傳輸速度可能會更高,從而可以實現更快的計算。
氮化鈧鋁:內置高效內存
UPenn 的 CIM 系統利用氮化鈧鋁(AlScN) 的獨特材料特性來生產小型高效的內存塊。AlScN 是一種鐵電材料,這意味著它可能在外部電場的響應下產生極化。通過改變施加的電場超過一定的閾值,鐵電二極管(FeD)可以被編程到低電阻或高電阻狀態(分別為LRS或HRS)。
顯示兩種極化狀態的 AlScN 鐵電二極管插圖。每個狀態都表現出低電阻或高電阻狀態,使其成為一種有效的記憶形式。圖片由UPenn ESE提供
除了作為存儲單元的可操作性之外,AlScN 還可用于創建沒有晶體管的三元內容可尋址存儲 (TCAM) 單元。TCAM 單元對于大數據應用非常重要,因為使用馮諾依曼架構搜索數據可能非常耗時。使用 LRS 和 HRS 狀態的組合,研究人員實現了一個有效的三態并聯,所有這些都沒有使用晶體管。
使用無晶體管 CIM 陣列的神經網絡
為了展示 AlScN 執行 CIM 操作的能力,UPenn 小組開發了一個使用 FeD 陣列的卷積神經網絡 (CNN)。該陣列通過對輸入電壓產生的輸出電流求和來有效地完成矩陣乘法。權重矩陣(即輸出電流和輸入電壓之間的關系)可以通過修改單元的電導率來調整到離散水平。這種調諧是通過偏置 AlScN 薄膜以表現出所需的電導來實現的。
由 AlScN FeD 陣列組成的神經網絡。通過調整每個 FeD 的電導率,可以修改權重/電導矩陣以實現矩陣乘法。圖片由UPenn ESE提供
AlScN CNN 僅使用 4 位電導率分辨率就成功地從MNIST 數據集中識別出手寫數字,與 32 位浮點軟件相比,性能僅下降約為 2%。此外,由于沒有晶體管,架構簡單且可擴展,使其成為未來需要高性能矩陣代數的人工智能應用的優秀計算技術。
打破馮諾依曼瓶頸
在其存在的大部分時間里,人工智能計算主要是一個軟件領域。然而,隨著數據變得更加密集,馮諾依曼瓶頸對系統有效計算的能力產生了更深的影響,使得非常規架構變得更加有價值。
基于AlScN FeDs的模擬CIM系統消除了訓練和評估神經網絡的一個主要延遲原因,使其更容易在現場部署。AlScN器件與現有硅硬件集成的多功能性可能會提供一種突破性的方法,將人工智能集成到更多的領域。
審核編輯:劉清
-
晶體管
+關注
關注
77文章
9734瀏覽量
138688 -
TCAM
+關注
關注
0文章
19瀏覽量
14080 -
CIM
+關注
關注
1文章
87瀏覽量
14932
原文標題:無晶體管的存內計算架構
文章出處:【微信號:bdtdsj,微信公眾號:中科院半導體所】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論