在芯片設計階段慎重考慮所使用的DRAM的類型及其訪問方式在實現性能優化方面越來越重要。
現階段芯片制造商在努力解決芯片上或封裝中的問題,正在更加關注DRAM,將附加內存視為一個關鍵的設計元素,而這可能會影響系統性能、功率和成本。普遍的共識是,如果要達到每瓦特處理更多數據所需的更高的性能水平,就必須提高能效。在給定的功率預算內,所使用的DRAM的類型及其訪問方式在實現性能目標方面發揮著越來越重要的作用。
“如何降低功率是在保持信號的完整性和達到所需的性能水平同時提高能效的問題。”Rambus的科學家說。以前只用于一種類型的內存,但現在多通道已經在市場上實現。目前市場主要的問題是圍繞著什么概念被借用到其他類型的內存中,以及低功耗市場將如何開始影響主內存。低功耗工程團隊一直專注于試圖節省性能開銷,并保持在一定的功率范圍內。“鑒于DRAM都基于相同的供電技術,所以問題的關鍵是如何優化周圍的一切,如何優化低功耗環境,以及如何優化高性能環境。”
瑞薩半導體副總裁兼總經理拉米·塞西對此表示同意。“人們普遍承認DDR總線在支持多時隙配置方面的能力將隨著時間的推移而變得越來越困難。當你以每秒6、7、8GB的傳輸速度運行這種寬并行偽差分總線時,首先你將失去第二個時隙,在這些速度下的多插槽配置也無法支持。當這種情況發生時,產品的記憶容量實際上減少了一半。DRAM擴展和密度增加將彌補其中的一些不足,用戶可以繼續向內存控制器添加越來越多的通道。但最終這將失去動力,這種方法無法提供所需的增量容量。”
西門子EDA負責數字設計實施的技術產品管理總監Stuart Clubb也指出了類似的趨勢。幾年前,英偉達發表的一份能源成本比較報告顯示,通過同樣的計算工作,使用主存(特別是DRAM)與本地CPU寄存器的能源成本大約要高出200倍。過去的其他論文也詳細描述了1級緩存和主存之間的功率成本近20倍的差異。”
此外,隨著功率和能量成為更重要的產品指標,使用特定于應用程序的加速器來補充通用計算資源的情況正在增加。
Clubb說:“無論是內存處理、計算存儲、SoC或PCI服務器端基于總線的加速器,還是在線預處理上,對降低主內存相關能源成本的高效硬件的需求都在增長。客戶需要針對特定任務構建專門的加速器,以實現低能耗。雖然傳統的RTL功率估計和優化工具可以幫助進行一般的RTL設計工作,但在這個加速器空間中,高級合成的使用有所上升。具有本地化低功耗內存解決方案的定制加速器的優點是,在不使用時,客戶可以完全關閉它們,這是CPU/GPU/NPU類型的解決方案無法做到的。無論如何嘗試優化主內存架構,數據移動的能源成本可能都是客戶真正想要盡可能避免的。”這是Compute Express Link(CPU到內存互連規范)的主要驅動程序之一。“CXL基本上允許串行連接,”瑞薩的Sethi說。“業界正在減少所需的管腳數量,可以將基于CXL的模塊放在離CPU更遠的地方,并且具有比直接與DDR連接更好的擴展性。這些模塊看起來更像存儲設備、SSD或PCIe插件,因此可以獲得更高的密度。然后,CXL還為緩存連接等提供了許多協議掛鉤,它允許DRAM看起來更像直接連接的DRAM,或者至少像非均勻內存訪問(NUMA)方式的DRAM訪問。”
反過來,這需要更多地考慮如何構建內存,以及使用哪種類型的內存。馬克指出:“當人們在內存之間進行選擇時,例如DDR和LPDDR,實際上,有些東西在很長一段時間內都會成為DDR。如果你要構建一個大型服務器,你可能會用DDR構建內存。如果你要設計一個手機,你可能會用LPDDR構建內存。”Cadence產品營銷、DDR、HBM、閃存/存儲和MIPI IP的集團總監Greenberg說到。“然而,差異并不那么明顯。在過去五年里,它變得越來越模糊,例如,LPDDR被用于傳統上可能完全屬于DDR內存的地方。”
“DDR內存的優點之一是可以添加容量,因此,如果你想添加更多的存儲,在大多數情況下,DDR是實現這一點的方法。LPDDR內存提供的是一定范圍的內存密度。我們看到LPDDR內存開始通過各種機器學習/人工智能加速器進入服務器領域。”
每種內存類型都有許多屬性,從接口上可以放置多少容量到添加容量的容易程度以及支持多少帶寬。還有電力和企業可靠性標準需要考慮。Greenberg指出,在某些情況下,LPDDR比DDR內存更好地滿足某些類型系統的要求,即使它是傳統的DDR類型的應用程序。
Keysight Technologies內存解決方案項目經理蘭迪·懷特認為,或多或少有兩種選擇——DDR或LPDDR,HBM和GDDR被用于更專業的設計中。“除非你專注于一個小眾應用程序,否則真正的選擇可以歸結為兩種。DDR可能是數據中心和臺式機之間內存容量的60%到70%。LPDDR是30%或更多,這一數字正在增長,因為它跟蹤了從手機引入其他移動設備的新產品的數量。同時,LPDDR往往比主流DDR領先一個百分點。多年來都是這樣,為什么LPDDR總是突破極限,也總是提前發布規格?這是因為手機是目標市場,而這也有大量的商機。
懷特說,這一決定取決于兩件事——容量和應用程序。“你需要超過64GB的內存嗎?一部手機或一個移動應用程序需要16GB到32GB的系統內存。這與所有視頻和文件的存儲不同。你為此付出了很多錢,買手機的時候手機廠商還會讓你選,但系統內存是固定的,但你很少注意。對于手機來說,你感覺真的不需要那個內存。”一臺運行數千臺虛擬機、進行金融交易、工程、數據庫查詢或Netflix流媒體的服務器需要TB級或更大的內存。這是第一選擇標準。你又想要多少呢?”
第二個考慮因素是它的發展方向。懷特說:“你想要的是什么?服務器需要大量內存,所以它們有許多DIMM插槽。但是你要如何將64GB、多個內存芯片放入一部手機?對于手機、顯示器、電池和處理器來說,空間的限制是不同的。”
另一個考慮因素涉及移動設計的演變。“你需要更多的計算能力,需要更多的內存,但空間正在縮小,你如何應對?這是一個非常吸引人的趨勢。處理器和內存本身之間的集成度要高得多。如果看看5年或10年前的一款舊手機,處理器位于主板的一部分,然后信號被發送到可能是一英寸或兩英寸的主板 ,然后到內存組件,然后信號來回傳遞。現在我們看到了芯片堆疊對封裝產生的趨勢。現在你可以疊加到16個,這就是為什么你得到32GB或更多的空間,因為這些內存芯片不超過2GB或4GB。集成度越來越高,空間也越來越大,速度也越來越快,如果不在電路板上傳輸那么遠的話,無法獲得更好的信號完整性。
同時,這并不意味著系統架構師更容易進行權衡。事實上,工程團隊在DDR、LPDDR、GDDR6甚至HBM之間多次改變主意并不罕見,Cadence的Greenberg也提醒到。
他說:“人們會在這些決定之間來回嘗試,權衡所有選擇,看看結果如何,有時在評估一段時間后會改變類型。他們通常會做系統級建模,他們會有一個視圖和神經網絡的模型,以及內存接口和內存本身的模型。工程師會在它上面運行流量,看看它看起來如何,并獲得性能評估。然后他們會看看每個要消耗多少成本。但是,使用HBM內存也有很多相關成本,因此工程團隊可以從HBM開始,運行模擬,當所有模擬看起來都很好時,他們將確認需要為連接HBM的芯片支付多少費用。然后他們將開始研究其他技術。HBM確實以價格提供了出色的性能。但是你想不想付出這個代價?有些應用程序需要HBM,而這些設備最終將達到一個價格點,在這個價格點上,它們可以證明內存使用是合理的。但還有很多其他設備不需要那么多性能,在某些情況下,它們可以歸結為GDDR6、LPDDR5和DDR5。”
圖1:GDDR6 16G數據眼與通道效應的模擬。
此外,當重點放在低功耗上時,假設LPDDR是無與倫比的是不對的。“真正的低功耗內存是HBM,”Synopsys產品營銷高級經理格雷厄姆·艾倫說。HBM是最終的點對點,因為它在同一個封裝中,在某種形式的插入器上。在SoC上的物理接口和DRAM上的物理接口之間有一條很短的路徑,它不會消耗任何終端電源。如果你看看能耗,你會發現HBM的功率效率是所有DRAM中最好的。因此,HBM確實是最終的低功耗DRAM。
另一種減少功率的方法是將DRAM的核心電源與I/O分開,這是內存在歷史上所沒有利用的。比如LPDDR4和LPDDR4x之間的主要區別是從DRAM獲取電源并將其切斷,也就是一個電源用于輸入/輸出,一個電源用于DRAM。”
“對于主機來說,不幸的是,如果是為LPDDR4設計的,那么需要把LPDDR4信號輸出到DRAM。如果是LPDDR4x DRAM,你會說,‘這些信號對我來說有點太強,電壓太高。我不能保證我的長期可靠性不受你給我的影響。因此,從技術上講,您違反了DRAM的超調/欠調規格。”你必須經歷一個轉變的過程。我們的客戶正在尋求有關DDR4到LPDDR4x的幫助。歸根結底,這沒省多少電。對于整個子系統的節能來說,可能在15%的范圍內。這是因為DRAM的核心需要大量電力,這不會改變電力供應鏈,所以也不會改變它們的工作方式。只需更改輸入/輸出的電壓,以通過總線傳輸數據。在SoC上的物理層中不光可以這樣做,在DRAM上的物理層中也能這樣做。現在有趣的是,當我們從HBM2和HBM2e轉換到HBM3時,我們已經從HBM2e的普通1.2伏電壓轉換為HBM3上I/O的0.4伏工作電源,因此我們將其減少了三分之一。這節省了大量電力,尤其是當有1024臺這樣的機器一起運行時。”
就可靠性問題 Rambus表示,與上述所有考慮相比,人們越來越擔心系統的可靠性。“可靠性正成為一個越來越突出的一流設計參數。在較小的工藝幾何圖形中,事情會變得更加復雜,事情會產生干擾,設備的可靠性變得困難。我們看到刷新時間/刷新間隔在下降,因為電容式電池越來越小。這些都反映了可靠性變得越來越重要。問題是,隨著完整性變得更具挑戰性,這些DRAM的架構如何變化?是更多的ECC還是類似的東西?”
那么,接下來會發生什么呢?這個行業將如何向前發展呢?吳宇說:“我們傾向于看到在組件級別上出現的問題真正具有挑戰性,要么是因為技術上很困難,要么是因為非常昂貴。”“我們傾向于看到這些問題被拉到系統層面,而人們則試圖在系統層面找到解決這些問題的方法。”
審核編輯 :李倩
-
半導體
+關注
關注
334文章
27583瀏覽量
220564 -
DRAM
+關注
關注
40文章
2320瀏覽量
183693 -
DDR
+關注
關注
11文章
712瀏覽量
65425
原文標題:選擇何種DRAM成為設計中心的考慮因素
文章出處:【微信號:ICViews,微信公眾號:半導體產業縱橫】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論