簡介
QDR SRAM 器件為滿足更高的帶寬存儲要求而開發,以網絡和電信應用為目標。基本 QDR 架構具有獨立的讀、寫數據通路,便于同時操作。每個時鐘周期內,兩個通路均使用雙倍數據速率 (DDR) 傳輸發送兩個字,一個在時鐘上升沿發送,一個在時鐘下降沿發送。結果,在每個時鐘周期內會傳輸四個總線寬度的數據(兩個讀和兩個寫),這就是四倍數據速率的由來。
QDR I 和 QDR II 的規范由 QDR 聯盟(Cypress、IDT、NEC、Samsung 和 Renesas)共同定義和開發。
QDR 存儲器器件以 2 字突發和 4 字突發架構提供。針對每個讀或寫請求,2 字突發器件傳輸兩個字。DDR 地址總線用于在前半個時鐘周期允許讀請求,在后半個時鐘周期允許寫請求。與之相反,4 字突發器件針對每個讀或寫請求傳輸四個字,這樣便只需要一個單倍數據速率 (SDR)地址總線,就能最大程度地利用數據帶寬。讀、寫操作請求必須在交替的時鐘周期(即不重疊的時鐘周期)內進行,以分享地址總線。
本應用指南所討論的參考設計針對的是 4 字突發 QDR II SRAM 器件。QDR II 架構的獨特性能之一是源同步回送時鐘 (CQ) 輸出,它與器件輸入時鐘 (K) 頻率相同,與通過讀通路輸出 (Q) 傳輸的數據邊沿對齊。CQ 時鐘輸出使用 QDR II 存儲器器件內的延遲鎖定環 (DLL) 電路被重新安排,使其與 Q 數據輸出對齊。對于在遠端器件上進行的讀數據采集操作,此種時鐘傳輸(亦稱源同步)接口方法允許較大的時序余量。
4 字突發 QDR II 存儲器接口上的并發讀/ 寫操作。QDR II 存儲器的所有輸入與輸入時鐘(K 和 K)同步,傳輸給存儲器時,數據中心通常與輸入時鐘 K 及 K 邊沿對齊。
注: 低有效的讀控制 (R) 和寫控制 (W) 引腳在時鐘周期內交替出現,以實現單獨 SDR 地址總線 (SA) 的共享。
寫總線數據輸入 (D) 值在 DDR 模式下被發送到存儲器,開始于寫控制引腳激活后的下一個K時鐘上升沿。讀總線數據輸出 (Q) 值在 DDR 模式下從存儲器中發送,并與 CQ 和 CQ 源同步回送時鐘輸出邊沿對齊。在 CQ 時鐘輸出的上升沿(緊隨 K 輸入時鐘的下一個上升沿之后),讀總線中的第一個字開始發送。
在從數據輸入 (D) 字中選擇要寫入存儲器的特定字節時,QDR II 存儲器還可使用低有效的字節寫 (BW) 使能引腳。為清晰起見,圖1 中省略了這些信號。
圖1 的時序圖表示 2 字突發 QDR II 存儲器接口上的并發讀/ 寫操作。在時鐘的前半個周期,DDR 地址總線允許讀地址被傳輸給存儲器;在時鐘的后半個周期,DDR 地址總線允許寫地址出現于其中。因此,低有效的讀控制 (/R) 和寫控制 (/W) 引腳可在同一時鐘周期內設定。
兩個寫總線數據輸入 (D) 值在 DDR 模式下被發送到存儲器,開始于寫地址有效前的那個 K 時鐘上升沿。讀總線數據輸出 (Q) 值在 DDR 模式下從存儲器中發送,并與 CQ 和 /CQ 源同步回送時鐘輸出邊沿對齊。在 /CQ 時鐘輸出的上升沿(緊隨 /K 輸入時鐘的下一個上升沿之后),讀總線中的第一個字開始發送。
設計概述
圖2 為 Virtex-5 QDR II 參考設計的高層次框圖,表明了 QDR II 存儲器器件的外部連接以及用于發送讀/ 寫命令的 FPGA 內部資源接口。
在圖2 中,QDR II 器件的 C 和 C 引腳均被設定為 High。
如第 4 頁圖3 所示,Virtex-5 QDR II 參考設計由以下四個主要部分組成:
用戶接口
物理接口
讀/ 寫狀態機
延遲校準狀態機
此用戶接口使用完全基于 SDR 信號的簡單協議創建讀/ 寫請求。此模塊主要由 FIFO16 基元構成,用于在讀/ 寫操作執行前后存儲相應的地址和數據值。有關用戶接口時序協議的詳情,請參閱第 5 頁“用戶接口”。
讀/ 寫狀態機主要負責監控用戶接口模塊內 FIFO 的狀態,調整用戶接口和物理接口間的數據流,并向外部存儲器器件發送實際讀/ 寫命令。此狀態機確保讀/ 寫操作按照 QDR II 存儲器規范的要求,以并發方式在最短延遲內完成。
物理接口負責生成正確的時序關系和 DDR 信號,以便以符合其命令協議和時序要求的方式與外部存儲器器件通信。
延遲校準狀態機是物理層中一個不可分割的組成部分,大大簡化了在 FPGA 內采集讀數據的任務,同時又可實現最佳性能。Virtex-5 器件的每個輸入引腳都包含一個可動態調整的可編程延遲元件 (IDELAY),用于控制 5 ns 窗口中輸入通路上的延遲時間。延遲校準狀態機利用此獨特功能調整從存儲器器件返回的讀數據的時序,因此它無需任何復雜的數據采集技術即可直接與全局 FPGA 系統時鐘 (USER_CLK0) 實現同步。
第 5 頁表1 總結了 Virtex-5 QDR II 參考設計的規范,包括性能目標和器件應用細節。
實現詳情
實現QDR II 參考設計的目的是利用 Virtex-5 系列的獨特功能。I/O、時鐘控制和存儲元件技術方面的發展使此設計的高性能和全承包操作得以實現。以下部分對此設計的實現給出進一步的詳細說明。
用戶接口
用戶接口模塊利用六個 FIFO16 模塊來存儲讀/ 寫操作的地址和數據值。三個 FIFO16 模塊用于寫命令,一個用于存儲寫地址 (USER_AD_WR) 和字節寫使能 (USER_BW_n) 信號,另外兩個用于存儲要寫入存儲器的 Low (USER_DWL) 和 High (USER_DWH) 36 位數據字。讀命令也使用三個 FIFO16 模塊,一個用于存儲讀地址 (USER_AD_RD),另兩個用于存儲由于執行讀而從存儲器中返回的 Low (USER_QRL) 和 High (USER_QRH) 36 位數據字。
第 6 頁圖4 表示使用 4 字突發參考設計時,向用戶接口發送讀/ 寫請求所需的時序協議。如前所述,此接口使用了所有已與主 FPGA 設計系統時鐘 (USER_CLK0) 同步的 SDR 信號。
寫請求在 USER_CLK0 上升沿期間通過低有效的 USER_W_n 信號創建。此 18 位寫地址(USER_AD_WR) 必須在此同一時鐘邊沿傳輸。此時,要寫入存儲器的第一個和第二個 36 位數據字也會分別傳輸給 36 位 USER_DWL 和 USER_DWH 輸入總線。4 字突發的第三個字和第四個字會在下一個 USER_CLK0 上升沿分別傳輸給 USER_DWL 和 USER_DWH。
讀請求在 USER_CLK0 上升沿期間通過低有效的 USER_R_n 信號創建。此 18 位讀地址(USER_AD_RD) 必須在此同一時鐘邊沿傳輸。執行讀命令后,4 字突發值存儲于讀數據 FIFO中。在 USER_CLK0 上升沿,一個低有效的 USER_QEN_n 信號會檢索這些值并將其傳輸至 36位 USER_QRL 和 USER_QRH 輸出。第一和第二個字在首個周期中傳輸,此時的USER_QEN_n 設置為 Low,緊接著是第三和第四個字在隨后一個周期中傳輸,此時的USER_QEN_n 也設置為 Low。
與 QDR II 存儲器本身不同,用戶接口在同一時鐘周期接受讀、寫請求(如圖4 所示的第三個周期)。讀/ 寫狀態機管理向外部存儲器器件所發送的讀與寫請求的交替,使用戶接口免于承擔這項職責。
用戶接口還提供了一批用于指示讀/ 寫 FIFO 狀態的信號,在圖4 中未顯示。高有效的
USER_WR_FULL 輸出表明寫 FIFO 已滿。此情況表明,寫請求隊列縮減之前將不再接受任何寫請求。USER_WR_FULL 為 High 時創建的任何寫請求都將被直接忽略。類似情況適用于讀請求的 USER_RD_FULL 信號。
高有效的 USER_QR_EMPTY 輸出表明不再有讀數據值存儲在讀數據 FIFO 中。在此情況下從USER_QRL 和 USER_QRH 總線讀值的嘗試將被忽略。此情況會一直持續,直到執行其他讀命令并且有相關數據值存入讀數據 FIFO。
讀/ 寫狀態機
第 8 頁圖5 為 4 字突發讀/ 寫狀態機的狀態圖。此狀態機負責調節用戶接口和物理接口之間的數據流。它根據保存在用戶接口 FIFO 中的請求向外部存儲器器件發送讀/ 寫命令。
USER_RESET 每次都會將狀態機恢復到 INIT 狀態,此時存儲器暫停運行,直到延遲校準狀態機完成所有 QDR_Q 輸入的 IDELAY 模塊上的延遲調整,使讀通路數據與 FPGA 系統時鐘(USER_CLK0) 中心對齊。校準操作完成的信號是一個高有效的 DLY_CAL_DONE 輸入,該輸入將讀/ 寫狀態機轉換到空閑狀態,以等候來自用戶接口的讀/ 寫請求。
在空閑狀態,寫命令首先假設向存儲器寫數據必須始終發生在任何有效讀數據出現之前。當沒有待處理的讀或寫請求時,此狀態機將在空閑狀態下循環運行。
用戶接口 FIFO 中的待處理寫請求會使狀態機轉入寫狀態,在此狀態下,寫命令通過內部的WR_INIT_n 選通脈沖發送。此選通脈沖從 FIFO 中取出寫地址和數據值,并使外部 QDR_W_n寫控制選通脈沖進入存儲器器件。
如果包含待處理讀請求,此狀態機會隨之轉入讀狀態,此時內部 RD_INIT_n 選通脈沖被激活。RD_INIT_n 選通脈沖從 FIFO 中取出讀地址,并向存儲器器件發送一個外部 QDR_R_n 選通脈沖。作為此處理過程的結果之一,對讀數據 FIFO 中的返回值也將進行采集。
讀/ 寫狀態機持續監控用戶接口 FIFO 狀態信號,以確定是否存在待處理讀/ 寫請求。連續不斷的并發讀/ 寫請求流將導致狀態機只在讀狀態和寫狀態之間轉換,以確保正確無誤地將請求交替發送到外部存儲器。一串只寫請求將導致空閑狀態和寫狀態輪流出現,同樣,一串讀請求也會在空閑狀態和讀狀態間轉換。
物理接口
Virtex-5 QDR II 參考設計的物理接口為讀/ 寫命令與外部存儲器器件之間的通信生成實際的I/O 信號和時序關系,包括 DDR 數據信號。它提供必要的時序余量及為滿足整體設計性能規范所需的 I/O 信號標準。QDR II 設計的所有 I/O 信號都使用 HSTL-I 發送。此部分詳細介紹物理接口的每個部件。
時鐘控制機制
此 QDR II 設計使用的是所有 Virtex-5 I/O 模塊中都有的輸出 DDR (ODDR) 基元。這些內置DDR 寄存器功能極大地簡化了以下任務:生成準確的時鐘、地址和數據,以及與 QDR II 存儲器器件通信的控制信號。IDDR 和 ODDR 基元都有多種運行模式,可分別確定采集或傳輸的DDR 數據以怎樣的方式出現在 FPGA 內部資源和 I/O 引腳中。
QDR II 設計中的時鐘控制機制(第 9 頁圖6)使用反沿 (opposite-edge) 模式的 ODDR 寄存器來為存儲器器件生成 QDR_K 和 QDR_K_n 時鐘。因為時鐘信號的時序與 QDR II 地址、數據和控制信號幾乎相同,此時鐘傳輸機制會有效地從時序余量因素中刪除 FPGA 的 clock-to-out參數。因此,就 clock-to-out 參數而言,所有外部傳輸信號都得以“匹配”。
寫通路
QDR II 存儲器的寫通路包括執行寫操作所必需的地址、數據和控制信號。寫地址
(QDR_AD_WR)、控制選通脈沖 (QDR_W_n) 和字節寫使能 (QDR_BW_n) 信號都使用 SDR 格式。不過,寫數據值 (QDR_D) 利用 DDR 信號在規定的時鐘周期實現所需的 2 字或 4 字突發。
所有這些寫通路信號在傳輸時都必須與 QDR_K 和 QDR_K_n 時鐘邊沿中心對齊。因此,這些信號的輸出寄存器與 USER_CLK270 時鐘同步。信號以同樣的頻率運行,但對于 USER_CLK0則會出現 270°(時鐘周期的 75%)的相差。這能確保對輸入 QDR_K 和 QDR_K_n 時鐘邊沿而言,存儲器器件有足夠的建立與保持余量。
第 10 頁圖7 說明了如何使用 USER_CLK270 和 ODDR 寄存器為 QDR_D 寫數據通路生成所需的 DDR 信號。ODDR 寄存器配置為同沿 (same-edge) 模式,允許在 USER_CLK270 的同一上升沿從 FPGA 架構中同時采集兩個 36 位數據字(FIFO_DWL 和 FIFO_DWH)。FIFO_DWL 值在此上升沿后立即發送到 QDR_D 寫數據總線,隨后,FIFO_DWH 值在 USER_CLK270 的下一個下降沿從 ODDR 模塊發送。對此過程加以重復,以生成一個 4 字寫數據突發。
使用 I/O 模塊中的單個觸發器以類似的方式生成讀/ 寫地址、字節寫使能和讀/ 寫控制選通脈沖,以創建與 USER_CLK270 同步的 SDR 信號。
讀數據通路
基于 CQ 的數據采集機制可以實現以極高的時鐘速率從存儲器中采集讀數據。此數據采集機制使用在每個 I/O 中都提供的 ISERDES 功能。輸入時鐘 (CQ) 和數據 (Q) 經延遲后與 ISERDES 模塊中的系統時鐘 (CLK0) 保持同步。
讀數據通路包括兩個階段:讀數據采集和讀數據重新采集。兩個階段均在各個 Virtex-5 I/O 的內置 ISERDES 中實現。途經 BUFIO 的 CQ 信號將采集 ISERDES 模塊內首組寄存器中的輸入讀數據 (Q)。第二組寄存器用來將 CQ 域中的數據傳輸至系統時鐘域。
ISERDES 具有三種時鐘輸入:CLK、OCLK 和 CLKDIV。讀數據 (Q) 在 CLK (CQ) 域經采集完成后,通過 OCLK 和 CLKDIV 傳輸至系統時鐘(圖8):
CLK:布線通過 BUFIO 的讀時鐘 (CQ) 提供 CLK 時鐘輸入。
OCLK 和 CLKDIV:這些時鐘負責對輸入數據進行串并轉換。由于數據以與接口速度相同的頻率進行傳輸,系統時鐘 (CLK_0) 提供針對 OCLK 和 CLKDIV 的輸入。
在ISERDES 中采集到的數據可以被寫入 Virtex-5 FPGA 中的內置 FIFO36 模塊。
基于 CQ 的數據采集機制要求將讀時鐘(CQ 和 CQ)置于 clock-capable I/O (CCIO) 中,時鐘從這些位置可以訪問各組 (bank) 內可用的 BUFIO。
對于 x36 寬的 QDR II SRAM 接口,CQ_P 和 CQ_N 均用來采集讀數據(第 11 頁圖9)。一個Virtex-5 器件中的每個組都包含 40 個 I/O,因此一個 x36 接口的讀數據需要置于兩個組中。
CQ_P 用來采集一個組中的首組字節,而 CQ_N 用來采集相鄰組中剩余的數據字節。CQ_P 和CQ_N 均需置于相應組中 CCIO 的 P 側。
延遲校準
延遲校準邏輯負責提供讀數據 (Q) 和時鐘 (CQ) 所需要的延遲,以便將采集到的數據與 FPGA時鐘中心對齊。當來自 IDELAYCTRL 的 IDELAY_READY 信號設定為 High,且存儲器初始化所需的時鐘周期得到滿足時,延遲校準狀態機就會啟動。校準過程包含單次寫,隨后向同一位置連續進行讀,直到找到 Q 和 CQ 信號正好需要的延遲值。讀校準開始后,校準狀態機會執行以下步驟:
1. 增加 CQ 和 Q 上的 tap 延遲值。如果在某個 tap 值上初次獲取了有效數據,則此 tap 值標志著數據有效窗口的開端。
2. 繼續增加 CQ 和 Q 的 tap 延遲值,直到達到有效窗口的終端。
3. 將 CQ 置于此有效窗口的中央。降低 tap 值,直到 CQ 被固定于數據有效窗口的中央。
4. 對于 CQ 和 FPGA 時鐘,數據總線 (Q) 將置于中央。重新設置 Q 的 tap 值,即可針對 CQ和系統時鐘 (CLK0) 得出 Q 的有效窗口。對于 CQ 和 FPGA 時鐘,數據信號 (Q) 將置于中央。
當所有 Q 信號圍繞 CQ 固定后,延遲校準過程就結束了,并繼之以讀使能校準。
讀使能邏輯對向存儲器發送的讀命令進行校準,為已采集到并寫入讀數據 FIFO 的數據生成寫使能。校準邏輯使用 SRL16 構建而成,有助于確定讀命令信號所需寄存器級數的數量,以生成正確的寫使能信號。
板設計中的考慮因素
盡管 Virtex-5 系列產品提供了許多與 I/O 和時鐘控制相關的高級功能,大大簡化了存儲器接口設計,但為了使接口可靠而高效,仍需注意基本的電路板設計標準。
需特別強調的是,讀和寫通路接口的源同步特性要求接口時鐘、數據及控制信號具有相匹配的電路板布線長度。
例如,QDR II 器件輸入信號(QDR_K、QDR_K_n、QDR_W_n、QDR_R_n、QDR_SA、QDR_BW_n 和 QDR_D)的布線長度必須完全匹配,以將控制、地址及數據線接至具備充足建立與保持余量的存儲器器件。物理接口的實現可確保這些信號在離開 FPGA 器件輸出時與QDR_K 和 QDR_K_n 時鐘邊沿中心對齊。電路板布線必須確保這種關聯狀態能持續到存儲器器件輸入。
同樣,QDR II 器件輸出信號(QDR_Q、QDR_CQ)必須具備完全匹配的布線長度,以使這些信號在 Virtex-5 器件的輸入端實現邊沿對齊。要實現直接時鐘控制讀數據采集方法,這一點非常關鍵。所有合理的板設計工具都可以在可接受的容錯范圍內輕松滿足這些布線長度。
時序分析
本 Virtex-5 QDR II 參考設計利用該器件的獨特 I/O 和時鐘控制功能,可最大限度地提高性能與時序余量,同時大大降低對詳細布局和管腳分配分析的需求。
本部分針對地址/ 控制通路、寫數據通路及讀(或采集)數據通路給出一個時序分析示例。
地址/ 控制通路
先前已討論過,讀/ 寫地址總線、字節寫使能信號和讀/ 寫控制選通脈沖都與USER_CLK270時鐘保持同步。這可以確保,對于來自 USER_CLK0 的輸入 QDR_K 和 QDR_K_n 時鐘邊沿,這些 SDR 信號具備對存儲器器件的有充足的建立與保持余量。
表2 根據用一個 Virtex-5 器件實現的 300 MHz 4 字突發 QDR II 存儲器器件接口,顯示針對這些信號的一個時序分析示例。
寫數據通路
寫數據 (QDR_D) 也與 USER_CLK270 保持同步。不過,寫數據字作為 DDR 進行發送,因此在QDR_K 和 QDR_K_n 上升沿均需具備充足的建立與保持余量。相應地,表3 所示寫通路的時序分析包括了存儲器時鐘的最大占空比失真,并基于 300 MHz 4 字突發 QDR II 存儲器器件及速度級別為 -11 的 Virtex-5 器件。
讀數據通路(數據采集)
讀數據通路 (QDR_Q) 值直接被采集至 SERDES 內的 USER_CLK0 時鐘域。表4 顯示讀數據采集的時序分析。
結論
本應用指南說明了利用 Virtex-5 器件實現 4 字突發 QDR II SRAM 接口及其時序的詳細信息。
數據采集機制的應用大大簡化了在 FPGA 內采集讀數據的任務,且為當前及下一代 QDR IISRAM 存儲器器件提供了高效、強大、可擴展的存儲器接口解決方案。
-
FPGA
+關注
關注
1629文章
21748瀏覽量
603909 -
存儲器
+關注
關注
38文章
7496瀏覽量
163924 -
DDR
+關注
關注
11文章
712瀏覽量
65371
發布評論請先 登錄
相關推薦
評論