串行RapidIO提升模塊化基站設計
蜂窩基站的模塊化設計和制造對組合視頻、語音和數據等 3G 移動服務,即通常所說的“三重服務”至關重要。但是,為什么模塊化設計如此重要呢?
事實上,客戶認為基站價格每年必須下降 80%。為了盡可能具成本效益地提供高帶寬要求的服務,服務提供商也要求吞吐量有顯著的增加——保證 10 Gbps。這就產生了一個,如何解決降低成本和提高性能這一明顯矛盾的問題?
將來,模塊化必將降低制造成本和設備升級成本,以滿足更嚴格的要求。然而,隨著符合標準的特定應用系統元件(ASSC)的部署,模塊化也可以滿足顯著增長的系統性能需求。結果如何呢?更高的吞吐量可以增加任何給定時隙的服務容量,從而可以降低服務的單位成本。
那么,我們怎樣實現模塊化呢?利用更低成本的標準元件來代替相對昂貴的基于蜂窩和 FPGA 的 ASIC 器件來實現該目標尚有很長一段路。但是,如果這些標準元件在沒有采用定制設計接口的條件下進行互操作,就需要標準接口。定制設計接口是標準元件有效使用的天敵,并可阻礙制造商最大限度地利用模塊化的能力。
串行 RapidIO 是為解決嵌入式系統中此問題而設計的一種開放標準接口。在實現板上
本文將介紹在模塊化 3G 基站設計中,兩種串行 RapidIO ASSC 的使用如何將性能提高 20%,以及根據基站設計師的說法,與其它解決方案相比如何降低 50% ~ 75% 的材料成本(BOM)。特別是,我們描述了一個標準的 ASSC——10 Gbps 串行緩沖器,它可消除基站嚴重的吞吐量瓶頸 —— 幀樣本比較瓶頸;同時還討論了怎樣用另一個標準 ASSC,即預處理交換器,通過減輕數字信號處理器(DSP)負載來提高系統性能。
幀樣本比較瓶頸
今天的無線基站必須多次處理同一套數據來解碼不同的信息。例如在 3G 系統中同樣的硬件模塊(DSP 或碼片率處理 ASIC)需要獲得 10 ms的樣本幀數據來首先執行隨機存取通道(RACH)解碼,然后執行數據通道(DCH),而同樣的數據都要被集群中所有的 DSP 訪問。
然而,射頻(RF)環境的干擾會導致數據的失真、破壞以及數據包的丟失。為此,基站必須對數據進行時域比較,以提高實時處理算法程序的效率,來彌補這些錯誤和損失,基站需要對以前的幀樣本(n-1)和當前的幀樣本(n)進行對比。但是,在 3G 基站等較高數據吞吐量的系統中,樣本都是相當大的,并且系統吞吐量會因執行如此大的樣本比較而受到限制。
幀樣本比較問題通常消耗寶貴的系統資源來實現所需的速度,并且限制基站系統以具競爭力的價格支持增值服務的能力。3G、4G 及以上的下一代無線基礎設施需要 10 Gbps的基站數據處理速度,以使傳送到獨立終端的傳輸數目最多。
可行但又不太理想的幾種辦法
有限的本地存儲能力是瓶頸。基本上,DSP 本地存儲器沒有足夠的容量在一個操作中執行這種比較。解決這個問題的一種方法是將大數據樣本分成若干片段進行單獨處理,然后再將這些結果整合起來。不過,這會影響基帶的吞吐量并降低性能。無論如何,這些本地存儲器應該專門用于高速緩存和程序代碼。如果將它們用于另外的用途將導致需要更多板上其它地方的存儲器,同時還會產生器件和空間成本以及存儲器管理等問題。當然,基站制造商可以通過增加 DSP 的數量或提高速度來部分地彌補性能的下降。但是,這種增量的方法并不能解決根本問題 —— 存儲大量數據樣本并迅速將它們傳遞給 DSP 進行處理。
由于存儲容量是我們面臨的一個挑戰,我們可以在板上增加一個本地存儲器作為緩沖器來饋入其它本地存儲器。這將使存儲管理變得復雜,只不過是減輕瓶頸問題的權宜之計,而不能解決這個問題。
另一種選擇是,我們可以使用復制的并行存儲器。然而,這將使器件和板卡空間非常昂貴,并會顯著增加 BOM。此外,由于吞吐量需求增加,電路板需要進行重新設計以容納更大的存儲器。因此,這種方案不易于進行擴展。
還有一種方法是采用 FPGA 連接基帶交換器將數據存儲在共享系統存儲器中,這是一種具有高設計成本、更高風險和更高 BOM的定制設計。此外,定制器件采用具有標準接口規范的標準器件會破壞模塊的主要啟動程序。解決這個問題的基本架構方法就是使數據并行。但是,這將顯著增加器件的輸入和輸出量。此外,它明顯需要占據更多的電路板面積,并可能潛在地減少給定電路板所支持的通道數量。最終結果是將大幅增加 BOM 和服務交付單位成本。
最后,所有這些純存儲解決方案并沒有引入智能的系統數據處理。因此,定制電路必須可以發現丟失的數據包,同時用虛擬信息包來填補空隙,從而保持信息包同步性。集成了所需智能的標準樣本比較解決方案就可一舉兩得。
適當的解決方案
基于對上面一些方案的評估分析,我們列舉出一個最佳解決方案應該具備的性能如下:
● 解決方案必須包括一個有足夠能力存儲大量數據樣本的存儲器。
●?為了“未來驗證”該設計,存儲器必須可以擴展。
●?存儲器和DSP集群之間必須是串行接口,以使I/O數量最少。
●?存儲器的串行接口必須足夠快,可以10 Gbps 板卡級吞吐量饋入 DSP。
●?串行接口必須滿足DSP廠商采用的行業標準規范。
●?器件必須采用智能數據處理,以消除對必須是定制設計的專用器件的需求。
●?器件必須消除任何和全部定制方法 —— 必須是標準的特定應用系統元件。
換句話說,該解決方案是一種具有內置智
由串行RapidIO激活的串行緩沖器的容量為18MB,并可通過可選的四倍數據速率(QDR)方法擴展至 90MB,有助于以10 Gbps 速率實現大型、連續幀樣本的實時比較。
10 Gbps性能和高存儲容量可保證DSP在基站應用中以大約15ms的數據在一次執行中實時進行全幀計算。這種器件僅需要16個 I/O 引腳,不僅可使I/O數量最少,還可實現與 FPGA 的直接連接。
該串行緩沖器包含智能監控和可以自動識別和補償丟失數據包以維持數據同步的控制電路。此外,它還可以作為一個主節點,確定何時向何處發送數據,并開始數據傳輸而無需 DSP 其它幫助。
提升數字處理吞吐量
解決了樣本比較問題,我們可以看看另一個使用串行 RapidIO ASSC 的方面,即處理性能本身。當然,增加 DSP 的數量和/或性能都會增加系統吞吐量。但是,通過使 DSP 的負載處于最佳狀態就可以簡單地增加吞吐量。這就是預處理交換芯片的作用。
預處理交換芯片位于 RF 背板和 DSP之間,在數據到達 DSP 之前進行攔截。交換芯片有助于對有效負載數據進行信息包處理,并在 DSP 執行無線運算之前對有效負載進行優化。該器件可以在交換信息包的同時預處理數據。然后輸出信息包會以組播方式傳送至 DSP 集群。這種預處理器件不僅可提供預處理功能,而且還可以根據帶寬、流量和調用數據實現 DSP 配置的軟件確定“隨時可編程”的修改。因此,這種交換芯片使系統可動態地調整、開始和關閉路徑,以滿足帶寬變化的需要。與以往的無線基站架構不同,這種預處理芯片提供了在未來能夠很好利用的內在擴展性。
這種交換芯片可以進行定制,以適用于基于蜂窩的芯片或 FPGA。然而,該應用是采用標準接口規范的標準器件的理想選擇。大量的 ASSC 測試表明:它可將 DSP 負載減少 20%,從而有效地提高 DSP 的能力。此外,取代老式結構的 FPGA 和雙端口存儲器可以降低成本和設計的復雜性。
開發具有串行緩沖器和預處理交換芯片的基站
基站設計者表示,與其它解決方案相比,串行緩沖器和預處理交換芯片的組合不僅使 DSP 的負載降低了 20%,而且可使材料成本下降 50% ~ 75%。采用兩個器件組合的基站電路板請參考圖1。
顯然,成功設計的先決條件是這兩個 ASSC 組合與 DSP 進行無縫互操作。為了實現這樣的操作,基站設計者可使用一個由主要元件廠商共同開發的開發平臺。根據這樣的平臺就可著手進行軟件編程和實現早期原型,從而加速上市時間。該開發平臺包括 4 個交換連接的超高性能 DSP、預處理交換芯片,以及支持其它包括串行緩沖器的串行 RapidIO 端點的子卡擴展端口。同時也包括加速安裝、初始化和現場案例執行所需的所有軟件。該平臺有 3 個千兆以太網背板、1個線路 I/O;每個 DSP 有多達 128 MB的 DRAM DDR2;閃存(串行高速)和 I2C;系統主引導 JTAG、MMC;用于其它應用的 IPMI MMC控制;以及 1 個獨立操作的局部功率選擇。
總結
模塊化設計需要使用具有標準接口的標準元件。串行緩沖器可以解決幀樣本比較問題,預處理交換芯片可以解決吞吐量密集的數據處理和交換問題。采用串行 RapidIO 的組合可為用戶提供完整的處理和存儲解決方案,幫助其具成本效益地向終端客戶提供先進的 DSP 密集無線服務,如視頻、語音和數據。此外,它還可解決無線基礎設施中日益增長的吞吐量局限性問題;與其它解決方案相比,可將 DSP 負載減少 20%,降低材料成本 50% ~ 75%。
評論
查看更多