隨著互聯網業務的高速發展,對構建互聯網基礎架構的網絡設備提出了更高要求,例如容量、性能、擴展性以及QoS等諸多關鍵特性,而這往往是由其所采用的硬件架構決定的。以框式核心交換機為例,先后出現了多種硬件架構,而現在最為常用的有三種:Full-Mesh交換架構、Crossbar矩陣交換架構和基于Cell的CLOS交換架構。本文將通過對這三種硬件架構、報文轉發流程等原理的分析,全面剖析三種架構的優劣勢。
名詞解釋
架構說明
圖1:Full-Mesh架構圖
如圖1所示,所有業務線卡通過背板走線連接到其它線卡,因為Full-Mesh不需要外部的交換芯片,而是任意兩個節點間都有直接連接,故得名全連接。
由于各線卡需要Full-Mesh互聯,一個節點數為N的Full-Mesh,連接總數為【N×(N-1)】÷2,所以隨著節點數量增加連接總數也急劇上升,因而可擴展性較差,僅適用于槽位數量較少的核心設備。
報文轉發流程
1.報文從線卡進入,跨卡報文送到與目的線卡連接的背板通路;
2.報文到達目的線卡。
Crossbar
架構說明
圖2:Crossbar架構圖
如圖2所示,業務線卡通過背板走線連接到Crossbar芯片上,Crossbar芯片集成在主控引擎上。
圖3:Crossbar芯片架構
Crossbar芯片架構如圖3所示,每一條輸入鏈路和輸出鏈路都有一個CrossPoint,在CrossPoint處有一個半導體開關連接輸入線路和輸出線路,當來自某個端口的輸入線路需要交換到另一個端口的輸出點時,在CPU或交換矩陣的控制下,將交叉點的開關連接,數據就被發到另一個接口。
簡單地說,Crossbar 架構是一種兩級架構,它是一個開關矩陣,每一個CrossPoint都是一個開關,交換機通過控制開關來完成輸入到特定輸出的轉發。如果交換具有N個輸入和N個輸出,那么該Crossbar Switch就是一個帶有N*(N-1)≈N?個CrossPoint點的矩陣,可見,隨著端口數量的增加,交叉點開關的數量呈幾何級數增長。對于Crossbar芯片的電路集成水平、矩陣控制開關的制造難度、制造成本都會呈幾何級數增長。所以,采用一塊Crossbar交換背板的交換機,所能連接的端口數量也是有限的。
報文轉發流程
無緩存Crossbar
每個交叉點沒有緩存,業務調度采用集中調度的方式,對輸入輸出進行統一調度,報文轉發流程如下:
1.報文從線卡進入,線卡先向Arbiter請求發送;
2.Arbiter根據輸出端口隊列擁塞情況,決定是否允許線卡發送報文到輸出端口;
3.報文通過Crossbar轉發到目的線卡輸出端口。
由于是集中調度,所以仲裁器的調度算法復雜度很高,擴展性較差,系統容量大時仲裁器容易形成瓶頸,難以做到精確調度。
緩存式Crossbar
最早的緩存式Crossbar只有交叉節點帶緩存,而輸入端是無緩存的,被稱為”bus matrix”,后來,CICQ的概念被引入,即在輸入端用大的Input Buffer,在中間節點用小的CrossPoint Buffer。
這種結構采用分布式調度的方式進行業務調度,即輸入和輸出端都有各自的調度器,報文轉發流程如下:
1.報文從線卡進入,輸入端口通過特定的調度算法(如RR算法)獨立地選擇有效的VOQ;
2.將VOQ隊列頭部分組發送到相應的交叉點緩存;
3.輸出端口通過特定的算法在非空的交叉點緩存中選擇進行服務。
由于輸入和輸出的調度策略相互獨立,所以很難保證交換系統在每個時隙整體上達到最佳匹配狀態,并且調度算法復雜度和交換系統規模有關,限制了其擴展性。
CLOS
架構說明
圖4:CLOS架構圖
如圖4所示,每塊業務線卡和所有交換網板相連,交換芯片集成在交換網板上,實現了交換網板和主控引擎硬件分離。CLOS架構是一種多級架構,每個入口級開關和每個中間級開關之間只有一個連接,并且,每個中間級開關正好連接到每個出口級開關,這種架構的優點是可以通過多個小型Crossbar 開關來實現大量輸入和輸出端口之間的連接,CrossPoint數量級別低于Crossbar架構的N的2次方,降低了芯片實現難度。
報文轉發流程
基于Cell的動態負載
1.入方向線卡將數據包切分為N個cell,其中:N=下一跳可用線路數量;
2.交換網板采用動態路由方式,即根據下一級各鏈路的實際可用交換能力,動態選路和負載均衡,通過多條路徑將分片發送到出方向線卡;
3.出方向線卡重組報文。
動態負載關鍵點在于能負載分擔地均衡利用所有可達路徑,由此實現了無阻塞交換。
CLOS架構交換機的分類
非正交背板設計
圖5:非正交背板
如圖5所示,業務線卡與交換網板互相平行,板卡之間通過背板走線連接。
背板走線會帶來信號干擾,背板設計也限制了帶寬的升級,同時,背板上PCB的走線要求很高,從背板開孔就成了奢望,這直接導致純前后的直通風道設計瓶頸一直無法突破。
正交背板設計
圖6:正交背板
如圖6所示,交換機線卡與交換網板分別與背板對接。
同非正交背板設計一樣,背板帶寬限制了帶寬的升級,同時也增加了散熱的難度。
正交零背板設計
圖7:正交零背板
如圖7所示,業務線卡與交換網板互相垂直,背板走線為零,甚至無中板。
正交設計能減少背板走線帶來的高速信號衰減,提高了硬件的可靠性,無背板設計能夠解除背板對容量提升的限制,當需要更大帶寬的時候,只需要更換相應板卡即可,大大縮短業務升級周期,并且因為沒有了背板的限制,交換機直通風道散熱問題迎刃而解,完美匹配數據中心機房空氣流的走向,形成了貫穿前后板卡的高速、通暢的氣流。
總結
下表將對以上三種架構做出總結:
對于高端機架式交換機,以Crossbar交換架構和CLOS交換架構為主。其中CLOS交換架構是當前大容量數據中心核心交換機的理想架構。銳捷網絡RG-N18000-X系列交換機基于無阻塞的CLOS架構,并且首次采用“零背板”技術,在提供高效、穩定交換服務的同時,可實現未來10年網絡可持續平滑升級。
責任編輯:gt
-
芯片
+關注
關注
456文章
51060瀏覽量
425742 -
互聯網
+關注
關注
54文章
11179瀏覽量
103583 -
交換機
+關注
關注
21文章
2650瀏覽量
99913
發布評論請先 登錄
相關推薦
評論