電子發燒友網報道(文/周凱揚)在生成式AI的熱度之下,橫向擴展AI訓練與推理性能成了每個云服務廠商、數據中心以及互聯網廠商追求的目標,這點從前段時間的GPU搶購潮就能看出來,龐大的GPU基數在當下幾乎可以和強大的AI算力畫上等號。
然而,真正將這些GPU連接起來的,還是靠以太網交換機、路由這類網絡芯片。隨著數據中心解耦趨勢愈發明顯,相繼認識到這一點的網絡芯片廠商都開始新一輪的軍備競賽,諸如博通、美滿和思科等廠商都已經加快了新品推出的節奏。
博通Tomahawk
作為在數據中心網絡芯片耕耘了12年以上的博通,從640G的Trident系列到25.6T的Tomahawk4系列,已經完成了多次設計迭代,顯著提高了網絡芯片的帶寬。今年三月,博通終于發布了Tomahawk 5系列網絡芯片,也是市面上首個量產51.2Tbps交換帶寬的芯片。
新的Tomahawk 5系列無疑是在暴漲的AI需求下誕生的,我們從其設計中也能看出。由于做到了更高的端口密度,Tomahawk 5可以實現256高性能AI/ML加速器之間的單跳連接,且每個都能做到200Gbps的網絡帶寬。這對于數據中心的AI訓練和推理的負載來說,無疑提高了吞吐效率,尤其是日益流行且愈發復雜的生成式AI模型。
Trident和Tomahawk芯片路線圖 / 博通
在物理設計上,Tomahawk 5采用了如今已經趨近成熟的共封裝光學(CPO)方案,相較過去的光模塊在前端面板插拔的方案,CPO選擇將網絡交換芯片和光模塊封裝在一起。這一封裝方案結合5nm的芯片工藝,將功耗進一步降低了30%。
另外值得一提的是,博通的第三條網絡芯片產品線,Jericho,也在近期迎來了新品Jericho3-AI。相比以高帶寬為重心的Tomahawk產品線,和主打更多功能性的Trident產品線,Jericho往往以較低帶寬、深度緩存和高可編程性著稱。
而Jericho3-AI雖然確實是28.8T的以太網交換機芯片,卻針對AI訓練負載做了特殊的優化,更高的端口密度使得Jericho3-AI可以在單個集群中連接32000個GPU,并做到800Gbps的連接帶寬表現。博通甚至將其與英偉達自己的InfiniBand方案對比,Jericho3-AI在完成時間上有著10%左右的優勢。這也是Jericho系列獨有的優勢,實現標準以太網芯片無法實現卻在AI或HPC應用上被看重的靈活功能。
思科Silicon One
其實早在2019年思科首次推出Silicon One網絡芯片時,博通CEO霍克·譚就表示:“思科在該市場的參與,恰巧驗證了我們推進的這一行業趨勢,也就是數據中心的解耦。我們很高興自己再次押對了,也歡迎更多的競爭。”要知道,之前的思科可是博通的優質客戶之一,如今身份的轉變已經對網絡芯片的市場格局產生了不小的影響。
Silicon One芯片路線圖 / 思科
在第一代自研芯片Silicon One發布三年半之后,思科在近日終于推出了該產品線的第四代產品,以太網交換機芯片G200和G202。其中G200專注于統一架構和基于以太網的AI/ML應用部署,這個采用 5nm工藝打造的芯片,基于512個112Gbps SerDes打造,同樣可以做到51.2Tbps的交換帶寬。
而G202則是針對想要繼續使用50G SerDes的客戶打造的,同樣基于5nm的工藝,G202采用了512x56Gbps SerDes的配置,其特性與G200完全一致,只不過交換性能只有G200的一半。
根據思科的說法,由于單設備512個100GE以太網端口的超高端口密度,客戶可以在一個雙層網絡上構建由32000個400G GPU組成的AI/ML集群。借助G200打造這樣一個龐大的網絡,卻依然可以省去50%的光學組件、40%左右的交換機,極大減少這類集群的碳足跡,每年最高可以省下900萬kWh的耗能。據了解,G200已經送樣給六大云服務商中的五家進行測試了。
美滿Teralynx
在收購由幾位前博通高管打造的芯片初創公司Innovium后,美滿也開始了他們的網絡芯片逆襲。同樣是在今年3月,美滿也推出了自己的51.2Tbps交換機芯片,Teralynx 10。相比其他兩家,美滿為Teralynx 10選擇的定位是超低延遲的可編程交換機芯片,這也是此前Innovium的設計目標。
不過直至目前為止,美滿并沒有將Teralynx并入自己的Prestera產品線內,看來Prestera應該還是主打企業與邊緣數據中心市場,而面向云端數據中心的Teralynx系列繼續沿用原來的產品線名稱。
除了用到業界頂級的112G SerDes IP和先進的工藝實現低功耗的系統設計以外,美滿電子宣稱Teralynx 10可以提供1.7倍的延遲優勢,這對于生成式AI這種看重完成時間和網絡傳輸時間的應用來說至關重要。
企業與數據中心的交換芯片方案 / 美滿
還有一點與其他兩家不同的是,Teralynx 10可以驅動128個400Gbps端口、64個800Gbps端口和32個1.6Tbps端口,1.6Tbps的端口驅動能力可以說是放眼未來了,這也意味著Teralynx 10可以直接在1RU大小的機柜中實現51.2Tbps的性能。
為此,美滿也推出了Nova這一業界首個做到1.6Tbps的PAM4電光平臺,Nova基于美滿的200Gbps/lambda光DSP打造,足以為1.6Tbps的可插拔光模塊提供支持。由于DSP的帶寬翻倍,基于Nova的光模塊不僅減少了所需激光和相關光學組件的數量,相較其他的方案來說穩定性也同樣加倍。雖然800Gbps的光模塊仍在普及中,但要想在下一代數據中心交換網絡中搶占先機,1.6Tbps的光模塊也該盡快提上日程了。
寫在最后
之所以這些廠商都能這么快推出下一代高性能網絡芯片,其實還是靠EDA/IP和封裝技術打好了第一波基礎,廠商們先一步推出了完善的以太網IP和共封裝光學方案。不過這也意味著過去數據中心交換硬件很可能迎來新一波的換代,從目前來看應該是只有大型云服務廠商有這個資本進行大規模替換。
但除了這些網絡芯片公司之間的斗爭之外,他們也需要提防英偉達這樣既有GPU業務又有網絡芯片業務的廠商。以上提到的這三家在推出的新品上都有劍指英偉達InfiniBand的意思,畢竟后者從一開始就是為了HPC和AI打造的通信標準,而它們則是剛從Web Scaling轉向AI Scaling,從外部網絡交換轉為內部網絡交換,仍需要不斷提升產品性能才能在這個競爭激烈的市場上存活下去。
不過這也可以看出AI帶來的熱度,因為無論是從軟件還是從硬件上,產品的迭代速度都有了成倍提升。800GbE時代的到來,也導致所有想在服務器市場創造增長的廠商紛紛趨之若鶩,好在這樣的趨勢恰恰是服務器市場急需的一劑強心劑。
-
gpu
+關注
關注
28文章
4760瀏覽量
129128 -
AI
+關注
關注
87文章
31243瀏覽量
269608 -
生成式AI
+關注
關注
0文章
509瀏覽量
509
發布評論請先 登錄
相關推薦
評論