本月,NVIDIA創始人兼CEO黃仁勛在COMPUTEX 2024發表了主題演講,宣布NVIDIA Spectrum-X以太網網絡平臺已被業界廣泛使用,并且將進一步加快新品發布計劃。
本期Kiwi Talks將從利好以太網發展的幾個因素出發淺析一下以太網的發展走勢...
云廠商從訓練側逐步過渡到推理側
隨著AI大模型變得更精簡、可在設備上運行并專注于推理任務,芯片制造商的市場重心將轉向推理,即模型應用。展望產業發展趨勢,AI算力負載有望逐步從訓練向推理端遷移,從而降低AI芯片門檻。不可否認英偉達的InfiniBand確實有優勢。目前很多AI集群都部署了InfiniBand網絡,這是因為其低延遲、擁塞控制機制等特性。
盡管InfiniBand在AI訓練集群中很受歡迎,但AI推理服務器通常通過以太網與主網絡互連。隨著推理能力成為AI工作負載的更大一部分,大多數AI推理服務器都將通過以太網連接。可預見的是越來越多的基于以太網的生態部署的出現在一定程度上是為了響應云廠商從訓練側向推理側轉移的需求。
以太網交換機市場的增速需求
據IDC統計,2023年全球交換機行業市場規模達到3698.6億元,同比增長18.5%,且預計未來5年的增速穩定在5%左右,預計2028年規模將達到4373.0億元。隨著大模型的廣泛應用和網絡技術的不斷進步,交換機在算力互聯、數據傳輸方面的價值將進一步提升,促進數據中心交換機市場空間持續增長。交換機市場展現出了蓬勃的增長態勢和快速的技術迭代。
就在近期博通的業績會上該公司強調以太網占據AI算力集群主力,表示當前最大的8個AI算力集群中有7個采用博通以太網方案,預計明年所有的大規模GPU算力集群均會采用以太網方案,并將今年網絡業務營收指引上修至同比增長40%。
博通的強勢業績以及熱烈的市場反應,體現以太網或將在未來訓推一體趨勢下更受云廠商等青睞,并充分受益 AI 集群部署,刷新市場對IB&以太網之爭認知。
相關機構預計從2025年底或2026年開始,以太網標準的增強將解決AI集群擴展問題。從那時起,以太網將在AI訓練集群中獲得更多應用,并將成為InfiniBand的有力競爭者。
全面擁抱以太網,更開放的生態
人工智能和高性能計算工作負載給網絡帶來了新的挑戰,例如需要更高的規模、更高的帶寬密度、多路徑、對擁塞的快速反應以及各單獨流的進展之間的相互依賴性(其中尾延遲是關鍵指標)。
超以太網聯盟 (Ultra Ethernet Consortium,UEC) 由 AMD、Arista、Broadcom、Cisco、Eviden、HPE、Intel、Meta 和 Microsoft 等行業領導者組成,旨在尋求通過“全行業合作”,構建一個完整的基于以太網的通信堆棧架構。超以太聯盟旨在提高網絡吞吐量、降低延遲,增強網絡的可靠性和穩定性,既保持以太網的成本效益和普及性,又保持超級計算互連所需的性能。
奇異摩爾也在近期加入了UEC 超以太網聯盟,賦能生態系統聯合創新,共同改造并增強網絡設備端對AI和HPC大規模部署的靈活性,從而進一步提升以太網的性能。
英偉達黃仁勛此前在業績發布會上坦言Spectrum-X為英偉達網絡技術開辟一個全新的市場,使以太網數據中心能夠適應大規模的人工智能,公司預計Spectrum-X將在一年內躍升為價值數十億美元的產品線。英偉達也采取了以太網與InfiniBand并行的經營策略,以爭取更多的市場份額。
另一巨頭AMD全面擁抱“開放”理念,服務器采用標準化設計,可以兼容任何客戶的集群。在網絡方面,內部互聯的Infinity Fabric協議將開放給合作的交換機廠商與戰略伙伴。同時,在跨服務器的顯卡連接上,AMD旗幟鮮明地指出“Ethernet is the answer”,以太網成為AMD用于構建集群的協議。
國內智算中心生態全面推進以太網建設
國內中國移動牽頭“全調度以太網(GSE)推進計劃”,基于逐包的以太網轉發和全局調度機制,突破傳統無損以太性能瓶頸,中國移動于2024年開展GSE中試,加速GSE關鍵技術和產業成熟,為標準開放的新型智算互聯貢獻中國方案。
GSE 面向無損、高帶寬、超低時延等高性能網絡需求業務場景,兼容以太網生態鏈,通過采用全調度轉發機制、基于 PKTC 的負載均衡技術、基于 DGSQ 的全調度技術、精細的反壓機制、無感知自愈機制、集中管理及分布式控制等技術,實現低時延、無阻塞、高帶寬的新型智算中心網絡。
近日,在天津舉行的“2024晶上系統生態大會”上,中國工程院院士孫凝暉公布了中國首個高通量以太網聯盟的最新進展。該聯盟由阿里云和中國科學院計算技術研究所聯合發起,目前已有北京大學、平頭哥、盛科、騰訊、字節跳動、曙光等40余家單位率先加入。高通量以太網聯盟將在今年9月發布國內首個高通量以太網協議1.0,提出面向智算場景的網絡方案解決方案,同時首次完整提出了針對集合通信的在網計算解決方案。
促進以太網生態,奇異摩爾在行動
奇異摩爾的一系列產品解決方案是全面基于Chiplet &RDMA技術,包括為AI網絡提供的面向高帶寬域南向網絡的NDSA-G2G以及面向服務器集群通信北向網絡NDSA-SNIC產品系列;
南向網絡GPU/NPU互聯通信
NDSA-G2G提供復用以太網基礎設施,基于RoCE RDMA技術的800G高速芯粒/芯片,旨在實現高性能GPU/NPU間高帶寬域的互聯(TB級)。
北向網絡服務器集群間通信
NDSA-SNIC智能網卡同樣基于RoCE RDMA技術,擁抱以太網基礎設施,以800G帶寬的高性能,助力AI智算網絡實現服務器集群間的高速互聯。
熱潮洶涌的人工智能科技正持續對云數據中心、邊緣計算等領域帶來一代又一代的變革。以太網技術的崛起預示著它將逐步取代InfiniBand,成為支撐AI技術服務千行百業的主流選擇。奇異摩爾正在通過加入國內外chiplet&以太網標準組織、聯合產業鏈上下游生態合作、從而共同打造一個更開放,更包容的AI網絡生態。
-
以太網
+關注
關注
40文章
5443瀏覽量
172077 -
交換機
+關注
關注
21文章
2646瀏覽量
99821 -
奇異摩爾
+關注
關注
0文章
49瀏覽量
3448
原文標題:Kiwi Talks | 全面擁抱以太網 “Ethernet is the answer”
文章出處:【微信號:奇異摩爾,微信公眾號:奇異摩爾】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論