近日,在OCP 全球峰會上,谷歌宣布開放其Falcon硬件傳輸協議。有業內人士指出,Falcon似乎與超以太網聯盟(UEC)和亞馬遜的可擴展可靠數據報(SRD)有很多相似之處,在某種程度上,所有這些都是為了解決 RoCEv2 的缺陷。(《ROCEv2 RDMA:TCP的變革者還是取代者?》一文介紹了ROCEv2的部署缺陷以及大廠的解決策略)
超以太網聯盟主席J Metz 博士表示,Falcon與超以太網聯盟有著共同的愿景,即推動以太網成為人工智能和高性能計算的最佳數據中心結構。本文將深入探討谷歌Falcon,UEC傳輸協議以及亞馬遜SRD協議,以便更全面地理解它們之間的聯系和差異。
谷歌Falcon:一種可靠的低延遲硬件傳輸協議
Falcon(硬件傳輸,硬件加速傳輸層)被譽為下一代以太網,專為以太網數據中心網絡中的可靠性、高性能、低延遲連接而設計。谷歌認為Falcon能夠提高標準網絡上數據傳輸的性能和效率。
Falcon涉及以下技術,包括Carousel、Snap、Swift、PLB和CSIG等。
Carousel:一種流量限制機制(流量整形),允許在各個主機的上下文中調節數據包流的性能和強度。
Snaps:基于微內核的網絡子系統,可以通過模塊進行擴展,通過模塊可以添加高級功能,例如網絡虛擬化、流量限制和消息傳遞功能。
Swift:數據中心級網絡的擁塞控制機制,短 RPC 消息可實現低于 50 微秒的延遲,同時在接近 100% 負載的情況下保持每臺服務器 100 Gbps 的吞吐量。
RACK-TLP:一種確定 TCP 數據包丟失的算法。
PLB:一種使用擁塞信號的負載平衡機制。
CSIG:一種遙測交換協議,用于發送擁塞和流量控制信號。
PSP:流量加密協議。
Falcon 的各層包括它們的相關功能如下圖所示。Falcon 可以支持 RDMA 和 NVM Express 以及其他上層協議 (ULP)。
Falcon使用三個關鍵技術來在高帶寬但有損的以太網數據中心網絡中實現低延遲。
發送請求和接收響應之間的延遲(RTT,往返時間)的詳細測量
硬件實現針對各個流進行流量整形
快速準確的數據包重傳
并通過多路徑同時訪問和支持連接加密的方式補充了這些屬性。
在此基礎之上,Falcon 被重新設計為一種多協議傳輸,能夠支持具有廣泛不同性能要求和應用語義的 ULP。ULP 映射層不僅提供與 Infiniband Verbs RDMA 和 NVMe ULP 的即插即用兼容性,還包括對超大規模應用至關重要的其他創新,例如靈活的排序語義和錯誤處理。
最重要的是,硬件和軟件經過共同設計,可以協同工作,幫助實現高消息速率、低延遲和高帶寬等屬性,同時保持可編程性和持續創新的靈活性。
Falcon支持將首次在Intel IPU E2000系列網絡加速器中提供,該加速器將以太網適配器與可編程處理器相結合,可處理通常在網絡堆棧或系統側執行的操作,如流量和擁塞管理控制以及高級協議分析。
UEC傳輸協議:比RDMA 更好的以太網傳輸協議
7 月 19 日,超以太網聯盟 (Ultra Ethernet Consortium,UEC) 正式成立,它是一個由 Linux 基金會及其聯合開發基金會倡議主辦的新組織。UEC 的目標是超越現有的以太網功能,例如遠程直接內存訪問 ( RDMA ) 和融合以太網 RDMA (RoCE),提供針對高性能計算和人工智能進行優化的高性能、分布式和無損傳輸層,直接將矛頭對準競爭對手的傳輸協議 InfiniBand。
UEC 聯盟提出的UEC 傳輸協議正在開發中,旨在提供AI和HPC應用程序所需性能的同時保留以太網/IP的優勢。UEC 傳輸是一種靠近傳輸層的新形式,將提供更靈活的傳輸,不需要無損網絡,允許many-to-many人工智能工作負載所需的多路徑和無序數據包傳輸等功能。
UEC傳輸協議:
從一開始就設計為在IP和以太網上運行的開放協議規范
多路徑、包噴灑傳輸,充分利用AI網絡,不會造成擁塞或隊頭阻塞,無需集中式負載均衡算法和路由控制器
Incast管理機制,以最小的丟包控制到目標主機的最終鏈接上的扇入
高效的速率控制算法,允許傳輸快速提升至線速,同時不會導致競爭流的性能損失
用于無序數據包傳送的 API,可選擇按順序完成消息,最大限度地提高網絡和應用程序的并發性,并最大限度地減少消息延遲
可擴展未來網絡,支持1,000,000個端點
性能和最佳網絡利用率,無需針對網絡和工作負載進行特定的擁塞算法參數調優
旨在在商用硬件上實現 800G、1.6T 和未來更快以太網的線速性能
日前,OCP 宣布與UEC聯盟合作,利用兩家組織的專業技能來提高人工智能工作負載的以太網性能。目前初步確定潛在合作的領域包括 OCP交換機抽象接口(SAI)、OCP Caliptra Workstream、OCP網絡項目、OCP網卡Workstream、OCP Time Appliance項目和OCP未來技術倡議。(更多內容可點擊《劍指InfiniBand,超以太網聯盟(UEC)正式成立》)
亞馬遜SRD:高吞吐、低延遲的網絡傳輸協議
SRD(Scalable Reliable Datagram,可擴展的可靠數據報文),是AWS年推出的協議,旨在解決亞馬遜的云性能挑戰。它是專為AWS數據中心網絡設計的、基于Nitro芯片、為提高HPC性能實現的一種高吞吐、低延遲的網絡傳輸協議。
SRD 不保留數據包順序,而是通過盡可能多的網絡路徑發送數據包,同時避免路徑過載。為了最大限度地減少抖動并確保對網絡擁塞波動的最快響應,在 AWS 自研的 Nitro chip 中實施 SRD。
SRD 的創新在于有意通過多個路徑分別發包,雖然包到達后通常是亂序的,但AWS實現了在接收處以極快的速度進行重新排序,最終在充分利用網絡吞吐能力的基礎上,極大地降低了傳輸延遲。(更多內容可點擊《當網絡傳輸協議SRD遇上DPU》)
SRD的主要功能包括:
亂序交付:取消按順序傳遞消息的約束,消除了隊頭阻塞,AWS在EFA用戶空間軟件堆棧中實現了數據包重排序處理引擎
等價多路徑路由(ECMP):兩個EFA實例之間可能有數百條路徑,通過使用大型多路徑網絡的一致性流哈希的屬性和SRD對網絡狀況的快速反應能力,可以找到消息的最有效路徑。數據包噴涂(Packet Spraying)可防止出現擁塞熱點,并可以從網絡故障中快速無感地恢復
快速的丟包響應:SRD對丟包的響應比任何高層級的協議都快得多。偶爾的丟包,特別是對于長時間運行的HPC應用程序,是正常網絡操作的一部分,不是異常情況
可擴展的傳輸卸載:使用SRD,與其他可靠協議(如InfiniBand可靠連接IBRC)不同,一個進程可以創建并使用一個隊列對與任何數量的對等方進行通信
隨著人工智能、高性能計算和大規模數據處理需求的不斷增加,對于高效、可靠的數據傳輸方式的需求也愈發迫切。在未來,我們可以期待看到這些協議不斷演進和完善,為數據中心和網絡通信領域帶來更多的創新和進步。
審核編輯:湯梓紅
-
谷歌
+關注
關注
27文章
6168瀏覽量
105380 -
數據中心
+關注
關注
16文章
4778瀏覽量
72125 -
傳輸協議
+關注
關注
0文章
78瀏覽量
11451 -
亞馬遜
+關注
關注
8文章
2666瀏覽量
83353
原文標題:谷歌Falcon、UEC協議、亞馬遜SRD:數據中心傳輸協議的較量
文章出處:【微信號:SDNLAB,微信公眾號:SDNLAB】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論