在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

減少包頭處理開銷最直接的方法:減少數據包數量

Linux閱碼場 ? 來源:Linuxer ? 2020-08-03 16:20 ? 次閱讀

背景

目前,有大量的網絡應用在處理數據包的時候只需要處理數據包頭,而不會操作數據負載部分,例如防火墻、TCP/IP協議棧和軟件交換機。對這類網絡應用而言, 包頭處理產生的開銷(稱為“per-packet overhead”)占了整體開銷的大部分。因此,如何減少包頭處理開銷是優化這類應用性能的關鍵。

減少包頭處理開銷最直接的方法:減少數據包數量

如何減少包數量?

增大Maximum Transmission Unit (MTU)。在數據量一定的情況下,使用大MTU的數據包可攜帶更多數據,從而減少了包的總量。但MTU值依賴于物理鏈路,我們無法保證數據包經過的所有鏈路均使用大MTU。

利用網卡特性:Large Receive Offload (LRO),UDP Fragmentation Offload (UFO)和TCP Segmentation Offload (TSO)。如圖1所示,LRO將從物理鏈路收到的TCP包(如1500B)合并為長度更長的TCP包(如64KB);UFO和TSO將上層應用發送的長數據負載的UDP和TCP包(如64KB)拆分成長度更短的數據包(如1500B),以滿足物理鏈路的MTU限制。通過在網卡上進行包合并和拆分,在不需要任何CPU開銷的情況下,上層應用就可以處理數量大大減少的大包。然而,LRO、TSO和UFO通常只能處理TCP和UDP包,而且并非所有的網卡都支持這些特性。

軟件包合并 (Generic Receive Offload,GRO)和包拆分 (Generic Segmentation Offload,GSO)。與前兩種方法相比,GRO和GSO有兩個優點:第一,不依賴于物理鏈路和網卡;第二,能夠支持更多的協議類型,如VxLAN和GRE。

圖1. LRO、UFO和TSO工作原理

為了幫助基于DPDK的應用程序(如Open vSwitch)減少包頭處理開銷,DPDK分別于17.08和17.11支持了GRO和GSO。如圖2所示, GRO和GSO是DPDK中的兩個用戶庫,應用程序直接調用它們進行包合并和分片。

圖2. DPDK GRO和DPDK GSO

1

GRO庫和GSO庫結構

圖3描繪了GRO庫和GSO庫的結構。根據數據包類型,GRO庫定義了不同的GRO類型。每一種GRO類型負責合并一種類型的數據包,如TCP/IPv4 GRO處理TCP/IPv4數據包。同樣的,GSO庫也定義了不同的GSO類型。GRO庫和GSO庫分別根據MBUF的packet_type域和ol_flags域將輸入的數據包交給對應的GRO和GSO類型處理。

圖3. GRO庫和GSO庫的框架

2

如何使用GRO庫和GSO庫?

使用GRO和GSO庫十分簡單。如圖4所示,只需要調用一個函數便可以對包進行合并和分片。

圖4. 代碼示例

為了支持不同的用戶場景,GRO庫提供了兩組API:輕量模式API和重量模式API,如圖5所示。輕量模式API應用于需要快速合并少量數據包的場景,而重量模式API則用于需要細粒度地控制合包并需要合并大量數據包的場景。

圖5. 輕量模式API和重量模式API

3

DPDK GRO的合包算法

算法挑戰

在高速的網絡環境下,高開銷的合包算法很可能會導致網卡丟包。

包亂序(“Packet Reordering”)增加了合包難度。例如Linux GRO無法合并亂序的數據包。

這就要求DPDK GRO的合包算法:

足夠輕量以適應高速的網絡環境

能夠合并亂序包

基于Key的合包算法

為解決上述兩點挑戰,DPDK GRO采用基于Key的合包算法,其流程如圖6所示。對新到的數據包,首先按照流(“flow”)對其進行分類,再在其所在的流中尋找相鄰的數據包(“neighbor”)進行合并。若無法找到匹配的流,就插入一條新流并將數據包存儲到新流中。若無法找到鄰居,則將數據包存儲到對應的流中。

基于Key的合包算法有兩個特點。首先,通過流分類來加速數據包的合并是十分輕量的一種做法;其次,保存無法合并的數據包(如亂序包)使得之后對其進行合并成為可能,故減輕了包亂序對合包帶來的影響。

圖6. 基于Key的合包算法流程

例如,TCP/IPv4 GRO使用源和目的Ethernet地址、IP地址、TCP端口號以及TCP Acknowledge Number定義流,使用TCP Sequence Number和IP ID決定TCP/IPv4包是否為鄰居。若兩個TCP/IPv4的數據包能夠合并,則它們必須屬于同一個流,并且TCP序號和IP ID必須連續。

4

DPDK GSO的分片策略

分片流程

如圖7所示,將一個數據包分片有3個步驟。首先,將包的數據負載分成許多長度更小的部分;其次,為每一個數據負載部分添加包頭(新形成的數據包稱為GSO Segment);最后,為每個GSO segment更新包頭(如TCP Sequence Number)。

圖7. GSO分片流程

GSO Segment的結構

生成一個GSO Segment的最簡單方法就是拷貝包頭和數據負載部分。但頻繁的數據拷貝會降低GSO性能,因此,DPDK GSO采用了一種基于零拷貝的數據結構——Two-part MBUF——來組織GSO Segment。如圖8所示,一個Two-part MBUF由一個Direct MBUF和多個Indirect MBUF組成。Direct MBUF用來存儲包頭,Indirect MBUF則類似于指針,指向數據負載部分。利用Two-part MBUF,生成一個GSO Segment僅需拷貝長度較短的包頭,而不需要拷貝較長的數據負載部分。

圖8. Two-part MBUF的結構

GRO庫和GSO庫的狀態

目前,GRO庫還處于一個初期階段,僅對使用最廣泛的TCP/IPv4數據包提供了合包支持。GSO庫則支持更豐富的包類型,包括TCP/IPv4、VxLAN和GRE。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • cpu
    cpu
    +關注

    關注

    68

    文章

    10863

    瀏覽量

    211784
  • 網卡
    +關注

    關注

    4

    文章

    311

    瀏覽量

    27384
  • 交換機
    +關注

    關注

    21

    文章

    2640

    瀏覽量

    99647

原文標題:怎么提高網絡應用性能?讓DPDK GRO和GSO來幫你!

文章出處:【微信號:LinuxDev,微信公眾號:Linux閱碼場】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    mtu配置步驟詳解 mtu與數據包丟失的關系

    最大的、無需拆即可通過的數據包長度。這個長度加上數據包頭(通常為28字節)即為MTU值。 訪問設備配置
    的頭像 發表于 12-16 14:33 ?534次閱讀

    利用P4與Vivado工具簡化數據包處理設計

    為設備就緒的 RTL 代碼,以實現最佳的硬件實現。使用 VNP4,您可以顯著減少開發基于設備的數據包處理系統所需的工程工作量,同時仍能實現每 LUT 或每 RAM 的高性能。本白皮書概述了
    的頭像 發表于 12-04 09:55 ?171次閱讀
    利用P4與Vivado工具簡化<b class='flag-5'>數據包</b><b class='flag-5'>處理</b>設計

    華納云:服務器平均響應時間和數據包大小之間的影響

    的時間在網絡上傳輸,因此會增加整體的響應時間。 解決方法: 對數據進行壓縮(如使用 Gzip 或 Brotli),減少傳輸的數據量。 2.網絡帶寬 影響: 帶寬決定了單位時間內可以傳輸
    的頭像 發表于 10-10 14:01 ?237次閱讀

    請問DCTCP與DCUDP 的登錄數據包和心跳數據包與服務器端是如何交互的?

    DCTCP與DCUDP的登錄數據包和心跳數據包與服務器端是如何交互的?
    發表于 07-25 06:37

    能否在ESP結束之前通過串行端口停止傳入的UDP數據包的傳輸以解析下一個UDP數據包

    丟棄在ESP完成之前不需要的數據包,以便通過串行端口發送它以接收下一個數據包, 如果沒有,我必須按順序讀取所有傳入的數據包,需要的和不需要的, 而且波特率不足,主機處理
    發表于 07-16 06:18

    如何直接從phy mac層發送和接收802.11數據包

    我閱讀了完整的文檔(espressif_iot_esp8266ex_development_kit_v0.9.4.zip),但我沒有找到答案: 是否可以訪問 802.11 數據包,并通過應用程序處理它們? 我希望能夠直接從 p
    發表于 07-15 08:03

    請問如何使用AT CIPSEND或AT CIPSENDBUF發送多個數據包

    我可以使用 AT CIPSEND 發送單個數據包。但是我必須發送一系列二進制數據包。如何使用AT CISEND或AT CIPSENDBUF發送多個數據包,什么是正確的算法? 到目前為止,我嘗試
    發表于 07-15 07:37

    如何減少構建中的組件數量

    large to enter in my module. 由于我的應用程序不需要某些組件,因此我想知道如何減少我的項目中鏈接的組件數量
    發表于 07-09 07:46

    用ESP32-CAM和ESP-WROVER-KIT做局域網視頻傳輸時,如何修改UDP數據包最大長度?

    UDP數據包包頭可以看出,UDP的最大包長度是2^16-1的個字節。由于UDP包頭占8個字節,而在IP層進行封裝后的IP包頭占去20字節,所以這個是UDP
    發表于 06-21 06:09

    在AN65974中短數據包和零長數據包是什么意思?

    在 AN65974 中,短數據包和零長數據包是什么意思? 非常感謝!
    發表于 05-30 07:41

    如何在AIROC GUI上獲取良好數據包和總數據包

    使用 IQxel-MW LifePoint 作為發生器并發送波形BT_1DH5_00001111_Fs80M.iqvsg,但無法在 AIROC 工具中接收數據包。 以下是從 IQxel 發送
    發表于 05-22 06:39

    請問高端網絡芯片如何處理數據包呢?

    隨著網絡芯片帶寬的持續提升,其內部數據包處理單元的工作負載也隨之增加。然而,如果處理單元無法與網絡接口的傳入速率相匹配,將無法及時處理數據包
    的頭像 發表于 04-02 16:36 ?632次閱讀
    請問高端網絡芯片如何<b class='flag-5'>處理</b><b class='flag-5'>數據包</b>呢?

    STM32H7接收數據包異常,一接收的數據出現兩發送的內容怎么解決?

    節:be1c0101屬于發送數據包1的; 剩余其他字節:屬于發送數據包2的; 問題困擾很久了,請大家幫忙處理下,急急急!
    發表于 03-08 08:05

    DPDK在AI驅動的高效數據包處理應用

    傳統的數據包處理方式是數據包先到內核最后再到用戶層進行處理。這種方式會增加額外的延遲和CPU開銷,嚴重影響
    的頭像 發表于 02-25 11:28 ?946次閱讀
    DPDK在AI驅動的高效<b class='flag-5'>數據包</b><b class='flag-5'>處理</b>應用

    使用P4和Vivado工具簡化數據包處理設計

    電子發燒友網站提供《使用P4和Vivado工具簡化數據包處理設計.pdf》資料免費下載
    發表于 01-26 17:49 ?0次下載
    使用P4和Vivado工具簡化<b class='flag-5'>數據包</b><b class='flag-5'>處理</b>設計
    主站蜘蛛池模板: 最新人妖shemaletube人妖| 性欧美www| 四虎影视国产精品| 国产色噜噜| 色视频色露露永久免费观看| 91免费在线视频| 四虎永久精品免费观看| 国产精品久久久久久久久ktv| 免费一级毛片在线播放不收费| 亚洲国产人久久久成人精品网站| 色婷婷视频在线| 国产色网站| 波多野结衣福利| 亚洲欧洲色| 国产精品黄页网站在线播放免费| 福利区在线观看| 五月婷在线观看| www黄色大片| 国产精品区在线12p| 色婷五月| 天天插天天插| 国产一区在线mmai| 黄 色 大 片 网站| 91网站在线看| 三级黄色片免费观看| 午夜a级毛片| 国产精品性| 国产午夜人做人视频羞羞| jizjizjizjiz日本护士出水| 特级毛片网站| 午夜激情福利视频| 久久99国产精品免费观看| 黄视频福利| 久久人人青草97香蕉| 欧美三级在线观看视频| 久久影视精品| 午夜伦理片在线观看| 天天弄| 在线观看免费视频国产| www.a级片| 男生脱美女内裤内衣动态图|