在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

在應用層nginx的處理流程

科技綠洲 ? 來源:Linux開發(fā)架構之路 ? 作者:Linux開發(fā)架構之路 ? 2023-11-13 14:44 ? 次閱讀

數(shù)據(jù)包從網(wǎng)卡到nginx

本文將研究一個數(shù)據(jù)包從被網(wǎng)卡接收到流出應用層到底經(jīng)歷了什么,并探究在應用層nginx的處理流程。**注:**本文只討論物理網(wǎng)卡,暫不涉及虛擬網(wǎng)卡。

從網(wǎng)卡到內(nèi)存

1: 數(shù)據(jù)包從外面的網(wǎng)絡進入物理網(wǎng)卡。如果目的地址不是該網(wǎng)卡,且該網(wǎng)卡沒有開啟混雜模式,該包會被網(wǎng)卡丟棄。

2: 網(wǎng)卡將數(shù)據(jù)包通過DMA的方式寫入到指定的內(nèi)存地址,該地址由網(wǎng)卡驅(qū)動分配并初始化。注: 老的網(wǎng)卡可能不支持DMA,不過新的網(wǎng)卡一般都支持。

3: 網(wǎng)卡通過硬件中斷(IRQ)通知CPU,告訴它有數(shù)據(jù)來了

4: CPU根據(jù)中斷表,調(diào)用已經(jīng)注冊的中斷函數(shù),這個中斷函數(shù)會調(diào)到驅(qū)動程序(NIC Driver)中相應的函數(shù)

5: 驅(qū)動先禁用網(wǎng)卡的中斷,表示驅(qū)動程序已經(jīng)知道內(nèi)存中有數(shù)據(jù)了,告訴網(wǎng)卡下次再收到數(shù)據(jù)包直接寫內(nèi)存就可以了,不要再通知CPU了,這樣可以提高效率,避免CPU不停的被中斷。

6: 啟動軟中斷。這步結束后,硬件中斷處理函數(shù)就結束返回了。由于硬中斷處理程序執(zhí)行的過程中不能被中斷,所以如果它執(zhí)行時間過長,會導致CPU沒法響應其它硬件的中斷,于是內(nèi)核引入軟中斷,這樣可以將硬中斷處理函數(shù)中耗時的部分移到軟中斷處理函數(shù)里面來慢慢處理。

如下圖:

圖片

內(nèi)存-網(wǎng)絡模塊-協(xié)議棧

RPS實現(xiàn)了數(shù)據(jù)流的hash歸類,并把軟中斷的負載均衡分到各個cpu

7: 內(nèi)核中的ksoftirqd進程專門負責軟中斷的處理,當它收到軟中斷后,就會調(diào)用相應軟中斷所對應的處理函數(shù),對于上面第6步中是網(wǎng)卡驅(qū)動模塊拋出的軟中斷,ksoftirqd會調(diào)用網(wǎng)絡模塊的net_rx_action函數(shù)

8: net_rx_action調(diào)用網(wǎng)卡驅(qū)動里的poll函數(shù)來一個一個的處理數(shù)據(jù)包

9: 在pool函數(shù)中,驅(qū)動會一個接一個的讀取網(wǎng)卡寫到內(nèi)存中的數(shù)據(jù)包,內(nèi)存中數(shù)據(jù)包的格式只有驅(qū)動知道

10: 驅(qū)動程序?qū)?nèi)存中的數(shù)據(jù)包轉換成內(nèi)核網(wǎng)絡模塊能識別的skb格式,然后調(diào)用napi_gro_receive函數(shù)

11: napi_gro_receive會處理GRO相關的內(nèi)容,也就是將可以合并的數(shù)據(jù)包進行合并,這樣就只需要調(diào)用一次協(xié)議棧。然后判斷是否開啟了RPS,如果開啟了,將會調(diào)用enqueue_to_backlog

12: 在enqueue_to_backlog函數(shù)中,會將數(shù)據(jù)包放入CPU的softnet_data結構體的input_pkt_queue中,然后返回,如果input_pkt_queue滿了的話,該數(shù)據(jù)包將會被丟棄,queue的大小可以通過
net.core.netdev_max_backlog來配置

13: CPU會接著在自己的軟中斷上下文中處理自己input_pkt_queue里的網(wǎng)絡數(shù)據(jù)(調(diào)用__netif_receive_skb_core)

14: 如果沒開啟RPS,napi_gro_receive會直接調(diào)用__netif_receive_skb_core

15: 看是不是有AF_PACKET類型的socket(也就是我們常說的原始套接字),如果有的話,拷貝一份數(shù)據(jù)給它。tcpdump抓包就是抓的這里的包。

16: 調(diào)用協(xié)議棧相應的函數(shù),將數(shù)據(jù)包交給協(xié)議棧處理。

17: 待內(nèi)存中的所有數(shù)據(jù)包被處理完成后(即poll函數(shù)執(zhí)行完成),啟用網(wǎng)卡的硬中斷,這樣下次網(wǎng)卡再收到數(shù)據(jù)的時候就會通知CPU

如下圖:

圖片

下面,數(shù)據(jù)包將交給相應的協(xié)議棧函數(shù)處理,進入第三層網(wǎng)絡層。

IP 層的入口函數(shù)在 ip_rcv 函數(shù)。該函數(shù)首先會做包括 package checksum 在內(nèi)的各種檢查,如果需要的話會做 IP defragment(將多個分片合并),然后 packet 調(diào)用已經(jīng)注冊的 Pre-routing netfilter hook ,完成后最終到達 ip_rcv_finish 函數(shù)。

ip_rcv_finish 函數(shù)會調(diào)用 ip_router_input 函數(shù),進入路由處理環(huán)節(jié)。它首先會調(diào)用 ip_route_input 來更新路由,然后查找 route,決定該 package 將會被發(fā)到本機還是會被轉發(fā)還是丟棄:

1、如果是發(fā)到本機的話,調(diào)用 ip_local_deliver 函數(shù),可能會做 de-fragment(合并多個 IP packet),然后調(diào)用 ip_local_deliver 函數(shù)。該函數(shù)根據(jù) package 的下一個處理層的 protocal number,調(diào)用下一層接口,包括 tcp_v4_rcv (TCP), udp_rcv (UDP),icmp_rcv (ICMP),igmp_rcv(IGMP)。對于 TCP 來說,函數(shù) tcp_v4_rcv 函數(shù)會被調(diào)用,從而處理流程進入 TCP 棧。

2、如果需要轉發(fā) (forward),則進入轉發(fā)流程。該流程需要處理 TTL,再調(diào)用 dst_input 函數(shù)。該函數(shù)會

(1)處理 Netfilter Hook

(2)執(zhí)行 IP fragmentation

(3)調(diào)用 dev_queue_xmit,進入鏈路層處理流程。

如下圖:

圖片

在上圖中,

  • ip_rcv: ip_rcv函數(shù)是IP模塊的入口函數(shù),在該函數(shù)里面,第一件事就是將垃圾數(shù)據(jù)包(目的mac地址不是當前網(wǎng)卡,但由于網(wǎng)卡設置了混雜模式而被接收進來)直接丟掉,然后調(diào)用注冊在NF_INET_PRE_ROUTING上的函數(shù)
  • NF_INET_PRE_ROUTING: netfilter放在協(xié)議棧中的鉤子,可以通過iptables來注入一些數(shù)據(jù)包處理函數(shù),用來修改或者丟棄數(shù)據(jù)包,如果數(shù)據(jù)包沒被丟棄,將繼續(xù)往下走
  • routing: 進行路由,如果是目的IP不是本地IP,且沒有開啟ip forward功能,那么數(shù)據(jù)包將被丟棄,如果開啟了ip forward功能,那將進入ip_forward函數(shù)
  • ip_forward: ip_forward會先調(diào)用netfilter注冊的NF_INET_FORWARD相關函數(shù),如果數(shù)據(jù)包沒有被丟棄,那么將繼續(xù)往后調(diào)用dst_output_sk函數(shù)
  • dst_output_sk: 該函數(shù)會調(diào)用IP層的相應函數(shù)將該數(shù)據(jù)包發(fā)送出去,同下一篇要介紹的數(shù)據(jù)包發(fā)送流程的后半部分一樣。
  • ip_local_deliver:如果上面routing的時候發(fā)現(xiàn)目的IP是本地IP,那么將會調(diào)用該函數(shù),在該函數(shù)中,會先調(diào)用NF_INET_LOCAL_IN相關的鉤子程序,如果通過,數(shù)據(jù)包將會向下發(fā)送到傳輸層

傳輸層

1、傳輸層 TCP包的 處理入口在 tcp_v4_rcv 函數(shù)(位于 linux/net/ipv4/tcp ipv4.c 文件中),它會做 TCP header 檢查等處理。

2、調(diào)用 _tcp_v4_lookup,查找該 package 的 open socket。如果找不到,該 package 會被丟棄。接下來檢查 socket 和 connection 的狀態(tài)。

3、如果socket 和 connection 一切正常,調(diào)用 tcp_prequeue 使 package 從內(nèi)核進入 user space,放進 socket 的 receive queue。然后 socket 會被喚醒,調(diào)用 system call,并最終調(diào)用 tcp_recvmsg 函數(shù)去從 socket recieve queue 中獲取 segment。

應用層

1、每當用戶應用調(diào)用 read 或者 recvfrom 時,該調(diào)用會被映射為/net/socket.c 中的 sys_recv 系統(tǒng)調(diào)用,并被轉化為 sys_recvfrom 調(diào)用,然后調(diào)用 sock_recgmsg 函數(shù)。

2、對于 INET 類型的 socket,/net/ipv4/af inet.c 中的 inet_recvmsg 方法會被調(diào)用,它會調(diào)用相關協(xié)議的數(shù)據(jù)接收方法。

3、對 TCP 來說,調(diào)用 tcp_recvmsg。該函數(shù)從 socket buffer 中拷貝數(shù)據(jù)到 user buffer。

4、對 UDP 來說,從 user space 中可以調(diào)用三個 system call recv()/recvfrom()/recvmsg() 中的任意一個來接收 UDP package,這些系統(tǒng)調(diào)用最終都會調(diào)用內(nèi)核中的 udp_recvmsg 方法。

整個報文接收的過程如下:

圖片

分層:

圖片

1、socket 位于傳輸層協(xié)議之上,屏蔽了不同網(wǎng)絡協(xié)議之間的差異

2、socket 是網(wǎng)絡編程的入口,它提供了大量的系統(tǒng)調(diào)用,構成了網(wǎng)絡程序的主體

3、在Linux系統(tǒng)中,socket 屬于文件系統(tǒng)的一部分,網(wǎng)絡通信可以被看作是對文件的讀取,使得我們對網(wǎng)絡的控制和對文件的控制一樣方便

nginx處理socket套接字的流程

nginx解析用戶配置,在所有端口創(chuàng)建socket并啟動監(jiān)聽。

nginx解析配置文件是由各個模塊分擔處理的,每個模塊注冊并處理自己關心的配置,通過模塊結構體ngx_module_t的字段ngx_command_t *commands實現(xiàn)。

main方法會調(diào)用ngx_init_cycle,其完成了服務器初始化的大部分工作,其中就包括啟動監(jiān)聽(
ngx_open_listening_sockets)

假設nginx使用epoll處理所有socket事件,ngx_event_core_module模塊是事件處理核心模塊,初始化此模塊時會執(zhí)行ngx_event_process_init函數(shù),包括將監(jiān)聽事件添加到epoll

  • 結構體ngx_connection_t存儲socket連接相關信息;nginx預先創(chuàng)建若干個ngx_connection_t對象,存儲在全局變量ngx_cycle->free_connections,稱之為連接池;當新生成socket時,會嘗試從連接池中獲取空閑connection連接,如果獲取失敗,則會直接關閉此socket。指令worker_connections用于配置連接池最大連接數(shù)目,配置在events指令塊中,由ngx_event_core_module解析
  • 結構體ngx_http_request_t存儲整個HTTP請求處理流程所需的所有信息,字段非常多
  • ngx_http_request.c文件中定義了所有的HTTP頭部,存儲在ngx_http_headers_in數(shù)組,數(shù)組的每個元素是一個ngx_http_header_t結構體,解析后的請求頭信息都存儲在ngx_http_headers_in_t結構體中
  • 從ngx_http_headers_in數(shù)組中查找請求頭對應ngx_http_header_t對象時,需要遍歷,每個元素都需要進行字符串比較,效率低下。因此nginx將ngx_http_headers_in數(shù)組轉換為哈希表,哈希表的鍵即為請求頭的key,方法ngx_http_init_headers_in_hash實現(xiàn)了數(shù)組到哈希表的轉換

1、在創(chuàng)建socket啟動監(jiān)聽時,會添加可讀事件到epoll,事件處理函數(shù)為ngx_event_accept,用于接收socket連接,分配connection連接,并調(diào)用ngx_listening_t對象的處理函數(shù)(ngx_http_init_connection)

2、socket連接成功后,nginx會等待客戶端發(fā)送HTTP請求,默認會有60秒的超時時間,即60秒內(nèi)沒有接收到客戶端請求時,斷開此連接,打印錯誤日志。函數(shù)ngx_http_init_connection用于設置讀事件處理函數(shù),以及超時定時器

3、函數(shù)
ngx_http_wait_request_handler為解析HTTP請求的入口函數(shù)

4、函數(shù)ngx_http_create_request創(chuàng)建并初始化ngx_http_request_t對象

5、解析完成請求行與請求頭,nginx就開始處理HTTP請求,并沒有等到解析完請求體再處理。處理請求入口為ngx_http_process_request。

下面進入nginx http請求處理的11個階段

絕大多數(shù)HTTP模塊都會將自己的handler添加到某個階段(將handler添加到全局唯一的數(shù)組ngx_http_phases中),注意其中有4個階段不能添加自定義handler,nginx處理HTTP請求時會挨個調(diào)用每個階段的handler

typedef enum {
    NGX_HTTP_POST_READ_PHASE = 0, //第一個階段,目前只有realip模塊會注冊handler,但是該模塊默認不會運行(nginx作為代理服務器時有用,后端以此獲取客戶端原始ip)

    NGX_HTTP_SERVER_REWRITE_PHASE,  //server塊中配置了rewrite指令,重寫url

    NGX_HTTP_FIND_CONFIG_PHASE,   //查找匹配的location配置;不能自定義handler;
    NGX_HTTP_REWRITE_PHASE,       //location塊中配置了rewrite指令,重寫url
    NGX_HTTP_POST_REWRITE_PHASE,  //檢查是否發(fā)生了url重寫,如果有,重新回到FIND_CONFIG階段;不能自定義handler;

    NGX_HTTP_PREACCESS_PHASE,     //訪問控制,比如限流模塊會注冊handler到此階段

    NGX_HTTP_ACCESS_PHASE,        //訪問權限控制,比如基于ip黑白名單的權限控制,基于用戶名密碼的權限控制等
    NGX_HTTP_POST_ACCESS_PHASE,   //根據(jù)訪問權限控制階段做相應處理;不能自定義handler;

    NGX_HTTP_TRY_FILES_PHASE,     //只有配置了try_files指令,才會有此階段;不能自定義handler;
    NGX_HTTP_CONTENT_PHASE,       //內(nèi)容產(chǎn)生階段,返回響應給客戶端

    NGX_HTTP_LOG_PHASE            //日志記錄
} ngx_http_phases;

nginx 在ngx_http_block函數(shù)中初始化11個階段的ngx_http_phases數(shù)組,把http模塊注冊到相應的階段去。注意多個模塊可能注冊到同一個階段,因此phases是一個二維數(shù)組

  • nginx使用結構體ngx_module_s表示一個模塊,其中字段ctx,是一個指向模塊上下文結構體的指針(上下文結構體的字段都是一些函數(shù)指針)
  • postconfiguration,負責注冊本模塊的handler到某個處理階段

使用GDB調(diào)試,斷點到ngx_http_block方法執(zhí)行所有HTTP模塊注冊handler之后,打印phases數(shù)組:

p cmcf- >phases[*].handlers
p *(ngx_http_handler_pt*)cmcf- >phases[*].handlers.elts

11個階段(7個階段可注冊)以及模塊注冊的handler如下圖:

圖片

處理請求的過程

1、HTTP請求的處理入口函數(shù)是ngx_http_process_request,其主要調(diào)用ngx_http_core_run_phases實現(xiàn)11個階段的執(zhí)行流程

2、ngx_http_core_run_phases遍歷預先設置好的cmcf->phase_engine.handlers數(shù)組,調(diào)用其checker函數(shù)

3、checker內(nèi)部就是調(diào)用handler,并設置下一步要執(zhí)行handler的索引

所以綜上看來,nginx處理請求的過程可以歸納為:

  1. 初始化 HTTP Request(讀取來自客戶端的數(shù)據(jù),生成 HTTP Request 對象,該對象含有該請求所有的信息)。
  2. 處理請求頭。
  3. 處理請求體。
  4. 如果有的話,調(diào)用與此請求(URL 或者 Location)關聯(lián)的 handler。
  5. 依次調(diào)用各 phase handler 進行處理。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 網(wǎng)卡
    +關注

    關注

    4

    文章

    312

    瀏覽量

    27411
  • 驅(qū)動程序

    關注

    19

    文章

    840

    瀏覽量

    48115
  • 數(shù)據(jù)包

    關注

    0

    文章

    265

    瀏覽量

    24426
  • nginx
    +關注

    關注

    0

    文章

    151

    瀏覽量

    12195
收藏 人收藏

    評論

    相關推薦

    Zigbee怎么應用層中查看信道?

    Zigbee怎么應用層中查看信道?我主要是想查找網(wǎng)絡的PANID和信道燈參數(shù),也就是_NIB里面的參數(shù)。謝謝
    發(fā)表于 04-19 09:47

    can應用層協(xié)議

    有寫過can應用層的協(xié)議嗎,我正在搞nmea2000的can協(xié)議,網(wǎng)上沒有資料,求幫助!!!!!!!!!
    發(fā)表于 04-09 19:03

    請問應用層臨時的數(shù)據(jù)怎么保存到nandflash

    請教,我應用層,有一些臨時的數(shù)據(jù)需要保存,想保存到nandflash里邊,我該從什么方面入手主要流程,還有使用哪些接口函數(shù),比如應用的nandflash的讀寫函數(shù),謝謝
    發(fā)表于 02-28 07:45

    【學習打卡】OpenHarmony的應用層說明

    因為有了應用層,使得我們在這個階段,可以把數(shù)據(jù)或應用程序以用戶可以看明白的可視形式呈現(xiàn)。應用層需要處理以下功能:1.確保接收設備被識別、可到達并準備好接受數(shù)據(jù);2.適當?shù)那闆r下,啟用
    發(fā)表于 07-14 08:44

    TCP/IP5模型中,應用層是如何與傳輸連接的?

    以TCP/IP5模型中,應用層是如何與傳輸連接的 “封裝”又是指什么?顯示全部
    發(fā)表于 10-28 06:53

    一個基于應用層的單源組播協(xié)議設計

    由于IP組播實現(xiàn)過程中遭遇了很多困難,所以應用層組播就成了Internet應用研究的熱點。本文簡單地論述了應用層組播的優(yōu)缺點后,提出了一個基于
    發(fā)表于 02-21 15:25 ?7次下載

    基于應用層負載均衡策略的分析

    基于應用層負載均衡策略的分析
    發(fā)表于 03-26 08:28 ?8次下載

    一個基于應用層的單源組播協(xié)議設計

    由于IP組播實現(xiàn)過程中遭遇了很多困難,所以應用層組播就成了Internet應用研究的熱點。本文簡單地論述了應用層組播的優(yōu)缺點后,提出了一個基于
    發(fā)表于 07-22 17:33 ?23次下載

    Zigbee應用層規(guī)范

    本內(nèi)容介紹了Zigbee應用層規(guī)范
    發(fā)表于 05-24 11:37 ?85次下載
    Zigbee<b class='flag-5'>應用層</b>規(guī)范

    區(qū)塊鏈的應用層及應用特征

    就像電腦操作系統(tǒng)上的軟件、互聯(lián)網(wǎng)瀏覽器上的門戶網(wǎng)站、電子商城或是手機端上的 APP,區(qū)塊鏈應用層封裝了各種應用場景和案例,是用戶可以真正直接使用的產(chǎn)品。本篇將聚焦區(qū)塊鏈應用層,探尋其與傳統(tǒng)互聯(lián)網(wǎng)應用的區(qū)別及特征。
    發(fā)表于 09-30 11:15 ?5039次閱讀

    局域網(wǎng)通信原理傳輸應用層

    局域網(wǎng)通信原理傳輸應用層(烽火通信網(wǎng)絡機頂盒hg680-j刷機)-該文檔為局域網(wǎng)通信原理傳輸應用層講解資料,講解的還不錯,感興趣的可以下載看看…………………………
    發(fā)表于 07-30 08:29 ?15次下載
    局域網(wǎng)通信原理傳輸<b class='flag-5'>層</b>和<b class='flag-5'>應用層</b>

    認知無線電MAC應用層仿真軟件

    認知無線電MAC應用層仿真軟件(澳萊特電源技術有限公司)-該文檔為認知無線電MAC應用層仿真軟件總結文檔,是一份很不錯的參考資料,具有較高參考價值,感興趣的可以下載看看…………
    發(fā)表于 09-15 11:40 ?11次下載
    認知無線電MAC<b class='flag-5'>層</b>與<b class='flag-5'>應用層</b>仿真軟件

    嵌入式Linux應用層開發(fā)教程(一)基本概念

    1 應用層與驅(qū)動要想學習嵌入式Linux應用層的開發(fā),首先要區(qū)分好應用層和驅(qū)動之間的關系。我們
    發(fā)表于 11-01 17:59 ?14次下載
    嵌入式Linux<b class='flag-5'>應用層</b>開發(fā)教程(一)基本概念

    應用層知多少?(總結在末尾)

    為什么需要應用層運輸給應用進程提供了端到端的通信服務,但不同的網(wǎng)絡進程之間,還需要有不同的通信規(guī)則,因此運輸之上還需要有應用層應用層協(xié)
    的頭像 發(fā)表于 08-26 11:16 ?1420次閱讀
    <b class='flag-5'>應用層</b>知多少?(總結在末尾)

    物聯(lián)網(wǎng)的技術架構及應用層是什么?

    物聯(lián)網(wǎng)的技術架構包括感知、網(wǎng)絡、平臺應用層應用層是物聯(lián)網(wǎng)的頂層,它的主要功能是將感知
    的頭像 發(fā)表于 07-15 08:56 ?3787次閱讀
    主站蜘蛛池模板: 国产呦系列呦交| www.黄色一片| 一区二区三区视频在线观看| 奇米影视99| 888米奇色狠狠俺去啦| 免费激情网址| 日韩欧美一区二区三区不卡视频 | 国产精品天天爽夜夜欢张柏芝| 三级视频在线| 大蕉久久伊人中文字幕| 天天爱天天做色综合| 91精品国产免费久久久久久青草| 中文天堂资源在线www| 天天舔天天操| 午夜视频久久| 在线观看色视频网站| 国产精品视频网站你懂得| 91老色批网站免费看| 天天干天天玩| 人人看人人做| 亚洲五月六月丁香激情| 4444狠狠| 国产成人精品影视| 中文字幕一区视频| 中文字幕一区二区三区在线不卡| 男女视频在线播放| 婷婷午夜| 久久精品国产99久久72| 欧美午夜剧场| 99久久国产综合精品国| 俄罗斯aaaaa一级毛片| 欧美区一区| 四虎a456tncom| 上课被同桌强行摸下面小黄文| 午夜精品影院| 四虎4hu影库永久地址| 欧美成人69| 久久电影福利| 福利社91| 亚洲主播自拍| 手机在线观看一级午夜片|