自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

Linux網(wǎng)絡(luò) - 數(shù)據(jù)包的接收過程

系統(tǒng) Linux
本文將介紹在Linux系統(tǒng)中,數(shù)據(jù)包是如何一步一步從網(wǎng)卡傳到進程手中的。本文只討論以太網(wǎng)的物理網(wǎng)卡,不涉及虛擬設(shè)備,并且以一個UDP包的接收過程作為示例。

[[186823]]

本文將介紹在Linux系統(tǒng)中,數(shù)據(jù)包是如何一步一步從網(wǎng)卡傳到進程手中的。

如果英文沒有問題,強烈建議閱讀后面參考里的兩篇文章,里面介紹的更詳細。

本文只討論以太網(wǎng)的物理網(wǎng)卡,不涉及虛擬設(shè)備,并且以一個UDP包的接收過程作為示例.

本示例里列出的函數(shù)調(diào)用關(guān)系來自于kernel 3.13.0,如果你的內(nèi)核不是這個版本,函數(shù)名稱和相關(guān)路徑可能不一樣,但背后的原理應(yīng)該是一樣的(或者有細微差別)

網(wǎng)卡到內(nèi)存

網(wǎng)卡需要有驅(qū)動才能工作,驅(qū)動是加載到內(nèi)核中的模塊,負責銜接網(wǎng)卡和內(nèi)核的網(wǎng)絡(luò)模塊,驅(qū)動在加載的時候?qū)⒆约鹤赃M網(wǎng)絡(luò)模塊,當相應(yīng)的網(wǎng)卡收到數(shù)據(jù)包時,網(wǎng)絡(luò)模塊會調(diào)用相應(yīng)的驅(qū)動程序處理數(shù)據(jù)。

下圖展示了數(shù)據(jù)包(packet)如何進入內(nèi)存,并被內(nèi)核的網(wǎng)絡(luò)模塊開始處理:

  1.                    +-----+ 
  2.                    |     |                            Memroy 
  3. +--------+   1     |     |  2  DMA     +--------+--------+--------+--------+ 
  4. | Packet |-------->| NIC |------------>| Packet | Packet | Packet | ...... | 
  5. +--------+         |     |             +--------+--------+--------+--------+ 
  6.                    |     |<--------+ 
  7.                    +-----+         | 
  8.                       |            +---------------+ 
  9.                       |                            | 
  10.                     3 | Raise IRQ                  | Disable IRQ 
  11.                       |                          5 | 
  12.                       |                            | 
  13.                       ↓                            | 
  14.                    +-----+                   +------------+ 
  15.                    |     |  Run IRQ handler  |            | 
  16.                    | CPU |------------------>| NIC Driver | 
  17.                    |     |       4           |            | 
  18.                    +-----+                   +------------+ 
  19.                                                    | 
  20.                                                 6  | Raise soft IRQ 
  21.                                                    | 
  22.                                                    ↓ 

 

1: 數(shù)據(jù)包從外面的網(wǎng)絡(luò)進入物理網(wǎng)卡。如果目的地址不是該網(wǎng)卡,且該網(wǎng)卡沒有開啟混雜模式,該包會被網(wǎng)卡丟棄。

2: 網(wǎng)卡將數(shù)據(jù)包通過DMA的方式寫入到指定的內(nèi)存地址,該地址由網(wǎng)卡驅(qū)動分配并初始化。注: 老的網(wǎng)卡可能不支持DMA,不過新的網(wǎng)卡一般都支持。

3: 網(wǎng)卡通過硬件中斷(IRQ)通知CPU,告訴它有數(shù)據(jù)來了

4: CPU根據(jù)中斷表,調(diào)用已經(jīng)注冊的中斷函數(shù),這個中斷函數(shù)會調(diào)到驅(qū)動程序(NIC Driver)中相應(yīng)的函數(shù)

5: 驅(qū)動先禁用網(wǎng)卡的中斷,表示驅(qū)動程序已經(jīng)知道內(nèi)存中有數(shù)據(jù)了,告訴網(wǎng)卡下次再收到數(shù)據(jù)包直接寫內(nèi)存就可以了,不要再通知CPU了,這樣可以提高效率,避免CPU不停的被中斷。

6: 啟動軟中斷。這步結(jié)束后,硬件中斷處理函數(shù)就結(jié)束返回了。由于硬中斷處理程序執(zhí)行的過程中不能被中斷,所以如果它執(zhí)行時間過長,會導(dǎo)致CPU沒法響應(yīng)其它硬件的中斷,于是內(nèi)核引入軟中斷,這樣可以將硬中斷處理函數(shù)中耗時的部分移到軟中斷處理函數(shù)里面來慢慢處理。

內(nèi)核的網(wǎng)絡(luò)模塊

軟中斷會觸發(fā)內(nèi)核網(wǎng)絡(luò)模塊中的軟中斷處理函數(shù),后續(xù)流程如下

  1.     +-----+ 
  2.                                     14      |     | 
  3.                                +----------->| NIC | 
  4.                                |            |     | 
  5.                                |Enable IRQ  +-----+ 
  6.                                | 
  7.                                | 
  8.                          +------------+                                      Memroy 
  9.                          |            |        Read           +--------+--------+--------+--------+ 
  10.         +--------------->| NIC Driver |<--------------------- | Packet | Packet | Packet | ...... | 
  11.         |                |            |          9            +--------+--------+--------+--------+ 
  12.         |                +------------+ 
  13.         |                      |    |        skb 
  14.    Poll | 8      Raise softIRQ | 6  +-----------------+ 
  15.         |                      |             10       | 
  16.         |                      ↓                      ↓ 
  17. +---------------+  Call  +-----------+        +------------------+ 
  18. | net_rx_action |<-------| ksoftirqd |        | napi_gro_receive | 
  19. +---------------+   7    +-----------+        +------------------+ 
  20.                                                       | 
  21.                                                       | 11 
  22.                                                       ↓ 
  23.                                            +--------------------------+    12      +------------------------+ 
  24.                                            | __netif_receive_skb_core |----------->| packet taps(AF_PACKET) | 
  25.                                            +--------------------------+            +------------------------+ 
  26.                                                       | 
  27.                                                       | 13 
  28.                                                       ↓ 
  29.                                              +-----------------+ 
  30.                                              | protocol layers | 
  31.                                              +-----------------+ 

 

7: 內(nèi)核中的ksoftirqd進程專門負責軟中斷的處理,當它收到軟中斷后,就會調(diào)用相應(yīng)軟中斷所對應(yīng)的處理函數(shù),對于上面第6步中是網(wǎng)卡驅(qū)動模塊拋出的軟中斷,ksoftirqd會調(diào)用網(wǎng)絡(luò)模塊的net_rx_action函數(shù)

8: net_rx_action調(diào)用網(wǎng)卡驅(qū)動里的poll函數(shù)來一個一個的處理數(shù)據(jù)包

9: 在pool函數(shù)中,驅(qū)動會一個接一個的讀取網(wǎng)卡寫到內(nèi)存中的數(shù)據(jù)包,內(nèi)存中數(shù)據(jù)包的格式只有驅(qū)動知道

10: 驅(qū)動程序?qū)?nèi)存中的數(shù)據(jù)包轉(zhuǎn)換成內(nèi)核網(wǎng)絡(luò)模塊能識別的skb格式,然后調(diào)用napi_gro_receive函數(shù)

11: napi_gro_receive會處理GRO相關(guān)的內(nèi)容,也就是將可以合并的數(shù)據(jù)包進行合并,這樣就只需要調(diào)用一次協(xié)議棧,接著調(diào)用__netif_receive_skb_core

12: 看是不是有AF_PACKET類型的socket(也就是我們常說的原始套接字),如果有的話,拷貝一份數(shù)據(jù)給它。tcpdump抓包就是抓的這里的包。

13: 調(diào)用協(xié)議棧相應(yīng)的函數(shù),將數(shù)據(jù)包交給協(xié)議棧處理。

14: 待內(nèi)存中的所有數(shù)據(jù)包被處理完成后(即poll函數(shù)執(zhí)行完成),啟用網(wǎng)卡的硬中斷,這樣下次網(wǎng)卡再收到數(shù)據(jù)的時候就會通知CPU

協(xié)議棧

IP層

由于是UDP包,所以***步會進入IP層,然后一級一級的函數(shù)往下調(diào):

  1.           | 
  2.           ↓         promiscuous mode && 
  3.       +--------+    PACKET_OTHERHOST (set by driver)   +-----------------+ 
  4.       | ip_rcv |-------------------------------------->| drop this packet| 
  5.       +--------+                                       +-----------------+ 
  6.           | 
  7.           | 
  8.           ↓ 
  9. +---------------------+ 
  10. | NF_INET_PRE_ROUTING | 
  11. +---------------------+ 
  12.           | 
  13.           | 
  14.           ↓ 
  15.       +---------+ 
  16.       |         | enabled ip forword  +------------+        +----------------+ 
  17.       | routing |-------------------->| ip_forward |------->| NF_INET_FOWARD | 
  18.       |         |                     +------------+        +----------------+ 
  19.       +---------+                                                   | 
  20.           |                                                         | 
  21.           | destination IP is local                                 ↓ 
  22.           ↓                                                 +---------------+ 
  23.  +------------------+                                       | dst_output_sk | 
  24.  | ip_local_deliver |                                       +---------------+ 
  25.  +------------------+ 
  26.           | 
  27.           | 
  28.           ↓ 
  29.  +------------------+ 
  30.  | NF_INET_LOCAL_IN | 
  31.  +------------------+ 
  32.           | 
  33.           | 
  34.           ↓ 
  35.     +-----------+ 
  36.     | UDP layer | 
  37.     +-----------+ 

 

  • ip_rcv: ip_rcv函數(shù)是IP模塊的入口函數(shù),在該函數(shù)里面,***件事就是將垃圾數(shù)據(jù)包(目的mac地址不是當前網(wǎng)卡,但由于網(wǎng)卡設(shè)置了混雜模式而被接收進來)直接丟掉,然后調(diào)用注冊在NF_INET_PRE_ROUTING上的函數(shù)
  • NF_INET_PRE_ROUTING: netfilter放在協(xié)議棧中的鉤子,可以通過iptables來注入一些數(shù)據(jù)包處理函數(shù),用來修改或者丟棄數(shù)據(jù)包,如果數(shù)據(jù)包沒被丟棄,將繼續(xù)往下走
  • routing: 進行路由,如果是目的IP不是本地IP,且沒有開啟ip forward功能,那么數(shù)據(jù)包將被丟棄,如果開啟了ip forward功能,那將進入ip_forward函數(shù)
  • ip_forward: ip_forward會先調(diào)用netfilter注冊的NF_INET_FORWARD相關(guān)函數(shù),如果數(shù)據(jù)包沒有被丟棄,那么將繼續(xù)往后調(diào)用dst_output_sk函數(shù)
  • dst_output_sk: 該函數(shù)會調(diào)用IP層的相應(yīng)函數(shù)將該數(shù)據(jù)包發(fā)送出去,同下一篇要介紹的數(shù)據(jù)包發(fā)送流程的后半部分一樣。
  • ip_local_deliver:如果上面routing的時候發(fā)現(xiàn)目的IP是本地IP,那么將會調(diào)用該函數(shù),在該函數(shù)中,會先調(diào)用NF_INET_LOCAL_IN相關(guān)的鉤子程序,如果通過,數(shù)據(jù)包將會向下發(fā)送到UDP層

UDP層

  1.  | 
  2.          | 
  3.          ↓ 
  4.      +---------+            +-----------------------+ 
  5.      | udp_rcv |----------->| __udp4_lib_lookup_skb | 
  6.      +---------+            +-----------------------+ 
  7.          | 
  8.          | 
  9.          ↓ 
  10. +--------------------+      +-----------+ 
  11. | sock_queue_rcv_skb |----->| sk_filter | 
  12. +--------------------+      +-----------+ 
  13.          | 
  14.          | 
  15.          ↓ 
  16. +------------------+ 
  17. | __skb_queue_tail | 
  18. +------------------+ 
  19.          | 
  20.          | 
  21.          ↓ 
  22.  +---------------+ 
  23.  | sk_data_ready | 
  24.  +---------------+ 

 

  • udp_rcv: udp_rcv函數(shù)是UDP模塊的入口函數(shù),它里面會調(diào)用其它的函數(shù),主要是做一些必要的檢查,其中一個重要的調(diào)用是__udp4_lib_lookup_skb,該函數(shù)會根據(jù)目的IP和端口找對應(yīng)的socket,如果沒有找到相應(yīng)的socket,那么該數(shù)據(jù)包將會被丟棄,否則繼續(xù)
  • sock_queue_rcv_skb: 主要干了兩件事,一是檢查這個socket的receive buffer是不是滿了,如果滿了的話,丟棄該數(shù)據(jù)包,然后就是調(diào)用sk_filter看這個包是否是滿足條件的包,如果當前socket上設(shè)置了filter,且該包不滿足條件的話,這個數(shù)據(jù)包也將被丟棄(在Linux里面,每個socket上都可以像tcpdump里面一樣定義filter,不滿足條件的數(shù)據(jù)包將會被丟棄)
  • __skb_queue_tail: 將數(shù)據(jù)包放入socket接收隊列的末尾
  • sk_data_ready: 通知socket數(shù)據(jù)包已經(jīng)準備好

調(diào)用完sk_data_ready之后,一個數(shù)據(jù)包處理完成,等待應(yīng)用層程序來讀取,上面所有函數(shù)的執(zhí)行過程都在軟中斷的上下文中。

socket

應(yīng)用層一般有兩種方式接收數(shù)據(jù),一種是recvfrom函數(shù)阻塞在那里等著數(shù)據(jù)來,這種情況下當socket收到通知后,recvfrom就會被喚醒,然后讀取接收隊列的數(shù)據(jù);另一種是通過epoll或者select監(jiān)聽相應(yīng)的socket,當收到通知后,再調(diào)用recvfrom函數(shù)去讀取接收隊列的數(shù)據(jù)。兩種情況都能正常的接收到相應(yīng)的數(shù)據(jù)包。

結(jié)束語

了解數(shù)據(jù)包的接收流程有助于幫助我們搞清楚我們可以在哪些地方監(jiān)控和修改數(shù)據(jù)包,哪些情況下數(shù)據(jù)包可能被丟棄,為我們處理網(wǎng)絡(luò)問題提供了一些參考,同時了解netfilter中相應(yīng)鉤子的位置,對于了解iptables的用法有一定的幫助,同時也會幫助我們后續(xù)更好的理解Linux下的網(wǎng)絡(luò)虛擬設(shè)備。

在接下來的幾篇文章中,將會介紹Linux下的網(wǎng)絡(luò)虛擬設(shè)備和iptables。

責任編輯:龐桂玉 來源: segmentfault
相關(guān)推薦

2020-10-29 15:05:31

Linux網(wǎng)絡(luò)包代碼

2017-04-07 09:30:49

Linux網(wǎng)絡(luò)數(shù)據(jù)包

2025-02-26 07:59:47

2019-04-29 07:53:11

TCP數(shù)據(jù)包TCP網(wǎng)絡(luò)編程

2023-03-27 00:17:21

eBPF技術(shù)網(wǎng)絡(luò)

2023-03-27 00:13:26

數(shù)據(jù)包Kubernete網(wǎng)絡(luò)

2013-01-28 13:32:52

路由器網(wǎng)絡(luò)設(shè)置數(shù)據(jù)傳輸

2017-10-26 16:29:43

2020-07-09 17:37:47

Linux網(wǎng)絡(luò)包中斷

2021-10-08 10:05:10

數(shù)據(jù)包三次握手HTTP

2012-09-04 11:08:57

VMwarevSwitchvSwitch配置

2019-03-28 13:34:22

IP TCP握手

2013-05-21 14:41:42

數(shù)據(jù)包分析內(nèi)聯(lián)監(jiān)控

2013-05-24 08:56:23

VMware虛擬機數(shù)據(jù)包

2020-11-18 07:54:31

太網(wǎng)數(shù)據(jù)包架構(gòu)

2021-07-15 09:57:39

Wireshark數(shù)據(jù)包長度

2017-08-22 11:30:15

LinuxWireshark過濾數(shù)據(jù)包

2012-12-04 09:54:33

路由器數(shù)據(jù)包TCP

2013-01-21 15:11:39

路由器數(shù)據(jù)包路由技術(shù)

2019-11-12 08:46:42

網(wǎng)絡(luò)數(shù)據(jù)包欺騙網(wǎng)絡(luò)攻擊
點贊
收藏

51CTO技術(shù)棧公眾號