自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

TCP源碼分析 - 三次握手之 Connect 過程

網(wǎng)絡(luò) 通信技術(shù)
本文主要分析 TCP 協(xié)議的實現(xiàn),但由于 TCP 協(xié)議比較復(fù)雜,所以分幾篇文章進行分析,這篇主要介紹 TCP 協(xié)議建立連接時的三次握手過程。

[[386167]]

本文轉(zhuǎn)載自微信公眾號「Linux內(nèi)核那些事」,作者songsong001。轉(zhuǎn)載本文請聯(lián)系Linux內(nèi)核那些事公眾號。  

本文主要分析 TCP 協(xié)議的實現(xiàn),但由于 TCP 協(xié)議比較復(fù)雜,所以分幾篇文章進行分析,這篇主要介紹 TCP 協(xié)議建立連接時的三次握手過程。

TCP 協(xié)議應(yīng)該是 TCP/IP 協(xié)議棧中最為復(fù)雜的一個協(xié)議(沒有之一),TCP 協(xié)議的復(fù)雜性來源于其面向連接和保證可靠傳輸。

如下圖所示,TCP 協(xié)議位于 TCP/IP 協(xié)議棧的第四層,也就是傳輸層,其建立在網(wǎng)絡(luò)層的 IP 協(xié)議。

但由于 IP 協(xié)議是一個無連接不可靠的協(xié)議,所以 TCP 協(xié)議要實現(xiàn)面向連接的可靠傳輸,就必須為每個 CS(Client - Server) 連接維護一個連接狀態(tài)。由此可知,TCP 協(xié)議的連接只是維護了一個連接狀態(tài),而非真正的連接。

由于本文主要介紹 Linux 內(nèi)核是怎么實現(xiàn) TCP 協(xié)議的,如果對 TCP 協(xié)議的原理不是很清楚的話,可以參考著名的《TCP/IP協(xié)議詳解》。

三次握手過程

我們知道,TCP 協(xié)議是建立在無連接的 IP 協(xié)議之上,而為了實現(xiàn)面向連接,TCP 協(xié)議使用了一種協(xié)商的方式來建立連接狀態(tài),稱為:三次握手。三次握手 的過程如下圖:

建立連接過程如下:

  • 客戶端需要發(fā)送一個 SYN包 到服務(wù)端(包含了客戶端初始化序列號),并且將連接狀態(tài)設(shè)置為 SYN_SENT。
  • 服務(wù)端接收到客戶端的 SYN包 后,需要回復(fù)一個 SYN+ACK包 給客戶端(包含了服務(wù)端初始化序列號),并且設(shè)置連接狀態(tài)為 SYN_RCVD。
  • 客戶端接收到服務(wù)端的 SYN+ACK包 后,設(shè)置連接狀態(tài)為 ESTABLISHED(表示連接已經(jīng)建立),并且回復(fù)一個 ACK包 給服務(wù)端。
  • 服務(wù)端接收到客戶端的 ACK包 后,將連接狀態(tài)設(shè)置為 ESTABLISHED(表示連接已經(jīng)建立)。

以上過程完成后,一個 TCP 連接就此建立完成。

TCP 頭部

要分析 TCP 協(xié)議就免不了要了解 TCP 協(xié)議頭部,我們通過下面的圖片來介紹 TCP 頭部的格式:

下面介紹一下 TCP 頭部各個字段的作用:

  • 源端口號:用于指定本地程序綁定的端口。
  • 目的端口號:用于指定遠端程序綁定的端口。
  • 序列號:用于本地發(fā)送數(shù)據(jù)時所使用的序列號。
  • 確認號:用于本地確認接收到遠端發(fā)送過來的數(shù)據(jù)序列號。
  • 首部長度:指示 TCP 頭部的長度。
  • 標(biāo)志位:用于指示 TCP 數(shù)據(jù)包的類型。
  • 窗口大?。河糜诹髁靠刂疲硎具h端能夠接收數(shù)據(jù)的能力。
  • 校驗和:用于校驗數(shù)據(jù)包是否在傳輸時損壞了。
  • 緊急指針:一般比較少用,用于指定緊急數(shù)據(jù)的偏移量(URG 標(biāo)志位為1時有效)。
  • 可選項:TCP的選項部分。

我們來看看 Linux 內(nèi)核怎么定義 TCP 頭部的結(jié)構(gòu),如下:

  1. struct tcphdr { 
  2.     __u16   source;   // 源端口 
  3.     __u16   dest;     // 目的端口 
  4.     __u32   seq;      // 序列號 
  5.     __u32   ack_seq;  // 確認號 
  6.     __u16   doff:4,   // 頭部長度 
  7.             res1:4,   // 保留 
  8.             res2:2,   // 保留 
  9.             urg:1,    // 是否包含緊急數(shù)據(jù) 
  10.             ack:1,    // 是否ACK包 
  11.             psh:1,    // 是否Push包 
  12.             rst:1,    // 是否Reset包 
  13.             syn:1,    // 是否SYN包 
  14.             fin:1;    // 是否FIN包 
  15.     __u16   window;   // 滑動窗口 
  16.     __u16   check;    // 校驗和 
  17.     __u16   urg_ptr;  // 緊急指針 
  18. }; 

從上面的定義可知,結(jié)構(gòu) tcphdr 的各個字段與 TCP 頭部的各個字段一一對應(yīng)。

客戶端連接過程

一個 TCP 連接是由客戶端發(fā)起的,當(dāng)客戶端程序調(diào)用 connect() 系統(tǒng)調(diào)用時,就會與服務(wù)端程序建立一個 TCP 連接。connect() 系統(tǒng)調(diào)用的原型如下:

  1. int connect(int sockfd, const struct sockaddr *addr, socklen_t addrlen); 

下面是 connect() 系統(tǒng)調(diào)用各個參數(shù)的作用:

  • sockfd:由 socket() 系統(tǒng)調(diào)用創(chuàng)建的文件句柄。
  • addr:指定要連接的遠端 IP 地址和端口。
  • addrlen:指定參數(shù) addr 的長度。

當(dāng)客戶端調(diào)用 connect() 函數(shù)時,會觸發(fā)內(nèi)核調(diào)用 sys_connect() 內(nèi)核函數(shù),sys_connect() 函數(shù)實現(xiàn)如下:

  1. int sys_connect(int fd, struct sockaddr *uservaddr, int addrlen) 
  2.     struct socket *sock; 
  3.     char address[MAX_SOCK_ADDR]; 
  4.     int err; 
  5.     ... 
  6.     // 獲取文件句柄對應(yīng)的socket對象 
  7.     sock = sockfd_lookup(fd, &err); 
  8.     ... 
  9.     // 從用戶空間復(fù)制要連接的遠端IP地址和端口信息 
  10.     err = move_addr_to_kernel(uservaddr, addrlen, address); 
  11.     ... 
  12.     // 調(diào)用 inet_stream_connect() 函數(shù)完成連接操作 
  13.     err = sock->ops->connect(sock, (struct sockaddr *)address, addrlen, 
  14.                              sock->file->f_flags); 
  15.     ... 
  16.     return err; 

sys_connect() 內(nèi)核函數(shù)主要完成 3 個步驟:

  • 調(diào)用 sockfd_lookup() 函數(shù)獲取 fd 文件句柄對應(yīng)的 socket 對象。
  • 調(diào)用 move_addr_to_kernel() 函數(shù)從用戶空間復(fù)制要連接的遠端 IP 地址和端口信息。
  • 調(diào)用 inet_stream_connect() 函數(shù)完成連接操作。

我們繼續(xù)分析 inet_stream_connect() 函數(shù)的實現(xiàn):

  1. int inet_stream_connect(struct socket *sock, struct sockaddr * uaddr, 
  2.                         int addr_len, int flags) 
  3.     struct sock *sk = sock->sk; 
  4.     int err; 
  5.     ... 
  6.     if (sock->state == SS_CONNECTING) { 
  7.         ... 
  8.     } else { 
  9.         // 嘗試自動綁定一個本地端口 
  10.         if (inet_autobind(sk) != 0)  
  11.             return(-EAGAIN); 
  12.         ... 
  13.         // 調(diào)用 tcp_v4_connect() 進行連接操作 
  14.         err = sk->prot->connect(sk, uaddr, addr_len); 
  15.         if (err < 0) 
  16.             return(err); 
  17.         sock->state = SS_CONNECTING; 
  18.     } 
  19.     ... 
  20.     // 如果 socket 設(shè)置了非阻塞, 并且連接還沒建立, 那么返回 EINPROGRESS 錯誤 
  21.     if (sk->state != TCP_ESTABLISHED && (flags & O_NONBLOCK)) 
  22.         return (-EINPROGRESS); 
  23.  
  24.     // 等待連接過程完成 
  25.     if (sk->state == TCP_SYN_SENT || sk->state == TCP_SYN_RECV) { 
  26.         inet_wait_for_connect(sk); 
  27.         if (signal_pending(current)) 
  28.             return -ERESTARTSYS; 
  29.     } 
  30.     sock->state = SS_CONNECTED; // 設(shè)置socket的狀態(tài)為connected 
  31.     ... 
  32.     return(0); 

inet_stream_connect() 函數(shù)的主要操作有以下幾個步驟:

  • 調(diào)用 inet_autobind() 函數(shù)嘗試自動綁定一個本地端口。
  • 調(diào)用 tcp_v4_connect() 函數(shù)進行 TCP 協(xié)議的連接操作。
  • 如果 socket 設(shè)置了非阻塞,并且連接還沒建立完成,那么返回 EINPROGRESS 錯誤。
  • 調(diào)用 inet_wait_for_connect() 函數(shù)等待連接服務(wù)端操作完成。
  • 設(shè)置 socket 的狀態(tài)為 SS_CONNECTED,表示連接已經(jīng)建立完成。

在上面的步驟中,最重要的是調(diào)用 tcp_v4_connect() 函數(shù)進行連接操作,我們來分析一下 tcp_v4_connect() 函數(shù)的實現(xiàn):

  1. int tcp_v4_connect(struct sock *sk, struct sockaddr *uaddr, int addr_len) 
  2.     struct tcp_opt *tp = &(sk->tp_pinfo.af_tcp); 
  3.     struct sockaddr_in *usin = (struct sockaddr_in *)uaddr; 
  4.     struct sk_buff *buff; 
  5.     struct rtable *rt; 
  6.     u32 daddr, nexthop; 
  7.     int tmp; 
  8.     ... 
  9.     nexthop = daddr = usin->sin_addr.s_addr; 
  10.     ... 
  11.     // 1. 獲取發(fā)送數(shù)據(jù)的路由信息 
  12.     tmp = ip_route_connect(&rt, nexthop, sk->saddr, 
  13.                            RT_TOS(sk->ip_tos)|RTO_CONN|sk->localroute, 
  14.                            sk->bound_dev_if); 
  15.     ... 
  16.     dst_release(xchg(&sk->dst_cache, rt)); // 2. 設(shè)置sk的路由信息 
  17.  
  18.     // 3. 申請一個skb數(shù)據(jù)包對象 
  19.     buff = sock_wmalloc(sk, (MAX_HEADER + sk->prot->max_header), 0, GFP_KERNEL); 
  20.     ... 
  21.     sk->dport = usin->sin_port; // 4. 設(shè)置目的端口 
  22.     sk->daddr = rt->rt_dst;     // 5. 設(shè)置目的IP地址 
  23.     ... 
  24.     if (!sk->saddr) 
  25.         sk->saddr = rt->rt_src; // 6. 如果沒有指定源IP地址, 那么使用路由信息的源IP地址 
  26.     sk->rcv_saddr = sk->saddr; 
  27.     ... 
  28.     // 7. 初始化TCP序列號 
  29.     tp->write_seq = secure_tcp_sequence_number(sk->saddr, sk->daddr, sk->sport, 
  30.                                                usin->sin_port); 
  31.     ... 
  32.     // 8. 重置TCP最大報文段大小 
  33.     tp->mss_clamp = ~0; 
  34.     ... 
  35.     // 9. 調(diào)用 tcp_connect() 函數(shù)繼續(xù)進行連接操作 
  36.     tcp_connect(sk, buff, rt->u.dst.pmtu); 
  37.     return 0; 

tcp_v4_connect() 函數(shù)只是做一些連接前的準(zhǔn)備工作,如下:

  • 調(diào)用 ip_route_connect() 函數(shù)獲取發(fā)送數(shù)據(jù)的路由信息,并且將路由信息保存到 socket 對象的路由緩存中。
  • 調(diào)用 sock_wmalloc() 函數(shù)申請一個 skb 數(shù)據(jù)包對象。
  • 設(shè)置 目的端口 和 目的 IP 地址。
  • 如果沒有指定 源 IP 地址,那么使用路由信息中的 源 IP 地址。
  • 調(diào)用 secure_tcp_sequence_number() 函數(shù)初始化 TCP 序列號。
  • 重置 TCP 協(xié)議最大報文段的大小。
  • 調(diào)用 tcp_connect() 函數(shù)發(fā)送 SYN包 給服務(wù)端程序。

由于 TCP三次握手 的第一步是由客戶端發(fā)送 SYN包 給服務(wù)端,所以我們主要關(guān)注 tcp_connect() 函數(shù)的實現(xiàn),其代碼如下:

  1. void tcp_connect(struct sock *sk, struct sk_buff *buff, int mtu) 
  2.     struct dst_entry *dst = sk->dst_cache; 
  3.     struct tcp_opt *tp = &(sk->tp_pinfo.af_tcp); 
  4.  
  5.     skb_reserve(buff, MAX_HEADER + sk->prot->max_header); // 保留所有的協(xié)議頭部空間 
  6.  
  7.     tp->snd_wnd = 0; 
  8.     tp->snd_wl1 = 0; 
  9.     tp->snd_wl2 = tp->write_seq; 
  10.     tp->snd_una = tp->write_seq; 
  11.     tp->rcv_nxt = 0; 
  12.     sk->err = 0; 
  13.     // 設(shè)置TCP頭部長度 
  14.     tp->tcp_header_len = sizeof(struct tcphdr) + 
  15.                            (sysctl_tcp_timestamps ? TCPOLEN_TSTAMP_ALIGNED : 0); 
  16.     ... 
  17.     tcp_sync_mss(sk, mtu); // 設(shè)置TCP報文段最大長度 
  18.     ... 
  19.     TCP_SKB_CB(buff)->flags = TCPCB_FLAG_SYN; // 設(shè)置SYN標(biāo)志為1(表示這是一個SYN包) 
  20.     TCP_SKB_CB(buff)->sacked = 0; 
  21.     TCP_SKB_CB(buff)->urg_ptr = 0; 
  22.     buff->csum = 0; 
  23.     TCP_SKB_CB(buff)->seq = tp->write_seq++;   // 設(shè)置序列號 
  24.     TCP_SKB_CB(buff)->end_seq = tp->write_seq; // 設(shè)置確認號 
  25.     tp->snd_nxt = TCP_SKB_CB(buff)->end_seq; 
  26.  
  27.     // 初始化滑動窗口的大小 
  28.     tp->window_clamp = dst->window; 
  29.     tcp_select_initial_window(sock_rspace(sk)/2, tp->mss_clamp, 
  30.                               &tp->rcv_wnd, &tp->window_clamp, 
  31.                               sysctl_tcp_window_scaling, &tp->rcv_wscale); 
  32.     ... 
  33.     tcp_set_state(sk, TCP_SYN_SENT); // 設(shè)置 socket 的狀態(tài)為 SYN_SENT 
  34.  
  35.     // 調(diào)用 tcp_v4_hash() 函數(shù)把 socket 添加到 tcp_established_hash 哈希表中 
  36.     sk->prot->hash(sk); 
  37.  
  38.     tp->rto = dst->rtt; 
  39.     tcp_init_xmit_timers(sk); // 設(shè)置超時重傳定時器 
  40.     ... 
  41.     // 把 skb 添加到 write_queue 隊列中, 用于重傳時使用 
  42.     __skb_queue_tail(&sk->write_queue, buff); 
  43.     TCP_SKB_CB(buff)->when = jiffies; 
  44.     ... 
  45.     // 調(diào)用 tcp_transmit_skb() 函數(shù)構(gòu)建 SYN 包發(fā)送給服務(wù)端程序 
  46.     tcp_transmit_skb(sk, skb_clone(buff, GFP_KERNEL)); 
  47.     ... 

tcp_connect() 函數(shù)的實現(xiàn)雖然比較長,但是邏輯相對簡單,就是設(shè)置 TCP 頭部各個字段的值,然后把數(shù)據(jù)包發(fā)送給服務(wù)端。下面列出 tcp_connect() 函數(shù)主要的工作:

  • 設(shè)置 TCP 頭部的 SYN 標(biāo)志位 為 1 (表示這是一個 SYN包)。
  • 設(shè)置 TCP 頭部的序列號和確認號。
  • 初始化滑動窗口的大小。
  • 設(shè)置 socket 的狀態(tài)為 SYN_SENT,可參考上面三次握手的狀態(tài)圖。
  • 調(diào)用 tcp_v4_hash() 函數(shù)把 socket 添加到 tcp_established_hash 哈希表中,用于通過 IP 地址和端口快速查找到對應(yīng)的 socket 對象。
  • 設(shè)置超時重傳定時器。
  • 把 skb 添加到 write_queue 隊列中, 用于超時重傳。
  • 調(diào)用 tcp_transmit_skb() 函數(shù)構(gòu)建 SYN包 發(fā)送給服務(wù)端程序。

注意:Linux 內(nèi)核通過 tcp_established_hash 哈希表來保存所有的 TCP 連接 socket 對象,而哈希表的鍵值就是連接的 IP 和端口,所以可以通過連接的 IP 和端口從 tcp_established_hash 哈希表中快速找到對應(yīng)的 socket 連接。如下圖所示:

通過上面的分析,構(gòu)建 SYN包 并且發(fā)送給服務(wù)端是通過 tcp_transmit_skb() 函數(shù)完成的,所以我們來分析一下 tcp_transmit_skb() 函數(shù)的實現(xiàn):

  1. void tcp_transmit_skb(struct sock *sk, struct sk_buff *skb) 
  2.     if (skb != NULL) { 
  3.         struct tcp_opt *tp = &(sk->tp_pinfo.af_tcp); 
  4.         struct tcp_skb_cb *tcb = TCP_SKB_CB(skb); 
  5.         int tcp_header_size = tp->tcp_header_len; 
  6.         struct tcphdr *th; 
  7.         ... 
  8.         // TCP頭部指針 
  9.         th = (struct tcphdr *)skb_push(skb, tcp_header_size); 
  10.         skb->h.th = th; 
  11.  
  12.         skb_set_owner_w(skb, sk); 
  13.  
  14.         // 構(gòu)建 TCP 協(xié)議頭部 
  15.         th->source = sk->sport;                // 源端口 
  16.         th->dest = sk->dport;                  // 目標(biāo)端口 
  17.         th->seq = htonl(TCP_SKB_CB(skb)->seq); // 請求序列號 
  18.         th->ack_seq = htonl(tp->rcv_nxt);      // 應(yīng)答序列號 
  19.         th->doff = (tcp_header_size >> 2);     // 頭部長度 
  20.         th->res1 = 0; 
  21.         *(((__u8 *)th) + 13) = tcb->flags;     // 設(shè)置TCP頭部的標(biāo)志位 
  22.  
  23.         if (!(tcb->flags & TCPCB_FLAG_SYN)) 
  24.             th->window = htons(tcp_select_window(sk)); // 滑動窗口大小 
  25.  
  26.         th->check = 0;                                 // 校驗和 
  27.         th->urg_ptr = ntohs(tcb->urg_ptr);             // 緊急指針 
  28.         ... 
  29.         // 計算TCP頭部的校驗和 
  30.         tp->af_specific->send_check(sk, th, skb->len, skb); 
  31.         ... 
  32.         tp->af_specific->queue_xmit(skb); // 調(diào)用 ip_queue_xmit() 函數(shù)發(fā)送數(shù)據(jù)包 
  33.     } 

tcp_transmit_skb() 函數(shù)的實現(xiàn)相對簡單,就是構(gòu)建 TCP 協(xié)議頭部,然后調(diào)用 ip_queue_xmit() 函數(shù)將數(shù)據(jù)包交由 IP 協(xié)議發(fā)送出去。

至此,客戶端就發(fā)送了一個 SYN包 給服務(wù)端,也就是說,TCP 三次握手 的第一步已經(jīng)完成。

 

責(zé)任編輯:武曉燕 來源: Linux內(nèi)核那些事
相關(guān)推薦

2023-03-06 15:43:56

2017-09-25 21:27:07

TCP協(xié)議數(shù)據(jù)鏈

2023-09-07 16:46:54

TCP數(shù)據(jù)傳遞

2023-10-24 15:22:09

TCPUDP

2020-12-08 06:34:16

TCP握手SYN 報文

2022-10-10 07:34:36

TCP三次握手區(qū)塊鏈

2015-10-13 09:42:52

TCP網(wǎng)絡(luò)協(xié)議

2019-06-12 11:26:37

TCP三次握手四次揮手

2024-01-12 08:23:11

TCPACK服務(wù)器

2022-07-25 07:07:35

TCP客戶端服務(wù)器

2024-10-09 20:54:16

2019-12-12 10:36:43

TCPSYNIP

2020-08-27 07:41:28

TCP協(xié)議數(shù)據(jù)

2022-07-07 09:00:17

TCP 連接HTTP 協(xié)議

2023-09-02 21:57:52

網(wǎng)絡(luò)TCP協(xié)議

2018-07-05 14:25:01

TCP握手原理

2018-10-15 08:06:33

TCP握手原理

2023-11-01 08:04:08

WiresharkTCP協(xié)議

2021-07-03 17:47:25

TCP控制協(xié)議

2021-01-29 06:11:08

TCP通信三次握手
點贊
收藏

51CTO技術(shù)棧公眾號