字節(jié)一面:TCP 三次握手,問的好細!
大家好,我是小林。
有位讀者在面試字節(jié)時,被問到這么個問題:
概括起來,是這兩個問題:
TCP 三次握手中,客戶端收到的第二次握手中 ack 確認號不是自己期望的,會發(fā)生什么?是直接丟棄 or 回 RST 報文?
什么情況下會收到不正確的 ack(第二次握手中的 ack) 呢?
問題解答
不賣關子,直接說這個問題,是回 RST 報文。過程如下圖:
三次握手避免歷史連接
當客戶端連續(xù)發(fā)送多次建立連接的 SYN 報文,然后在網絡擁堵的情況,就會發(fā)生客戶端收到不正確的 ack 的情況。具體過程如下:
- 客戶端先發(fā)送了 SYN(seq = 90) 報文,但是被網絡阻塞了,服務端并沒有收到,接著客戶端又重新發(fā)送了 SYN(seq = 100) 報文,注意不是重傳 SYN,重傳的 SYN 的序列號是一樣的。
- 「舊 SYN 報文」比「最新的 SYN 」 報文早到達了服務端,那么此時服務端就會回一個 SYN + ACK 報文給客戶端,此報文的確認號是 91(90+1)。
- 客戶端收到后,發(fā)行自己期望收到的確認號應該是 100+1,而不是 90 + 1,于是就會回 RST 報文。
- 服務端收到 RST 報文后,就會中止連接。
- 后續(xù)最新的 SYN 抵達了服務端后,客戶端與服務端就可以正常的完成三次握手了。
上述中的「舊 SYN 報文」稱為歷史連接,TCP 使用三次握手建立連接的最主要原因就是防止「歷史連接」初始化了連接。
我們也可以從 RFC 793 知道 TCP 連接使用三次握手的首要原因:
The principle reason for the three-way handshake is to prevent old duplicate connection initiations from causing confusion.
簡單來說,三次握手的首要原因是為了防止舊的重復連接初始化造成混亂。RFC 給出的三次握手防止歷史連接的案例圖如下:
RFC 793
如果是兩次握手連接,就無法阻止歷史連接,那為什么 TCP 兩次握手為什么無法阻止歷史連接呢?
我先直接說結論,主要是因為在兩次握手的情況下,「被動發(fā)起方」沒有中間狀態(tài)給「主動發(fā)起方」來阻止歷史連接,導致「被動發(fā)起方」可能建立一個歷史連接,造成資源浪費。
你想想,兩次握手的情況下,「被動發(fā)起方」在收到 SYN 報文后,就進入 ESTABLISHED 狀態(tài),意味著這時可以給對方發(fā)送數據給,但是「主動發(fā)」起方此時還沒有進入 ESTABLISHED 狀態(tài),假設這次是歷史連接,主動發(fā)起方判斷到此次連接為歷史連接,那么就會回 RST 報文來斷開連接,而「被動發(fā)起方」在第一次握手的時候就進入 ESTABLISHED 狀態(tài),所以它可以發(fā)送數據的,但是它并不知道這個是歷史連接,它只有在收到 RST 報文后,才會斷開連接。
兩次握手無法阻止歷史連接
可以看到,上面這種場景下,「被動發(fā)起方」在向「主動發(fā)起方」發(fā)送數據前,并沒有阻止掉歷史連接,導致「被動發(fā)起方」建立了一個歷史連接,又白白發(fā)送了數據,妥妥地浪費了「被動發(fā)起方」的資源。
因此,要解決這種現象,最好就是在「被動發(fā)起方」發(fā)送數據前,也就是建立連接之前,要阻止掉歷史連接,這樣就不會造成資源浪費,而要實現這個功能,就需要三次握手。
源碼分析
我說回 RST 就回 RST 嗎?當然不是了,肯定得用源碼證明我說的這個結論。
聽到要源碼分析,可能有的同學就慫了。
其實要分析我們今天這個問題,只要懂 if else 就行了,我也會用中文來表述代碼的邏輯,所以單純看我的文字也是可以的。
這次我們重點分析的是,在 SYN_SENT 狀態(tài)下,收到不正確的確認號的 syn+ack 報文是如何處理的。
處于 SYN_SENT 狀態(tài)下的客戶端,在收到服務端的 syn+ack 報文后,最終會調用 tcp_rcv_state_process,在這里會根據 TCP 狀態(tài)做對應的處理,這里我們只關注 SYN_SENT 狀態(tài)。
可以看到,接下來,會繼續(xù)調用 tcp_rcv_synsent_state_process 函數。
從上面的函數,就可以得知了,客戶端在 SYN_SENT 狀態(tài)下,收到不正確的確認號的 syn+ack 報文會回 RST 報文。
小結
TCP 三次握手中,客戶端收到的第二次握手中 ack 確認號不是自己期望的,會發(fā)生什么?是直接丟棄 or 回 RST 報文?
回 RST 報文。
什么情況下會收到不正確的 ack(第二次握手中的 ack) 呢?
當客戶端發(fā)起多次 SYN 報文,然后網絡擁堵的情況下,「舊的 SYN 報文」比「新的 SYN 報文」早抵達服務端,此時服務端就會按照收到的「舊的 SYN 報文」回復 syn+ack 報文,而此報文的確認號并不是客戶端期望收到的,于是客戶端就會回 RST 報文。