背了一年的計(jì)網(wǎng)八股,還不知道什么是 Socket?
?前言
不明白 Socket 是什么的主要原因其實(shí)就是沒有實(shí)際的網(wǎng)絡(luò)編程經(jīng)驗(yàn),就沒有在代碼里用過 Socket,背來背去還是腦袋一片漿糊,很正常,看完這篇文章肯定就清楚了(狗頭)
TCP 四元組
要說 Socket,那當(dāng)然不能繞過 TCP 了,各位不妨先來思考下如何確定一個(gè) TCP 連接?
以小黑和小白為例,他們分別位于不同的小區(qū),小黑找小白玩,需要知道小白的小區(qū)和門牌號(hào),也就是說,小區(qū) + 門牌號(hào)就是小白家的入口,知道了這個(gè)入口,小黑就能找到小白。反之也是同樣的。
小區(qū)類比于 IP 地址,門牌號(hào)類比于端口號(hào),IP 地址 + 端口號(hào)(小區(qū) + 門牌號(hào)) 就能唯一確定一個(gè)程序。光有小區(qū)不行,光有門牌號(hào)也不行,所以這就是為什么說網(wǎng)絡(luò)層負(fù)責(zé)建立主機(jī)到主機(jī)的通信(IP 地址),傳輸層負(fù)責(zé)建立端口到端口的通信(端口號(hào))了。
這個(gè)很好記憶,你上線一個(gè)網(wǎng)站的時(shí)候,如果沒有綁定域名的話,那么就只能通過 IP 地址 + 端口號(hào)(默認(rèn)是 80,瀏覽器上不顯示)訪問。
總結(jié)下就是,TCP 四元組可以唯一的確定一個(gè)連接,四元組包括如下:
- 目的 IP 地址
- 目的端口
- 源 IP 地址
- 源端口
其中:
- IP 地址(源地址和目的地址,32位)是在 IP 頭部中
- 端口號(hào)(源端口和目的端口,16位)是在 TCP 頭部中
Socket
掌握了四元組這個(gè)基本概念,我們?cè)賮斫忉?Socket。
上文說過,小區(qū) + 門牌號(hào)是住宅的入口,IP 地址 + 端口號(hào)是一個(gè)程序的入口,這個(gè)入口就是 Socket,那么服務(wù)端和客戶端之間想要進(jìn)行通信,只要互相暴露出自己的入口(Socket),就能夠找到彼此了。
更嚴(yán)謹(jǐn)來說,Socket 封裝了基本的通信功能,是 TCP/IP 協(xié)議的基本操作單元。
以 Java 中的 Socket? 類為例,服務(wù)端和客戶端首先都需要調(diào)用構(gòu)造函數(shù)創(chuàng)建 Socket 暴露自己的入口(綁定 IP 地址和端口,也可以調(diào)用 bind 方法進(jìn)行綁定)
光暴露了入口還不行,你還得豎起耳朵聽,不然別人來敲門你聽不見那也沒法通信啊,所以接下來服務(wù)端調(diào)用 accept() 方法,該方法將一直等待,直到客戶端請(qǐng)求服務(wù)端的入口,再就是 TCP 三次握手建立連接的過程了。
服務(wù)端 Socket 創(chuàng)建一般使用 ServerSocket 類,該類提供了非常重要的 accept(建立連接) :
那客戶端是如何請(qǐng)求服務(wù)端的入口的呢?也就是是如何發(fā)起連接的呢,客戶端在創(chuàng)建好 Socket 后,調(diào)用 connect(host, port) 函數(shù)發(fā)起連接,該函數(shù)需要指明服務(wù)端的 IP 地址和端口號(hào)。
所以說,TCP 三次握手其實(shí)是發(fā)生在客戶端 connect? 和服務(wù)端 accept? 兩個(gè)函數(shù)之間。握手完了就可以通過 read()? 和 write() 來通信啦。這里需要重點(diǎn)注意的是:監(jiān)聽的 Socket 和真正用來傳數(shù)據(jù)的 Socket 是兩個(gè)不同的 Socket:
- 一個(gè)是 監(jiān)聽 Socket;
- 一個(gè)是 已連接 Socket;
看下上述的 ServerSocket.accept? 方法就明白了,accept會(huì)返回一個(gè) Socket 對(duì)象,后續(xù)服務(wù)端和客戶端之間的數(shù)據(jù)傳輸都用這個(gè) Socket:
事實(shí)上,在三次握手的過程中,內(nèi)核(Kernel)為每個(gè)連接都維護(hù)了兩個(gè)隊(duì)列:
- TCP 半連接隊(duì)列:這個(gè)隊(duì)列存儲(chǔ)沒有完成三次握手的 Socket,此時(shí)服務(wù)端處于 syn_rcvd 的狀態(tài);
- TCP 全連接隊(duì)列:這個(gè)隊(duì)列存儲(chǔ)已經(jīng)完成了三次握手的 Socket,此時(shí)服務(wù)端處于 established 狀態(tài);
當(dāng) TCP 全連接隊(duì)列不為空后,服務(wù)端的 accept() 函數(shù),就會(huì)從內(nèi)核中的 TCP 全連接隊(duì)列里拿出一個(gè)已經(jīng)完成連接的 Socket 并返回,用于后續(xù)服務(wù)端和客戶端的通信。
總結(jié)
綜上, 基于 TCP 協(xié)議的 Socket 調(diào)用過程就結(jié)束了,下面由貼心助理 ChatGPT 總結(jié)下:
以下全是 ChatGPT 生成的結(jié)果,沒有一個(gè)字是我寫的(??),雖然是我引導(dǎo)了很多輪的結(jié)果,但是輸入合適的 Promt 并配合上下文 ChatGPT 基本能輸出 90% 想要的內(nèi)容,確實(shí)太強(qiáng)了
文字解釋:
代碼示例:
客戶端代碼示例
服務(wù)器端代碼示例
由于我懶得畫圖,所以決定再讓 ChatGPT 幫我生成下,雖然結(jié)果不是很行,不過還是能看,不用我費(fèi)勁畫了,舒服!
在上面的流程圖中,Socket 客戶端和服務(wù)端之間的通信過程如下:
- 客戶端創(chuàng)建一個(gè) Socket 對(duì)象,指定服務(wù)端的 IP 地址和端口號(hào),然后調(diào)用 connect() 方法發(fā)起連接請(qǐng)求。
- 服務(wù)端創(chuàng)建一個(gè) ServerSocket 對(duì)象,并指定端口號(hào),然后調(diào)用 accept() 方法等待客戶端連接請(qǐng)求。
- 當(dāng)客戶端的連接請(qǐng)求到達(dá)服務(wù)端,服務(wù)端的 accept() 方法會(huì)返回一個(gè)新的 Socket 對(duì)象,該 Socket 對(duì)象代表了客戶端和服務(wù)端之間的通信連接。
- 客戶端可以通過該 Socket 對(duì)象的 getOutputStream()? 方法獲取輸出流對(duì)象,用于向服務(wù)端發(fā)送數(shù)據(jù);也可以通過該 Socket 對(duì)象的 getInputStream() 方法獲取輸入流對(duì)象,用于接收服務(wù)端發(fā)送的數(shù)據(jù)。
- 服務(wù)端可以通過該 Socket 對(duì)象的 getOutputStream()? 方法獲取輸出流對(duì)象,用于向客戶端發(fā)送數(shù)據(jù);也可以通過該 Socket 對(duì)象的 getInputStream() 方法獲取輸入流對(duì)象,用于接收客戶端發(fā)送的數(shù)據(jù)。
- 客戶端和服務(wù)端可以通過各自的輸出流和輸入流進(jìn)行數(shù)據(jù)的讀寫操作。
- 當(dāng)通信完成后,客戶端和服務(wù)端都需要調(diào)用該 Socket 對(duì)象的 close() 方法關(guān)閉連接。