自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

Socket粘包問題的3種解決方案,哪一種更優(yōu)秀!

開發(fā) 前端
在 Java 語言中,傳統(tǒng)的 Socket 編程分為兩種實(shí)現(xiàn)方式,這兩種實(shí)現(xiàn)方式也對應(yīng)著兩種不同的傳輸層協(xié)議:TCP 協(xié)議和 UDP 協(xié)議,但作為互聯(lián)網(wǎng)中最常用的傳輸層協(xié)議 TCP,在使用時卻會導(dǎo)致粘包和半包問題,于是為了徹底的解決此問題,便誕生了此篇文章。

[[373961]]

本文轉(zhuǎn)載自微信公眾號「Java中文社群」,作者磊哥 。轉(zhuǎn)載本文請聯(lián)系Java中文社群公眾號。  

在 Java 語言中,傳統(tǒng)的 Socket 編程分為兩種實(shí)現(xiàn)方式,這兩種實(shí)現(xiàn)方式也對應(yīng)著兩種不同的傳輸層協(xié)議:TCP 協(xié)議和 UDP 協(xié)議,但作為互聯(lián)網(wǎng)中最常用的傳輸層協(xié)議 TCP,在使用時卻會導(dǎo)致粘包和半包問題,于是為了徹底的解決此問題,便誕生了此篇文章。

什么是 TCP 協(xié)議?

TCP 全稱是 Transmission Control Protocol(傳輸控制協(xié)議),它由 IETF 的 RFC 793 定義,是一種面向連接的點(diǎn)對點(diǎn)的傳輸層通信協(xié)議。

TCP 通過使用序列號和確認(rèn)消息,從發(fā)送節(jié)點(diǎn)提供有關(guān)傳輸?shù)侥繕?biāo)節(jié)點(diǎn)的數(shù)據(jù)包的傳遞的信息。TCP 確保數(shù)據(jù)的可靠性,端到端傳遞,重新排序和重傳,直到達(dá)到超時條件或接收到數(shù)據(jù)包的確認(rèn)為止。

TCP 是 Internet 上最常用的協(xié)議,它也是實(shí)現(xiàn) HTTP(HTTP 1.0/HTTP 2.0)通訊的基礎(chǔ),當(dāng)我們在瀏覽器中請求網(wǎng)頁時,計算機(jī)會將 TCP 數(shù)據(jù)包發(fā)送到 Web 服務(wù)器的地址,要求它將網(wǎng)頁返還給我們,Web 服務(wù)器通過發(fā)送 TCP 數(shù)據(jù)包流進(jìn)行響應(yīng),然后瀏覽器將這些數(shù)據(jù)包縫合在一起以形成網(wǎng)頁。

TCP 的全部意義在于它的可靠性,它通過對數(shù)據(jù)包編號來對其進(jìn)行排序,而且它會通過讓服務(wù)器將響應(yīng)發(fā)送回瀏覽器說“已收到”來進(jìn)行錯誤檢查,因此在傳輸過程中不會丟失或破壞任何數(shù)據(jù)。

目前市場上主流的 HTTP 協(xié)議使用的版本是 HTTP/1.1,如下圖所示:

什么是粘包和半包問題?

粘包問題是指當(dāng)發(fā)送兩條消息時,比如發(fā)送了 ABC 和 DEF,但另一端接收到的卻是 ABCD,像這種一次性讀取了兩條數(shù)據(jù)的情況就叫做粘包(正常情況應(yīng)該是一條一條讀取的)。

半包問題是指,當(dāng)發(fā)送的消息是 ABC 時,另一端卻接收到的是 AB 和 C 兩條信息,像這種情況就叫做半包。

為什么會有粘包和半包問題?

這是因?yàn)?TCP 是面向連接的傳輸協(xié)議,TCP 傳輸?shù)臄?shù)據(jù)是以流的形式,而流數(shù)據(jù)是沒有明確的開始結(jié)尾邊界,所以 TCP 也沒辦法判斷哪一段流屬于一個消息。

粘包的主要原因:

  • 發(fā)送方每次寫入數(shù)據(jù) < 套接字(Socket)緩沖區(qū)大小;
  • 接收方讀取套接字(Socket)緩沖區(qū)數(shù)據(jù)不夠及時。

半包的主要原因:

  • 發(fā)送方每次寫入數(shù)據(jù) > 套接字(Socket)緩沖區(qū)大小;
  • 發(fā)送的數(shù)據(jù)大于協(xié)議的 MTU (Maximum Transmission Unit,最大傳輸單元),因此必須拆包。

小知識點(diǎn):什么是緩沖區(qū)?

緩沖區(qū)又稱為緩存,它是內(nèi)存空間的一部分。也就是說,在內(nèi)存空間中預(yù)留了一定的存儲空間,這些存儲空間用來緩沖輸入或輸出的數(shù)據(jù),這部分預(yù)留的空間就叫做緩沖區(qū)。

緩沖區(qū)的優(yōu)勢以文件流的寫入為例,如果我們不使用緩沖區(qū),那么每次寫操作 CPU 都會和低速存儲設(shè)備也就是磁盤進(jìn)行交互,那么整個寫入文件的速度就會受制于低速的存儲設(shè)備(磁盤)。但如果使用緩沖區(qū)的話,每次寫操作會先將數(shù)據(jù)保存在高速緩沖區(qū)內(nèi)存上,當(dāng)緩沖區(qū)的數(shù)據(jù)到達(dá)某個閾值之后,再將文件一次性寫入到磁盤上。因?yàn)閮?nèi)存的寫入速度遠(yuǎn)遠(yuǎn)大于磁盤的寫入速度,所以當(dāng)有了緩沖區(qū)之后,文件的寫入速度就被大大提升了。

粘包和半包問題演示

接下來我們用代碼來演示一下粘包和半包問題,為了演示的直觀性,我會設(shè)置兩個角色:

  • 服務(wù)器端用來接收消息;
  • 客戶端用來發(fā)送一段固定的消息。

然后通過打印服務(wù)器端接收到的信息來觀察粘包和半包問題。

服務(wù)器端代碼如下:

  1. /** 
  2.  * 服務(wù)器端(只負(fù)責(zé)接收消息) 
  3.  */ 
  4. class ServSocket { 
  5.     // 字節(jié)數(shù)組的長度 
  6.     private static final int BYTE_LENGTH = 20;   
  7.     public static void main(String[] args) throws IOException { 
  8.         // 創(chuàng)建 Socket 服務(wù)器 
  9.         ServerSocket serverSocket = new ServerSocket(9999); 
  10.         // 獲取客戶端連接 
  11.         Socket clientSocket = serverSocket.accept(); 
  12.         // 得到客戶端發(fā)送的流對象 
  13.         try (InputStream inputStream = clientSocket.getInputStream()) { 
  14.             while (true) { 
  15.                 // 循環(huán)獲取客戶端發(fā)送的信息 
  16.                 byte[] bytes = new byte[BYTE_LENGTH]; 
  17.                 // 讀取客戶端發(fā)送的信息 
  18.                 int count = inputStream.read(bytes, 0, BYTE_LENGTH); 
  19.                 if (count > 0) { 
  20.                     // 成功接收到有效消息并打印 
  21.                     System.out.println("接收到客戶端的信息是:" + new String(bytes)); 
  22.                 } 
  23.                 count = 0; 
  24.             } 
  25.         } 
  26.     } 

客戶端代碼如下:

  1. /** 
  2.  * 客戶端(只負(fù)責(zé)發(fā)送消息) 
  3.  */ 
  4. static class ClientSocket { 
  5.     public static void main(String[] args) throws IOException { 
  6.         // 創(chuàng)建 Socket 客戶端并嘗試連接服務(wù)器端 
  7.         Socket socket = new Socket("127.0.0.1", 9999); 
  8.         // 發(fā)送的消息內(nèi)容 
  9.         final String message = "Hi,Java.";  
  10.         // 使用輸出流發(fā)送消息 
  11.         try (OutputStream outputStream = socket.getOutputStream()) { 
  12.             // 給服務(wù)器端發(fā)送 10 次消息 
  13.             for (int i = 0; i < 10; i++) { 
  14.                 // 發(fā)送消息 
  15.                 outputStream.write(message.getBytes()); 
  16.             } 
  17.         } 
  18.     } 

以上程序的通訊結(jié)果如下圖所示:

通過上述結(jié)果我們可以看出,服務(wù)器端發(fā)生了粘包和半包的問題,因?yàn)榭蛻舳税l(fā)送了 10 次固定的“Hi,Java.”的消息,正常的結(jié)果應(yīng)該是服務(wù)器端也接收到了 10 次固定的消息才對,但現(xiàn)實(shí)的結(jié)果并非如此。

粘包和半包的解決方案

粘包和半包的解決方案有以下 3 種:

  1. 發(fā)送方和接收方規(guī)定固定大小的緩沖區(qū),也就是發(fā)送和接收都使用固定大小的 byte[] 數(shù)組長度,當(dāng)字符長度不夠時使用空字符彌補(bǔ);
  2. 在 TCP 協(xié)議的基礎(chǔ)上封裝一層數(shù)據(jù)請求協(xié)議,既將數(shù)據(jù)包封裝成數(shù)據(jù)頭(存儲數(shù)據(jù)正文大小)+ 數(shù)據(jù)正文的形式,這樣在服務(wù)端就可以知道每個數(shù)據(jù)包的具體長度了,知道了發(fā)送數(shù)據(jù)的具體邊界之后,就可以解決半包和粘包的問題了;
  3. 以特殊的字符結(jié)尾,比如以“\n”結(jié)尾,這樣我們就知道結(jié)束字符,從而避免了半包和粘包問題(推薦解決方案)。

那么接下來我們就來演示一下,以上解決方案的具體代碼實(shí)現(xiàn)。

解決方案1:固定緩沖區(qū)大小

固定緩沖區(qū)大小的實(shí)現(xiàn)方案,只需要控制服務(wù)器端和客戶端發(fā)送和接收字節(jié)的(數(shù)組)長度相同即可。

服務(wù)器端實(shí)現(xiàn)代碼如下:

  1. /** 
  2.  * 服務(wù)器端,改進(jìn)版本一(只負(fù)責(zé)接收消息) 
  3.  */ 
  4. static class ServSocketV1 { 
  5.     private static final int BYTE_LENGTH = 1024;  // 字節(jié)數(shù)組長度(收消息用) 
  6.     public static void main(String[] args) throws IOException { 
  7.         ServerSocket serverSocket = new ServerSocket(9091); 
  8.         // 獲取到連接 
  9.         Socket clientSocket = serverSocket.accept(); 
  10.         try (InputStream inputStream = clientSocket.getInputStream()) { 
  11.             while (true) { 
  12.                 byte[] bytes = new byte[BYTE_LENGTH]; 
  13.                 // 讀取客戶端發(fā)送的信息 
  14.                 int count = inputStream.read(bytes, 0, BYTE_LENGTH); 
  15.                 if (count > 0) { 
  16.                     // 接收到消息打印 
  17.                     System.out.println("接收到客戶端的信息是:" + new String(bytes).trim()); 
  18.                 } 
  19.                 count = 0; 
  20.             } 
  21.         } 
  22.     } 

客戶端實(shí)現(xiàn)代碼如下:

  1. /** 
  2.  * 客戶端,改進(jìn)版一(只負(fù)責(zé)接收消息) 
  3.  */ 
  4. static class ClientSocketV1 { 
  5.     private static final int BYTE_LENGTH = 1024;  // 字節(jié)長度 
  6.     public static void main(String[] args) throws IOException { 
  7.         Socket socket = new Socket("127.0.0.1", 9091); 
  8.         final String message = "Hi,Java."; // 發(fā)送消息 
  9.         try (OutputStream outputStream = socket.getOutputStream()) { 
  10.             // 將數(shù)據(jù)組裝成定長字節(jié)數(shù)組 
  11.             byte[] bytes = new byte[BYTE_LENGTH]; 
  12.             int idx = 0; 
  13.             for (byte b : message.getBytes()) { 
  14.                 bytes[idx] = b; 
  15.                 idx++; 
  16.             } 
  17.             // 給服務(wù)器端發(fā)送 10 次消息 
  18.             for (int i = 0; i < 10; i++) { 
  19.                 outputStream.write(bytes, 0, BYTE_LENGTH); 
  20.             } 
  21.         } 
  22.     } 

以上代碼的執(zhí)行結(jié)果如下圖所示:

優(yōu)缺點(diǎn)分析

從以上代碼可以看出,雖然這種方式可以解決粘包和半包的問題,但這種固定緩沖區(qū)大小的方式增加了不必要的數(shù)據(jù)傳輸,因?yàn)檫@種方式當(dāng)發(fā)送的數(shù)據(jù)比較小時會使用空字符來彌補(bǔ),所以這種方式就大大的增加了網(wǎng)絡(luò)傳輸?shù)呢?fù)擔(dān),所以它也不是最佳的解決方案。

解決方案二:封裝請求協(xié)議

這種解決方案的實(shí)現(xiàn)思路是將請求的數(shù)據(jù)封裝為兩部分:數(shù)據(jù)頭+數(shù)據(jù)正文,在數(shù)據(jù)頭中存儲數(shù)據(jù)正文的大小,當(dāng)讀取的數(shù)據(jù)小于數(shù)據(jù)頭中的大小時,繼續(xù)讀取數(shù)據(jù),直到讀取的數(shù)據(jù)長度等于數(shù)據(jù)頭中的長度時才停止。

因?yàn)檫@種方式可以拿到數(shù)據(jù)的邊界,所以也不會導(dǎo)致粘包和半包的問題,但這種實(shí)現(xiàn)方式的編碼成本較大也不夠優(yōu)雅,因此不是最佳的實(shí)現(xiàn)方案,因此我們這里就略過,直接來看最終的解決方案吧。

解決方案三:特殊字符結(jié)尾,按行讀取

以特殊字符結(jié)尾就可以知道流的邊界了,因此也可以用來解決粘包和半包的問題,此實(shí)現(xiàn)方案是我們推薦最終解決方案。

這種解決方案的核心是,使用 Java 中自帶的 BufferedReader 和 BufferedWriter,也就是帶緩沖區(qū)的輸入字符流和輸出字符流,通過寫入的時候加上 \n 來結(jié)尾,讀取的時候使用 readLine 按行來讀取數(shù)據(jù),這樣就知道流的邊界了,從而解決了粘包和半包的問題。

服務(wù)器端實(shí)現(xiàn)代碼如下:

  1. /** 
  2.  * 服務(wù)器端,改進(jìn)版三(只負(fù)責(zé)收消息) 
  3.  */ 
  4. static class ServSocketV3 { 
  5.     public static void main(String[] args) throws IOException { 
  6.         // 創(chuàng)建 Socket 服務(wù)器端 
  7.         ServerSocket serverSocket = new ServerSocket(9092); 
  8.         // 獲取客戶端連接 
  9.         Socket clientSocket = serverSocket.accept(); 
  10.         // 使用線程池處理更多的客戶端 
  11.         ThreadPoolExecutor threadPool = new ThreadPoolExecutor(100, 150, 100, 
  12.                 TimeUnit.SECONDS, new LinkedBlockingQueue<>(1000)); 
  13.         threadPool.submit(() -> { 
  14.             // 消息處理 
  15.             processMessage(clientSocket); 
  16.         }); 
  17.     } 
  18.     /** 
  19.      * 消息處理 
  20.      * @param clientSocket 
  21.      */ 
  22.     private static void processMessage(Socket clientSocket) { 
  23.         // 獲取客戶端發(fā)送的消息流對象 
  24.         try (BufferedReader bufferedReader = new BufferedReader( 
  25.                 new InputStreamReader(clientSocket.getInputStream()))) { 
  26.             while (true) { 
  27.                 // 按行讀取客戶端發(fā)送的消息 
  28.                 String msg = bufferedReader.readLine(); 
  29.                 if (msg != null) { 
  30.                     // 成功接收到客戶端的消息并打印 
  31.                     System.out.println("接收到客戶端的信息:" + msg); 
  32.                 } 
  33.             } 
  34.         } catch (IOException ioException) { 
  35.             ioException.printStackTrace(); 
  36.         } 
  37.     } 

PS:上述代碼使用了線程池來解決多個客戶端同時訪問服務(wù)器端的問題,從而實(shí)現(xiàn)了一對多的服務(wù)器響應(yīng)。

客戶端的實(shí)現(xiàn)代碼如下:

  1. /** 
  2.  * 客戶端,改進(jìn)版三(只負(fù)責(zé)發(fā)送消息) 
  3.  */ 
  4. static class ClientSocketV3 { 
  5.     public static void main(String[] args) throws IOException { 
  6.         // 啟動 Socket 并嘗試連接服務(wù)器 
  7.         Socket socket = new Socket("127.0.0.1", 9092); 
  8.         final String message = "Hi,Java."; // 發(fā)送消息 
  9.         try (BufferedWriter bufferedWriter = new BufferedWriter( 
  10.                 new OutputStreamWriter(socket.getOutputStream()))) { 
  11.             // 給服務(wù)器端發(fā)送 10 次消息 
  12.             for (int i = 0; i < 10; i++) { 
  13.                 // 注意:結(jié)尾的 \n 不能省略,它表示按行寫入 
  14.                 bufferedWriter.write(message + "\n"); 
  15.                 // 刷新緩沖區(qū)(此步驟不能省略) 
  16.                 bufferedWriter.flush(); 
  17.             } 
  18.         } 
  19.     } 

以上代碼的執(zhí)行結(jié)果如下圖所示:

圖片

總結(jié)

本文我們講了 TCP 粘包和半包問題,粘包是指讀取到了兩條信息,正常情況下消息應(yīng)該是一條一條讀取的,而半包問題是指讀取了一半信息。導(dǎo)致粘包和半包的原因是 TCP 的傳輸是以流的形式進(jìn)行的,而流數(shù)據(jù)是沒有明確的開始和結(jié)尾標(biāo)識的,因此就導(dǎo)致了此問題。

本文我們提供了 3 種粘包和半包的解決方案,其中最推薦的是使用 BufferedReader 和 BufferedWriter 按行來讀、寫和區(qū)分消息,也就是本文的第三種解決方案。

 

責(zé)任編輯:武曉燕 來源: Java中文社群
相關(guān)推薦

2021-04-05 14:44:20

JavaScript循環(huán)代碼

2022-05-07 09:20:38

智能客服模塊方案

2014-09-10 10:04:37

程序員

2014-09-10 10:43:58

程序員

2021-01-13 10:18:29

SocketNetty粘包

2010-06-12 11:03:02

UML應(yīng)用

2010-09-09 09:24:43

極客專屬人格技術(shù)狂人

2017-11-13 12:01:31

開發(fā)者編程編程風(fēng)格

2010-12-20 11:12:31

企業(yè)網(wǎng)絡(luò)VPN

2018-02-27 10:36:20

物聯(lián)網(wǎng)無線通信應(yīng)用程序

2024-11-28 09:06:52

2023-11-06 08:20:35

Kubernetesnginx

2018-01-05 08:53:32

LinuxUbuntu發(fā)行版

2021-07-25 20:22:04

容器技術(shù)計算

2011-07-25 10:57:02

信息安全認(rèn)證IT安全學(xué)歷信息安全職業(yè)

2023-03-30 15:28:24

2024-03-29 11:13:17

云計算人工智能

2015-04-17 10:21:37

云存儲附加存儲

2021-08-10 09:00:00

存儲容器硬件

2013-12-27 09:42:04

程序員趣聞
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號