自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

Socket編程實戰(zhàn)

開發(fā) 后端
本文著重介紹現在用的最多的 network socket,包括其在網絡模型中的位置、API 的編程范式、常見錯誤等方面,最后用 Python 語言中的 socket API 實現幾個實際的例子。Socket 中文一般翻譯為“套接字”,不得不說這是個讓人摸不著頭腦的翻譯,我也沒想到啥“信達雅”的翻譯,所以本文直接用其英文表述。本文中所有代碼均可在 socket.py 倉庫中找到。

Socket 在英文中的含義為“(連接兩個物品的)凹槽”,像the eye socket,意為“眼窩”,此外還有“插座”的意思。在計算機科學中,socket 通常是指一個連接的兩個端點,這里的連接可以是同一機器上的,像unix domain socket,也可以是不同機器上的,像network socket。

本文著重介紹現在用的最多的 network socket,包括其在網絡模型中的位置、API 的編程范式、常見錯誤等方面,***用 Python 語言中的 socket API 實現幾個實際的例子。Socket 中文一般翻譯為“套接字”,不得不說這是個讓人摸不著頭腦的翻譯,我也沒想到啥“信達雅”的翻譯,所以本文直接用其英文表述。本文中所有代碼均可在 socket.py 倉庫中找到。

概述

Socket 作為一種通用的技術規(guī)范,***是由 Berkeley 大學在 1983 為 4.2BSD Unix 提供的,后來逐漸演化為 POSIX 標準。Socket API 是由操作系統(tǒng)提供的一個編程接口,讓應用程序可以控制使用 socket 技術。Unix 哲學中有一條一切皆為文件,所以 socket 和file 的 API 使用很類似:可以進行read、write、open、close等操作。

現在的網絡系統(tǒng)是分層的,理論上有OSI模型,工業(yè)界有TCP/IP協(xié)議簇。其對比如下:

每層上都有其相應的協(xié)議,socket API 不屬于TCP/IP協(xié)議簇,只是操作系統(tǒng)提供的一個用于網絡編程的接口,工作在應用層與傳輸層之間:

我們平常瀏覽網站所使用的http協(xié)議,收發(fā)郵件用的smtp與imap,都是基于 socket API 構建的。

一個 socket,包含兩個必要組成部分:

  1. 地址,由 ip 與 端口組成,像192.168.0.1:80。
  2. 協(xié)議,socket 所是用的傳輸協(xié)議,目前有三種:TCP、UDP、raw IP。

地址與協(xié)議可以確定一個socket;一臺機器上,只允許存在一個同樣的socket。TCP 端口 53 的 socket 與 UDP 端口 53 的 socket 是兩個不同的 socket。

根據 socket 傳輸數據方式的不同(使用協(xié)議不同),可以分為以下三種:

  1. Stream sockets,也稱為“面向連接”的 socket,使用 TCP 協(xié)議。實際通信前需要進行連接,傳輸的數據沒有特定的結構,所以高層協(xié)議需要自己去界定數據的分隔符,但其優(yōu)勢是數據是可靠的。
  2. Datagram sockets,也稱為“無連接”的 socket,使用 UDP 協(xié)議。實際通信前不需要連接,一個優(yōu)勢時 UDP 的數據包自身是可分割的(self-delimiting),也就是說每個數據包就標示了數據的開始與結束,其劣勢是數據不可靠。
  3. Raw sockets,通常用在路由器或其他網絡設備中,這種 socket 不經過TCP/IP協(xié)議簇中的傳輸層(transport layer),直接由網絡層(Internet layer)通向應用層(Application layer),所以這時的數據包就不會包含 tcp 或 udp 頭信息。

Python socket API

Python 里面用(ip, port)的元組來表示 socket 的地址屬性,用AF_*來表示協(xié)議類型。

數據通信有兩組動詞可供選擇:send/recv 或 read/write。read/write 方式也是 Java 采用的方式,這里不會對這種方式進行過多的解釋,但是需要注意的是:

read/write 操作的具有 buffer 的“文件”,所以在進行讀寫后需要調用flush方法去真正發(fā)送或讀取數據,否則數據會一直停留在緩沖區(qū)內。

TCP socket

TCP socket 由于在通向前需要建立連接,所以其模式較 UDP socket 負責些。具體如下:

每個API 的具體含義這里不在贅述,可以查看手冊,這里給出 Python 語言的實現的 echo server。

  1. # echo_server.py 
  2. # coding=utf8 
  3. import socket 
  4.  
  5. sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM) 
  6. # 設置 SO_REUSEADDR 后,可以立即使用 TIME_WAIT 狀態(tài)的 socket 
  7. sock.setsockopt(socket.SOL_SOCKET, socket.SO_REUSEADDR, 1) 
  8. sock.bind(('', 5500)) 
  9. sock.listen(5)  
  1. def handler(client_sock, addr): 
  2.     print('new client from %s:%s' % addr) 
  3.     msg = client_sock.recv(1024) 
  4.     client_sock.send(msg) 
  5.     client_sock.close() 
  6.     print('client[%s:%s] socket closed' % addr) 
  7.  
  8. if __name__ == '__main__'
  9.     while 1: 
  10.         client_sock, addr = sock.accept() 
  11.         handler(client_sock, addr)  
  1. # echo_client.py 
  2. # coding=utf8 
  3. import socket 
  4.  
  5. sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM) 
  6. sock.connect(('', 5500)) 
  7. sock.send('hello socket world'
  8. print sock.recv(1024)  

上面簡單的echo server 代碼中有一點需要注意的是:server 端的 socket 設置了SO_REUSEADDR為1,目的是可以立即使用處于TIME_WAIT狀態(tài)的socket,那么TIME_WAIT又是什么意思呢?后面在講解 tcp 狀態(tài)變更圖時再做詳細介紹。

UDP socket

UDP socket server 端代碼在進行bind后,無需調用listen方法。

  1. # udp_echo_server.py 
  2. # coding=utf8 
  3. import socket 
  4.  
  5. sock = socket.socket(socket.AF_INET, socket.SOCK_DGRAM) 
  6. # 設置 SO_REUSEADDR 后,可以立即使用 TIME_WAIT 狀態(tài)的 socket 
  7. sock.setsockopt(socket.SOL_SOCKET, socket.SO_REUSEADDR, 1) 
  8. sock.bind(('', 5500)) 
  9. # 沒有調用 listen 
  10.  
  11. if __name__ == '__main__'
  12.     while 1: 
  13.         data, addr = sock.recvfrom(1024) 
  14.  
  15.         print('new client from %s:%s' % addr) 
  16.         sock.sendto(data, addr) 
  17.  
  18. # udp_echo_client.py 
  19. # coding=utf8 
  20. import socket 
  21.  
  22. udp_server_addr = ('', 5500) 
  23.  
  24. if __name__ == '__main__'
  25.     sock = socket.socket(socket.AF_INET, socket.SOCK_DGRAM) 
  26.     data_to_sent = 'hello udp socket' 
  27.     try: 
  28.         sent = sock.sendto(data_to_sent, udp_server_addr) 
  29.         data, server = sock.recvfrom(1024) 
  30.         print('receive data:[%s] from %s:%s' % ((data,) + server)) 
  31.     finally: 
  32.         sock.close()  

常見陷阱

忽略返回值

本文中的 echo server 示例因為篇幅限制,也忽略了返回值。網絡通信是個非常復雜的問題,通常無法保障通信雙方的網絡狀態(tài),很有可能在發(fā)送/接收數據時失敗或部分失敗。所以有必要對發(fā)送/接收函數的返回值進行檢查。本文中的 tcp echo client 發(fā)送數據時,正確寫法應該如下:

  1. total_send = 0 
  2. content_length = len(data_to_sent) 
  3. while total_send < content_length: 
  4.     sent = sock.send(data_to_sent[total_send:]) 
  5.     if sent == 0: 
  6.         raise RuntimeError("socket connection broken"
  7.     total_send += total_send + sent  

send/recv操作的是網絡緩沖區(qū)的數據,它們不必處理傳入的所有數據。

一般來說,當網絡緩沖區(qū)填滿時,send函數就返回了;當網絡緩沖區(qū)被清空時,recv 函數就返回。

當 recv 函數返回0時,意味著對端已經關閉。

可以通過下面的方式設置緩沖區(qū)大小。

  1. s.setsockopt(socket.SOL_SOCKET, socket.SO_SNDBUF, buffer_size) 

認為 TCP 具有 framing

TCP 不提供 framing,這使得其很適合于傳輸數據流。這是其與 UDP 的重要區(qū)別之一。UDP 是一個面向消息的協(xié)議,能保持一條消息在發(fā)送者與接受者之間的完備性。

 

代碼示例參考:framing_assumptions 

TCP 的狀態(tài)機

在前面echo server 的示例中,提到了TIME_WAIT狀態(tài),為了正式介紹其概念,需要了解下 TCP 從生成到結束的狀態(tài)機器。(圖片來源)

 

這個狀圖轉移圖非常非常關鍵,也比較復雜,我自己為了方便記憶,對這個圖進行了拆解,仔細分析這個圖,可以得出這樣一個結論,連接的打開與關閉都有被動(passive)與主動(active)兩種,主動關閉時,涉及到的狀態(tài)轉移最多,包括FIN_WAIT_1、FIN_WAIT_2、CLOSING、TIME_WAIT。

此外,由于 TCP 是可靠的傳輸協(xié)議,所以每次發(fā)送一個數據包后,都需要得到對方的確認(ACK),有了上面這兩個知識后,再來看下面的圖:(圖片來源)

 

 

  1. 在主動關閉連接的 socket 調用 close方法的同時,會向被動關閉端發(fā)送一個 FIN
  2. 對端收到FIN后,會向主動關閉端發(fā)送ACK進行確認,這時被動關閉端處于 CLOSE_WAIT 狀態(tài)
  3. 當被動關閉端調用close方法進行關閉的同時向主動關閉端發(fā)送 FIN 信號,接收到 FIN 的主動關閉端這時就處于 TIME_WAIT 狀態(tài)
  4. 這時主動關閉端不會立刻轉為 CLOSED 狀態(tài),而是需要等待 2MSL(max segment life,一個數據包在網絡傳輸中***的生命周期),以確保被動關閉端能夠收到***發(fā)出的 ACK。如果被動關閉端沒有收到***的 ACK,那么被動關閉端就會重新發(fā)送 FIN,所以處于TIME_WAIT的主動關閉端會再次發(fā)送一個 ACK 信號,這么一來(FIN來)一回(ACK),正好是兩個 MSL 的時間。如果等待的時間小于 2MSL,那么新的socket就可以收到之前連接的數據。

前面 echo server 的示例也說明了,處于 TIME_WAIT 并不是說一定不能使用,可以通過設置 socket 的 SO_REUSEADDR 屬性以達到不用等待 2MSL 的時間就可以復用socket 的目的,當然,這僅僅適用于測試環(huán)境,正常情況下不要修改這個屬性。

實戰(zhàn)

HTTP UA

http 協(xié)議是如今萬維網的基石,可以通過 socket API 來簡單模擬一個瀏覽器(UA)是如何解析 HTTP 協(xié)議數據的。

  1. #coding=utf8 
  2. import socket 
  3.  
  4. sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM) 
  5. baidu_ip = socket.gethostbyname('baidu.com'
  6. sock.connect((baidu_ip, 80)) 
  7. print('connected to %s' % baidu_ip) 
  8.  
  9. req_msg = [ 
  10.     'GET / HTTP/1.1'
  11.     'User-Agent: curl/7.37.1'
  12.     'Host: baidu.com'
  13.     'Accept: */*'
  14. delimiter = '\r\n' 
  15.  
  16. sock.send(delimiter.join(req_msg)) 
  17. sock.send(delimiter) 
  18. sock.send(delimiter) 
  19.  
  20. print('%sreceived%s' % ('-'*20, '-'*20)) 
  21. http_response = sock.recv(4096) 
  22. print(http_response)  

運行上面的代碼可以得到下面的輸出

  1. --------------------received-------------------- 
  2. HTTP/1.1 200 OK 
  3. Date: Tue, 01 Nov 2016 12:16:53 GMT 
  4. Server: Apache 
  5. Last-Modified: Tue, 12 Jan 2010 13:48:00 GMT 
  6. ETag: "51-47cf7e6ee8400" 
  7. Accept-Ranges: bytes 
  8. Content-Length: 81 
  9. Cache-Control: max-age=86400 
  10. Expires: Wed, 02 Nov 2016 12:16:53 GMT 
  11. Connection: Keep-Alive 
  12. Content-Type: text/html 
  13.  
  14. <html> 
  15. <meta http-equiv="refresh" content="0;url=http://www.baidu.com/"
  16. </html>  

http_response是通過直接調用recv(4096)得到的,萬一真正的返回大于這個值怎么辦?我們前面知道了 TCP 協(xié)議是面向流的,它本身并不關心消息的內容,需要應用程序自己去界定消息的邊界,對于應用層的 HTTP 協(xié)議來說,有幾種情況,最簡單的一種時通過解析返回值頭部的Content-Length屬性,這樣就知道body的大小了,對于 HTTP 1.1版本,支持Transfer-Encoding: chunked傳輸,對于這種格式,這里不在展開講解,大家只需要知道, TCP 協(xié)議本身無法區(qū)分消息體就可以了。對這塊感興趣的可以查看 CPython 核心模塊 http.client

Unix_domain_socket

UDS 用于同一機器上不同進程通信的一種機制,其API適用與 network socket 很類似。只是其連接地址為本地文件而已。

代碼示例參考:uds_server.py、uds_client.py

ping

ping 命令作為檢測網絡聯(lián)通性最常用的工具,其適用的傳輸協(xié)議既不是TCP,也不是 UDP,而是 ICMP,利用 raw sockets,我們可以適用純 Python 代碼來實現其功能。

代碼示例參考:ping.py

netstat vs ss

netstat 與 ss 是類 Unix 系統(tǒng)上查看 Socket 信息的命令。netstat 是比較老牌的命令,我常用的選擇有

  • -t,只顯示 tcp 連接
  • -u,只顯示 udp 連接
  • -n,不用解析hostname,用 IP 顯示主機,可以加快執(zhí)行速度
  • -p,查看連接的進程信息
  • -l,只顯示監(jiān)聽的連接

ss 是新興的命令,其選項和 netstat 差不多,主要區(qū)別是能夠進行過濾(通過state與exclude關鍵字)。

  1. $ ss -o state time-wait -n | head 
  2. Recv-Q Send-Q             Local Address:Port               Peer Address:Port 
  3. 0      0                 10.200.181.220:2222              10.200.180.28:12865  timer:(timewait,33sec,0) 
  4. 0      0                      127.0.0.1:45977                 127.0.0.1:3306   timer:(timewait,46sec,0) 
  5. 0      0                      127.0.0.1:45945                 127.0.0.1:3306   timer:(timewait,6.621ms,0) 
  6. 0      0                 10.200.181.220:2222              10.200.180.28:12280  timer:(timewait,12sec,0) 
  7. 0      0                 10.200.181.220:2222              10.200.180.28:35045  timer:(timewait,43sec,0) 
  8. 0      0                 10.200.181.220:2222              10.200.180.28:42675  timer:(timewait,46sec,0) 
  9. 0      0                      127.0.0.1:45949                 127.0.0.1:3306   timer:(timewait,11sec,0) 
  10. 0      0                      127.0.0.1:45954                 127.0.0.1:3306   timer:(timewait,21sec,0) 
  11. 0      0               ::ffff:127.0.0.1:3306           ::ffff:127.0.0.1:45964  timer:(timewait,31sec,0)  

這兩個命令更多用法可以參考:

總結

我們的生活已經離不開網絡,平時的開發(fā)也充斥著各種復雜的網絡應用,從最基本的數據庫,到各種分布式系統(tǒng),不論其應用層怎么復雜,其底層傳輸數據的的協(xié)議簇是一致的。Socket 這一概念我們很少直接與其打交道,但是當我們的系統(tǒng)出現問題時,往往是對底層的協(xié)議認識不足造成的,希望這篇文章能對大家編程網絡方面的程序有所幫助。

責任編輯:龐桂玉 來源: segmentfault
相關推薦

2012-03-19 11:41:30

JavaSocket

2010-03-03 16:19:29

Python Sock

2013-03-26 12:46:23

Android開發(fā)So

2013-03-27 13:26:04

Android開發(fā)Socket

2015-07-27 09:53:13

PHP編程過程

2011-06-13 16:51:19

Qt Socket

2013-09-22 11:03:20

SocketSocket編程

2015-04-24 09:48:59

TCPsocketsocket編程

2010-03-22 10:42:37

Java Socket

2010-03-17 14:22:40

Java Socket

2012-02-15 10:37:38

JavaJava Socket

2009-06-11 10:00:05

Java Socket

2012-03-19 10:55:27

JavaSocket

2022-10-24 08:01:32

Sockets網絡協(xié)議

2009-02-04 09:45:05

Java SocketSocket APIJava編程

2019-02-12 15:04:09

2012-02-15 10:34:29

JavaJava Socket

2012-02-15 10:40:37

JavaJava Socket

2011-06-20 13:43:08

Qt Socket 線程

2015-09-08 10:06:18

JavaSocket編程通信
點贊
收藏

51CTO技術棧公眾號