小菜學(xué)網(wǎng)絡(luò)之WebSocket協(xié)議
Web應(yīng)用 采用 HTTP 協(xié)議進(jìn)行通信:客戶端向服務(wù)器發(fā)送 HTTP 請(qǐng)求,服務(wù)器對(duì)請(qǐng)求進(jìn)行處理后,向客戶端回復(fù) HTTP 響應(yīng)。換句話講,HTTP 協(xié)議只能客戶端主動(dòng)發(fā)起請(qǐng)求,服務(wù)器被動(dòng)進(jìn)行響應(yīng)。
圖片
不少應(yīng)用場(chǎng)景要求服務(wù)主動(dòng)向客戶端進(jìn)行推送,這時(shí) HTTP 協(xié)議就有點(diǎn)捉襟見肘了。舉個(gè)例子,為實(shí)現(xiàn) Web 聊天室功能,當(dāng)新消息到達(dá)時(shí),服務(wù)器必須向客戶端推送通知。只用 HTTP 協(xié)議來實(shí)現(xiàn),我們必須在客戶端做輪詢。
輪詢有個(gè)致命的缺陷——性能比較差:如果輪詢頻率很高,服務(wù)器要消耗很多資源;但如果控制輪詢頻率,應(yīng)用消息通知的實(shí)時(shí)性又大打折扣。
很顯然,服務(wù)器主動(dòng)向客戶端推送數(shù)據(jù),也是一個(gè)非常常見的應(yīng)用場(chǎng)景,最好能從網(wǎng)絡(luò)協(xié)議層面進(jìn)行支持。為此,計(jì)算機(jī)網(wǎng)絡(luò)先驅(qū)們?cè)O(shè)計(jì)了 WebSocket 協(xié)議。
WebSocket 協(xié)議,顧名思義為 Web 應(yīng)用引入了 套接字( socket )通信能力。Websocket 是一種應(yīng)用層協(xié)議,以 TCP 為底層傳輸協(xié)議,為通信雙方提供了一個(gè) 全雙工 的信道。
為了兼容 Web 主流應(yīng)用協(xié)議 HTTP ,WeSocket 復(fù)用 80 和 443 端口,并使用 HTTP 請(qǐng)求來建立連接(配合 Upgrade 頭部)。因此,WebSocket 可以兼容現(xiàn)有的 HTTP代理 和中間件,例如 Nginx 。
URL
和 HTTP 協(xié)議一樣,WebSocket 服務(wù)器地址也用 URL 表示,只是協(xié)議部分為 ws 或 wss 。例如:
# ws代表WebSocket協(xié)議,端口為80
ws://api.fasionchan.com/chat
# wss代表WebSocket安全協(xié)議,與https類似,端口為443
wss://api.fasionchan.com/chat
連接建立
客戶端先通過 TCP 協(xié)議連到服務(wù)器,然后通過 TCP 連接向服務(wù)器發(fā)送 HTTP 請(qǐng)求。請(qǐng)注意,HTTP 請(qǐng)求頭中要帶 Upgrade 頭部,告訴服務(wù)器將連接升級(jí)到 WebSocket 協(xié)議:
GET /chat HTTP/1.1
Host: localhost:8080
User-Agent: Go-http-client/1.1
Connection: Upgrade
Sec-WebSocket-Key: bLPIf/xpAnrtCKuifPKTUg==
Sec-WebSocket-Version: 13
Upgrade: websocket
服務(wù)器接到請(qǐng)求后,檢查 Upgrade 頭部,發(fā)現(xiàn)客戶端想將連接協(xié)議升級(jí)到 WebSocket 。如果應(yīng)用服務(wù)器支持 WebSocket ,它便回復(fù) 101 狀態(tài)碼,表示同意切換協(xié)議:
HTTP/1.1 101 Switching Protocols
Upgrade: websocket
Connection: Upgrade
Sec-WebSocket-Accept: lShvB7NL9TbGxezz+KUd5ee6jhA=
圖片
HTTP 請(qǐng)求和響應(yīng)交互完畢后,通信雙方就可以在 TCP 連接上互相發(fā)送 WebSocket 報(bào)文了。
數(shù)據(jù)幀
連接建好后,通信雙方就可以用 WebSocket 協(xié)議來發(fā)送數(shù)據(jù)了。WebSocket 將數(shù)據(jù)組織成一系列幀( frame )來傳輸,一條應(yīng)用層消息可以封裝成一個(gè)或多個(gè)數(shù)據(jù)幀。數(shù)據(jù)幀報(bào)文結(jié)構(gòu)如下所示:
圖片
- 標(biāo)志位 ,占 4每個(gè)標(biāo)識(shí)占一位;
a.FIN
b.RSV1 、RSV2 和 RSV3
a.0 這是前面數(shù)據(jù)幀的續(xù)幀(一個(gè)消息封裝成多個(gè)幀時(shí));
b.1表示這是一個(gè)文本幀;
c.2 表示這是一個(gè)二進(jìn)制( binary )幀;
d3~7 保留,未來可以分配給新的非控制( non-control )幀;
e.8 表示這是一個(gè)連接關(guān)閉( close )幀;
f.9 表示這是一個(gè) ping 幀;
g.10 表示這是一個(gè) pong 幀;
h.11~15 保留,未來可以分配給新的控制( control )幀;
- MASK 位,表示 承載數(shù)據(jù)( payload data )是否做掩碼處理,1 表示掩碼處理,0 表示不做掩碼處理(客戶端發(fā)的幀必須做掩碼處理,主要出于避免網(wǎng)絡(luò)中間件混淆和安全上的考慮);
- 數(shù)據(jù)長度( payload len ),占 7 位,用來表示數(shù)據(jù)負(fù)載的長度(以字節(jié)為單位);
a.該字段小于 126 時(shí),該字段直接表示數(shù)據(jù)長度,其后的擴(kuò)展字段為空( 0 字節(jié)),可表示 0~125 字節(jié)的數(shù)據(jù);
b.當(dāng)該字段等于 126 時(shí),數(shù)據(jù)長度由其后的擴(kuò)展字段表示,這是擴(kuò)展字段為 2 字節(jié),可表示長度為 126~65535 字節(jié)的數(shù)據(jù);
c.
- 擴(kuò)展數(shù)據(jù)長度( extended payload len ),占用 0 、2 或 8 字節(jié),由前一個(gè)字段決定;
- 掩碼Key( masking key ),數(shù)據(jù)幀開啟掩碼處理時(shí)( MASK=1 )才有,占用 4 個(gè)字節(jié),用于掩碼計(jì)算;
- 承載數(shù)據(jù)( payload data ),即數(shù)據(jù)幀承載的應(yīng)用層數(shù)據(jù);
數(shù)據(jù)長度字段比較復(fù)雜,需要分三種情況討論,分別舉個(gè)例子幫助理解:
圖片
注意到,為了簡(jiǎn)化報(bào)文,我們假設(shè) MASK=0 ,未啟動(dòng)掩碼處理。
WebSocket 幀結(jié)構(gòu)看似復(fù)雜,但無非還是先分成 頭部 和 數(shù)據(jù) 兩大部分,其中頭部保存 數(shù)據(jù)類型(操作碼)和 數(shù)據(jù)長度 ,而操作碼又分成控制和非控制兩種。
控制幀則繼續(xù)分為 close 、ping 和 pong 三種:close 用于關(guān)閉連接;ping 和 pong 用于檢測(cè)連接狀態(tài),檢測(cè)方發(fā) ping ,被檢測(cè)方回復(fù) pong 。這樣當(dāng)應(yīng)用暫時(shí)沒有數(shù)據(jù)要發(fā)送時(shí),ping/pong 可讓連接保持活躍。當(dāng)連接斷開時(shí),也能及時(shí)檢測(cè)到。
而非控制幀則分為 text 和 binary 兩種,上層應(yīng)用使用文本協(xié)議,則選 text ;使用二進(jìn)制協(xié)議,則選 binary 。
總結(jié)
- WebSocket 兼容 HTTP 協(xié)議,借助 HTTP 請(qǐng)求建立連接;
- WebSocket 通信分為兩個(gè)階段:
- 連接建立階段:使用 HTTP
- 數(shù)據(jù)通信階段:使用 WebSocket
- WebSocket 通信報(bào)文為 幀 ,一個(gè)幀由 頭部 和 數(shù)據(jù) 兩部分組成;
- WebSocket 幀頭部保存 操作碼 和 數(shù)據(jù)長度 等字段;
- 根據(jù)操作碼不同,WebSocket 幀可以分成 控制幀 和 非控制幀 兩類;
- WebSocket 控制幀分為 close 、ping 和 pong 三種;
- ping / pong 控制幀用于連接?;詈蜖顟B(tài)檢測(cè);
- close 控制幀用于關(guān)閉連接;
- WebSocket 非控制幀分為 文本幀 和 二進(jìn)制幀 兩種;