HTML 5 Web Socket:下一次Web通信革命揭幕
原創(chuàng)【51CTO譯文】關(guān)于HTML 5的各種前沿技術(shù)應(yīng)用51CTO已經(jīng)報(bào)道過很多,比如HTML 5的視頻音頻元素、HTML 5 Web SQL Database、HTML5 File API以及如何從零開始構(gòu)建一個(gè)HTML 5頁面等等。這些都是HTML 5對(duì)當(dāng)前Web開發(fā)標(biāo)準(zhǔn)技術(shù)的升級(jí)或擴(kuò)展。今天,51CTO帶您了解HTML 5的另一面——HTML 5 Web Socket,以及它對(duì)當(dāng)前Web通信的改變。
最近關(guān)于HTML 5 Web Socket的流言已經(jīng)滿天飛,它通過Web上的一個(gè)單一Socket定義了一個(gè)全雙工通信信道,HTML 5 Web Socket并不是普通HTTP通信的增強(qiáng)版,它代表著一個(gè)巨大的進(jìn)步,特別是針對(duì)實(shí)時(shí)的、事件驅(qū)動(dòng)的Web應(yīng)用程序。
Google的工程師Ian Hickson說“數(shù)據(jù)的字節(jié)數(shù)急劇減少到2字節(jié),延遲從150毫秒減少到50毫秒,實(shí)際上,這兩個(gè)因素已經(jīng)足以引起Google的興趣了”。通過在一個(gè)瀏覽器中模擬全雙工連接,HTML 5 Web Socket對(duì)Web通信帶來了顯著的改善。
讓我們與傳統(tǒng)的解決方案相比,看看HTML 5 Web Socket是如何減少不必要的網(wǎng)絡(luò)流量和延遲的。
當(dāng)前的Web通信——頭疼的輪詢(Polling)
通常,當(dāng)瀏覽器訪問一個(gè)網(wǎng)頁時(shí),會(huì)向托管該網(wǎng)頁的Web服務(wù)器發(fā)送一個(gè)HTTP請(qǐng)求,Web服務(wù)器識(shí)別這一請(qǐng)求,并返回響應(yīng)。例如,股票價(jià)格,新聞報(bào)道,門票銷售,流量模式,醫(yī)療設(shè)備讀數(shù)等,在瀏覽器渲染頁面時(shí),響應(yīng)可能會(huì)過期,如果你想獲得***的“實(shí)時(shí)”信息,你可以不斷地手動(dòng)刷新頁面,但顯然這不是***的辦法。
目前提供的實(shí)時(shí)Web程序主要是圍繞輪詢和其它服務(wù)器端推送技術(shù)進(jìn)行的,***的是Comnet,它推遲了HTTP響應(yīng)的結(jié)束,基于Comnet的推送通常是使用JavaScript結(jié)合長(zhǎng)輪詢(Long Polling)或流連接策略實(shí)現(xiàn)的。
使用輪詢時(shí),瀏覽器定期發(fā)送HTTP請(qǐng)求,并立即收到響應(yīng),這種技術(shù)是交付實(shí)時(shí)信息的***次嘗試,顯然,如果知道消息傳遞的時(shí)間間隔,這算是一個(gè)好辦法,因?yàn)槟憧梢栽诜?wù)器上的信息可用時(shí)同步客戶端請(qǐng)求,但實(shí)時(shí)數(shù)據(jù)往往是不可預(yù)測(cè)的,不可避免會(huì)產(chǎn)生一些不必要的請(qǐng)求,導(dǎo)致許多連接處于打開狀態(tài),有些不必關(guān)閉的連接卻被關(guān)閉了。
使用長(zhǎng)輪詢時(shí),瀏覽器向服務(wù)器發(fā)送一個(gè)請(qǐng)求,服務(wù)器在既定期限內(nèi)保持請(qǐng)求處于打開狀態(tài),如果在此期間收到通知,向客戶端發(fā)送一個(gè)包含消息的響應(yīng),如果在此期間沒有收到消息,服務(wù)器發(fā)送一個(gè)響應(yīng)終止打開的請(qǐng)求。最重要的是要理解,當(dāng)你的信息容量很高時(shí),長(zhǎng)輪詢與傳統(tǒng)的輪詢相比不提供任何性能改善。實(shí)際上,它可能更糟,因?yàn)殚L(zhǎng)輪詢可能會(huì)失控進(jìn)入一個(gè)死循環(huán)。
使用流時(shí),瀏覽器發(fā)送一個(gè)完整的請(qǐng)求,但服務(wù)器發(fā)送一個(gè)響應(yīng),并保存打開狀態(tài),然后不斷更新使其一直保持打開(或在一段時(shí)間內(nèi)保持打開),無論何時(shí)消息準(zhǔn)備好發(fā)送時(shí),響應(yīng)就更新,但服務(wù)器不會(huì)發(fā)送一個(gè)結(jié)束的響應(yīng),因此連接就一直保持打開狀態(tài),后面發(fā)送的消息就可以繼續(xù)使用這個(gè)連接。但流仍然是封裝在HTTP中的,阻擾了防火墻和代理服務(wù)器選擇緩沖區(qū)中的內(nèi)容進(jìn)行響應(yīng),因此消息傳遞的時(shí)間就延長(zhǎng)了。許多流式Comnet解決方案都轉(zhuǎn)向了長(zhǎng)輪詢,另外,TLS(SSL)連接可以用來屏蔽來自緩沖區(qū)的響應(yīng),但在這種情況下,每個(gè)連接消耗的服務(wù)器資源更多了。
最終,所有這些方法都提供了實(shí)時(shí)數(shù)據(jù),包含HTTP請(qǐng)求和響應(yīng)頭,其中包含許多額外的,不必要的頭數(shù)據(jù),最重要的是,全雙工連接需要的不僅僅是從服務(wù)器到客戶端的下行連接。為了模擬基于半雙工HTTP上的全雙工通信,目前的許多解決方案都使用了兩個(gè)連接:一個(gè)下行連接,一個(gè)上行連接。維護(hù)和協(xié)調(diào)這兩個(gè)連接需要大量的系統(tǒng)開銷,并增加了復(fù)雜性。簡(jiǎn)言之,HTTP不是為實(shí)時(shí)的,全雙工通信設(shè)計(jì)的,如圖1所示,它顯示了構(gòu)建一個(gè)Comnet Web應(yīng)用程序的復(fù)雜性,它從后端數(shù)據(jù)源使用發(fā)布/訂閱模式基于半雙工HTTP顯示實(shí)時(shí)數(shù)據(jù)。
圖 1:Comnet程序的復(fù)雜性
當(dāng)你試圖向外擴(kuò)展那些Comet解決方案時(shí),情況變得更糟糕,模擬基于HTTP的雙向通信容易出錯(cuò),即使最終用戶感覺某些東西看起來象是一個(gè)實(shí)時(shí)Web應(yīng)用程序,但這種“實(shí)時(shí)”體驗(yàn)的代價(jià)都是非常高昂的,需要付出更多的延遲等待時(shí)間,不必要的網(wǎng)絡(luò)流量和對(duì)CPU性能的拖累。
#p#
HTML 5 Web Socket——拯救
HTML 5 Web Socket定義在HTML 5規(guī)范的通信章節(jié),它代表Web通信的下一個(gè)演變:通過一個(gè)單一的Socket實(shí)現(xiàn)一個(gè)全雙工,雙向通信的信道。HTML 5 Web Socket提供了一個(gè)真正的標(biāo)準(zhǔn),你可以使用它構(gòu)建可擴(kuò)展的實(shí)時(shí)Web應(yīng)用程序。此外,由于它提供了一個(gè)瀏覽器自帶的套接字,消除了Comet解決方案的許多問題,Web Socket顯著降低了系統(tǒng)開銷和復(fù)雜性。
為了建立一個(gè)Web Socket連接,客戶端和服務(wù)器在初始握手期間要從HTTP協(xié)議升級(jí)到WebSocket協(xié)議,如下面的例子:
例1:WebSocket握手(瀏覽器請(qǐng)求,服務(wù)器響應(yīng))
- GET /text HTTP/1.1\r\n
- Upgrade: WebSocket\r\n
- Connection: Upgrade\r\n
- Host: www.websocket.org\r\n
- ...\r\n
- HTTP/1.1 101 WebSocket Protocol Handshake\r\n
- Upgrade: WebSocket\r\n
- Connection: Upgrade\r\n
- ...\r\n
建立好連接后,WebSocket數(shù)據(jù)幀就可以在客戶端和服務(wù)器之間以全雙工模式傳輸,在同一時(shí)間任何方向,可以全雙工發(fā)送文本和二進(jìn)制幀,最小的幀只有2個(gè)字節(jié)。在文本幀中,每一幀始于0x00直接,止于0xFF字節(jié),數(shù)據(jù)使用UTF-8編碼。WebSocket文本幀使用終結(jié)器,而二進(jìn)制幀使用一個(gè)長(zhǎng)度前綴。
注意:雖然WebSocket協(xié)議已經(jīng)可以支持多種客戶端,但不能將原始數(shù)據(jù)傳遞給JavaScript,因?yàn)镴avaScript不支持字節(jié)類型,因此,如果客戶端是JavaScript,二進(jìn)制數(shù)據(jù)會(huì)被忽略,但可以傳遞給支持字節(jié)類型的客戶端。
Comet和HTML 5 Web Socket之間的對(duì)決
人們最關(guān)注的是HTML 5 Web Socket如何減少不必要的網(wǎng)絡(luò)流量和延遲,我們比較一個(gè)輪詢應(yīng)用程序和Web Socket應(yīng)用程序就知道了。
對(duì)于輪詢的例子,我創(chuàng)建了一個(gè)簡(jiǎn)單的Web應(yīng)用程序,一個(gè)網(wǎng)頁使用傳統(tǒng)的發(fā)布/訂閱模式從RabbitMQ消息代理請(qǐng)求實(shí)時(shí)的股票數(shù)據(jù),它是通過輪詢一個(gè)托管在Web服務(wù)器上的Java Servlet實(shí)現(xiàn)的,RabbitMQ消息代理從一個(gè)虛構(gòu)的,不斷更新價(jià)格的股票價(jià)格源接收數(shù)據(jù),網(wǎng)頁連接并訂閱一個(gè)特定的股票頻道(消息代理上的一個(gè)主題),使用XMLHttpRequest每秒更新一次進(jìn)行輪詢。當(dāng)收到更新時(shí),執(zhí)行一些計(jì)算,然后將股票數(shù)據(jù)顯示在圖2所示的表中。
圖 2:一個(gè)JavaScript股票行情應(yīng)用程序
注意:后端的股票源每秒實(shí)際上產(chǎn)生了大量的股票價(jià)格更新,因此使用每秒一次輪詢的方式比使用長(zhǎng)輪詢方式更好,長(zhǎng)輪詢會(huì)產(chǎn)生許多連續(xù)的輪詢,輪詢會(huì)更有效地阻止傳入更新。
這一切看起來還不錯(cuò),但仔細(xì)觀察,你就會(huì)發(fā)現(xiàn)這種應(yīng)用程序存在嚴(yán)重的問題,例如,使用Firefox的Firebug插件(允許你調(diào)試網(wǎng)頁和監(jiān)控頁面加載和腳本執(zhí)行時(shí)間),你可以看到每秒都有一個(gè)GET請(qǐng)求砸向服務(wù)器。打開Live HTTP Headers(另一個(gè)Firefox 插件,顯示實(shí)時(shí)的HTTP消息頭流量)揭示每個(gè)請(qǐng)求關(guān)聯(lián)的消息頭開銷數(shù)量是相當(dāng)驚人的。下面兩個(gè)例子顯示了一個(gè)請(qǐng)求和響應(yīng)的HTTP消息頭數(shù)據(jù)。
例2:HTTP請(qǐng)求頭
- GET /PollingStock//PollingStock HTTP/1.1
- Host: localhost:8080
- User-Agent: Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.9.1.5) Gecko/20091102 Firefox/3.5.5
- Accept: text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8
- Accept-Language: en-us
- Accept-Encoding: gzip,deflate
- Accept-Charset: ISO-8859-1,utf-8;q=0.7,*;q=0.7
- Keep-Alive: 300
- Connection: keep-alive
- Referer: http://www.example.com/PollingStock/
- Cookie: showInheritedConstant=false;
showInheritedProtectedConstant=false;
showInheritedProperty=false;
showInheritedProtectedProperty=false;
showInheritedMethod=false;
showInheritedProtectedMethod=false;
showInheritedEvent=false;
showInheritedStyle=false;
showInheritedEffect=false
例3:HTTP響應(yīng)頭
- HTTP/1.x 200 OK
- X-Powered-By: Servlet/2.5
- Server: Sun Java System Application Server 9.1_02
- Content-Type: text/html;charset=UTF-8
- Content-Length: 21
- Date: Sat, 07 Nov 2009 00:32:46 GMT
HTTP請(qǐng)求和響應(yīng)頭信息開銷總共包括871字節(jié),而且還不包括任何數(shù)據(jù),當(dāng)然,這只是一個(gè)例子,你的消息頭數(shù)據(jù)完全可能低于871字節(jié),但我也看到過消息頭數(shù)據(jù)超過2000字節(jié)的情況。在這個(gè)例子中,股票主題消息數(shù)據(jù)大約只有20個(gè)字符。
當(dāng)你把這樣的程序大規(guī)模部署給用戶時(shí)會(huì)怎么樣?我們使用三個(gè)不同的用例觀察一下該輪詢應(yīng)用程序關(guān)聯(lián)的HTTP請(qǐng)求和響應(yīng)頭數(shù)據(jù)需要的網(wǎng)絡(luò)吞吐量。
用例A:1000客戶端,每秒輪詢一次
網(wǎng)絡(luò)吞吐量(871x1000)=871000字節(jié)=6968000比特/秒(6.6Mbps)
用例B:10000客戶端,每秒輪詢一次
網(wǎng)絡(luò)吞吐量(871x10000)=8710000字節(jié)=69680000比特/秒(66Mbps)
用例C:100000客戶端,每秒輪詢一次
網(wǎng)絡(luò)吞吐量(871x100000)=87100000字節(jié)=696800000比特/秒(665Mbps)
這是一個(gè)不必要的巨大的網(wǎng)絡(luò)吞吐量,這時(shí)我們可以使用HTML 5 Web Socket,我使用HTML 5 Web Socket重構(gòu)了應(yīng)用程序,給網(wǎng)頁添加了一個(gè)事件處理程序,同步監(jiān)聽來自消息代理的股票更新消息。每個(gè)消息都是一個(gè)Web Socket幀,開銷只有2個(gè)字節(jié)(而不是871字節(jié)),再來看看對(duì)網(wǎng)絡(luò)吞吐量的影響。
用例A:1000客戶端,每秒輪詢一次
網(wǎng)絡(luò)吞吐量(2x1000)=2000字節(jié)=16000比特/秒(0.015Mbps)
用例B:10000客戶端,每秒輪詢一次
網(wǎng)絡(luò)吞吐量(2x10000)=20000字節(jié)=160000比特/秒(0.153Mbps)
用例C:100000客戶端,每秒輪詢一次
網(wǎng)絡(luò)吞吐量(2x100000)=200000字節(jié)=1600000比特/秒(1.526Mbps)
正如你在圖3中可以看到的,與輪詢解決方案相比,HTML 5 Web Socket減少了不必要的網(wǎng)絡(luò)流量。
圖 3:比較輪詢和WebSocket應(yīng)用程序之間的網(wǎng)絡(luò)吞吐量
延遲減少怎么樣呢?看看圖4便知,圖中上半部分顯示了半雙工輪詢方案的延遲,這里我們假設(shè)消息從服務(wù)器傳輸?shù)綖g覽器需要50毫秒,輪詢方式引入許多額外的延遲,因?yàn)楫?dāng)響應(yīng)完成時(shí),一個(gè)新的請(qǐng)求已經(jīng)發(fā)送到服務(wù)器了,這個(gè)新請(qǐng)求又需要50毫秒,在此期間服務(wù)器不能發(fā)送任何消息給瀏覽器,導(dǎo)致額外的服務(wù)器內(nèi)存消耗。
圖4下半部分顯示了Web Socket方式產(chǎn)生的延遲,一旦連接升級(jí)到Web Socket,消息的傳輸會(huì)更及時(shí),從服務(wù)器傳輸?shù)綖g覽器仍然需要50毫秒,但Web Socket連接保持打開,之后就再也不用向服務(wù)器發(fā)送請(qǐng)求了。
圖 4:輪詢和Web Socket應(yīng)用程序之間的延遲對(duì)比
HTML5 Web Socket和Kaazing WebSocket網(wǎng)關(guān)
目前,只有Google的Chrome瀏覽器原生支持HTML 5 Web Socket,但其它瀏覽器也將提供支持,若要解決這個(gè)限制,Kaazing Web Socket網(wǎng)關(guān)為所有舊瀏覽器(IE 5.5+,F(xiàn)irefox 1.5+,Safari 3.0+和Opera 9.5+)提供了一個(gè)完整的Web Socket仿真,因此你現(xiàn)在就可以使用HTML 5 Web Socket API。
Web Socket很了不起,但在你的瀏覽器中有一個(gè)全雙工套接字連接后可以做什么呢?為了充分利用HTML 5 Web Socket的全部功能,Kaazing為二進(jìn)制通信提供了一個(gè)ByteSocket庫,為諸如Stomp、AMQP、XMPP、IRC等協(xié)議提供了更高級(jí)的庫,它們都是建立在Web Socket之上的。
例如,如果你為Stomp或AMQP協(xié)議使用了一個(gè)更高級(jí)的庫,這時(shí)你可以直接與后端消息代理如RabbitMQ進(jìn)行通信,通過直接連接服務(wù),不再需要額外的應(yīng)用程序服務(wù)邏輯將這些雙向,全雙工TCP后端協(xié)議轉(zhuǎn)換成非雙向,半雙工HTTP連接,因?yàn)闉g覽器本身就可以理解這些協(xié)議。
圖5 :Kaazing Web Socket網(wǎng)關(guān)擴(kuò)展基于TCP的消息,并具有更好的性能
總結(jié)
HTML 5 Web Socket在實(shí)時(shí)Web應(yīng)用擴(kuò)展性方面朝前邁出了一大步,正如你在本文中所看到的,HTML 5 Web Socket可以提供5000:1或 – 根據(jù)HTTP消息頭大小 – 1000:1的比例減少不必要的HTTP頭流量和3:1的比例減少通信延遲,這不是一個(gè)漸進(jìn)式的改進(jìn),而是一次革命性的飛躍。
Kaazing Web Socket網(wǎng)關(guān)讓HTML 5 Web Socket代碼能夠在所有瀏覽器中運(yùn)行,同時(shí)提供額外的協(xié)議庫允許你充分利用HTML 5 Web Socket提供的全雙工套接字連接功能,直接與后端服務(wù)進(jìn)行通信。