奪命連環(huán)問:一個(gè)TCP連接可以發(fā)多少個(gè)HTTP請求?
曾經(jīng)有這么一道面試題:從 URL 在瀏覽器被被輸入到頁面展現(xiàn)的過程中發(fā)生了什么?
相信大多數(shù)準(zhǔn)備過的同學(xué)都能回答出來,但是如果繼續(xù)問:收到的 HTML 如果包含幾十個(gè)圖片標(biāo)簽,這些圖片是以什么方式、什么順序、建立了多少連接、使用什么協(xié)議被下載下來的呢?
要搞懂這個(gè)問題,我們需要先解決下面五個(gè)問題:
- 現(xiàn)代瀏覽器在與服務(wù)器建立了一個(gè) TCP 連接后是否會在一個(gè) HTTP 請求完成后斷開?什么情況下會斷開?
- 一個(gè) TCP 連接可以對應(yīng)幾個(gè) HTTP 請求?
- 一個(gè) TCP 連接中 HTTP 請求發(fā)送可以一起發(fā)送么(比如一起發(fā)三個(gè)請求,再三個(gè)響應(yīng)一起接收)?
- 為什么有的時(shí)候刷新頁面不需要重新建立 SSL 連接?
- 瀏覽器對同一 Host 建立 TCP 連接到數(shù)量有沒有限制?
***個(gè)問題
現(xiàn)代瀏覽器在與服務(wù)器建立了一個(gè) TCP 連接后是否會在一個(gè) HTTP 請求完成后斷開?什么情況下會斷開?
在 HTTP/1.0 中,一個(gè)服務(wù)器在發(fā)送完一個(gè) HTTP 響應(yīng)后,會斷開 TCP 鏈接。但是這樣每次請求都會重新建立和斷開 TCP 連接,代價(jià)過大。所以雖然標(biāo)準(zhǔn)中沒有設(shè)定,某些服務(wù)器對 Connection: keep-alive 的 Header 進(jìn)行了支持。意思是說,完成這個(gè) HTTP 請求之后,不要斷開 HTTP 請求使用的 TCP 連接。這樣的好處是連接可以被重新使用,之后發(fā)送 HTTP 請求的時(shí)候不需要重新建立 TCP 連接,以及如果維持連接,那么 SSL 的開銷也可以避免,兩張圖片是我短時(shí)間內(nèi)兩次訪問 https://www.github.com 的時(shí)間統(tǒng)計(jì):

頭一次訪問,有初始化連接和 SSL 開銷。

初始化連接和 SSL 開銷消失了,說明使用的是同一個(gè) TCP 連接。
持久連接:既然維持 TCP 連接好處這么多,HTTP/1.1 就把 Connection 頭寫進(jìn)標(biāo)準(zhǔn),并且默認(rèn)開啟持久連接,除非請求中寫明 Connection: close,那么瀏覽器和服務(wù)器之間是會維持一段時(shí)間的 TCP 連接,不會一個(gè)請求結(jié)束就斷掉。
所以***個(gè)問題的答案是:默認(rèn)情況下建立 TCP 連接不會斷開,只有在請求報(bào)頭中聲明 Connection: close 才會在請求完成后關(guān)閉連接。
第二個(gè)問題
一個(gè) TCP 連接可以對應(yīng)幾個(gè) HTTP 請求?
了解了***個(gè)問題之后,其實(shí)這個(gè)問題已經(jīng)有了答案,如果維持連接,一個(gè) TCP 連接是可以發(fā)送多個(gè) HTTP 請求的。
第三個(gè)問題
一個(gè) TCP 連接中 HTTP 請求發(fā)送可以一起發(fā)送么(比如一起發(fā)三個(gè)請求,再三個(gè)響應(yīng)一起接收)?
HTTP/1.1 存在一個(gè)問題,單個(gè) TCP 連接在同一時(shí)刻只能處理一個(gè)請求,意思是說:兩個(gè)請求的生命周期不能重疊,任意兩個(gè) HTTP 請求從開始到結(jié)束的時(shí)間在同一個(gè) TCP 連接里不能重疊。
雖然 HTTP/1.1 規(guī)范中規(guī)定了 Pipelining 來試圖解決這個(gè)問題,但是這個(gè)功能在瀏覽器中默認(rèn)是關(guān)閉的。
先來看一下 Pipelining 是什么,RFC 2616 中規(guī)定了:
- A client that supports persistent connections MAY "pipeline" its requests (i.e., send multiple requests without waiting for each response). A server MUST send its responses to those requests in the same order that the requests were received. 一個(gè)支持持久連接的客戶端可以在一個(gè)連接中發(fā)送多個(gè)請求(不需要等待任意請求的響應(yīng))。收到請求的服務(wù)器必須按照請求收到的順序發(fā)送響應(yīng)。
至于標(biāo)準(zhǔn)為什么這么設(shè)定,我們可以大概推測一個(gè)原因:由于 HTTP/1.1 是個(gè)文本協(xié)議,同時(shí)返回的內(nèi)容也并不能區(qū)分對應(yīng)于哪個(gè)發(fā)送的請求,所以順序必須維持一致。比如你向服務(wù)器發(fā)送了兩個(gè)請求 GET/query?q=A 和 GET/query?q=B,服務(wù)器返回了兩個(gè)結(jié)果,瀏覽器是沒有辦法根據(jù)響應(yīng)結(jié)果來判斷響應(yīng)對應(yīng)于哪一個(gè)請求的。
- Pipelining 這種設(shè)想看起來比較美好,但是在實(shí)踐中會出現(xiàn)許多問題:
- 一些代理服務(wù)器不能正確的處理 HTTP Pipelining。
- 正確的流水線實(shí)現(xiàn)是復(fù)雜的。
Head-of-line Blocking 連接頭阻塞:在建立起一個(gè) TCP 連接之后,假設(shè)客戶端在這個(gè)連接連續(xù)向服務(wù)器發(fā)送了幾個(gè)請求。按照標(biāo)準(zhǔn),服務(wù)器應(yīng)該按照收到請求的順序返回結(jié)果,假設(shè)服務(wù)器在處理***請求時(shí)花費(fèi)了大量時(shí)間,那么后面所有的請求都需要等著***請求結(jié)束才能響應(yīng)。
所以現(xiàn)代瀏覽器默認(rèn)是不開啟 HTTP Pipelining 的。
但是,HTTP2 提供了 Multiplexing 多路傳輸特性,可以在一個(gè) TCP 連接中同時(shí)完成多個(gè) HTTP 請求。至于 Multiplexing 具體怎么實(shí)現(xiàn)的就是另一個(gè)問題了。我們可以看一下使用 HTTP2 的效果。

綠色是發(fā)起請求到請求返回的等待時(shí)間,藍(lán)色是響應(yīng)的下載時(shí)間,可以看到都是在同一個(gè) Connection,并行完成的。
所以這個(gè)問題也有了答案:在 HTTP/1.1 存在 Pipelining 技術(shù)可以完成這個(gè)多個(gè)請求同時(shí)發(fā)送,但是由于瀏覽器默認(rèn)關(guān)閉,所以可以認(rèn)為這是不可行的。在 HTTP2 中由于 Multiplexing 特點(diǎn)的存在,多個(gè) HTTP 請求可以在同一個(gè) TCP 連接中并行進(jìn)行。
那么在 HTTP/1.1 時(shí)代,瀏覽器是如何提高頁面加載效率的呢?主要有下面兩點(diǎn):
- 維持和服務(wù)器已經(jīng)建立的 TCP 連接,在同一連接上順序處理多個(gè)請求。
- 和服務(wù)器建立多個(gè) TCP 連接。
第四個(gè)問題
為什么有的時(shí)候刷新頁面不需要重新建立 SSL 連接?
在***個(gè)問題的討論中已經(jīng)有答案了,TCP 連接有的時(shí)候會被瀏覽器和服務(wù)端維持一段時(shí)間。TCP 不需要重新建立,SSL 自然也會用之前的。
第五個(gè)問題
瀏覽器對同一 Host 建立 TCP 連接到數(shù)量有沒有限制?
假設(shè)我們還處在 HTTP/1.1 時(shí)代,那個(gè)時(shí)候沒有多路傳輸,當(dāng)瀏覽器拿到一個(gè)有幾十張圖片的網(wǎng)頁該怎么辦呢?肯定不能只開一個(gè) TCP 連接順序下載,那樣用戶肯定等的很難受,但是如果每個(gè)圖片都開一個(gè) TCP 連接發(fā) HTTP 請求,那電腦或者服務(wù)器都可能受不了,要是有 1000 張圖片的話總不能開 1000 個(gè)TCP 連接吧,你的電腦同意 NAT 也不一定會同意。
所以答案是:有。Chrome 最多允許對同一個(gè) Host 建立六個(gè) TCP 連接。不同的瀏覽器有一些區(qū)別。
https://developers.google.com/web/tools/chrome-devtools/network/issues#queued-or-stalled-requestsdevelopers.google.com
那么回到最開始的問題,收到的 HTML 如果包含幾十個(gè)圖片標(biāo)簽,這些圖片是以什么方式、什么順序、建立了多少連接、使用什么協(xié)議被下載下來的呢?
如果圖片都是 HTTPS 連接并且在同一個(gè)域名下,那么瀏覽器在 SSL 握手之后會和服務(wù)器商量能不能用 HTTP2,如果能的話就使用 Multiplexing 功能在這個(gè)連接上進(jìn)行多路傳輸。不過也未必會所有掛在這個(gè)域名的資源都會使用一個(gè) TCP 連接去獲取,但是可以確定的是 Multiplexing 很可能會被用到。
如果發(fā)現(xiàn)用不了 HTTP2 呢?或者用不了 HTTPS(現(xiàn)實(shí)中的 HTTP2 都是在 HTTPS 上實(shí)現(xiàn)的,所以也就是只能使用 HTTP/1.1)。那瀏覽器就會在一個(gè) HOST 上建立多個(gè) TCP 連接,連接數(shù)量的***限制取決于瀏覽器設(shè)置,這些連接會在空閑的時(shí)候被瀏覽器用來發(fā)送新的請求,如果所有的連接都正在發(fā)送請求呢?那其他的請求就只能等等了。