你清楚HTTP緩存機制和原理嗎?
前言
Http 緩存機制作為 web 性能優(yōu)化的重要手段,對于從事 Web 開發(fā)的同學們來說,應(yīng)該是知識體系庫中的一個基礎(chǔ)環(huán)節(jié),同時對于有志成為前端架構(gòu)師的同學來說是必備的知識技能。
但是對于很多前端同學來說,僅僅只是知道瀏覽器會對請求的靜態(tài)文件進行緩存,但是為什么被緩存,緩存是怎樣生效的,卻并不是很清楚。
在此,我會嘗試用簡單明了的文字,像大家系統(tǒng)的介紹HTTP緩存機制,期望對各位正確的理解前端緩存有所幫助。
在介紹HTTP緩存之前,作為知識鋪墊,先簡單介紹一下HTTP報文
HTTP報文就是瀏覽器和服務(wù)器間通信時發(fā)送及響應(yīng)的數(shù)據(jù)塊。
瀏覽器向服務(wù)器請求數(shù)據(jù),發(fā)送請求(request)報文;服務(wù)器向瀏覽器返回數(shù)據(jù),返回響應(yīng)(response)報文。
報文信息主要分為兩部分
- 包含屬性的首部(header):附加信息(cookie,緩存信息等)與緩存相關(guān)的規(guī)則信息,均包含在header中。
- 包含數(shù)據(jù)的主體部分(body):HTTP請求真正想要傳輸?shù)牟糠帧?/li>
緩存規(guī)則解析
為方便大家理解,我們認為瀏覽器存在一個緩存數(shù)據(jù)庫,用于存儲緩存信息。
在客戶端***次請求數(shù)據(jù)時,此時緩存數(shù)據(jù)庫中沒有對應(yīng)的緩存數(shù)據(jù),需要請求服務(wù)器,服務(wù)器返回后,將數(shù)據(jù)存儲至緩存數(shù)據(jù)庫中。
HTTP緩存有多種規(guī)則,根據(jù)是否需要重新向服務(wù)器發(fā)起請求來分類,我將其分為兩大類(強制緩存,對比緩存),在詳細介紹這兩種規(guī)則之前,先通過時序圖的方式,讓大家對這兩種規(guī)則有個簡單了解。
已存在緩存數(shù)據(jù)時,僅基于強制緩存,請求數(shù)據(jù)的流程如下:
已存在緩存數(shù)據(jù)時,僅基于對比緩存,請求數(shù)據(jù)的流程如下:
對緩存機制不太了解的同學可能會問,基于對比緩存的流程下,不管是否使用緩存,都需要向服務(wù)器發(fā)送請求,那么還用緩存干什么?
這個問題,我們暫且放下,后文在詳細介紹每種緩存規(guī)則的時候,會帶給大家答案。
我們可以看到兩類緩存規(guī)則的不同,強制緩存如果生效,不需要再和服務(wù)器發(fā)生交互,而對比緩存不管是否生效,都需要與服務(wù)端發(fā)生交互。
兩類緩存規(guī)則可以同時存在,強制緩存優(yōu)先級高于對比緩存,也就是說,當執(zhí)行強制緩存的規(guī)則時,如果緩存生效,直接使用緩存,不再執(zhí)行對比緩存規(guī)則。
強制緩存
從上文我們得知,強制緩存,在緩存數(shù)據(jù)未失效的情況下,可以直接使用緩存數(shù)據(jù),那么瀏覽器是如何判斷緩存數(shù)據(jù)是否失效呢?
我們知道,在沒有緩存數(shù)據(jù)的時候,瀏覽器向服務(wù)器請求數(shù)據(jù)時,服務(wù)器會將數(shù)據(jù)和緩存規(guī)則一并返回,緩存規(guī)則信息包含在響應(yīng)header中。
對于強制緩存來說,響應(yīng)header中會有兩個字段來標明失效規(guī)則(Expires/Cache-Control)
使用chrome的開發(fā)者工具,可以很明顯的看到對于強制緩存生效時,網(wǎng)絡(luò)請求的情況:
Expires
Expires的值為服務(wù)端返回的到期時間,即下一次請求時,請求時間小于服務(wù)端返回的到期時間,直接使用緩存數(shù)據(jù)。
不過Expires 是HTTP 1.0的東西,現(xiàn)在默認瀏覽器均默認使用HTTP 1.1,所以它的作用基本忽略。
另一個問題是,到期時間是由服務(wù)端生成的,但是客戶端時間可能跟服務(wù)端時間有誤差,這就會導致緩存***的誤差。
所以HTTP 1.1 的版本,使用Cache-Control替代。
Cache-Control
Cache-Control 是最重要的規(guī)則。常見的取值有private、public、no-cache、max-age,no-store,默認為private。
- private: 客戶端可以緩存
- public: 客戶端和代理服務(wù)器都可緩存(前端的同學,可以認為public和private是一樣的)
- max-age=xxx: 緩存的內(nèi)容將在 xxx 秒后失效
- no-cache: 需要使用對比緩存來驗證緩存數(shù)據(jù)(后面介紹)
- no-store: 所有內(nèi)容都不會緩存,強制緩存,對比緩存都不會觸發(fā)(對于前端開發(fā)來說,緩存越多越好,so…基本上和它說886)
舉個板栗
圖中Cache-Control僅指定了max-age,所以默認為private,緩存時間為31536000秒(365天),也就是說,在365天內(nèi)再次請求這條數(shù)據(jù),都會直接獲取緩存數(shù)據(jù)庫中的數(shù)據(jù),直接使用。
對比緩存
對比緩存,顧名思義,需要進行比較判斷是否可以使用緩存。
瀏覽器***次請求數(shù)據(jù)時,服務(wù)器會將緩存標識與數(shù)據(jù)一起返回給客戶端,客戶端將二者備份至緩存數(shù)據(jù)庫中。
再次請求數(shù)據(jù)時,客戶端將備份的緩存標識發(fā)送給服務(wù)器,服務(wù)器根據(jù)緩存標識進行判斷,判斷成功后,返回304狀態(tài)碼,通知客戶端比較成功,可以使用緩存數(shù)據(jù)。
***次訪問:
再次訪問:
通過兩圖的對比,我們可以很清楚的發(fā)現(xiàn),在對比緩存生效時,狀態(tài)碼為304,并且報文大小和請求時間大大減少。
原因是,服務(wù)端在進行標識比較后,只返回header部分,通過狀態(tài)碼通知客戶端使用緩存,不再需要將報文主體部分返回給客戶端。
對于對比緩存來說,緩存標識的傳遞是我們著重需要理解的,它在請求header和響應(yīng)header間進行傳遞,一共分為兩種標識傳遞,接下來,我們分開介紹。
Last-Modified / If-Modified-Since
Last-Modified:
服務(wù)器在響應(yīng)請求時,告訴瀏覽器資源的***修改時間。
If-Modified-Since:
再次請求服務(wù)器時,通過此字段通知服務(wù)器上次請求時,服務(wù)器返回的資源***修改時間。
服務(wù)器收到請求后發(fā)現(xiàn)有頭If-Modified-Since 則與被請求資源的***修改時間進行比對。
若資源的***修改時間大于If-Modified-Since,說明資源又被改動過,則響應(yīng)整片資源內(nèi)容,返回狀態(tài)碼200;
若資源的***修改時間小于或等于If-Modified-Since,說明資源無新修改,則響應(yīng)HTTP 304,告知瀏覽器繼續(xù)使用所保存的cache。
Etag / If-None-Match
優(yōu)先級高于Last-Modified / If-Modified-Since
Etag:
服務(wù)器響應(yīng)請求時,告訴瀏覽器當前資源在服務(wù)器的唯一標識(生成規(guī)則由服務(wù)器決定)。
If-None-Match:
再次請求服務(wù)器時,通過此字段通知服務(wù)器客戶段緩存數(shù)據(jù)的唯一標識。
服務(wù)器收到請求后發(fā)現(xiàn)有頭If-None-Match 則與被請求資源的唯一標識進行比對:
不同,說明資源又被改動過,則響應(yīng)整片資源內(nèi)容,返回狀態(tài)碼200;
相同,說明資源無新修改,則響應(yīng)HTTP 304,告知瀏覽器繼續(xù)使用所保存的cache。
總結(jié)
對于強制緩存,服務(wù)器通知瀏覽器一個緩存時間,在緩存時間內(nèi),下次請求,直接用緩存,不在時間內(nèi),執(zhí)行比較緩存策略。
對于比較緩存,將緩存信息中的Etag和Last-Modified通過請求發(fā)送給服務(wù)器,由服務(wù)器校驗,返回304狀態(tài)碼時,瀏覽器直接使用緩存。
瀏覽器***次請求:
瀏覽器再次請求時: