Http報(bào)文工作原理大解剖
HTTP請(qǐng)求報(bào)文解剖
HTTP請(qǐng)求報(bào)文由3部分組成(請(qǐng)求行+請(qǐng)求頭+請(qǐng)求體):
下面是一個(gè)實(shí)際的請(qǐng)求報(bào)文:
①是請(qǐng)求方法,GET和POST是最常見的HTTP方法,除此以外還包括DELETE、HEAD、OPTIONS、PUT、TRACE。不過(guò),當(dāng)前的大多數(shù)瀏覽器只支持GET和POST,Spring 3.0提供了一個(gè)HiddenHttpMethodFilter,允許你通過(guò)“_method”的表單參數(shù)指定這些特殊的HTTP方法(實(shí)際上還是通過(guò)POST提交表單)。服務(wù)端配置了HiddenHttpMethodFilter后,Spring會(huì)根據(jù)_method參數(shù)指定的值模擬出相應(yīng)的HTTP方法,這樣,就可以使用這些HTTP方法對(duì)處理方法進(jìn)行映射了。
②為請(qǐng)求對(duì)應(yīng)的URL地址,它和報(bào)文頭的Host屬性組成完整的請(qǐng)求URL,③是協(xié)議名稱及版本號(hào)。
④是HTTP的報(bào)文頭,報(bào)文頭包含若干個(gè)屬性,格式為“屬性名:屬性值”,服務(wù)端據(jù)此獲取客戶端的信息。
⑤是報(bào)文體,它將一個(gè)頁(yè)面表單中的組件值通過(guò)param1=value1¶m2=value2的鍵值對(duì)形式編碼成一個(gè)格式化串,它承載多個(gè)請(qǐng)求參數(shù)的數(shù)據(jù)。不但報(bào)文體可以傳遞請(qǐng)求參數(shù),請(qǐng)求URL也可以通過(guò)類似于“/chapter15/user.html? param1=value1¶m2=value2”的方式傳遞請(qǐng)求參數(shù)。
對(duì)照上面的請(qǐng)求報(bào)文,我們把它進(jìn)一步分解,你可以看到一幅更詳細(xì)的結(jié)構(gòu)圖:
引用
HttpWatch是強(qiáng)大的網(wǎng)頁(yè)數(shù)據(jù)分析工具,安裝后將集成到Internet Explorer工具欄中。它不用代理服務(wù)器或一些復(fù)雜的網(wǎng)絡(luò)監(jiān)控工具,就能抓取請(qǐng)求及響應(yīng)的完整信息,包括Cookies、消息頭、查詢參數(shù)、響應(yīng)報(bào)文等,是Web應(yīng)用開發(fā)人員的必備工具。
HTTP請(qǐng)求報(bào)文頭屬性
報(bào)文頭屬性是什么東西呢?我們不妨以一個(gè)小故事來(lái)說(shuō)明吧。
引用
快到中午了,張三豐不想去食堂吃飯,于是打電話叫外賣:老板,我要一份[魚香肉絲],要12:30之前給我送過(guò)來(lái)哦,我在江湖湖公司研發(fā)部,叫張三豐。
這里,你要[魚香肉絲]相當(dāng)于HTTP報(bào)文體,而“12:30之前送過(guò)來(lái)”,你叫“張三豐”等信息就相當(dāng)于HTTP的報(bào)文頭。它們是一些附屬信息,幫忙你和飯店老板順利完成這次交易。
請(qǐng)求HTTP報(bào)文和響應(yīng)HTTP報(bào)文都擁有若干個(gè)報(bào)文關(guān)屬性,它們是為協(xié)助客戶端及服務(wù)端交易的一些附屬信息。
常見的HTTP請(qǐng)求報(bào)文頭屬性
Accept
請(qǐng)求報(bào)文可通過(guò)一個(gè)“Accept”報(bào)文頭屬性告訴服務(wù)端 客戶端接受什么類型的響應(yīng)。
如下報(bào)文頭相當(dāng)于告訴服務(wù)端,俺客戶端能夠接受的響應(yīng)類型僅為純文本數(shù)據(jù)啊,你丫別發(fā)其它什么圖片啊,視頻啊過(guò)來(lái),那樣我會(huì)歇菜的~~~:
Accept:text/plain
Accept屬性的值可以為一個(gè)或多個(gè)MIME類型的值,關(guān)于MIME類型。
Cookie
客戶端的Cookie就是通過(guò)這個(gè)報(bào)文頭屬性傳給服務(wù)端的哦!如下所示:
Cookie: $Version=1; Skin=new;jsessionid=5F4771183629C9834F8382E23BE13C4C
服務(wù)端是怎么知道客戶端的多個(gè)請(qǐng)求是隸屬于一個(gè)Session呢?注意到后臺(tái)的那個(gè)jsessionid=5F4771183629C9834F8382E23BE13C4C木有?原來(lái)就是通過(guò)HTTP請(qǐng)求報(bào)文頭的Cookie屬性的jsessionid的值關(guān)聯(lián)起來(lái)的!(當(dāng)然也可以通過(guò)重寫URL的方式將會(huì)話ID附帶在每個(gè)URL的后面哦)。
Referer
表示這個(gè)請(qǐng)求是從哪個(gè)URL過(guò)來(lái)的,假如你通過(guò)google搜索出一個(gè)商家的廣告頁(yè)面,你對(duì)這個(gè)廣告頁(yè)面感興趣,鼠標(biāo)一點(diǎn)發(fā)送一個(gè)請(qǐng)求報(bào)文到商家的網(wǎng)站,這個(gè)請(qǐng)求報(bào)文的Referer報(bào)文頭屬性值就是http://www.google.com。
#p#
引用
唐僧到了西天.
如來(lái)問:儂是不是從東土大唐來(lái)啊?
唐僧:厲害!你咋知道的!
如來(lái):呵呵,我偷看了你的Referer...
很多貌似神奇的網(wǎng)頁(yè)監(jiān)控軟件(如著名的 我要啦),只要在你的網(wǎng)頁(yè)上放上一段JavaScript,就可以幫你監(jiān)控流量,全國(guó)訪問客戶的分布情況等報(bào)表和圖表,其原理就是通過(guò)這個(gè)Referer及其它一些HTTP報(bào)文頭工作的。
Cache-Control
對(duì)緩存進(jìn)行控制,如一個(gè)請(qǐng)求希望響應(yīng)返回的內(nèi)容在客戶端要被緩存一年,或不希望被緩存就可以通過(guò)這個(gè)報(bào)文頭達(dá)到目的。
如以下設(shè)置,相當(dāng)于讓服務(wù)端將對(duì)應(yīng)請(qǐng)求返回的響應(yīng)內(nèi)容不要在客戶端緩存:
Cache-Control: no-cache
如何訪問請(qǐng)求報(bào)文頭
由于請(qǐng)求報(bào)文頭是客戶端發(fā)過(guò)來(lái)的,服務(wù)端當(dāng)然只能讀取了,以下是HttpServletRequest一些用于讀取請(qǐng)求報(bào)文頭的API:
//獲取請(qǐng)求報(bào)文中的屬性名稱 java.util.EnumerationgetHeaderNames(); //獲取指定名稱的報(bào)文頭屬性的值 java.lang.String getHeader(java.lang.String name)
由于一些請(qǐng)求報(bào)文頭屬性“太著名”了,因此HttpServletRequest為它們提供了VIP的API:
//獲取報(bào)文頭中的Cookie(讀取Cookie的報(bào)文頭屬性) Cookie[] getCookies() ; //獲取客戶端本地化信息(讀取 Accept-Language 的報(bào)文頭屬性) java.util.Locale getLocale() //獲取請(qǐng)求報(bào)文體的長(zhǎng)度(讀取Content-Length的報(bào)文頭屬性) int getContentLength();
HttpServletRequest可以通過(guò)
HttpSession getSession()
獲取請(qǐng)求所關(guān)聯(lián)的HttpSession,其內(nèi)部的機(jī)理是通過(guò)讀取請(qǐng)求報(bào)文頭中Cookie屬性的JSESSIONID的值,在服務(wù)端的一個(gè)會(huì)話Map中,根據(jù)這個(gè)JSESSIONID獲取對(duì)應(yīng)的HttpSession的對(duì)象。(這樣,你就不會(huì)覺得HttpSession很神秘了吧,你自己也可以做一個(gè)類似的會(huì)話管理)
HTTP響應(yīng)報(bào)文解剖
響應(yīng)報(bào)文結(jié)構(gòu)
HTTP的響應(yīng)報(bào)文也由三部分組成(響應(yīng)行+響應(yīng)頭+響應(yīng)體):
以下是一個(gè)實(shí)際的HTTP響應(yīng)報(bào)文:
①報(bào)文協(xié)議及版本;
②狀態(tài)碼及狀態(tài)描述;
③響應(yīng)報(bào)文頭,也是由多個(gè)屬性組成;
④響應(yīng)報(bào)文體,即我們真正要的“干貨”。
響應(yīng)狀態(tài)碼
和請(qǐng)求報(bào)文相比,響應(yīng)報(bào)文多了一個(gè)“響應(yīng)狀態(tài)碼”,它以“清晰明確”的語(yǔ)言告訴客戶端本次請(qǐng)求的處理結(jié)果。
HTTP的響應(yīng)狀態(tài)碼由5段組成:
1xx 消息,一般是告訴客戶端,請(qǐng)求已經(jīng)收到了,正在處理,別急...
2xx 處理成功,一般表示:請(qǐng)求收悉、我明白你要的、請(qǐng)求已受理、已經(jīng)處理完成等信息.
3xx 重定向到其它地方。它讓客戶端再發(fā)起一個(gè)請(qǐng)求以完成整個(gè)處理。
4xx 處理發(fā)生錯(cuò)誤,責(zé)任在客戶端,如客戶端的請(qǐng)求一個(gè)不存在的資源,客戶端未被授權(quán),禁止訪問等。
5xx 處理發(fā)生錯(cuò)誤,責(zé)任在服務(wù)端,如服務(wù)端拋出異常,路由出錯(cuò),HTTP版本不支持等。
#p#
以下是幾個(gè)常見的狀態(tài)碼:
200 OK
你最希望看到的,即處理成功!
303 See Other
我把你redirect到其它的頁(yè)面,目標(biāo)的URL通過(guò)響應(yīng)報(bào)文頭的Location告訴你。
引用
悟空:師傅給個(gè)桃吧,走了一天了
唐僧:我哪有桃啊!去王母娘娘那找吧
304 Not Modified
告訴客戶端,你請(qǐng)求的這個(gè)資源至你上次取得后,并沒有更改,你直接用你本地的緩存吧,我很忙哦,你能不能少來(lái)煩我啊!
404 Not Found
你最不希望看到的,即找不到頁(yè)面。如你在google上找到一個(gè)頁(yè)面,點(diǎn)擊這個(gè)鏈接返回404,表示這個(gè)頁(yè)面已經(jīng)被網(wǎng)站刪除了,google那邊的記錄只是美好的回憶。
500 Internal Server Error
看到這個(gè)錯(cuò)誤,你就應(yīng)該查查服務(wù)端的日志了,肯定拋出了一堆異常,別睡了,起來(lái)改BUG去吧!
其它的狀態(tài)碼參見:http://en.wikipedia.org/wiki/List_of_HTTP_status_codes
有些響應(yīng)碼,Web應(yīng)用服務(wù)器會(huì)自動(dòng)給生成。你可以通過(guò)HttpServletResponse的API設(shè)置狀態(tài)碼:
//設(shè)置狀態(tài)碼,狀態(tài)碼在HttpServletResponse中通過(guò)一系列的常量預(yù)定義了,如SC_ACCEPTED,SC_OK void setStatus(int sc)
常見的HTTP響應(yīng)報(bào)文頭屬性
Cache-Control
響應(yīng)輸出到客戶端后,服務(wù)端通過(guò)該報(bào)文頭屬告訴客戶端如何控制響應(yīng)內(nèi)容的緩存。
下面,的設(shè)置讓客戶端對(duì)響應(yīng)內(nèi)容緩存3600秒,也即在3600秒內(nèi),如果客戶再次訪問該資源,直接從客戶端的緩存中返回內(nèi)容給客戶,不要再?gòu)姆?wù)端獲取(當(dāng)然,這個(gè)功能是靠客戶端實(shí)現(xiàn)的,服務(wù)端只是通過(guò)這個(gè)屬性提示客戶端“應(yīng)該這么做”,做不做,還是決定于客戶端,如果是自己宣稱支持HTTP的客戶端,則就應(yīng)該這樣實(shí)現(xiàn))。
Cache-Control: max-age=3600
ETag
一個(gè)代表響應(yīng)服務(wù)端資源(如頁(yè)面)版本的報(bào)文頭屬性,如果某個(gè)服務(wù)端資源發(fā)生變化了,這個(gè)ETag就會(huì)相應(yīng)發(fā)生變化。它是Cache-Control的有益補(bǔ)充,可以讓客戶端“更智能”地處理什么時(shí)候要從服務(wù)端取資源,什么時(shí)候可以直接從緩存中返回響應(yīng)。
Spring 3.0還專門為此提供了一個(gè)org.springframework.web.filter.ShallowEtagHeaderFilter(實(shí)現(xiàn)原理很簡(jiǎn)單,對(duì)JSP輸出的內(nèi)容MD5,這樣內(nèi)容有變化ETag就相應(yīng)變化了),用于生成響應(yīng)的ETag,因?yàn)檫@東東確實(shí)可以幫助減少請(qǐng)求和響應(yīng)的交互。
下面是一個(gè)ETag:
ETag: "737060cd8c284d8af7ad3082f209582d"
Location
我們?cè)贘SP中讓頁(yè)面Redirect到一個(gè)某個(gè)A頁(yè)面中,其實(shí)是讓客戶端再發(fā)一個(gè)請(qǐng)求到A頁(yè)面,這個(gè)需要Redirect到的A頁(yè)面的URL,其實(shí)就是通過(guò)響應(yīng)報(bào)文頭的Location屬性告知客戶端的,如下的報(bào)文頭屬性,將使客戶端redirect到iteye的首頁(yè)中:
Location: http://www.iteye.com
Set-Cookie
服務(wù)端可以設(shè)置客戶端的Cookie,其原理就是通過(guò)這個(gè)響應(yīng)報(bào)文頭屬性實(shí)現(xiàn)的:
Set-Cookie: UserID=JohnDoe; Max-Age=3600; Version=1
其它HTTP響應(yīng)報(bào)文頭屬性
更多其它的HTTP響應(yīng)頭報(bào)文,參見:http://en.wikipedia.org/wiki/List_of_HTTP_header_fields
如何寫HTTP請(qǐng)求報(bào)文頭
在服務(wù)端可以通過(guò)HttpServletResponse的API寫響應(yīng)報(bào)文頭的屬性:
//添加一個(gè)響應(yīng)報(bào)文頭屬性 void setHeader(String name, String value)
象Cookie,Location這些響應(yīng)都是有福之人,HttpServletResponse為它們都提供了VIP版的API:
//添加Cookie報(bào)文頭屬性 void addCookie(Cookie cookie) //不但會(huì)設(shè)置Location的響應(yīng)報(bào)文頭,還會(huì)生成303的狀態(tài)碼呢,兩者天仙配呢 void sendRedirect(String location)