輕松易懂,一文帶你HTTP協(xié)議入門?
一、什么是http?
Http協(xié)議即超文本傳送協(xié)議 (HTTP-Hypertext transfer protocol) 。
它定義了瀏覽器(即萬維網(wǎng)客戶進(jìn)程)怎樣向萬維網(wǎng)服務(wù)器請求萬維網(wǎng)文檔,以及服務(wù)器怎樣把文檔傳送給瀏覽器。從層次的角度看,HTTP是面向(transaction-oriented)應(yīng)用層協(xié)議,它是萬維網(wǎng)上能夠可靠地交換文件(包括文本、聲音、圖像等各種多媒體文件)的重要基礎(chǔ)。并且詳細(xì)的規(guī)定了客戶端瀏覽器與服務(wù)器之間互相通信的規(guī)則。
二、抓包
下面是一口君抓取的訪問自己搭建的web服務(wù)器交互的所有數(shù)據(jù)包。以下是瀏覽器顯示信息:
以下是實(shí)際 index.html內(nèi)容:
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" >
<html xmlns="http://www.w3.org/1999/xhtml">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
<title>一口Linux</title>
</head>
<body >
<div align="center">
<table width="900" border="0">
<tr><td>
<form onsubmit="return isValidate(myform)" action="cgi-bin/login.cgi" method="post">
用戶名: <input type="text" name="username" id="username" >
<td> </td>
<tr><td>
密 碼: <input type="password" name="userpass" id="userpass">
<td> </td>
<tr><td>
<input type="submit" value="登錄" id="button" >
</form>
</td></tr>
</table>
</div>
<div align="center">
<table width="900" height="467" border="0" background="./image/yikou.png">
<tr>
<td width="126" height="948"> </td>
<td width="351"></td>
<td width="101"> </td>
</tr>
</div>
</body>
</html>
下面是用抓包工具抓取的所有HTTP數(shù)據(jù)包:
瀏覽器發(fā)送的GET請求數(shù)據(jù)包:
服務(wù)器回復(fù)的頁面對應(yīng)的數(shù)據(jù)包:
完整的瀏覽訪問服務(wù)器數(shù)據(jù)包交互流程如下:
數(shù)據(jù)包交互流程,簡單總?cè)缦拢?
- 瀏覽器會(huì)向web服務(wù)器發(fā)起tcp 3次握手,(http是基于tcp,上圖數(shù)據(jù)包1-3。
- 瀏覽器會(huì)根據(jù)網(wǎng)址欄輸入的url,通過DNS協(xié)議查找該domain對應(yīng)的IP地址(如果url中直接給出IP地址,則省略該步驟)。
- 瀏覽器發(fā)送HTTP協(xié)議的GET請求,web服務(wù)器會(huì)回復(fù)對應(yīng)的頁面(沒有指定的話,一般由配置文件指定默認(rèn)文件比如index.html,見數(shù)據(jù)包4-6)。
- 因?yàn)轫撁嬗袌D片信息,瀏覽器再請求獲取對應(yīng)的圖片文件(見數(shù)據(jù)包7-24)。
- 最后會(huì)關(guān)閉tcp連接,執(zhí)行4握手(見數(shù)據(jù)包25-28)。
三、頁面交互流程
下面我們來看一下,從網(wǎng)頁輸入U(xiǎn)RL到加載,http究竟做了哪些工作?
瀏覽器負(fù)責(zé)發(fā)起請求和最后的響應(yīng)請求,服務(wù)器接收請求后,處理請求。
1、輸入U(xiǎn)RL。
不管是鏈接還是地址欄的輸入,情況都是一樣的。http協(xié)議已經(jīng)規(guī)定了URL的格式,通過http協(xié)議中的域名或IP找到服務(wù)器。
2、找到服務(wù)器的同時(shí),會(huì)有http的請求發(fā)送過來,告訴服務(wù)器我求你做什么?http協(xié)議規(guī)定了發(fā)送請求的格式,這個(gè)格式有三部分組成請求行、請求頭、請求體。
請求行包括請求的方式(get、post或其他)、要求響應(yīng)的文件、http版本。請求頭包括本機(jī)信息、瀏覽器信息等等,當(dāng)然,也包括URL中?后面的參數(shù)。
請求體包括POST傳遞數(shù)據(jù)的相關(guān)信息,Get方式傳值時(shí),請求體為空。
3、請求信息發(fā)送至服務(wù)器以后,服務(wù)器會(huì)獲取傳遞過來的相關(guān)信息進(jìn)行后端程序的處理。服務(wù)器可以通過數(shù)據(jù)包中信息獲取URL傳遞過來的值,通過form(表單)獲取POST傳遞過來的值,當(dāng)然,也是可以獲取到所有的其他請求過來的信息,如瀏覽器信息、cookie信息、操作系統(tǒng)信息等。獲取相關(guān)的數(shù)據(jù)以后,服務(wù)器就會(huì)根據(jù)程序進(jìn)行處理。
4、處理完成以后,服務(wù)器會(huì)做出響應(yīng),向?yàn)g覽器輸出相關(guān)信息。http對響應(yīng)的格式也做出了規(guī)定,響應(yīng)的信息主要包括,響應(yīng)碼、響應(yīng)頭、響應(yīng)體。
響應(yīng)碼用來標(biāo)識服務(wù)器響應(yīng)的結(jié)果,如我們??吹降?00、404等。大致的分類如下:
1開頭的表示消息。
2開頭表示成功。
3開頭表示重定向,
4開頭表示失敗。
5開頭表示服務(wù)器異常。
響應(yīng)頭記錄服務(wù)器相關(guān)信息如服務(wù)器是否啟用壓縮、服務(wù)器為IIS或Ngnix、程序所用服務(wù)端語言等等。當(dāng)然,緩存也是在這里設(shè)置的,通過修改響應(yīng)頭可以修改html在本地緩存的情況,如設(shè)置瀏覽器緩存過期的時(shí)間。
響應(yīng)體主要是我看到的html的相關(guān)內(nèi)容了。
完成以上4步操作以后,瀏覽器就斷開了與服務(wù)器的數(shù)據(jù)連接,不能在進(jìn)行數(shù)據(jù)傳輸,如果需要再次進(jìn)行數(shù)據(jù)傳輸,那么一切就要從輸入U(xiǎn)RL開始。
如此,便是一個(gè)完整的網(wǎng)頁流程,http從中的作用就是對整個(gè)流程進(jìn)行規(guī)定,包括執(zhí)行步驟,每一步的數(shù)據(jù)格式。只有了解http協(xié)議以及網(wǎng)頁是如何產(chǎn)生的以后,才能對網(wǎng)頁進(jìn)行更好的控制,例如控制瀏覽器緩存、通過非瀏覽器發(fā)送http請求、get和post傳值的選擇,甚至是建立長連接,這些都是以http協(xié)議為基礎(chǔ)。
四、補(bǔ)充
1、 http主要方法
1.0 版本和 1.1 版本的描述分別基于 RFC1945 和 RFC2616 除了上圖中的內(nèi)容之外, HTTP 消息中還有一些用來表示附加信息的 頭字段。客戶端向 Web 服務(wù)器發(fā)送數(shù)據(jù)時(shí), 會(huì)先發(fā)送頭字段, 然后再發(fā)送 數(shù)據(jù)。
2、 狀態(tài)碼
收到請求消息之后, Web 服務(wù)器會(huì)對其中的內(nèi)容進(jìn)行解析, 通過 URI和方法來判斷“對什么”“進(jìn)行怎樣的操作”, 并根據(jù)這些要求來完成自己的工作, 然后將結(jié)果存放在響應(yīng)消息中。在響應(yīng)消息的開頭有一個(gè)狀態(tài)碼,它用來表示操作的執(zhí)行結(jié)果是成功還是發(fā)生了錯(cuò)誤。
當(dāng)我們訪問 Web 服務(wù)器時(shí), 遇到找不到的文件就會(huì)顯示出 404 Not Found 的錯(cuò)誤信息, 其實(shí)這就是狀態(tài)碼。狀態(tài)碼后面就是頭字段和網(wǎng)頁數(shù)據(jù)。響應(yīng)消息會(huì)被發(fā)送回客戶端, 客戶端收到之后, 瀏覽器會(huì)從消息中讀出所需的數(shù)據(jù)并顯示在屏幕上。到這里, HTTP 的整個(gè)工作就完成了。
HTTP 狀態(tài)碼由三個(gè)十進(jìn)制數(shù)字組成,第一個(gè)十進(jìn)制數(shù)字定義了狀態(tài)碼的類型。
響應(yīng)分為五類:信息響應(yīng)(100–199),成功響應(yīng)(200–299),重定向(300–399),客戶端錯(cuò)誤(400–499)和服務(wù)器錯(cuò)誤 (500–599):
HTTP狀態(tài)碼列表:
本文轉(zhuǎn)載自微信公眾號「一口Linux」,可以通過以下二維碼關(guān)注。轉(zhuǎn)載本文請聯(lián)系一口Linux公眾號。