一篇文章,只用看三遍,終生不忘網(wǎng)絡(luò)分層!
本文轉(zhuǎn)載自微信公眾號「程序新視界」,作者二師兄。轉(zhuǎn)載本文請聯(lián)系程序新視界公眾號。
前言
如果你對網(wǎng)絡(luò)分層不太了解,當(dāng)聽到三層協(xié)議、五層協(xié)議時是不是一頭霧水?不知道所謂的層是什么,所謂的協(xié)議是什么?甚至對網(wǎng)絡(luò)通信都知之甚少,那么這篇文章一定能夠讓你快速學(xué)到,如果沒有收獲就別點贊。
網(wǎng)絡(luò)、通信、協(xié)議
在深入學(xué)習(xí)之前,先了解一些基本的概念。
網(wǎng)絡(luò)是什么?網(wǎng)絡(luò)是用物理鏈路將工作站或主機(jī)相連在一起,組成數(shù)據(jù)鏈路,從而達(dá)到資源共享和通信的目的。這里的物理鏈路不僅僅指的是我們能夠看得到的雙絞線、光纖,也可能是無線電波。
網(wǎng)絡(luò)通信,狹義的講,可以理解為計算機(jī)與計算機(jī)之間基于網(wǎng)絡(luò)進(jìn)行的數(shù)據(jù)交換。當(dāng)然,這個過程中也有人與計算機(jī)的交互。
就像人與人溝通一樣,既然想“聊天”,最起碼得有一個基本條件,比如都使用漢語或英語,這算是一個比較寬泛的協(xié)議了。而在計算機(jī)通信當(dāng)中,也差不多,就是約定好咱們交互時的數(shù)據(jù)格式是什么,每個數(shù)據(jù)項什么意思,然后你收到之后應(yīng)該怎么處理或怎么回應(yīng)。
暫且不管官方的定義,簡單來說,互聯(lián)網(wǎng)協(xié)議就是在互聯(lián)網(wǎng)上傳輸數(shù)據(jù)的規(guī)則。當(dāng)然,協(xié)議是非常多的,比如TCP、UDP、IP協(xié)議、FTP協(xié)議等等。而使用這些協(xié)議最基本的要求就是發(fā)送方和接收方所使用的協(xié)議必須一致,否則不就雞同鴨講了嘛。
當(dāng)我們說幾層協(xié)議時,一般來說:一臺設(shè)備上的第X層與另一臺設(shè)備上的第X層進(jìn)行通信的規(guī)則就是第X層協(xié)議。
網(wǎng)絡(luò)分層模型
就像一家公司,有老板、經(jīng)理、組長、成員,不同層面的人有不同的溝通方式,但最終還是從上而下的進(jìn)行實施。老板與老板的溝通就相當(dāng)于應(yīng)用層之間的溝通,而老板的目標(biāo)又需要下面經(jīng)理的支持,就像應(yīng)用層需要傳輸層的支持一樣。
理解了網(wǎng)絡(luò)分層的基本作用,來看看網(wǎng)絡(luò)分層的幾種方式。標(biāo)準(zhǔn)的七層網(wǎng)絡(luò)分層,也就是OSI七層模型。TCP/IP五層模型和TCP/IP四層模型是從OSI七層優(yōu)化而來。
通常,作為用戶來講,使用最多的就是應(yīng)用層了,大多數(shù)情況下可能都感知不到其他層的存在。
那么,為什么要分層呢?這樣與我們設(shè)計軟件架構(gòu)的思想差不多,就是要具有高內(nèi)聚、低耦合、復(fù)用、擴(kuò)展性等特性。試想一下,如果沒有分層,當(dāng)一個業(yè)務(wù)或協(xié)議需要改變時,我們只能針對整個系統(tǒng)做修改或擴(kuò)展。而分層之后,便可以很方便的把不同功能的模塊抽離出來,修改對應(yīng)的模塊即可。而且不同層還可以被復(fù)用,只要確保按照這個層的協(xié)議來處理就可以了。
后面呢,我們就主要針對TCP/IP五層模型來進(jìn)行逐個講解。
網(wǎng)絡(luò)分層與協(xié)議
上面了解了協(xié)議和網(wǎng)絡(luò)分層,這里通過一張圖來對照一下常見的協(xié)議都位于哪個層。
網(wǎng)絡(luò)分層與物理設(shè)備
通過一張圖,看一下不同網(wǎng)絡(luò)分層通常對應(yīng)的硬件設(shè)備:
物理層
了解了上面的基礎(chǔ)知識,我們下面就來看看每層的作用,而通過功能的關(guān)聯(lián)性來記憶網(wǎng)絡(luò)的分層是一個非常好的記憶方法。我們首先來看物理層。
這一層就是把各個網(wǎng)絡(luò)設(shè)備連接起來,讓其可以傳輸0 1 0 1的電信號
物理層,顧名思義,用物理手段將電腦連接起來,基本上是用雙絞線、光纖、無線電波的方式來實現(xiàn)物理層。網(wǎng)絡(luò)設(shè)備連接起來之后,就可以基于它來發(fā)送高低電壓(電信號)進(jìn)行通信,高電壓對應(yīng)數(shù)字1,低電壓對應(yīng)數(shù)字0。0、1信號本身沒有任何的現(xiàn)實意義,所有需要用另一層用來規(guī)定不同0、1組合的意義。
數(shù)據(jù)鏈路層
單純的電信號0和1沒有任何意義,必須規(guī)定電信號多少位一組,每組什么意思。數(shù)據(jù)鏈路層的功能就是通過規(guī)定一套協(xié)議來定義電信號的分組方式,以及規(guī)定不同的組代表什么意思,從而雙方計算機(jī)都能夠進(jìn)行識別,這個協(xié)議就是“以太網(wǎng)協(xié)議”。
以太網(wǎng)協(xié)議規(guī)定,一組電信號構(gòu)成一個數(shù)據(jù)包,我們把這個數(shù)據(jù)包稱之為幀。每一個楨由包頭(Head)和數(shù)據(jù)(Data)兩部分組成。
其中Head包含數(shù)據(jù)包的一些說明信息,包括發(fā)送者、接收者、數(shù)據(jù)類型;Data則是數(shù)據(jù)包的具體內(nèi)容。
Head部分包含固定的18個字節(jié):
- 發(fā)送者/源地址,6個字節(jié);
- 接收者/目標(biāo)地址,6個字節(jié);
- 數(shù)據(jù)類型,6個字節(jié)。
Data部分的長度,最短為46字節(jié),最長為1500字節(jié)。因此,整個”幀”最短為64字節(jié),最長為1518字節(jié)。如果數(shù)據(jù)很長,就必須分割成多個幀進(jìn)行發(fā)送。
有了數(shù)據(jù)包的定義,那么計算機(jī)是如何標(biāo)識誰是誰?以及如何知道對方的地址呢?這就涉及到MAC地址和廣播。
MAC地址
以太網(wǎng)規(guī)定,連入網(wǎng)絡(luò)的所有設(shè)備都必須具有網(wǎng)卡。數(shù)據(jù)包的發(fā)送地址和接收地址指的就是網(wǎng)卡地址,也就是MAC地址。
MAC地址作為網(wǎng)絡(luò)中計算機(jī)設(shè)備的唯一標(biāo)識,從計算機(jī)在廠商生產(chǎn)出來就被十六進(jìn)制的數(shù)標(biāo)識為MAC地址,MAC地址理論上是獨一無二的。這也是為什么很多軟件校驗設(shè)備唯一性時,會用到MAC地址。
MAC地址長度為48位2進(jìn)制,通常由12位16進(jìn)制數(shù)表示(前六位是廠商編號,后六位是流水線號)。
有了MAC地址,那么兩臺機(jī)器之間是找到對方進(jìn)行通信的呢?
廣播
有了MAC地址,在同一網(wǎng)絡(luò)內(nèi)的兩臺主機(jī)就可以通信了。
在同一個子網(wǎng)中,計算機(jī)1要向計算機(jī)4發(fā)送一個數(shù)據(jù)包,數(shù)據(jù)包中包含接收方的MAC地址。計算機(jī)1向本網(wǎng)絡(luò)內(nèi)所有計算機(jī)都發(fā)送(以廣播的方式),這時同一子網(wǎng)中的每臺計算機(jī) (包括2、3)都會收到這個數(shù)據(jù)包的。然后每臺計算機(jī)都會把數(shù)據(jù)包的MAC地址取出來,與自身的MAC地址進(jìn)行對比,如果兩者相同,則接受這個數(shù)據(jù)包,否則就丟棄這個數(shù)據(jù)包。計算機(jī)4發(fā)現(xiàn)包含自己的MAC地址,于是就進(jìn)行響應(yīng)。
網(wǎng)絡(luò)層
以太網(wǎng)通過廣播這種很原始的形式,解決了兩臺計算機(jī)之間的通信問題。但很明顯,它不是把數(shù)據(jù)包準(zhǔn)確的送達(dá)接收方,而是向網(wǎng)絡(luò)中所有的計算機(jī)發(fā)送數(shù)據(jù)包。
而我們所處的網(wǎng)絡(luò)是由無數(shù)個子網(wǎng)絡(luò)構(gòu)成的。即便忽略掉子網(wǎng)的存在,如果所有的通信都采用以太網(wǎng)的廣播方式,那么一臺機(jī)器發(fā)送的包全世界都會收到,整個網(wǎng)絡(luò)是會奔潰的。
而實現(xiàn)的網(wǎng)絡(luò)又是由無數(shù)個子網(wǎng)絡(luò)構(gòu)成的,以太網(wǎng)采用廣播方式發(fā)送數(shù)據(jù)包,效率低且發(fā)送的數(shù)據(jù)只能局限在發(fā)送者所在的子網(wǎng)絡(luò)。
此時就需要另想辦法,如果是同一個子網(wǎng)絡(luò),就采用廣播方式發(fā)送,如果不是在同一個子網(wǎng) , 那就通過網(wǎng)關(guān)和路由向不同廣播域/子網(wǎng)分發(fā)數(shù)據(jù)包。所以就有了網(wǎng)絡(luò)層,它是處理分組在網(wǎng)絡(luò)中的活動,比如分組的選路。
網(wǎng)絡(luò)層引入一套新的協(xié)議用來區(qū)分不同的廣播域/子網(wǎng),于是就有了IP 協(xié)議。
IP 協(xié)議
網(wǎng)絡(luò)地址協(xié)議,叫做IP協(xié)議。相對于上面講到的MAC地址, IP 地址可以理解成邏輯地址,也就是說 MAC 地址是物理上的地址,是固定的。IP 地址是動態(tài)分配的,是不固定的?,F(xiàn)在廣泛采用的IPv4地址,同時IPv6也在不斷的發(fā)展壯大。
通過IP協(xié)議發(fā)送的數(shù)據(jù),就叫做IP數(shù)據(jù)包,也分為“包頭”和“數(shù)據(jù)”兩個部分:“包頭”部分主要包括版本、長度、IP地址等信息;“數(shù)據(jù)”部分則是IP數(shù)據(jù)包的具體內(nèi)容。IP數(shù)據(jù)包的”包頭”部分的長度為20到60字節(jié),整個數(shù)據(jù)包的總長度最大為65535字節(jié)。
IPv4地址是由32位的二進(jìn)制數(shù)組成,一般把它分成4段的十進(jìn)制表示,地址范圍為0.0.0.0~255.255.255.255。
IP地址分成兩部分:網(wǎng)絡(luò)部分(標(biāo)識子網(wǎng))和主機(jī)部分(標(biāo)識主機(jī))。網(wǎng)絡(luò)部分和主機(jī)部分所占用的二進(jìn)制位數(shù)是不固定的。
IP地址段只是標(biāo)識了IP地址的種類,從網(wǎng)絡(luò)部分或主機(jī)部分都無法辨識一個IP所處的子網(wǎng)。如果兩個IP的網(wǎng)絡(luò)部分相同,則說明它們處于同一個子網(wǎng)中。例如192.168.33.1和192.168.33.2,如果它們的網(wǎng)絡(luò)部分為24位,主機(jī)部分為8位,網(wǎng)絡(luò)部分都為 192.168.33,處于同一個子網(wǎng)中。
但如果像192.16.10.1與192.16.10.2,并不知道網(wǎng)絡(luò)部分和主機(jī)部分各幾位,就不能確定是否處于同一子網(wǎng)。于是就有了子網(wǎng)掩碼。
子網(wǎng)掩碼
子網(wǎng)掩碼就是用來標(biāo)識同一局域網(wǎng)中的 IP 地址的信息的。子網(wǎng)掩碼也是由 32 個二進(jìn)制位組成的,但是只能用 0 或 1 來表示,如11111111.11111111.11111111.00000000。
子網(wǎng)掩碼的網(wǎng)絡(luò)部分全部為1,主機(jī)部分全部為0。兩臺計算機(jī)的 IP 地址分別和子網(wǎng)掩碼進(jìn)行一種AND 運(yùn)算(兩個數(shù)位都為1,運(yùn)算結(jié)果為1,否則為0),如果結(jié)果相同,兩臺計算機(jī)就在同一局域網(wǎng)中,否則就不在同一局域網(wǎng)中。
比如IP地址為192.16.10.1,如果已知網(wǎng)絡(luò)部分是前24位,主機(jī)部分是后8位,那么子網(wǎng)絡(luò)掩碼就是11111111.11111111.11111111.00000000,寫成十進(jìn)制就是255.255.255.0。
假設(shè)192.168.33.1和192.168.33.2的子碼掩碼都為255.255.255.0,把IP與子碼掩碼相與,結(jié)果都為192.168.33.0,那么它們說明處于同一個子網(wǎng)中。
ARP協(xié)議
有了IP協(xié)議,可以判斷計算機(jī)屬于哪個子網(wǎng)了。在鏈路層時我們通過MAC地址進(jìn)行通信的,現(xiàn)在只有目標(biāo)的IP地址,如何才能拿到它的MAC地址呢?這就又要用到ARP協(xié)議。
ARP協(xié)議可以通過廣播的方式發(fā)送數(shù)據(jù)包,獲取目標(biāo)主機(jī)的MAC地址。具體實現(xiàn)為:發(fā)送端主機(jī)通過廣播的方式發(fā)送數(shù)據(jù)包,所有主機(jī)接收后拆開包,如果發(fā)現(xiàn)目標(biāo)IP為自己就響應(yīng),返回MAC地址。
數(shù)據(jù)包格式:(發(fā)送端的MAC地址,目標(biāo)MAC地址,發(fā)送端IP地址,目標(biāo)IP地址,數(shù)據(jù))。
傳輸層
經(jīng)過數(shù)據(jù)鏈路層和網(wǎng)絡(luò)層的支持,我們已經(jīng)可以正常在兩臺計算機(jī)之間進(jìn)行通訊了,但是計算機(jī)會同時運(yùn)行著許多程序,比如同時開著QQ與WX,那么怎么區(qū)分消息是QQ的還是WX的呢?
通常我們會看到計算機(jī)上運(yùn)行的不同程序都會分配不同的端口,而傳輸層的功能就是建立端口到端口的通信,使得數(shù)據(jù)能夠正確的傳送給不同的應(yīng)用程序。
端口是每一個使用網(wǎng)卡的程序的編號,每一個端口號標(biāo)志一個可執(zhí)行程序。端口號是0到65535之間的一個整數(shù),正好16個二進(jìn)制位,0-1023為系統(tǒng)占用端口,其他應(yīng)用程序只能選用大于1023的端口。
至此,用IP + 端口,已經(jīng)能實現(xiàn)唯一確定互聯(lián)網(wǎng)上一個程序,進(jìn)而實現(xiàn)網(wǎng)絡(luò)間的程序通信了。
傳輸層最常見的兩大協(xié)議是 TCP(Transmission Control Protocol,傳輸控制協(xié)議) 協(xié)議和 UDP(User Data Protocol,用戶數(shù)據(jù)報協(xié)議) 協(xié)議。
UDP協(xié)議就是在數(shù)據(jù)前面加上端口號,“包頭”部分主要定義了發(fā)出端口和接收端口,一共只有8個字節(jié)。“數(shù)據(jù)”部分就是具體的內(nèi)容??傞L度不超過65,535字節(jié),正好放進(jìn)一個IP數(shù)據(jù)包。
UDP協(xié)議簡單且容易實現(xiàn),這是它的優(yōu)點。但同樣也有缺點,就是進(jìn)行通信時不知道對方是否接收到數(shù)據(jù)了。此時需要再定義一套規(guī)則,讓其可以和對方進(jìn)行確認(rèn),那么TCP出現(xiàn)了。
TCP數(shù)據(jù)包沒有長度限制,理論上可以無限長,可是為了保證網(wǎng)絡(luò)的效率,通常TCP數(shù)據(jù)包的長度不會超過IP數(shù)據(jù)包的長度,也就是小于65,535字節(jié),這也確保單個TCP數(shù)據(jù)包不必再分割。像我們通常說 TCP 三次握手和四次揮手,就是傳輸層完成的。關(guān)于TCP實現(xiàn)部分的內(nèi)容比較多,我們這里就不再拓展了。
TCP的優(yōu)點是能夠確保數(shù)據(jù)不會遺失,安全可靠的傳輸。缺點是過程復(fù)雜、實現(xiàn)困難、消耗較多的資源。
應(yīng)用層
終于說到應(yīng)用層了,應(yīng)用層算是我們最經(jīng)??吹降囊粚恿恕?yīng)用層的功能就是規(guī)定了應(yīng)用程序的數(shù)據(jù)格式。我們經(jīng)常用的電子郵件、HTTP協(xié)議以及FTP數(shù)據(jù)的格式,就是在應(yīng)用層定義的。
應(yīng)用層的主要協(xié)議有:FTP(文件傳送協(xié)議、21端口)、Telnet(遠(yuǎn)程登錄協(xié)議)、DNS(域名解析協(xié)議)、SMTP(郵件傳送協(xié)議、25端口),POP3協(xié)議(郵局協(xié)議),HTTP協(xié)議(Hyper Text Transfer Protocol、80端口)。
正反俄羅斯套娃
最后,我們以HTTP請求為例,來梳理一下整個網(wǎng)絡(luò)分層中各種的職責(zé)與處理流程。在整個通信過程中,就像俄羅斯套娃一樣,一層層的包裝起來,然后再一層層的打開。
小結(jié)
經(jīng)過這篇文章,我們從最下方的物理層到最上方的應(yīng)用層,按照故事性的形式進(jìn)行了講解,想必你已經(jīng)有一個感性的認(rèn)識了,是不是發(fā)現(xiàn)再也不用死記硬背網(wǎng)絡(luò)分層了?你就說值不值得來個贊?