阿里終面:怎么用 UDP 實(shí)現(xiàn) TCP?
本篇來自于我的一次真實(shí)面試經(jīng)歷。
背景
本題是我在面試中,技術(shù)總監(jiān)問我的一道真題,當(dāng)時(shí)答得不太好,所以把它揪出來總結(jié)了下。后來問了下總監(jiān),總監(jiān)說這是阿里的面試題。。
其實(shí)面試官主要是想讓我說出 UDP 和 TCP 的原理上的區(qū)別,怎么給 UDP 加些功能實(shí)現(xiàn) TCP。
看好去很容易就能說出一兩個 TCP 和 UDP 的區(qū)別,但如果能用女朋友都能聽懂的方式該怎么說呢?
女朋友:我不想聽課本上講的!我聽不懂呀~
下面我會以大白話的方式來解答上面的問題。
UDP 的特點(diǎn)
UDP 讓我想起了剛畢業(yè)參加工作那會,一名畢業(yè)菜鳥。
- 溝通簡單
領(lǐng)導(dǎo)安排的任務(wù),直接干就完了。
UDP 也是,相信網(wǎng)絡(luò)世界永遠(yuǎn)是美好的,我發(fā)送的包是很容易送到的,接收方也是很容易組裝的。數(shù)據(jù)結(jié)構(gòu)也很簡單,不需要大量的數(shù)據(jù)結(jié)構(gòu)、處理邏輯、包頭字段。
- 輕信他人
測試人員報(bào)的 bug 我也不會和她爭論什么,永遠(yuǎn)相信測試人員是對的,測試人員說啥就是啥,我改就是。
UDP 也是,不會建立連接,有個端口號,誰都可以監(jiān)聽這個端口號往上面發(fā)數(shù)據(jù)。也可以從這個端口號傳給任何人數(shù)據(jù)。反正我只管發(fā)就是。
- 不會討價(jià)還價(jià)
產(chǎn)品經(jīng)理昨天說手機(jī)殼需要根據(jù)心情變色,測試人員說這個 bug 要把關(guān)聯(lián)的兩個 bug 一起修掉。那就按照他們說的做吧!
UDP 也是,不懂堅(jiān)持和退讓。也就是根據(jù)網(wǎng)絡(luò)情況進(jìn)行擁塞控制。無論網(wǎng)絡(luò)丟包多嚴(yán)重,我還是照樣發(fā)~
UDP 使用場景
針對像我那時(shí)候畢業(yè)菜鳥的情況,領(lǐng)導(dǎo)給我安排了三種工作環(huán)境讓我選。
- 內(nèi)部系統(tǒng),任務(wù)簡單,模塊單一,不需要考慮代碼的關(guān)聯(lián)影響,即使失敗了也沒有關(guān)系。
UDP 也是,需要資源少,網(wǎng)絡(luò)情況比較好的內(nèi)網(wǎng),或者對于丟包不敏感的應(yīng)用。
- 有一個強(qiáng)力的團(tuán)隊(duì)支持,都是中高級開發(fā)、測試人員,團(tuán)隊(duì)成員打過很多年交道,互相信任。有什么問題,吼一嗓子就可以了!
UDP 也是,不需要一對一溝通來建立連接,可以廣播的應(yīng)用。
- 一個新項(xiàng)目,需要有激情,對于剛畢業(yè)的菜鳥,都是有很強(qiáng)的自主能動性的,也不會?;^,躲在廁所玩手機(jī),帶薪拉shi ?即使項(xiàng)目不忙,我也抓緊時(shí)間干。項(xiàng)目忙,還是一樣干!
UDP 也是,猛著發(fā)包就是,主要應(yīng)用在需要處理速度快,時(shí)延低,可以容忍少數(shù)丟包的情況。即使網(wǎng)絡(luò)情況不佳,發(fā)包就是~
針對上面的三大場景,UDP 常用在實(shí)時(shí)競技游戲,IoT 物聯(lián)網(wǎng),移動通信領(lǐng)域。
TCP 的特點(diǎn)?
- 面向連接
TCP 和 UDP 是傳輸層里面比較重要的兩個協(xié)議。大部分面試的時(shí)候都會問到兩者的區(qū)別。而大部分都會兩句,比如 TCP 是面向連接的,UDP 是面向無連接。
那什么是面向連接?
TCP 三次握手是我們常常念叨和背誦的。而在這三次握手成功后,就是建立連接成功。
那什么又叫面向呢?
我們也常聽到面向?qū)ο缶幊獭⒚嫦蚯忻婢幊?、面向服?wù)編程。那到底什么是面向?
在我看來 面向 就是遵循一定的協(xié)議、規(guī)范、數(shù)據(jù)結(jié)構(gòu)等來做一系列事情。
比如面向連接,就是為了在客戶端和服務(wù)端維護(hù)連接,而建立一定的數(shù)據(jù)結(jié)構(gòu)來維護(hù)雙方交互的狀態(tài),用這樣的數(shù)據(jù)來保證所謂的面向連接的特性。
知道了 TCP 的是用三次握手來建立連接,那我們是否可以讓 UDP 也發(fā)三個包來模擬 TCP 建立連接?可以是可以,但是如果只是建立,而不是面向連接,其實(shí)意義不大。
那 TCP 面向連接做了哪些事情?
TCP 提供可靠交付,通過 TCP 連接傳輸?shù)臄?shù)據(jù),可以無差錯、不丟失、不重復(fù)、并且按序到達(dá)。而 UDP 繼承了 IP 包的特性,不保證不丟失,不保證按順序到達(dá)。
- 面向字節(jié)流
TCP 是面向字節(jié)流,所謂字節(jié)流,就是發(fā)的是一個流,沒頭沒尾。TCP 自己維護(hù)流狀態(tài)。
UDP 基于 IP 數(shù)據(jù)報(bào),一個一個地發(fā),一個一個地收。
- 擁塞控制
TCP 擁有擁塞控制,如果包丟棄了或者網(wǎng)絡(luò)環(huán)境不好了,就會根據(jù)網(wǎng)絡(luò)情況自行控制自己的行為,看下是發(fā)快點(diǎn)還是發(fā)慢點(diǎn)。
UDP 則沒有這么智能了, 你讓我發(fā),我就發(fā)唄,反正是你讓我發(fā)的,其他的一概不管~
- 有狀態(tài)服務(wù)
TCP 是一個有狀態(tài)的服務(wù),有狀態(tài)可以理解為:我記錄了哪些發(fā)送了,哪些沒有發(fā)送,哪些接收到了,哪些沒接收到,應(yīng)該接收哪個了,一點(diǎn)差錯都不行。TCP 干的事情可真多!
而 UDP 則不是有狀態(tài)的服務(wù),我只管發(fā),其他的就交給接收端吧,有點(diǎn)任性是吧?
如何讓 UDP 實(shí)現(xiàn) TCP 功能?
建立連接上面已經(jīng)講到了,三次握手和四次握手,UDP 也可以模擬去做。
那下面還有幾個問題:
- 順序問題
- 丟包問題
- 流量控制
- 擁塞控制
TCP 的數(shù)據(jù)結(jié)構(gòu)長這樣:
其實(shí)如果你能把這些結(jié)構(gòu)講清楚,就已經(jīng)理解了 TCP 的核心功能。下面我還是用大白話的方式來講解上面的四個問題。
順序問題和丟包問題可以利用確認(rèn)與重發(fā)的機(jī)制。假如包收到了,可以做一個確認(rèn),發(fā)送一個 ACK 給發(fā)送端,告訴他我收到了。假如有的包提前到了,就緩存著。假如有包丟失了,就可以超時(shí)重試。超時(shí)重試不宜過短,時(shí)間必須大于往返時(shí)間 RTT,否則會引起不必要的重傳。也不宜過長,如果超時(shí)時(shí)間過長,訪問就變慢了。那怎么確定這個時(shí)間,可以通過采樣 RTT 的時(shí)間,進(jìn)行加權(quán)平均。還需要根據(jù)網(wǎng)絡(luò)狀況,動態(tài)變化??梢粤私庀伦赃m應(yīng)重傳算法。
流量控制就是根據(jù)網(wǎng)絡(luò)情況調(diào)整發(fā)包的速率。利用的是滑動窗口。在對于包的確認(rèn)中,同時(shí)會攜帶一個窗口的大小,只要利用好這個窗口大小,就能很好地調(diào)整發(fā)包速率,發(fā)的報(bào)文段不要超過窗口的大小就 OK。(圖片來源網(wǎng)絡(luò))
擁塞控制主要用來避免包丟失和超時(shí)重傳,如果出現(xiàn)了這兩種現(xiàn)象,就說明發(fā)的速率太快了。那最開始怎么知道發(fā)送速率呢?其實(shí)開始時(shí)只發(fā)送一個報(bào)文段數(shù)據(jù),如果收到一個確認(rèn),則倍增報(bào)文段,依次類推。當(dāng)發(fā)現(xiàn)超時(shí)重傳時(shí),就又回到只發(fā)送一個報(bào)文段的情況,這個就是慢啟動,這種方式不合適。其實(shí)還有一種快速重傳算法,簡單來說就是擁塞窗口減半,后續(xù)線性增速。針對于算法怎么實(shí)現(xiàn)的,這里就不展開講述了。(圖片來源網(wǎng)絡(luò))
至此,我用大白話的方式講解了 UDP 和 TCP 的區(qū)別,以及 UDP 缺什么功能,需要怎么去彌補(bǔ)才能實(shí)現(xiàn) TCP 的功能。相信這樣回答的思路可以讓面試官覺得還是有點(diǎn)東西的。
本文轉(zhuǎn)載自微信公眾號「悟空聊架構(gòu)」,可以通過以下二維碼關(guān)注。轉(zhuǎn)載本文請聯(lián)系悟空聊架構(gòu)公眾號。