關(guān)于BitTorrent協(xié)議工作機(jī)理的探討
相信有網(wǎng)絡(luò)下載經(jīng)驗(yàn)的朋友們肯定不會(huì)不知道BitTorrent協(xié)議。這個(gè)協(xié)議所支持的就是我們所常說(shuō)的“BT”下載。那么這個(gè)協(xié)議的一些基礎(chǔ)情況,我們?cè)谶@里為大家詳細(xì)介紹一下。其中也包含了它的具體工作原理,希望能讓大家了解這部分的內(nèi)容。
普通的HTTP/FTP下載使用TCP/IP協(xié)議,BitTorrent協(xié)議是架構(gòu)于TCP/IP協(xié)議之上的一個(gè)P2P文件傳輸協(xié)議,處于TCP/IP結(jié)構(gòu)的應(yīng)用層。 BitTorrent協(xié)議本身也包含了很多具體的內(nèi)容協(xié)議和擴(kuò)展協(xié)議,并在不斷擴(kuò)充中。
根據(jù)BitTorrent協(xié)議,文件發(fā)布者會(huì)根據(jù)要發(fā)布的文件生成提供一個(gè).torrent文件,即種子文件,也簡(jiǎn)稱為種子。
.torrent文件本質(zhì)上是文本文件,包含Tracker信息和文件信息兩部分。Tracker信息主要是BT下載中需要用到的Tracker服務(wù)器的地址和針對(duì)Tracker服務(wù)器的設(shè)置,文件信息是根據(jù)對(duì)目標(biāo)文件的計(jì)算生成的,計(jì)算結(jié)果根據(jù)BitTorrent協(xié)議內(nèi)的Bencode規(guī)則進(jìn)行編碼。它的主要原理是需要把提供下載的文件虛擬分成大小相等的塊,塊大小必須為2k的整數(shù)次方(由于是虛擬分塊,硬盤(pán)上并不產(chǎn)生各個(gè)塊文件),并把每個(gè)塊的索引信息和Hash驗(yàn)證碼寫(xiě)入.torrent文件中;所以,.torrent文件就是被下載文件的索引。
下載者要下載文件內(nèi)容,需要先得到相應(yīng)的.torrent文件,然后使用BT客戶端軟件進(jìn)行下載。
下載時(shí),BT客戶端首先解析.torrent文件得到Tracker地址,然后連接Tracker服務(wù)器。Tracker服務(wù)器回應(yīng)下載者的請(qǐng)求,提供下載者其他下載者(包括發(fā)布者)的IP。下載者再連接其他下載者,根據(jù).torrent文件,兩者分別告知對(duì)方自己已經(jīng)有的塊,然后交換對(duì)方所沒(méi)有的數(shù)據(jù)。此時(shí)不需要其他服務(wù)器參與,分散了單個(gè)線路上的數(shù)據(jù)流量,因此減輕了服務(wù)器負(fù)擔(dān)。
下載者每得到一個(gè)塊,需要算出下載塊的Hash驗(yàn)證碼與.torrent文件中的對(duì)比,如果一樣則說(shuō)明塊正確,不一樣則需要重新下載這個(gè)塊。這種規(guī)定是為了解決下載內(nèi)容準(zhǔn)確性的問(wèn)題。
一般的HTTP/FTP下載,發(fā)布文件僅在某個(gè)或某幾個(gè)服務(wù)器,下載的人太多,服務(wù)器的帶寬很易不勝負(fù)荷,變得很慢。而B(niǎo)itTorrent協(xié)議下載的特點(diǎn)是,下載的人越多,提供的帶寬也越多,種子也會(huì)越來(lái)越多,下載速度就越快。
而有些人下載完成后關(guān)掉下載任務(wù),提供較少量數(shù)據(jù)給其他用戶,為盡量避免這種行為,在非官方BitTorrent協(xié)議中存在超級(jí)種子(super seed)的算法。這種算法允許文件發(fā)布者分幾步發(fā)布文件,發(fā)布者不需要一次提供文件所有內(nèi)容,而是慢慢開(kāi)放的下載內(nèi)容的比例,延長(zhǎng)下載時(shí)間。此時(shí),速度快的人由于未下載完必須提供給他人數(shù)據(jù),速度慢的人有更多機(jī)會(huì)得到數(shù)據(jù)。
BitTorrent協(xié)議原理在該圖示中,由不同顏色區(qū)分的是某一文件的不同部分,當(dāng)傳輸開(kāi)始時(shí),只有種子發(fā)布都擁有全部文件,在傳輸進(jìn)行中,有部分用戶獲得部分文件(帶顏色線條表示),隨著傳輸?shù)睦^續(xù),文件已經(jīng)全部公布在系統(tǒng)中,此時(shí),種子擁有者可以退出,也不會(huì)影響該文件的傳播。