自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

大規(guī)模網站架構技術原理透析

開發(fā) 架構 前端
本文從各個角度討論了設計大規(guī)模網站架構時所需要注意的問題。作者介紹了網站架構中比如CDN一類最基礎和常見的概念,以及對于動態(tài)內容處理的考慮,并簡單描述了OSI七層模型的功能。

51CTO推薦 視頻專題:大型網站架構專家談

跟朋友聊天的時候,發(fā)現(xiàn)很多人對大型網站系統(tǒng)架構非常感興趣,我也很感興趣,經常會在家里2臺筆記本和1臺服務器組成的局域網環(huán)境里作些實驗。我進入IT行業(yè)的時間,大約是97,98年吧,那時候PC客戶端軟件最為盛行,做軟件開發(fā)是一份很體面也很喜歡的工作。我從Win3.1上的VC1.5開始一直到VC6.0,然后轉為.Net開發(fā),基本上都是從事客戶端軟件開發(fā)。本人的性格是危機意識向來嚴重,所以深感互聯(lián)網必將盛行,傳統(tǒng)軟件必將走向沒落,于是轉向了WEB開發(fā)。記得以前去某Portal網站應聘的時候,主考官就問我:你認為客戶端開發(fā)和互聯(lián)網開發(fā)有什么不同。我當時的回答是:互聯(lián)網開發(fā)比客戶端軟件開發(fā)簡單多了,我再也不用考慮那么多的用戶環(huán)境因素了,一點部署,何時何地都可用。

很多年過去了,我再想起當初我的回答,依然覺得那個回答是正確的。就產品開發(fā)層面來講,互聯(lián)網開發(fā)確實簡單多了。這里首先澄清一個概念,我所說的互聯(lián)網開發(fā)并不是指所有的B/S應用,例如B/S方式的銀行內部業(yè)務系統(tǒng)。我所說的互聯(lián)網應用是指在互聯(lián)網上服務于公眾的應用。企業(yè)級的業(yè)務系統(tǒng),它的特點是業(yè)務邏輯是比較復雜的,但用戶一般不太大;互聯(lián)網應用則相反,業(yè)務邏輯一般很簡單,但面對的是海量用戶。

既然互聯(lián)網應用開發(fā)的業(yè)務邏輯不復雜,但為什么大型網站都投入了那么多的技術人員呢?主要是因為運營的環(huán)境太復雜,這種復雜性形成的原因以下:

1、公開性

網站的服務是公開的,任何人都可以來訪問,所以就會直接面對大量的不良用戶,系統(tǒng)數(shù)據(jù)的安全面臨很大的風險,一旦系統(tǒng)被攻入,結果將是災難性的。

2、訪問量大

訪問量大,就意味著網站必須能夠承受高并發(fā)大流量的考驗,如果網站的服務能力和健壯性等達不到要求,你的系統(tǒng)就會被沖垮。

3、用戶體驗

用戶體驗要好,除了產品設計的因素之外,就要求訪問網站的速度要快,具有高可用性,別用一會就掛。

網站各子系統(tǒng)如何進行部署,如何提高系統(tǒng)的健壯性和高可用性,如何實現(xiàn)網站的安全,如何提高訪問速度,如何進行負載均衡,甚至于采用什么的硬件設備,另外,網站發(fā)展的不同時期會可能會采用不同的架構,如何實現(xiàn)架構的平滑過渡,如何使目前的架構具有彈性,具備可擴展的能力,這都是大型網站必須解決的問題,也是小網站成長過程中遲早會遇到的問題。我后面的文章將會逐步就這個話題展開。

網站機構包括網站的軟件架構和系統(tǒng)架構兩部分,軟件架構主要是指子系統(tǒng)和邏輯層的劃分結構;系統(tǒng)架構,一般是系統(tǒng)部署結構。

系統(tǒng)架構師的知識體系比較龐雜,所謂的見多識廣,多數(shù)是由運維工程師成長起來的,他們開發(fā)能力不強,編碼不多,但動手能力很強,腳本編寫非常熟練,經常會做各種類型的實驗,密切跟蹤最新技術最新產品的相關信息。當然,一個大型的網站,需要一個架構師團隊,他們各自承擔擅長領域的架構設計,比如安全架構、存儲架構等等。

我覺得一般的開發(fā)人員還是很難走上這條路的,這份工作需要經驗,需要不斷實踐,但如果開發(fā)人員一旦走上了這條路,會有很大的發(fā)展,主要源于開發(fā)人員的思考習慣和技術的深度。我的這系列文章,開發(fā)人員可以作為參考,比如如何開發(fā)可分布式部署的系統(tǒng),另外很多朋友都是身兼數(shù)職,從開發(fā)到實施,到部署全部包辦。我個人深感精力有限,所以又特意找了幾個朋友從Unix/Linux系統(tǒng)和Windows系統(tǒng)不同角度進行探索,以造福正在摸索中的朋友,有興趣的朋友也可以參與。

其實,這部分內容我一直在寫,比如PHP深度探索系列,寫了大量的關于apache的內容,我已經大體把apache代碼閱讀了一遍,很費時間,進度緩慢,但我想這有助于我們理解apache的配置和調優(yōu)。

在介紹網站架構之前,我們先介紹一些網站架構中最基礎和常見的概念,以便更好的理解后面的有關負載均衡和分布式存儲等技術。第一個,首先講講CDN。

1、CDN是什么

CDN(Content Delivery Network),就是內容發(fā)布網或者內容分發(fā)網,它的主要目的:通過在現(xiàn)有的Internet中增加一層新的網絡架構,將網站的內容發(fā)布到最接近用戶的網絡邊緣,使用戶可以就近取得所需的內容,從而提高用戶訪問網站的響應速度,提升用戶體驗,同時能夠分散訪問壓力,把本來用戶集中訪問分散到各地去。網站的內容提供商(比如新浪、搜狐、網易等等)使用CDN,就可以在宏觀層解決一部分大流量、海量用戶并發(fā)等令人頭疼的問題。

2、CDN的組成

內容發(fā)布網(CDN)是一個經策略性部署的整體系統(tǒng),包括分布式存儲、負載均衡、網絡請求的重定向和內容管理4個要件,而內容管理和全局的網絡流量管理是CDN的核心所在。通過用戶就近性和服務器負載的判斷,CDN確保內容以一種極為高效的方式為用戶的請求提供服務,達到用戶所要求的服務距用戶僅有"一跳"(Single Hop)之遙。

我們通常的內容發(fā)布模式都是將網站數(shù)據(jù)放到一處,然后應對來自世界各地的訪問,我們多數(shù)考慮的是軟件部署架構,很少考慮網絡硬件架構。與之形成對比的是,CDN則強調了網絡在內容發(fā)布中的重要性。通過引入主動的內容管理層的和全局負載均衡,CDN從根本上區(qū)別于傳統(tǒng)的內容發(fā)布模式。

內容提供商承擔了他們不該干也干不好的內容發(fā)布服務。

3、互聯(lián)網服務的產業(yè)鏈

縱觀整個寬帶服務的價值鏈,內容提供商和用戶位于整個價值鏈的兩端,中間依靠網絡服務提供商將其串接起來。隨著互聯(lián)網工業(yè)的成熟和商業(yè)模式的變革,在這條價值鏈上的角色越來越多也越來越細分,出現(xiàn)了內容運營商、托管服務提供商、骨干網絡服務提供商、接入服務提供商等等。在這一條價值鏈上的每一個角色都要分工合作、各司其職才能為客戶提供良好的服務,從而帶來多贏的局面。從內容與網絡的結合模式上看,內容的發(fā)布已經走過了ICP的內容(應用)服務器和IDC這兩個階段。IDC的熱潮也催生了托管服務提供商這一角色。但是,IDC并不能解決內容的有效發(fā)布問題。內容位于網絡的中心并不能解決骨干帶寬的占用和建立IP網絡上的流量秩序。因此將內容推到網絡的邊緣,為用戶提供就近性的邊緣服務,從而保證服務的質量和整個網絡上的訪問秩序就成了一種顯而易見的選擇,這就是CDN服務模式。CDN的建立解決了困擾內容運營商的內容"集中與分散"的兩難選擇,無疑對于構建良好的互聯(lián)網價值鏈是有價值的,也是不可或缺的最優(yōu)網站加速服務。

4、CDN服務提供商

ChinaCache是中國最大的CDN服務提供商,是不是唯一未可知也。要想成為CDN服務提供商,恐怕要擺平電信、網通、鐵通等等運營商,這得需要什么樣的能力和背景不得而知。它的服務節(jié)點在全球已經超過130個,其中國內節(jié)點超過80個,覆蓋全國主要6大網絡(所謂6線機房,就是這么來的)的主要省份,象各大門戶網站,比如新浪、網易等等都是租用了他們的服務。所以,你無論是在南方,或者北方,還是在北美,訪問這些門戶網站,感覺速度都很快,最主要的原因之一就是CDN發(fā)揮了效果。一般小網站是用不起這服務的,所以慢點就慢點了吧,可以租用互聯(lián)互通的6線機房,如果網絡足夠寬的話,用戶也可以忍受。如果想繼續(xù)提升用戶體驗的話,就需要做一些網站鏡像,部署在具有代表性的幾個大城市,比如華南可以部署在廣州,華東可以部署在上海,華北可以部署在北京,不過內容鏡像的過程,就需要自己去部署和維護。還有的網站,采用內容分割的方式,比如建立針對各地的分站,業(yè)務情況不同,可能部署的策略不同。CDN可以認為是基礎網絡建設的一種策略。

#p#

前面介紹了cdn的一些原理和概念,以及提供cdn基礎網絡服務的途徑。cdn看起來對于靜態(tài)內容的,比如html,js,image是非常合適的,通過cdn的部署,用戶只需要一跳就可以訪問到網站的內容。那對于動態(tài)內容怎么辦呢?我回答一下:

動態(tài)內容按照存在形態(tài)可以分為三類。

第一類:內容長時間不需變化,這類內容一般是通過網頁靜化技術,實現(xiàn)動態(tài)內容轉換成靜態(tài)內容,從而達到cdn部署,典型的就是內容類網站,比如新浪、搜狐、網易等等的內容發(fā)布系統(tǒng)cms,內容的增刪改等管理工作被準實時同步到各個節(jié)點。

第二類:內容可能會短時間內發(fā)生變動,但是最終會穩(wěn)定。比如論壇、博客等應用,這類服務提供的內容按照一定的時間間隔,實現(xiàn)批量靜化,當然也有實時靜化,像Mop的大雜燴、網易社區(qū)就是使用了這樣的策略。

第三類:內容會實時變化,非常個性化。比如郵箱應用,這類服務提供的內容無法實現(xiàn)靜化,只能通過實行分區(qū)域部署和負載均衡等手段進行優(yōu)化。

對于提供cdn服務的廠商來講,靜態(tài)內容的cdn自然沒有問題,對于第三類服務,只能從通信鏈路層進行相應的優(yōu)化。

對于很多網站的偽靜化,有的出于Seo的考慮,有的出于安全性的考慮,手段基本上是rewrite Url。它只不過是一種外在的表現(xiàn)形式,與Html靜化是兩回事,它依然是一種動態(tài)內容。

1. 負載均衡的分類

負載均衡技術在網站運營過程中應用非常普遍,技術也很成熟。負載均衡技術按照軟硬件形式分為軟均衡和硬均衡。軟均衡就是基于軟件技術的均衡,硬均衡是基于硬件技術的均衡;

按照網絡協(xié)議劃分又分為四層均衡和七層均衡。四層均衡就是基于OSI網絡層的數(shù)據(jù)均衡,七層均衡是基于OSI應用層的數(shù)據(jù)均衡。

各種均衡方式在大型網站中均有采用,而且大多數(shù)情況下,是多種均衡方式的組合。

2. DNS輪詢均衡

這種方式,算是比較獨立的一種方式,不在上述劃分之列,但使用比較廣泛,一般用在網站最前端。你可以做個試驗,在dos命令行中運行nslook命令。比如:nslookup www。163。com,你會看到命令給出了一堆解析后的IP地址。這些地址就是www.163.com這個域名綁定的多條A記錄。我們從瀏覽器發(fā)起的訪問請求http://www.163.com/,那么你輸入的域名首先需要經過DNS服務器進行解析,Dns服務器的解析的過程就是按照A記錄的順序,依次分配IP地址。Dns輪詢方式實現(xiàn)均衡就是利用這個原理,在一個域名下面綁定N個IP地址,訪問請求被均衡到不同的設備。Dns輪詢方式提供的IP地址,在大型網站中往往是一個集群的地址,可能是均衡交換機也可能是均衡服務器。對于小網站的話,掛接多臺服務器也沒有問題。

DNS輪詢均衡的優(yōu)點:

1、零成本:只是在Dns服務器上綁定幾個A記錄,域名注冊商一般都提供;

2、部署簡單:就是在網絡拓撲進行設備擴增,然后在Dns服務器上添加記錄。

DNS輪詢均衡的缺點:

1、流量分配不均:Dns解析過程其實環(huán)節(jié)很多,而且是一種層層緩存的機制,你的dns服務器雖然進行更新,但是客戶機、以及網絡上其它的dns服務器不會實時更新,所以流量很難保證100%的平均。目前,dns服務器都提供了多種手段可以調整dns輪詢分配的策略,但是確實無法保證很完美的均衡。

2、健康檢查:Dns服務器中A記錄地址中的某一臺服務器宕機,DNS服務器是無法知道的,仍舊會將訪問分配到此服務器。所以需要人員或者工具進行實時檢測,在某臺機器宕機之后,把備份機推上生產線,如果想要從A記錄地址摘除某個地址,這個通知過程需要幾個小時甚至更久才能擴散到所有的客戶機。

Dns輪詢方式推到服務的最前端還是很有效的,它通過最原始的方式,把訪問用戶映射到不同的服務集群上。對于大型網站來講,對外服務的IP地址是不可能經常變動的,而且后端的集群一旦宕掉,可以迅速推上冗余集群。再加上,一般都是經過CDN部署,服務被拆分到各個局部,所以在運營過程中不會產生太大的影響。

3. OSI七層模型

我們接下來講講七層均衡。要理解四七層均衡的原理,就先要回憶一下大學課本里學的網絡七層模型(OSI)。

OSI是一個開放性的通行系統(tǒng)互連參考模型,他是一個定義的非常好的協(xié)議規(guī)范。OSI模型有7層結構,每層都可以有幾個子層。

OSI七層模型是一個很好的理論模型,但是在實際應用中都做了裁剪。尤其是TCP/IP的盛行,把7層結構壓成了4層,

所以很多人都批評OSI七層模型過于復雜,但是作為一個完整的全面的網絡模型,還是被大家非常認可的。OSI的7層從上到下分別是應用層、表示層、會話層、傳輸層、網絡層、數(shù)據(jù)鏈路層、物理層。

OSI 7層的功能描述:

(1)應用層:與其他計算機進行通訊的一個應用,它是對應應用程序的通信服務的。例如,一個沒有通信功能的字處理程序就不能執(zhí)行通信的代碼,從事字處理工作的程序員也不關心OSI的第7層。但是,如果添加了一個傳輸文件的選項,那么字處理器的程序員就需要實現(xiàn)OSI的第7層。示例:telnet,HTTP,FTP,WWW,NFS,SMTP等。

(2)表示層:這一層的主要功能是定義數(shù)據(jù)格式及加密。例如,F(xiàn)TP允許你選擇以二進制或ASII格式傳輸。如果選擇二進制,那么發(fā)送方和接收方不改變文件的內容。如果選擇ASII格式,發(fā)送方將把文本從發(fā)送方的字符集轉換成標準的ASII后發(fā)送數(shù)據(jù)。在接收方將標準的ASII轉換成接收方計算機的字符集。示例:加密,ASII等。

(3)會話層:他定義了如何開始、控制和結束一個會話,包括對多個雙向小時的控制和管理,以便在只完成連續(xù)消息的一部分時可以通知應用,從而使表示層看到的數(shù)據(jù)是連續(xù)的,在某些情況下,如果表示層收到了所有的數(shù)據(jù),則用數(shù)據(jù)代表表示層。示例:RPC,SQL等。

(4)傳輸層:這層的功能包括是否選擇差錯恢復協(xié)議還是無差錯恢復協(xié)議,及在同一主機上對不同應用的數(shù)據(jù)流的輸入進行復用,還包括對收到的順序不對的數(shù)據(jù)包的重新排序功能。示例:TCP,UDP,SPX。

(5)網絡層:這層對端到端的包傳輸進行定義,他定義了能夠標識所有結點的邏輯地址,還定義了路由實現(xiàn)的方式和學習的方式。為了適應最大傳輸單元長度小于包長度的傳輸介質,網絡層還定義了如何將一個包分解成更小的包的分段方法。示例:IP,IPX等。

(6)數(shù)據(jù)鏈路層:他定義了在單個鏈路上如何傳輸數(shù)據(jù)。這些協(xié)議與被討論的歌種介質有關。示例:ATM,F(xiàn)DDI等。

(7)物理層:OSI的物理層規(guī)范是有關傳輸介質的特性標準,這些規(guī)范通常也參考了其他組織制定的標準。連接頭、針、針的使用、電流、電流、編碼及光調制等都屬于各種物理層規(guī)范中的內容。物理層常用多個規(guī)范完成對所有細節(jié)的定義。

【編輯推薦】

  1. CDN:讓網絡訪問更高效
  2. 大型網站架構不得不考慮的10個問題
  3. 大中型網站架構探秘
責任編輯:yangsai 來源: ITpub
相關推薦

2017-09-04 08:49:17

存儲原理架構

2010-03-17 08:55:10

ASP.NETWeb Server

2019-04-02 08:00:39

閃存架構共享

2021-03-26 09:49:22

架構并行處理

2012-02-21 09:36:30

云計算飛天云計算

2022-01-14 18:59:06

網絡攻擊黑客網絡安全

2021-12-14 15:52:52

網絡攻擊漏洞網絡安全

2012-07-24 08:54:15

2022-03-17 05:53:25

DDoS網絡攻擊

2019-03-10 21:32:18

區(qū)塊鏈區(qū)塊鏈技術比特幣

2015-06-12 09:58:51

2022-01-19 11:52:44

網絡攻擊烏克蘭網站癱瘓

2020-10-16 07:03:17

Scrapy爬蟲框架

2015-09-22 09:43:31

2020-10-15 19:22:09

Menger機器學習強化學習

2016-01-29 20:23:23

華為

2009-04-09 09:32:00

VoWLANWLAN

2010-09-01 15:16:49

WLAN交換機結構

2017-04-26 13:30:24

爬蟲數(shù)據(jù)采集數(shù)據(jù)存儲

2022-05-13 14:13:05

黑客WordPress網網絡攻擊
點贊
收藏

51CTO技術棧公眾號