What?老板讓我開發(fā)一個(gè)億級(jí)流量的大型網(wǎng)站
我們常見的大型網(wǎng)站,如百度、淘寶、京東等,都是一個(gè)分布式系統(tǒng)。這么復(fù)雜的系統(tǒng)也不是一天建成的,每個(gè)系統(tǒng)都經(jīng)歷了漫長的演變過程。
圖片來自 Pexels
對(duì)于一個(gè)大型網(wǎng)站,主要有以下幾個(gè)特征:
- 支撐海量數(shù)據(jù)
- 非常高的訪問量
在大型網(wǎng)站中,其最核心的功能就是計(jì)算和存儲(chǔ)。因此系統(tǒng)演變過程也主要圍繞這兩點(diǎn)進(jìn)行。
單機(jī)系統(tǒng)
在網(wǎng)站剛剛起步時(shí),數(shù)據(jù)量、訪問量都非常小,通常情況下,只需一臺(tái)應(yīng)用服務(wù)器就可以了。
單機(jī)部署方案
起步時(shí),我們把所有資源全部打包到部署文件中(如 XXX.war),其中包括:
- class 文件、依賴 jar 等。
- js、css、圖片等靜態(tài)資源。
- 對(duì)于用戶上傳文件的場景,直接在服務(wù)器上新建一個(gè)目錄,將上傳的文件放置在目錄即可。
然后,將打好的發(fā)布包放到 Web 容器中,比如 Tomcat,最后啟動(dòng)容器,讓其直接對(duì)外提供服務(wù)。
該部署策略有以下幾個(gè)特征:
- 用戶通過瀏覽器直接與 Java 應(yīng)用程序進(jìn)行交互(通常是 Tomcat)。
- Java 應(yīng)用程序通過 JDBC 與本機(jī)的數(shù)據(jù)庫進(jìn)行交互(如 MySQL)。
- 如果存在文件讀寫的需求,Java 應(yīng)用程序通過文件接口直接對(duì)文件進(jìn)行操作。
這時(shí),有人會(huì)問,Java 應(yīng)用程序直接對(duì)外,會(huì)不會(huì)存在一些安全或性能方面的問題呢?
是的,Tomcat 這種 Web 容器對(duì)鏈接的保持能力比較弱,當(dāng)存在大量鏈接時(shí),性能下降很快。
同時(shí),Tomcat 并不擅長靜態(tài)資源的處理,對(duì)此,我們可以引入 Nginx,以緩解 Tomcat 的壓力。
單機(jī)部署方案進(jìn)階
我們?cè)趩螜C(jī)部署基礎(chǔ)上,添加 Nginx,也就有了進(jìn)階方案:
該方案存在以下特征:
- 用戶不在直接與 Java 應(yīng)用程序進(jìn)行交互,而是與 Nginx 進(jìn)行交互。
- Tomcat 掛在 Nginx 后,對(duì)動(dòng)態(tài)請(qǐng)求進(jìn)行處理。
- 對(duì)于靜態(tài)資源的訪問,通過 Nginx 直接訪問文件系統(tǒng)。
- 當(dāng)有文件寫需求時(shí),通過 Java 應(yīng)用程序直接寫入磁盤。
此時(shí),架構(gòu)顯得清晰很多,但我們發(fā)現(xiàn)一個(gè)問題,就是系統(tǒng)對(duì)靜態(tài)資源和動(dòng)態(tài)資源的處理是完全不同的。
對(duì)于靜態(tài)資源的處理,相對(duì)簡單,只是簡單的文件讀寫。而,動(dòng)態(tài)請(qǐng)求(也就是我們的業(yè)務(wù)承載者)會(huì)隨著業(yè)務(wù)的發(fā)展越來越復(fù)雜。
動(dòng)靜分離部署方案
由于靜態(tài)請(qǐng)求與動(dòng)態(tài)請(qǐng)求采用不同的處理策略,我們可以將其進(jìn)行分離。
該部署方案存在以下特性:
- 通過不同的域名對(duì)動(dòng)態(tài)請(qǐng)求和靜態(tài)請(qǐng)求進(jìn)行分離。
- 新增靜態(tài)資源服務(wù)器,專門處理靜態(tài)請(qǐng)求,并在服務(wù)器上部署 Java 應(yīng)用程序,處理文件寫需求;Nginx 只負(fù)責(zé)文件的讀操作。
- 對(duì)動(dòng)態(tài)請(qǐng)求進(jìn)行獨(dú)立部署,應(yīng)用程序?qū)⑽募膶懻?qǐng)求轉(zhuǎn)發(fā)到靜態(tài)服務(wù)器進(jìn)行處理。
靜態(tài)資源服務(wù)器功能單一,部署繁瑣,有沒有一種更好的策略呢?
答案就是云服務(wù),比如阿里云的 OSS 提供靜態(tài)資源存儲(chǔ)服務(wù)。CDN 提供訪問加速服務(wù),兩者結(jié)合使用,就得到了一個(gè)海量容量并且性能超強(qiáng)的靜態(tài)資源服務(wù)器(集群)。
結(jié)合 OSS 和 CDN,靜態(tài)請(qǐng)求不會(huì)成為系統(tǒng)的瓶頸,因此,接下來只對(duì)動(dòng)態(tài)請(qǐng)求進(jìn)行討論。
隨著系統(tǒng)訪問量的增加,動(dòng)態(tài)請(qǐng)求出現(xiàn)了明顯的瓶頸。
應(yīng)用集群化部署
由于所有的動(dòng)態(tài)請(qǐng)求全部由一臺(tái)應(yīng)用服務(wù)器進(jìn)行處理,當(dāng)訪問量上升時(shí),這臺(tái)服務(wù)就成了系統(tǒng)的瓶頸。
此時(shí),我們需要將系統(tǒng)中的多個(gè)組件部署到不同的服務(wù)器上。
新部署有以下特征:
- 對(duì) Nginx 進(jìn)行獨(dú)立部署,形成 Web 集群。
- 對(duì) Java 應(yīng)用程序進(jìn)行獨(dú)立部署,形成應(yīng)用集群。
- 對(duì)數(shù)據(jù)庫進(jìn)行獨(dú)立部署。
- Web 集群與應(yīng)用集群間通過 HTTP 協(xié)議進(jìn)行交互。
- 應(yīng)用集群與數(shù)據(jù)庫間通過 JDBC 協(xié)議進(jìn)行交互。
應(yīng)用集群化,會(huì)面臨很多挑戰(zhàn),主要的焦點(diǎn)是如何有效的分配用戶請(qǐng)求。
DNS 輪詢
首先要解決的問題便是,用戶如何將請(qǐng)求發(fā)送到不同的 Nginx 中,最常見的方式便是 DNS 輪詢。
大多域名注冊(cè)商都支持多條 A 記錄的解析,其實(shí)這就是 DNS 輪詢,DNS 服務(wù)器將解析請(qǐng)求按照 A 記錄的順序,逐一分配到不同的 IP 上,這樣就完成了簡單的負(fù)載均衡。
負(fù)載均衡器
這里的負(fù)載均衡器主要指的是 Nginx 的反向代理功能。當(dāng)用戶請(qǐng)求發(fā)送到 Nginx 后,Nginx 需要決定將請(qǐng)求轉(zhuǎn)發(fā)到哪臺(tái)應(yīng)用服務(wù)器上。
反向代理(Reverse Proxy)是指以代理服務(wù)器來接受 Internet 上的連接請(qǐng)求,然后將請(qǐng)求轉(zhuǎn)發(fā)給內(nèi)部網(wǎng)絡(luò)上的服務(wù)器,并將從服務(wù)器上得到的結(jié)果返回給 Internet 上請(qǐng)求連接的客戶端,此時(shí)代理服務(wù)器對(duì)外就表現(xiàn)為一個(gè)反向代理服務(wù)器。
Nginx 對(duì)于后臺(tái)服務(wù)器配置比較靈活,可以同時(shí)配置多臺(tái)服務(wù)器,并根據(jù)負(fù)載策略將請(qǐng)求分發(fā)給后臺(tái)服務(wù)器。
會(huì)話問題
在單機(jī)時(shí)代,我們的請(qǐng)求只會(huì)發(fā)送到同一臺(tái)機(jī)器上,不存在會(huì)話問題。當(dāng)將應(yīng)用集群部署時(shí),用戶的多次請(qǐng)求會(huì)發(fā)送到不同的應(yīng)用服務(wù)器上。此時(shí),如何對(duì)會(huì)話進(jìn)行同步便是棘手問題。
①Session Sticky
這種方案主要由 Nginx 處理,讓同樣 Session 請(qǐng)求每次都發(fā)送到同一臺(tái)服務(wù)器進(jìn)行處理。
Nginx 會(huì)將相同用戶的請(qǐng)求發(fā)送到同一臺(tái)應(yīng)用服務(wù)器中。
這是最簡單的策略,但存在一定的問題:
- Web 服務(wù)器重啟 Session 丟失。
- 負(fù)載均衡需要進(jìn)行應(yīng)用層解析(第 7 層),性能損耗較大。
- 負(fù)載均衡器變?yōu)橐粋€(gè)有狀態(tài)的點(diǎn),不易容災(zāi)。
②Session Replication
會(huì)話問題的根源在于 Session 由多個(gè)應(yīng)用維護(hù),我們可以使用某種機(jī)制,在多臺(tái) Web 服務(wù)間進(jìn)行 Session 的數(shù)據(jù)同步。
由 Session 同步器在各個(gè) Java 應(yīng)用程序間完成 Session 的同步,最終使每個(gè)服務(wù)器中都存在所有用戶的 Session 數(shù)據(jù)。
這個(gè)方案的問題:
- 造成網(wǎng)絡(luò)開銷。
- 每臺(tái) Web 服務(wù)器都保存所有的 Session,內(nèi)存開銷大。
③集中式 Session
我們可以將 Session 從 Web 服務(wù)中抽取出來,并對(duì)其進(jìn)行集中存儲(chǔ)。
將 Session 信息保存到 Session 存儲(chǔ)集群中,Java 應(yīng)用程序不在負(fù)責(zé) Session 的存儲(chǔ)。
這個(gè)方案的問題:
- 讀取 Session 引入了網(wǎng)絡(luò)開銷。
- 存儲(chǔ)設(shè)施問題影響應(yīng)用。
④Cookie Based Session
還可以將 Session 數(shù)據(jù)放在 Cookie 中,然后在 Web 服務(wù)器上從 Cookie 中生成對(duì)應(yīng)的 Session 數(shù)據(jù)。
將 Session 數(shù)據(jù)編碼到 Cookie 中,每次 Java 應(yīng)用程序使用 Session 時(shí),都從 Cookie 中重建 Session。
該方案的問題:
- 受到 Cookie 大小的限制。
- 存在安全性問題。
- 每次都攜帶巨大的 Cookie,帶寬消耗嚴(yán)重。
- 每次都進(jìn)行 Session 數(shù)據(jù)恢復(fù),加大應(yīng)用服務(wù)器的負(fù)擔(dān)。
隨著系統(tǒng)訪問量的持續(xù)增加,面對(duì)大量的數(shù)據(jù)讀取請(qǐng)求,數(shù)據(jù)庫有些不堪重負(fù)。此時(shí),我們需要對(duì)數(shù)據(jù)庫進(jìn)行優(yōu)化。
數(shù)據(jù)庫讀寫分離
通常情況下,數(shù)據(jù)庫的讀會(huì)成為系統(tǒng)的瓶頸。對(duì)此,我們可以使用數(shù)據(jù)庫主從機(jī)制,通過添加多個(gè)從庫來減緩讀壓力。
與之前部署相比,該架構(gòu)只是為數(shù)據(jù)庫增加了若干個(gè)從庫:
- 對(duì)數(shù)據(jù)庫實(shí)施主從部署策略。
- 對(duì)于數(shù)據(jù)的寫請(qǐng)求,只能在主庫上進(jìn)行。
- 對(duì)于數(shù)據(jù)的讀請(qǐng)求,可以在任意的從庫上進(jìn)行。
- 主庫與從庫間,通過數(shù)據(jù)庫同步策略進(jìn)行數(shù)據(jù)同步。
由于主庫與從庫間的數(shù)據(jù)同步需要時(shí)間,會(huì)出現(xiàn)數(shù)據(jù)不一致的情況,這塊是業(yè)務(wù)上需要慎重考慮的一點(diǎn)。
隨著業(yè)務(wù)越來越復(fù)雜,對(duì)功能和性能的要求也越來越高,最常見的便是數(shù)據(jù)庫 like 語句性能已經(jīng)無法滿足需求;對(duì)于某些熱點(diǎn)數(shù)據(jù)的訪問,其性能也下降很快。
此時(shí),我們需要引入其他組件來有針對(duì)性的解決問題。
引入搜索和緩存
針對(duì)數(shù)據(jù)庫的 like 語句,通常情況下,是通過引入搜索引擎來解決;而熱點(diǎn)數(shù)據(jù)的訪問加速,是通過引入緩存服務(wù)來解決。
該架構(gòu)的特征如下:
- 添加搜索集群,用以提升數(shù)據(jù)檢索性能。
- 添加緩存集群,用以提升熱點(diǎn)數(shù)據(jù)訪問性能。
在對(duì)數(shù)據(jù)查詢進(jìn)行優(yōu)化后,慢慢的系統(tǒng)的寫性能成為了瓶頸。此時(shí),需要對(duì)數(shù)據(jù)的寫性能進(jìn)行擴(kuò)展。
數(shù)據(jù)庫分庫分表
隨著數(shù)據(jù)量的增長,寫請(qǐng)求量的增加,數(shù)據(jù)庫的寫入逐漸成為了瓶頸。常規(guī)的寫性能優(yōu)化便是對(duì)數(shù)據(jù)庫進(jìn)行分庫分表。
垂直拆分
將不同的業(yè)務(wù)數(shù)據(jù)放到不同的數(shù)據(jù)庫實(shí)例中。
水平切分
把同一個(gè)表中的數(shù)據(jù)拆分到多個(gè)數(shù)據(jù)庫中。
隨著研發(fā)團(tuán)隊(duì)的規(guī)模越來越多,大家同時(shí)在一個(gè)項(xiàng)目中進(jìn)行開發(fā),導(dǎo)致頻繁的沖突和相互影響。
此時(shí),會(huì)將整個(gè)應(yīng)用程序根據(jù)功能模塊進(jìn)行拆分,從而形成多個(gè)子網(wǎng)站或子頻道。
應(yīng)用垂直拆分
面對(duì)一個(gè)巨無霸式的應(yīng)用,就像面對(duì)一團(tuán)毛線團(tuán),總有一種無法下手的感覺。對(duì)此,可以將其進(jìn)行拆分,將其拆分為多個(gè)應(yīng)用,每個(gè)應(yīng)用獨(dú)立開發(fā)、獨(dú)立部署、獨(dú)立維護(hù)。
該部署方案更加靈活,大大降低維護(hù)成本:
- 通過不同的域名或 URL 將整個(gè)系統(tǒng)分解為多個(gè)子系統(tǒng)。
- 用戶通過瀏覽器將各子系統(tǒng)拼接成一個(gè)完整的系統(tǒng)。
- 各系統(tǒng)間存在少量交互,甚至沒有交互。
問題慢慢展現(xiàn)出來,系統(tǒng)間公共部分沒有統(tǒng)一維護(hù)點(diǎn),同樣的功能、同樣的代碼分布在各個(gè)系統(tǒng)中。
當(dāng)然,我們可以通過發(fā)布 jar 包的方式,共享功能代碼;但當(dāng) jar 升級(jí)時(shí),就需要所有的子系統(tǒng)同步升級(jí),運(yùn)維開銷巨大。此時(shí),我們需要引入服務(wù)化架構(gòu)。
服務(wù)化架構(gòu)
我們可以將通用功能封裝成一個(gè)服務(wù),獨(dú)立開發(fā)、獨(dú)立部署、獨(dú)立維護(hù)。
在該方案中,我們將業(yè)務(wù)邏輯進(jìn)行了進(jìn)一步拆分:
- 整理各個(gè)系統(tǒng)間通用業(yè)務(wù)功能,將其封裝為服務(wù),以承載核心業(yè)務(wù)邏輯,構(gòu)建成服務(wù)集群。
- 原來的子系統(tǒng)或子頻道,變成薄薄的一層,不承載核心業(yè)務(wù),只是根據(jù)業(yè)務(wù)流程對(duì)業(yè)務(wù)服務(wù)進(jìn)行編排。
- 應(yīng)用服務(wù)與業(yè)務(wù)服務(wù)間通過 HTTP 或其他協(xié)議進(jìn)行通信,常見的包括 Dubbo、Thrift 等。
服務(wù)化解決了系統(tǒng)之間的直接調(diào)用問題,也就是常說的 RPC,整個(gè)系統(tǒng)的協(xié)調(diào)點(diǎn)全部由應(yīng)用服務(wù)完成。
這種架構(gòu)適用于多種場景,但在一些需要異步處理的極端場景就顯得有心無力了。此時(shí),我們需要引入消息中間件。
引入消息隊(duì)列
服務(wù)化解決了直接調(diào)用問題,對(duì)于異步調(diào)用,最常見的便是消息中間件。
相比之前的架構(gòu),變化很小,只是在各個(gè)業(yè)務(wù)服務(wù)間添加了另外的一種調(diào)用方式。
小結(jié)
冰凍三尺非一日之寒,一個(gè)大型系統(tǒng)的構(gòu)建也不是一朝一夕的事情。我們需要根據(jù)業(yè)務(wù)情況、數(shù)據(jù)量情況、請(qǐng)求量情況對(duì)系統(tǒng)進(jìn)行合理規(guī)劃。
切記,架構(gòu)不是越復(fù)雜越好,而是“適合自己的便是最好的”。