自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

What?老板讓我開發(fā)一個(gè)億級(jí)流量的大型網(wǎng)站

開發(fā) 架構(gòu) 開發(fā)工具
我們常見的大型網(wǎng)站,如百度、淘寶、京東等,都是一個(gè)分布式系統(tǒng)。這么復(fù)雜的系統(tǒng)也不是一天建成的,每個(gè)系統(tǒng)都經(jīng)歷了漫長的演變過程。

我們常見的大型網(wǎng)站,如百度、淘寶、京東等,都是一個(gè)分布式系統(tǒng)。這么復(fù)雜的系統(tǒng)也不是一天建成的,每個(gè)系統(tǒng)都經(jīng)歷了漫長的演變過程。

[[277068]]

圖片來自 Pexels 

對(duì)于一個(gè)大型網(wǎng)站,主要有以下幾個(gè)特征:

  • 支撐海量數(shù)據(jù)
  • 非常高的訪問量

在大型網(wǎng)站中,其最核心的功能就是計(jì)算和存儲(chǔ)。因此系統(tǒng)演變過程也主要圍繞這兩點(diǎn)進(jìn)行。

單機(jī)系統(tǒng)

在網(wǎng)站剛剛起步時(shí),數(shù)據(jù)量、訪問量都非常小,通常情況下,只需一臺(tái)應(yīng)用服務(wù)器就可以了。

單機(jī)部署方案

起步時(shí),我們把所有資源全部打包到部署文件中(如 XXX.war),其中包括:

  • class 文件、依賴 jar 等。
  • js、css、圖片等靜態(tài)資源。
  • 對(duì)于用戶上傳文件的場景,直接在服務(wù)器上新建一個(gè)目錄,將上傳的文件放置在目錄即可。

然后,將打好的發(fā)布包放到 Web 容器中,比如 Tomcat,最后啟動(dòng)容器,讓其直接對(duì)外提供服務(wù)。

該部署策略有以下幾個(gè)特征: 

  • 用戶通過瀏覽器直接與 Java 應(yīng)用程序進(jìn)行交互(通常是 Tomcat)。
  • Java 應(yīng)用程序通過 JDBC 與本機(jī)的數(shù)據(jù)庫進(jìn)行交互(如 MySQL)。
  • 如果存在文件讀寫的需求,Java 應(yīng)用程序通過文件接口直接對(duì)文件進(jìn)行操作。

這時(shí),有人會(huì)問,Java 應(yīng)用程序直接對(duì)外,會(huì)不會(huì)存在一些安全或性能方面的問題呢?

是的,Tomcat 這種 Web 容器對(duì)鏈接的保持能力比較弱,當(dāng)存在大量鏈接時(shí),性能下降很快。

同時(shí),Tomcat 并不擅長靜態(tài)資源的處理,對(duì)此,我們可以引入 Nginx,以緩解 Tomcat 的壓力。

單機(jī)部署方案進(jìn)階

我們?cè)趩螜C(jī)部署基礎(chǔ)上,添加 Nginx,也就有了進(jìn)階方案:

 

該方案存在以下特征:

  • 用戶不在直接與 Java 應(yīng)用程序進(jìn)行交互,而是與 Nginx 進(jìn)行交互。
  • Tomcat 掛在 Nginx 后,對(duì)動(dòng)態(tài)請(qǐng)求進(jìn)行處理。
  • 對(duì)于靜態(tài)資源的訪問,通過 Nginx 直接訪問文件系統(tǒng)。
  • 當(dāng)有文件寫需求時(shí),通過 Java 應(yīng)用程序直接寫入磁盤。

此時(shí),架構(gòu)顯得清晰很多,但我們發(fā)現(xiàn)一個(gè)問題,就是系統(tǒng)對(duì)靜態(tài)資源和動(dòng)態(tài)資源的處理是完全不同的。

對(duì)于靜態(tài)資源的處理,相對(duì)簡單,只是簡單的文件讀寫。而,動(dòng)態(tài)請(qǐng)求(也就是我們的業(yè)務(wù)承載者)會(huì)隨著業(yè)務(wù)的發(fā)展越來越復(fù)雜。

動(dòng)靜分離部署方案

由于靜態(tài)請(qǐng)求與動(dòng)態(tài)請(qǐng)求采用不同的處理策略,我們可以將其進(jìn)行分離。

 

該部署方案存在以下特性:

  • 通過不同的域名對(duì)動(dòng)態(tài)請(qǐng)求和靜態(tài)請(qǐng)求進(jìn)行分離。
  • 新增靜態(tài)資源服務(wù)器,專門處理靜態(tài)請(qǐng)求,并在服務(wù)器上部署 Java 應(yīng)用程序,處理文件寫需求;Nginx 只負(fù)責(zé)文件的讀操作。
  • 對(duì)動(dòng)態(tài)請(qǐng)求進(jìn)行獨(dú)立部署,應(yīng)用程序?qū)⑽募膶懻?qǐng)求轉(zhuǎn)發(fā)到靜態(tài)服務(wù)器進(jìn)行處理。

靜態(tài)資源服務(wù)器功能單一,部署繁瑣,有沒有一種更好的策略呢?

答案就是云服務(wù),比如阿里云的 OSS 提供靜態(tài)資源存儲(chǔ)服務(wù)。CDN 提供訪問加速服務(wù),兩者結(jié)合使用,就得到了一個(gè)海量容量并且性能超強(qiáng)的靜態(tài)資源服務(wù)器(集群)。

結(jié)合 OSS 和 CDN,靜態(tài)請(qǐng)求不會(huì)成為系統(tǒng)的瓶頸,因此,接下來只對(duì)動(dòng)態(tài)請(qǐng)求進(jìn)行討論。

隨著系統(tǒng)訪問量的增加,動(dòng)態(tài)請(qǐng)求出現(xiàn)了明顯的瓶頸。

應(yīng)用集群化部署

由于所有的動(dòng)態(tài)請(qǐng)求全部由一臺(tái)應(yīng)用服務(wù)器進(jìn)行處理,當(dāng)訪問量上升時(shí),這臺(tái)服務(wù)就成了系統(tǒng)的瓶頸。

此時(shí),我們需要將系統(tǒng)中的多個(gè)組件部署到不同的服務(wù)器上。

 

新部署有以下特征:

  • 對(duì) Nginx 進(jìn)行獨(dú)立部署,形成 Web 集群。
  • 對(duì) Java 應(yīng)用程序進(jìn)行獨(dú)立部署,形成應(yīng)用集群。
  • 對(duì)數(shù)據(jù)庫進(jìn)行獨(dú)立部署。
  • Web 集群與應(yīng)用集群間通過 HTTP 協(xié)議進(jìn)行交互。
  • 應(yīng)用集群與數(shù)據(jù)庫間通過 JDBC 協(xié)議進(jìn)行交互。

應(yīng)用集群化,會(huì)面臨很多挑戰(zhàn),主要的焦點(diǎn)是如何有效的分配用戶請(qǐng)求。

DNS 輪詢

首先要解決的問題便是,用戶如何將請(qǐng)求發(fā)送到不同的 Nginx 中,最常見的方式便是 DNS 輪詢。

大多域名注冊(cè)商都支持多條 A 記錄的解析,其實(shí)這就是 DNS 輪詢,DNS 服務(wù)器將解析請(qǐng)求按照 A 記錄的順序,逐一分配到不同的 IP 上,這樣就完成了簡單的負(fù)載均衡。

負(fù)載均衡器

這里的負(fù)載均衡器主要指的是 Nginx 的反向代理功能。當(dāng)用戶請(qǐng)求發(fā)送到 Nginx 后,Nginx 需要決定將請(qǐng)求轉(zhuǎn)發(fā)到哪臺(tái)應(yīng)用服務(wù)器上。

反向代理(Reverse Proxy)是指以代理服務(wù)器來接受 Internet 上的連接請(qǐng)求,然后將請(qǐng)求轉(zhuǎn)發(fā)給內(nèi)部網(wǎng)絡(luò)上的服務(wù)器,并將從服務(wù)器上得到的結(jié)果返回給 Internet 上請(qǐng)求連接的客戶端,此時(shí)代理服務(wù)器對(duì)外就表現(xiàn)為一個(gè)反向代理服務(wù)器。

Nginx 對(duì)于后臺(tái)服務(wù)器配置比較靈活,可以同時(shí)配置多臺(tái)服務(wù)器,并根據(jù)負(fù)載策略將請(qǐng)求分發(fā)給后臺(tái)服務(wù)器。

會(huì)話問題

在單機(jī)時(shí)代,我們的請(qǐng)求只會(huì)發(fā)送到同一臺(tái)機(jī)器上,不存在會(huì)話問題。當(dāng)將應(yīng)用集群部署時(shí),用戶的多次請(qǐng)求會(huì)發(fā)送到不同的應(yīng)用服務(wù)器上。此時(shí),如何對(duì)會(huì)話進(jìn)行同步便是棘手問題。

①Session Sticky

這種方案主要由 Nginx 處理,讓同樣 Session 請(qǐng)求每次都發(fā)送到同一臺(tái)服務(wù)器進(jìn)行處理。

Nginx 會(huì)將相同用戶的請(qǐng)求發(fā)送到同一臺(tái)應(yīng)用服務(wù)器中。

這是最簡單的策略,但存在一定的問題:

  • Web 服務(wù)器重啟 Session 丟失。
  • 負(fù)載均衡需要進(jìn)行應(yīng)用層解析(第 7 層),性能損耗較大。
  • 負(fù)載均衡器變?yōu)橐粋€(gè)有狀態(tài)的點(diǎn),不易容災(zāi)。

②Session Replication

會(huì)話問題的根源在于 Session 由多個(gè)應(yīng)用維護(hù),我們可以使用某種機(jī)制,在多臺(tái) Web 服務(wù)間進(jìn)行 Session 的數(shù)據(jù)同步。

由 Session 同步器在各個(gè) Java 應(yīng)用程序間完成 Session 的同步,最終使每個(gè)服務(wù)器中都存在所有用戶的 Session 數(shù)據(jù)。

這個(gè)方案的問題:

  • 造成網(wǎng)絡(luò)開銷。
  • 每臺(tái) Web 服務(wù)器都保存所有的 Session,內(nèi)存開銷大。

③集中式 Session

我們可以將 Session 從 Web 服務(wù)中抽取出來,并對(duì)其進(jìn)行集中存儲(chǔ)。

將 Session 信息保存到 Session 存儲(chǔ)集群中,Java 應(yīng)用程序不在負(fù)責(zé) Session 的存儲(chǔ)。

這個(gè)方案的問題:

  • 讀取 Session 引入了網(wǎng)絡(luò)開銷。
  • 存儲(chǔ)設(shè)施問題影響應(yīng)用。

④Cookie Based Session

還可以將 Session 數(shù)據(jù)放在 Cookie 中,然后在 Web 服務(wù)器上從 Cookie 中生成對(duì)應(yīng)的 Session 數(shù)據(jù)。

將 Session 數(shù)據(jù)編碼到 Cookie 中,每次 Java 應(yīng)用程序使用 Session 時(shí),都從 Cookie 中重建 Session。

該方案的問題:

  • 受到 Cookie 大小的限制。
  • 存在安全性問題。
  • 每次都攜帶巨大的 Cookie,帶寬消耗嚴(yán)重。
  • 每次都進(jìn)行 Session 數(shù)據(jù)恢復(fù),加大應(yīng)用服務(wù)器的負(fù)擔(dān)。

隨著系統(tǒng)訪問量的持續(xù)增加,面對(duì)大量的數(shù)據(jù)讀取請(qǐng)求,數(shù)據(jù)庫有些不堪重負(fù)。此時(shí),我們需要對(duì)數(shù)據(jù)庫進(jìn)行優(yōu)化。

數(shù)據(jù)庫讀寫分離

通常情況下,數(shù)據(jù)庫的讀會(huì)成為系統(tǒng)的瓶頸。對(duì)此,我們可以使用數(shù)據(jù)庫主從機(jī)制,通過添加多個(gè)從庫來減緩讀壓力。

與之前部署相比,該架構(gòu)只是為數(shù)據(jù)庫增加了若干個(gè)從庫:

  • 對(duì)數(shù)據(jù)庫實(shí)施主從部署策略。
  • 對(duì)于數(shù)據(jù)的寫請(qǐng)求,只能在主庫上進(jìn)行。
  • 對(duì)于數(shù)據(jù)的讀請(qǐng)求,可以在任意的從庫上進(jìn)行。
  • 主庫與從庫間,通過數(shù)據(jù)庫同步策略進(jìn)行數(shù)據(jù)同步。

由于主庫與從庫間的數(shù)據(jù)同步需要時(shí)間,會(huì)出現(xiàn)數(shù)據(jù)不一致的情況,這塊是業(yè)務(wù)上需要慎重考慮的一點(diǎn)。

隨著業(yè)務(wù)越來越復(fù)雜,對(duì)功能和性能的要求也越來越高,最常見的便是數(shù)據(jù)庫 like 語句性能已經(jīng)無法滿足需求;對(duì)于某些熱點(diǎn)數(shù)據(jù)的訪問,其性能也下降很快。

此時(shí),我們需要引入其他組件來有針對(duì)性的解決問題。

引入搜索和緩存

針對(duì)數(shù)據(jù)庫的 like 語句,通常情況下,是通過引入搜索引擎來解決;而熱點(diǎn)數(shù)據(jù)的訪問加速,是通過引入緩存服務(wù)來解決。

該架構(gòu)的特征如下:

  • 添加搜索集群,用以提升數(shù)據(jù)檢索性能。
  • 添加緩存集群,用以提升熱點(diǎn)數(shù)據(jù)訪問性能。

在對(duì)數(shù)據(jù)查詢進(jìn)行優(yōu)化后,慢慢的系統(tǒng)的寫性能成為了瓶頸。此時(shí),需要對(duì)數(shù)據(jù)的寫性能進(jìn)行擴(kuò)展。

數(shù)據(jù)庫分庫分表

隨著數(shù)據(jù)量的增長,寫請(qǐng)求量的增加,數(shù)據(jù)庫的寫入逐漸成為了瓶頸。常規(guī)的寫性能優(yōu)化便是對(duì)數(shù)據(jù)庫進(jìn)行分庫分表。

垂直拆分

將不同的業(yè)務(wù)數(shù)據(jù)放到不同的數(shù)據(jù)庫實(shí)例中。

水平切分

把同一個(gè)表中的數(shù)據(jù)拆分到多個(gè)數(shù)據(jù)庫中。

隨著研發(fā)團(tuán)隊(duì)的規(guī)模越來越多,大家同時(shí)在一個(gè)項(xiàng)目中進(jìn)行開發(fā),導(dǎo)致頻繁的沖突和相互影響。

此時(shí),會(huì)將整個(gè)應(yīng)用程序根據(jù)功能模塊進(jìn)行拆分,從而形成多個(gè)子網(wǎng)站或子頻道。

應(yīng)用垂直拆分

面對(duì)一個(gè)巨無霸式的應(yīng)用,就像面對(duì)一團(tuán)毛線團(tuán),總有一種無法下手的感覺。對(duì)此,可以將其進(jìn)行拆分,將其拆分為多個(gè)應(yīng)用,每個(gè)應(yīng)用獨(dú)立開發(fā)、獨(dú)立部署、獨(dú)立維護(hù)。

該部署方案更加靈活,大大降低維護(hù)成本:

  • 通過不同的域名或 URL 將整個(gè)系統(tǒng)分解為多個(gè)子系統(tǒng)。
  • 用戶通過瀏覽器將各子系統(tǒng)拼接成一個(gè)完整的系統(tǒng)。
  • 各系統(tǒng)間存在少量交互,甚至沒有交互。

問題慢慢展現(xiàn)出來,系統(tǒng)間公共部分沒有統(tǒng)一維護(hù)點(diǎn),同樣的功能、同樣的代碼分布在各個(gè)系統(tǒng)中。

當(dāng)然,我們可以通過發(fā)布 jar 包的方式,共享功能代碼;但當(dāng) jar 升級(jí)時(shí),就需要所有的子系統(tǒng)同步升級(jí),運(yùn)維開銷巨大。此時(shí),我們需要引入服務(wù)化架構(gòu)。

服務(wù)化架構(gòu)

我們可以將通用功能封裝成一個(gè)服務(wù),獨(dú)立開發(fā)、獨(dú)立部署、獨(dú)立維護(hù)。

在該方案中,我們將業(yè)務(wù)邏輯進(jìn)行了進(jìn)一步拆分:

  • 整理各個(gè)系統(tǒng)間通用業(yè)務(wù)功能,將其封裝為服務(wù),以承載核心業(yè)務(wù)邏輯,構(gòu)建成服務(wù)集群。
  • 原來的子系統(tǒng)或子頻道,變成薄薄的一層,不承載核心業(yè)務(wù),只是根據(jù)業(yè)務(wù)流程對(duì)業(yè)務(wù)服務(wù)進(jìn)行編排。
  • 應(yīng)用服務(wù)與業(yè)務(wù)服務(wù)間通過 HTTP 或其他協(xié)議進(jìn)行通信,常見的包括 Dubbo、Thrift 等。

服務(wù)化解決了系統(tǒng)之間的直接調(diào)用問題,也就是常說的 RPC,整個(gè)系統(tǒng)的協(xié)調(diào)點(diǎn)全部由應(yīng)用服務(wù)完成。

這種架構(gòu)適用于多種場景,但在一些需要異步處理的極端場景就顯得有心無力了。此時(shí),我們需要引入消息中間件。

引入消息隊(duì)列

服務(wù)化解決了直接調(diào)用問題,對(duì)于異步調(diào)用,最常見的便是消息中間件。

相比之前的架構(gòu),變化很小,只是在各個(gè)業(yè)務(wù)服務(wù)間添加了另外的一種調(diào)用方式。

小結(jié)

冰凍三尺非一日之寒,一個(gè)大型系統(tǒng)的構(gòu)建也不是一朝一夕的事情。我們需要根據(jù)業(yè)務(wù)情況、數(shù)據(jù)量情況、請(qǐng)求量情況對(duì)系統(tǒng)進(jìn)行合理規(guī)劃。

切記,架構(gòu)不是越復(fù)雜越好,而是“適合自己的便是最好的”。

 

責(zé)任編輯:武曉燕 來源: geekhalo
相關(guān)推薦

2020-03-03 07:59:29

設(shè)計(jì)秒殺系統(tǒng)

2021-04-09 08:13:14

API網(wǎng)關(guān)互聯(lián)網(wǎng)

2021-08-31 07:11:48

MySQL億級(jí)流量

2018-09-25 15:27:00

開發(fā)者

2018-12-20 09:52:05

JVM內(nèi)存分配

2021-06-02 06:49:18

Redis緩存設(shè)計(jì).

2018-11-01 13:23:02

網(wǎng)關(guān)APIHTTP

2021-10-14 09:51:17

架構(gòu)運(yùn)維技術(shù)

2021-03-02 07:54:18

流量網(wǎng)關(guān)設(shè)計(jì)

2022-08-19 09:12:19

數(shù)據(jù)庫開發(fā)

2025-04-22 08:57:27

2017-03-24 17:17:35

限流節(jié)流系統(tǒng)

2018-11-26 08:06:24

API網(wǎng)關(guān)億級(jí)

2021-03-05 07:47:07

工作流引擎節(jié)點(diǎn)

2013-06-19 09:59:07

2020-09-01 07:49:14

JVM流量系統(tǒng)

2020-12-28 05:54:37

構(gòu)造builder模式

2021-03-11 08:32:58

參數(shù)模式構(gòu)造

2016-12-14 10:00:44

數(shù)據(jù)結(jié)構(gòu)編譯器

2021-12-03 10:47:28

WOT技術(shù)峰會(huì)技術(shù)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)