自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

設(shè)計(jì)了一個(gè)支撐數(shù)億用戶的系統(tǒng)

開發(fā) 前端
用戶(或客戶端)連接到 DNS 系統(tǒng),以獲得我們系統(tǒng)所在的服務(wù)器的互聯(lián)網(wǎng)協(xié)議(IP)地址。一旦獲得 IP 地址,請(qǐng)求就會(huì)直接發(fā)送到我們的系統(tǒng)。

要設(shè)計(jì)出一套能支撐幾十億人的系統(tǒng)是很困難的。對(duì)于軟件架構(gòu)師來(lái)說(shuō),這一直是一項(xiàng)很大的挑戰(zhàn),但是,從現(xiàn)在開始,看完我的文章,你就會(huì)覺(jué)得容易很多了。

下面是我在本文中提到的幾個(gè)話題:

  • 從最簡(jiǎn)單的開始:萬(wàn)事合一。
  • 可擴(kuò)展性的藝術(shù):縱向擴(kuò)展,橫向擴(kuò)展。
  • 擴(kuò)展關(guān)系型數(shù)據(jù)庫(kù):主 - 從復(fù)制、主 - 主復(fù)制、聯(lián)合、分片、非規(guī)范化和 SQL 調(diào)優(yōu)。
  • 使用哪種數(shù)據(jù)庫(kù):NoSQL 還是 SQL?
  • 先進(jìn)概念:緩存、CDN、geoDNS 等。

在這篇文章里,我不打算談?wù)撝T如容錯(cuò)、可靠性、高可用性等高性能計(jì)算的通用術(shù)語(yǔ)。

1. 從頭開始

在下圖中,我要先設(shè)計(jì)一個(gè)有一些用戶的基本應(yīng)用。最容易的方式是在一臺(tái)服務(wù)器上部署整個(gè)應(yīng)用。我們中的大部分人可能都是這樣開始的。

  • 一個(gè)網(wǎng)站(包括 API)在 Apache(或 Tomcat)等網(wǎng)絡(luò)服務(wù)器上運(yùn)行。
  • 一個(gè) Oracle(或 MySQL)之類的數(shù)據(jù)庫(kù)。

圖片

我們?cè)谕慌_(tái)物理機(jī)上同時(shí)擁有 Web 服務(wù)器和數(shù)據(jù)庫(kù)服務(wù)器

  • 但是,當(dāng)前的架構(gòu)存在下列缺陷:
  • 如果數(shù)據(jù)庫(kù)出現(xiàn)故障,則系統(tǒng)將失效。

一旦網(wǎng)絡(luò)服務(wù)器出現(xiàn)故障,則會(huì)導(dǎo)致整個(gè)系統(tǒng)的癱瘓。

在這種情況下,我們沒(méi)有故障轉(zhuǎn)移和冗余。如果一個(gè)服務(wù)器出現(xiàn)故障,所有的都將會(huì)失效。

使用 DNS 服務(wù)器來(lái)解析主機(jī)名和 IP 地址

在上圖中,用戶(或客戶端)連接到 DNS 系統(tǒng),以獲得我們系統(tǒng)所在的服務(wù)器的互聯(lián)網(wǎng)協(xié)議(IP)地址。一旦獲得 IP 地址,請(qǐng)求就會(huì)直接發(fā)送到我們的系統(tǒng)。

每次訪問(wèn)網(wǎng)站時(shí),計(jì)算機(jī)都會(huì)執(zhí)行 DNS 查詢。

通常情況下,域名系統(tǒng)(DNS)服務(wù)器是作為托管公司提供的付費(fèi)服務(wù)使用的,并不在你自己的服務(wù)器上運(yùn)行。

2. 可擴(kuò)展性的藝術(shù)

由于很多原因,我們的系統(tǒng)可能需要進(jìn)行擴(kuò)展,例如數(shù)據(jù)量的增加、工作量的增加(如事務(wù)的數(shù)目),以及用戶的增加。

可擴(kuò)展性一般是指添加更多的資源,在不影響用戶體驗(yàn)的情況下處理更多的用戶、客戶機(jī)、數(shù)據(jù)、事務(wù)或請(qǐng)求。

我們必須決定怎樣才能擴(kuò)大這個(gè)系統(tǒng)的規(guī)模。在這種情況下,有以下兩種類型的擴(kuò)展:縱向擴(kuò)展(scale up) 和橫向擴(kuò)展(scale out)。

圖片

縱向擴(kuò)展 vs 橫向擴(kuò)展

縱向擴(kuò)展:在現(xiàn)有服務(wù)器上增加更多的內(nèi)存和 CPU

這也被稱為“垂直擴(kuò)展”,是指為了提高系統(tǒng)處理日益增長(zhǎng)的負(fù)載的能力而使系統(tǒng)能夠最大限度地利用資源——例如,通過(guò)增加內(nèi)存和 CPU 來(lái)增加服務(wù)器的能力。

如果我們運(yùn)行的服務(wù)器有 8G 的內(nèi)存,那么只要更換或者增加硬件,就可以輕松地提升到 32G,甚至 128G。

有很多方法可以進(jìn)行縱向擴(kuò)展,具體如下:

  • 通過(guò)在 RAID 陣列中增加更多的硬盤來(lái)增加 I/O 容量。
  • 通過(guò)切換到固態(tài)硬盤(SSD)來(lái)改善 I/O 訪問(wèn)時(shí)間。
  • 切換到具有更多處理器的服務(wù)器。
  • 通過(guò)升級(jí)網(wǎng)絡(luò)接口或安裝額外的網(wǎng)絡(luò)接口來(lái)提高網(wǎng)絡(luò)吞吐量。
  • 通過(guò)增加內(nèi)存來(lái)減少 I/O 操作。

對(duì)于小型系統(tǒng)來(lái)說(shuō),縱向擴(kuò)展是一個(gè)很好的選擇,可以負(fù)擔(dān)得起硬件升級(jí),但也存在一些嚴(yán)重的限制,具體如下:

  • “不可能在一臺(tái)服務(wù)器上增加無(wú)限的能力”。這主要取決于操作系統(tǒng)和服務(wù)器的內(nèi)存總線寬度。
  • 給系統(tǒng)升級(jí)內(nèi)存時(shí),必須關(guān)掉服務(wù)器,因此,如果系統(tǒng)只有一臺(tái)服務(wù)器,停機(jī)是不可避免的。
  • 強(qiáng)大的機(jī)器往往要比流行的硬件昂貴很多。

縱向擴(kuò)展不僅適用于硬件方面,也適用于軟件方面,例如,它包括優(yōu)化查詢和應(yīng)用程序代碼。

相比之下,縱向減縮(scale down)是指從現(xiàn)有的服務(wù)器中移除現(xiàn)有的資源,如 CPU、內(nèi)存和磁盤。

您需要多臺(tái)服務(wù)器嗎?

當(dāng)用戶數(shù)量不斷增加時(shí),一臺(tái)服務(wù)器將無(wú)法滿足需求。我們需要考慮將一臺(tái)單獨(dú)的服務(wù)器分離到多臺(tái)服務(wù)器上。

圖片

當(dāng)用戶數(shù)量不斷增加時(shí),一臺(tái)服務(wù)器將無(wú)法滿足需求

采用該架構(gòu)有如下優(yōu)勢(shì):

  • 可對(duì) Web 服務(wù)器進(jìn)行不同于數(shù)據(jù)庫(kù)服務(wù)器的調(diào)優(yōu)。
  • 網(wǎng)絡(luò)服務(wù)器需要更好的 CPU,而數(shù)據(jù)庫(kù)服務(wù)器需要更多的內(nèi)存。
  • 為 Web 層和數(shù)據(jù)層提供單獨(dú)的服務(wù)器,允許它們彼此獨(dú)立地進(jìn)行擴(kuò)展。

橫向擴(kuò)展:添加任意數(shù)量的硬件和軟件實(shí)體

這也被稱為“水平擴(kuò)展”,是指向資源池中添加更多的實(shí)體(如機(jī)器、服務(wù)等)。橫向擴(kuò)展要比縱向擴(kuò)展更難實(shí)現(xiàn),因?yàn)槲覀儽仨氃诮⒁粋€(gè)系統(tǒng)之前就把這個(gè)問(wèn)題考慮進(jìn)去。

開始時(shí),為了滿足最基本的需求,我們需要更多的服務(wù)器,因此橫向擴(kuò)展最初往往花費(fèi)更多,但是到了最后,我們將獲得更多的收益。我們需要權(quán)衡利弊。

服務(wù)器數(shù)量的增長(zhǎng)意味著更多的資源需要維護(hù)。同時(shí),還必須對(duì)系統(tǒng)代碼進(jìn)行修改,以便實(shí)現(xiàn)在多臺(tái)服務(wù)器間進(jìn)行并行和分配工作。

與此相反,橫向減縮(Scale in)指的是刪除現(xiàn)有服務(wù)器的過(guò)程。

3. 使用負(fù)載均衡器來(lái)均衡所有節(jié)點(diǎn)上的流量

負(fù)載均衡器是一種專門的硬件或軟件組件,它可以幫助分散流量到服務(wù)器集群,從而改善系統(tǒng)的響應(yīng)能力和可用性,包括但不限于應(yīng)用程序、網(wǎng)站或數(shù)據(jù)庫(kù)。

圖片

使用負(fù)載均衡器來(lái)均衡所有節(jié)點(diǎn)之間的流量

負(fù)載均衡器一般都是在客戶端與服務(wù)器之間,接受傳入的網(wǎng)絡(luò)及應(yīng)用程序的流量,并利用各種算法,將流量分配到多個(gè)后端服務(wù)器。所以,它也可以用于各種場(chǎng)合,比如 Web 服務(wù)器與數(shù)據(jù)庫(kù)服務(wù)器之間,以及客戶端和 Web 服務(wù)器之間。

HAProxy 和 Nginx 是目前比較受歡迎的開源負(fù)載均衡軟件。

負(fù)載均衡器技術(shù)是一種能夠改善系統(tǒng)可用性的容錯(cuò)保護(hù)方法,具體如下:

  • 如果服務(wù)器 1 脫機(jī),則所有的流量將被路由到服務(wù)器 2 和服務(wù)器 3。網(wǎng)站就不會(huì)脫機(jī)。你還需要在服務(wù)器池中添加一個(gè)新的健康服務(wù)器來(lái)均衡負(fù)載。
  • 當(dāng)流量快速增長(zhǎng)時(shí),你只需要向網(wǎng)站服務(wù)器池添加更多的服務(wù)器,負(fù)載均衡器將為你路由流量。

負(fù)載均衡器通過(guò)不同的策略和任務(wù)分配算法對(duì)負(fù)載進(jìn)行了最優(yōu)分配,具體如下:

  • 循環(huán):在這種情況下,每個(gè)服務(wù)器按順序接收請(qǐng)求,類似于先進(jìn)先出(FIFO)。
  • 最少的連接數(shù):連接數(shù)最少的服務(wù)器將被引導(dǎo)到請(qǐng)求。
  • 最快的響應(yīng)時(shí)間:具有最快響應(yīng)時(shí)間的服務(wù)器(最近或經(jīng)常)將被引導(dǎo)到請(qǐng)求。
  • 加權(quán):較強(qiáng)大的服務(wù)器將比較弱的服務(wù)器收到更多的請(qǐng)求加權(quán)策略。
  • IP 哈希:在這種情況下,計(jì)算客戶的 IP 地址的哈希值,將請(qǐng)求重定向到服務(wù)器。

在多個(gè)服務(wù)器之間均衡請(qǐng)求的最直接方法是使用一個(gè)硬件設(shè)備。

  • 從共享 IP 中添加和刪除真正的服務(wù)器,將會(huì)立即發(fā)生。
  • 負(fù)載均衡可以根據(jù)需要進(jìn)行。

軟件負(fù)載均衡是硬件負(fù)載均衡器的一個(gè)廉價(jià)替代品。其操作于第 4 層(網(wǎng)絡(luò)層)和第 7 層(應(yīng)用層)。

  • 第 4 層:負(fù)載均衡器使用網(wǎng)絡(luò)層的 TCP 提供的信息。在這一層,它一般不會(huì)查看所請(qǐng)求的內(nèi)容,而是選擇一臺(tái)服務(wù)器。
  • 第 7 層:請(qǐng)求可以根據(jù)查詢字符串、cookies 或我們選擇的任何頭的信息,以及包括源和目標(biāo)地址在內(nèi)的常規(guī)層信息進(jìn)行均衡。

4. 擴(kuò)展關(guān)系數(shù)據(jù)庫(kù)

對(duì)于一個(gè)簡(jiǎn)單的系統(tǒng),我們可以通過(guò) RDBMS,如 Oracle 或者 MySQL 來(lái)存儲(chǔ)數(shù)據(jù)項(xiàng)。然而,關(guān)系數(shù)據(jù)庫(kù)系統(tǒng)也存在著一些問(wèn)題,尤其是在我們需要擴(kuò)展的時(shí)候。

有很多技術(shù)可以擴(kuò)展關(guān)系型數(shù)據(jù)庫(kù):主 - 從復(fù)制、主 - 主復(fù)制、聯(lián)合、分片、非規(guī)范化和 SQL 調(diào)優(yōu)。

  • 復(fù)制 通常指的是一種技術(shù),可以讓我們?cè)诓煌臋C(jī)器上存儲(chǔ)同一數(shù)據(jù)的多個(gè)副本。
  • 聯(lián)合(或功能分區(qū))將數(shù)據(jù)庫(kù)按功能進(jìn)行劃分。
  • 分片 是一種與分區(qū)相關(guān)的數(shù)據(jù)庫(kù)架構(gòu)模式,它將數(shù)據(jù)的不同部分放到不同的服務(wù)器上,不同的用戶將訪問(wèn)數(shù)據(jù)集的不同部分。
  • 非規(guī)范化 試圖以犧牲一些寫入性能為代價(jià)來(lái)提高讀取性能,將數(shù)據(jù)寫入多個(gè)表中以避免昂貴的連接。
  • SQL 調(diào)優(yōu)。

主 - 從復(fù)制

主 - 從復(fù)制技術(shù)使一個(gè)數(shù)據(jù)庫(kù)服務(wù)器(主服務(wù)器)的數(shù)據(jù)被復(fù)制到一個(gè)或多個(gè)其他數(shù)據(jù)庫(kù)服務(wù)器(從服務(wù)器),如下圖所示:

圖片

對(duì)主服務(wù)器進(jìn)行的所有更新

  • 客戶端將連接到主服務(wù)器,并更新數(shù)據(jù)。
  • 數(shù)據(jù)隨后會(huì)在從服務(wù)器上進(jìn)行傳輸,直到所有的數(shù)據(jù)在服務(wù)器上都是一致的。

在實(shí)踐中,還是存在一些瓶頸。

  • 如果主服務(wù)器由于某種原因宕機(jī)了,數(shù)據(jù)仍然可以通過(guò)從服務(wù)器獲得,但是將無(wú)法再進(jìn)行新的寫入。
  • 我們還需要一種新的算法,把一臺(tái)從服務(wù)器提升到主服務(wù)器。

下面是實(shí)現(xiàn)僅一臺(tái)服務(wù)器能處理更新請(qǐng)求的一些解決方案。

  • 同步解決方案:只有當(dāng)所有的服務(wù)器都接受了修改數(shù)據(jù)的事務(wù)(分布式事務(wù))之后,才會(huì)被提交,因此,當(dāng)發(fā)生故障切換時(shí),數(shù)據(jù)不會(huì)丟失。
  • 異步解決方案:提交 → 延遲 → 傳播到集群中的其他服務(wù)器,因此,當(dāng)發(fā)生故障切換時(shí),某些數(shù)據(jù)更新會(huì)丟失。

請(qǐng)記住,如果同步解決方案過(guò)慢,那就改成異步解決方案。

主 - 主復(fù)制

每個(gè)數(shù)據(jù)庫(kù)服務(wù)器都可以在其他服務(wù)器被當(dāng)作主服務(wù)器的同時(shí)充當(dāng)主服務(wù)器。在某個(gè)時(shí)間點(diǎn)上,所有的這服務(wù)器都會(huì)同步,以確保它們的數(shù)據(jù)是正確的、最新的。

圖片

所有節(jié)點(diǎn)讀寫所有數(shù)據(jù)

以下是主 - 主復(fù)制的一些優(yōu)勢(shì):

  • 當(dāng)一臺(tái)主服務(wù)器發(fā)生故障時(shí),其他數(shù)據(jù)庫(kù)服務(wù)器可以正常運(yùn)行,并接替其工作。當(dāng)數(shù)據(jù)庫(kù)服務(wù)器重新上線時(shí),它將利用復(fù)制的方式趕上來(lái)。
  • 主服務(wù)器可以位于幾個(gè)物理站點(diǎn),也可以分布在網(wǎng)絡(luò)上。
  • 受限于主服務(wù)器處理更新的能力。

聯(lián)合

聯(lián)合(或功能分區(qū))將數(shù)據(jù)庫(kù)按功能劃分。例如,你可以有三個(gè)數(shù)據(jù)庫(kù):Forum、users 和 products,而不是一個(gè)單一的單體數(shù)據(jù)庫(kù),這樣就能降低對(duì)各個(gè)數(shù)據(jù)庫(kù)的讀寫流量,因此減少了復(fù)制滯后。

圖片

聯(lián)合按功能劃分?jǐn)?shù)據(jù)庫(kù)

數(shù)據(jù)庫(kù)越小,可以容納在內(nèi)存中的數(shù)據(jù)就越多,這反過(guò)來(lái)會(huì)導(dǎo)致緩存點(diǎn)擊率的增加,這是由于緩存命中的改進(jìn)。因?yàn)椴恍枰獑我坏闹醒胫骺仄餍蛄谢瘜懖僮?,所以你可以進(jìn)行并行寫入,這樣就可以提高吞吐量。

分片

分片(也被稱為數(shù)據(jù)分區(qū)),是一種將大數(shù)據(jù)庫(kù)分成許多小部分的技術(shù),這樣每個(gè)數(shù)據(jù)庫(kù)只能管理數(shù)據(jù)的一個(gè)子集。

在理想情況下,我們有不同的用戶都與不同的數(shù)據(jù)庫(kù)節(jié)點(diǎn)對(duì)話。它有助于提高系統(tǒng)的可管理性、性能、可用性和負(fù)載均衡。

每個(gè)用戶只需要和一個(gè)服務(wù)器對(duì)話,所以可以從該服務(wù)器得到快速的響應(yīng)。

負(fù)載在服務(wù)器之間得到了很好的均衡——例如,如果我們有五個(gè)服務(wù)器,每個(gè)服務(wù)器只需要處理 20% 的負(fù)載。

在實(shí)踐中,有許多不同的技術(shù)可以將一個(gè)數(shù)據(jù)庫(kù)分解成多個(gè)小部分。

水平分區(qū)

這種技術(shù)是將不同的行放到不同的表中。比如,如果我們?cè)谝粋€(gè)表中存儲(chǔ)用戶資料,我們可以決定將 ID 小于 1000 的用戶存儲(chǔ)在一個(gè)表中,而將 ID 大于 1001 小于 2000 的用戶存儲(chǔ)在另一個(gè)表中。

圖片

我們將不同的行放入不同的表中

垂直分區(qū)

在這種情況下,我們對(duì)數(shù)據(jù)進(jìn)行劃分,將與特定特性相關(guān)的表存儲(chǔ)在它們自己的服務(wù)器上。例如,如果我們正在建立一個(gè)類似于 Instagram 的系統(tǒng)——需要存儲(chǔ)與用戶、他們上傳的照片以及他們所關(guān)注的人有關(guān)的數(shù)據(jù)——我們可以決定將用戶的資料信息放在一臺(tái)數(shù)據(jù)庫(kù)服務(wù)器上,好友列表放在另一臺(tái)服務(wù)器上,而照片放在第三臺(tái)服務(wù)器上。

圖片

我們將數(shù)據(jù)劃分,存儲(chǔ)與特定特性相關(guān)的表,并將其存儲(chǔ)在各自的服務(wù)器上。

基于目錄的分區(qū)

解決這個(gè)問(wèn)題的一個(gè)松散耦合的方法,就是創(chuàng)建一個(gè)查詢服務(wù),它了解你當(dāng)前的分區(qū)模式,并保持每個(gè)實(shí)體以及存儲(chǔ)在哪個(gè)數(shù)據(jù)庫(kù)分片的映射關(guān)系。

當(dāng)數(shù)據(jù)存儲(chǔ)可能需要擴(kuò)展到超出單個(gè)存儲(chǔ)節(jié)點(diǎn)的可用資源時(shí),或者通過(guò)減少數(shù)據(jù)存儲(chǔ)中的爭(zhēng)用來(lái)提高性能時(shí),我們可以使用這種方法。但請(qǐng)記住,分片技術(shù)存在以下一些常見(jiàn)問(wèn)題:

  • 數(shù)據(jù)庫(kù)連接變得更加昂貴,在某些情況下是不可行的。
  • 分片會(huì)破壞數(shù)據(jù)庫(kù)的引用完整性。
  • 數(shù)據(jù)庫(kù)模式的改變會(huì)變得非常昂貴。
  • 數(shù)據(jù)分布不均勻,而且在分片上有大量負(fù)載。

非規(guī)范化

非規(guī)范化的目的是提高讀取性能,但卻要犧牲一定的寫入性能。為了避免昂貴的連接,可以將數(shù)據(jù)的冗余副本寫入到多個(gè)表中。

一旦數(shù)據(jù)通過(guò)聯(lián)合和分片等技術(shù)變得分散,管理跨數(shù)據(jù)中心的連接將會(huì)進(jìn)一步增加復(fù)雜性。非規(guī)范化可以避免需要如此復(fù)雜的連接。

在大多數(shù)系統(tǒng)中,讀取操作的次數(shù)遠(yuǎn)遠(yuǎn)多于寫入操作,大約是 100:1,甚至是 1000:1。導(dǎo)致讀取復(fù)雜數(shù)據(jù)庫(kù)連接可能會(huì)非常昂貴,而且會(huì)耗費(fèi)很多時(shí)間在磁盤上。

有些 RDBMS,像 PostgreSQL 和 Oracle 都支持物化視圖,它們可以處理存儲(chǔ)冗余數(shù)據(jù),并使冗余副本保持一致。

Facebook 的 Ryan Mack 在其出色的文章《建立時(shí)間表:利用非規(guī)范化的力量擴(kuò)大規(guī)模來(lái)保存你的生活故事》(Building Timeline: Scaling up to hold your life story)中分享了很多時(shí)間表自身的實(shí)現(xiàn)故事。

5. 使用哪個(gè)數(shù)據(jù)庫(kù)?

在數(shù)據(jù)庫(kù)領(lǐng)域,主要有兩種類型的解決方案。SQL 與 NoSQL。它們的構(gòu)建方式、存儲(chǔ)信息的類型以及存儲(chǔ)方式都有所不同。

SQL

關(guān)系型數(shù)據(jù)庫(kù)以行和列的形式存儲(chǔ)數(shù)據(jù)。每一行包含一個(gè)實(shí)體的所有信息,每一列包含所有獨(dú)立的數(shù)據(jù)點(diǎn)。

目前最受歡迎的關(guān)系型數(shù)據(jù)庫(kù)是 MySQL、Oracle、MS SQL Server、SQLite、Postgres 和 MariaDB。

NoSQL

它也被稱為非關(guān)系型數(shù)據(jù)庫(kù)。這些數(shù)據(jù)庫(kù)一般分為五大類別:Key-Value、Graph、Column、Document 和 Blob 存儲(chǔ)。

鍵值存儲(chǔ)

數(shù)據(jù)被存儲(chǔ)在一個(gè)鍵值對(duì)的數(shù)組中。key(鍵)是一個(gè)與 value(值)相連的屬性名稱。

知名的鍵值存儲(chǔ)有 Redis、Voldemort 和 Dynamo。

文檔數(shù)據(jù)庫(kù)

在這些數(shù)據(jù)庫(kù)中,數(shù)據(jù)被存儲(chǔ)在文檔中(而不是表格中的行和列),這些文檔被分組在集合中。每個(gè)文檔都可能是截然不同的結(jié)構(gòu)。

文檔數(shù)據(jù)庫(kù)包括 CouchDB 和 MongoDB。

寬列式數(shù)據(jù)庫(kù)

在列式數(shù)據(jù)庫(kù)中,我們沒(méi)有“表”,而是有列族,它們是行的容器。與關(guān)系型數(shù)據(jù)庫(kù)不同,我們不必事先了解所有的列,也不必要求每一行的列數(shù)目都相同。

列式數(shù)據(jù)庫(kù)最適合分析大型數(shù)據(jù)集,著名的有 Cassandra 和 HBase。

圖數(shù)據(jù)庫(kù)

這些數(shù)據(jù)庫(kù)用于存儲(chǔ)數(shù)據(jù),其關(guān)系最好用圖來(lái)表示。數(shù)據(jù)被保存在帶有節(jié)點(diǎn)(實(shí)體)、屬性(關(guān)于實(shí)體的信息)和線(實(shí)體之間的連接)的圖結(jié)構(gòu)中。

圖數(shù)據(jù)庫(kù)的例子包括 Neo4J 和 InfiniteGraph。

Blob 數(shù)據(jù)庫(kù)

Blob 更像是文件的鍵 / 值存儲(chǔ),可以通過(guò) Amazon S3、Windows Azure Blob Storage、Google Cloud Storage、Rackspace Cloud Files 或 OpenStack Swift 等 API 訪問(wèn)。

如何選擇要使用的數(shù)據(jù)庫(kù)?

當(dāng)涉及數(shù)據(jù)庫(kù)技術(shù)時(shí),沒(méi)有放之四海而皆準(zhǔn)的解決方案。這就是為什么許多企業(yè)同時(shí)依賴 SQL 和 NoSQL 數(shù)據(jù)庫(kù)來(lái)滿足不同的需求。

請(qǐng)看下面我畫的思維導(dǎo)圖!

圖片

使用哪個(gè)數(shù)據(jù)庫(kù)?

6. 橫向擴(kuò)展 Web 層

我們已經(jīng)擴(kuò)展了數(shù)據(jù)層,現(xiàn)在我們也需要擴(kuò)展 Web 層。為了做到這一點(diǎn),我們需要將用戶會(huì)話的數(shù)據(jù)(狀態(tài))移出 Web 層,將其存儲(chǔ)在數(shù)據(jù)庫(kù)中,如關(guān)系型數(shù)據(jù)庫(kù)或 NoSQL。這也被稱為無(wú)狀態(tài)架構(gòu)。

圖片

無(wú)狀態(tài)系統(tǒng)很簡(jiǎn)單。

不要使用有狀態(tài)架構(gòu);由于狀態(tài)的實(shí)現(xiàn)會(huì)限制可擴(kuò)展性。降低可用性和提高成本,所以我們需要盡可能地選擇無(wú)狀態(tài)架構(gòu)。

在上面的場(chǎng)景中,由于可以為最優(yōu)的請(qǐng)求處理選擇任意服務(wù)器,因此負(fù)載均衡器能夠可以達(dá)到最高的效率。

7. 先進(jìn)概念

緩存

負(fù)載均衡能夠幫助你橫向擴(kuò)展越來(lái)越多的服務(wù)器,但緩存可以讓你更好地利用現(xiàn)有的資源,從而更快速地向下一個(gè)請(qǐng)求提供數(shù)據(jù)。

圖片

如果數(shù)據(jù)不在緩存中,就從數(shù)據(jù)庫(kù)中獲取,然后保存到緩存中,再?gòu)木彺嬷凶x取。

我們可以在服務(wù)器中添加緩存,避免從服務(wù)器中直接讀取網(wǎng)頁(yè)或數(shù)據(jù),從而降低了服務(wù)器的響應(yīng)時(shí)間及負(fù)載。這使得我們的應(yīng)用程序更加易于擴(kuò)展。

緩存可以被用于許多層,例如數(shù)據(jù)庫(kù)層、Web 服務(wù)器層和網(wǎng)絡(luò)層。

內(nèi)容分發(fā)網(wǎng)絡(luò) (CDN )

CDN 服務(wù)器保存內(nèi)容(如圖像、網(wǎng)頁(yè)等)的緩存副本,并從最近的位置提供服務(wù)。

CDN 的使用可以提高用戶的頁(yè)面加載時(shí)間,因?yàn)閿?shù)據(jù)是在離它最近的地方檢索的。這也有助于提高內(nèi)容的可用性,因?yàn)樗淮鎯?chǔ)在多個(gè)地點(diǎn)。

使用 CDN 改善了用戶的頁(yè)面加載時(shí)間,因?yàn)閿?shù)據(jù)是在最接近它的地方被檢索到的。

CDN 服務(wù)器向我們的網(wǎng)絡(luò)服務(wù)器發(fā)出請(qǐng)求,以驗(yàn)證被緩存的內(nèi)容,并在需要時(shí)更新它們。被緩存的內(nèi)容通常是靜態(tài)的,如 HTML 頁(yè)面、圖像、JavaScript 文件、CSS 文件等。

走向全球

隨著你的應(yīng)用程序在全球范圍內(nèi)推廣,你將會(huì)在全球范圍內(nèi)建立和運(yùn)營(yíng)數(shù)據(jù)中心,使你的產(chǎn)品每天 24 小時(shí)、每周 7 天保持運(yùn)行。收到的請(qǐng)求將被路由到基于 GeoDNS 的“最佳”數(shù)據(jù)中心。

圖片

當(dāng)你的應(yīng)用程序走向全球時(shí)……

GeoDNS 是一項(xiàng) DNS 服務(wù),它可以將一個(gè)域名按照用戶所在的位置解析為 IP 地址。來(lái)自亞洲的客戶端可以得到與來(lái)自歐洲客戶端的不同 IP 地址。

把它整合在一起

通過(guò)迭代應(yīng)用所有這些技術(shù),我們可以輕松地將系統(tǒng)擴(kuò)展到 1 億多用戶,如無(wú)狀態(tài)架構(gòu)、應(yīng)用負(fù)載均衡器、盡可能多地使用緩存數(shù)據(jù)、支持多個(gè)數(shù)據(jù)中心、在 CDN 上托管靜態(tài)資產(chǎn)、通過(guò)分片擴(kuò)展你的數(shù)據(jù)層,諸如此類。

圖片

擴(kuò)展是一個(gè)迭代的過(guò)程

責(zé)任編輯:武曉燕 來(lái)源: 碼猿技術(shù)專欄
相關(guān)推薦

2020-03-03 07:59:29

設(shè)計(jì)秒殺系統(tǒng)

2014-04-15 11:15:00

2023-01-18 17:50:35

系統(tǒng)架構(gòu)Kafka

2024-09-29 15:50:51

2013-12-10 23:17:00

2018-11-01 13:23:02

網(wǎng)關(guān)APIHTTP

2020-07-27 07:53:36

高并發(fā)流量系統(tǒng)

2018-11-26 08:06:24

API網(wǎng)關(guān)億級(jí)

2016-03-31 17:06:02

2018-09-18 09:38:11

RPC遠(yuǎn)程調(diào)用網(wǎng)絡(luò)通信

2015-11-11 17:20:48

2014-08-05 10:19:08

2024-04-24 10:38:22

2024-11-20 13:18:21

2019-08-09 10:45:09

操作系統(tǒng)WindowsLinux

2023-09-08 08:10:48

2023-09-08 08:22:30

2024-08-27 12:49:20

2020-09-02 07:22:17

JavaScript插件框架

2020-10-27 07:29:43

架構(gòu)系統(tǒng)流量
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)