自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

為什么 MySQL 單表不能超過 2000 萬行?

數(shù)據(jù)庫 MySQL
互聯(lián)網(wǎng)江湖上的確流傳著一個(gè)說法:?jiǎn)伪頂?shù)據(jù)量超過 500 萬行時(shí)就要進(jìn)行分表分庫,已經(jīng)超過 2000 萬行時(shí) MySQL 的性能就會(huì)急劇下降。

互聯(lián)網(wǎng)江湖上的確流傳著一個(gè)說法:?jiǎn)伪頂?shù)據(jù)量超過 500 萬行時(shí)就要進(jìn)行分表分庫,已經(jīng)超過 2000 萬行時(shí) MySQL 的性能就會(huì)急劇下降。

那么,MySQL 一張表最多能存多少數(shù)據(jù)?

今天我們就從技術(shù)層面剖析一下,MySQL 單表數(shù)據(jù)不能過大的根本原因是什么?

猜想一:是索引深度嗎?

很多人認(rèn)為:數(shù)據(jù)量超過 500 萬行或 2000 萬行時(shí),引起 B+tree 的高度增加,延長(zhǎng)了索引的搜索路徑,進(jìn)而導(dǎo)致了性能下降。事實(shí)果真如此嗎?

我們先理一下關(guān)系,MySQL 采用了索引組織表的形式組織數(shù)據(jù),葉子節(jié)點(diǎn)存儲(chǔ)數(shù)據(jù),非葉子節(jié)點(diǎn)存儲(chǔ)主鍵與頁面號(hào)的映射關(guān)系。若用戶的主鍵長(zhǎng)度是 8 字節(jié)時(shí),MySQL 中頁面偏移占 4 個(gè)字節(jié),在非葉子節(jié)點(diǎn)的時(shí)候?qū)嶋H上是 8+4=12 個(gè)字節(jié),12 個(gè)字節(jié)表示一個(gè)頁面的映射關(guān)系。

MySQL 默認(rèn)是 16K 的頁面,拋開它的配置 header,大概就是 15K,因此,非葉子節(jié)點(diǎn)的索引頁面可放 15*1024/12=1280 條數(shù)據(jù),按照每行 1K 計(jì)算,每個(gè)葉子節(jié)點(diǎn)可以存 15 條數(shù)據(jù)。同理,三層就是 15*1280*1280=24576000 條數(shù)據(jù)。只有數(shù)據(jù)量達(dá)到 24576000 條時(shí),深度才會(huì)增加為 4,所以,索引深度沒有那么容易增加,詳細(xì)數(shù)據(jù)可參考下表:

搜索路徑延長(zhǎng)導(dǎo)致性能下降的說法,與當(dāng)時(shí)的機(jī)械硬盤和內(nèi)存條件不無關(guān)系。

之前機(jī)械硬盤的 IOPS 在 100 左右,而現(xiàn)在普遍使用的 SSD 的 IOPS 已經(jīng)過萬,之前的內(nèi)存最大幾十 G,現(xiàn)在服務(wù)器內(nèi)存最大可達(dá)到 TB 級(jí)。

因此,即使深度增加,以目前的硬件資源,IO 也不會(huì)成為限制 MySQL 單表數(shù)據(jù)量的根本性因素。

那么,限制 MySQL 單表不能過大的根本性因素是什么?

猜想二:是 SMO 無法并發(fā)嗎?

我們可以嘗試從 MySQL 所采用的存儲(chǔ)引擎 InnoDB 本身來探究一下。

大家知道 InnoDB 引擎使用的是索引組織表,它是通過索引來組織數(shù)據(jù)的,而它采用 B+tree 作為索引的數(shù)據(jù)結(jié)構(gòu)。

B+Tree 操作非原子,所以當(dāng)一個(gè)線程做結(jié)構(gòu)調(diào)整(SMO,Struction-Modification-Operation)時(shí)一般會(huì)涉及多個(gè)節(jié)點(diǎn)的改動(dòng)。

SMO 動(dòng)作過程中,此時(shí)若有另一個(gè)線程進(jìn)來可能會(huì)訪問到錯(cuò)誤的 B+Tree 結(jié)構(gòu),InnoDB 為了解決這個(gè)問題采用了樂觀鎖和悲觀鎖的并發(fā)控制協(xié)議。

InnoDB 對(duì)于葉子節(jié)點(diǎn)的修改操作如下:

方式一,先采用樂觀鎖的方式嘗試進(jìn)行修改

對(duì)根節(jié)點(diǎn)加 S 鎖(shared lock,叫共享鎖,也稱讀鎖),依次對(duì)非葉子節(jié)點(diǎn)加 S 鎖。

如果葉子節(jié)點(diǎn)的修改不會(huì)引起 B+Tree 結(jié)構(gòu)變動(dòng),如分裂、合并等操作,那么只需要對(duì)葉子節(jié)點(diǎn)進(jìn)行加 X 鎖(exclusive lock,叫排他鎖,也稱為寫鎖)即可完成修改。如下圖中所示 :


方式二,采用悲觀鎖的方式

如果對(duì)葉子結(jié)點(diǎn)的修改會(huì)觸發(fā) SMO,那么會(huì)采用悲觀鎖的方式。

采用悲觀鎖,需要重新遍歷 B+Tree,對(duì)根節(jié)點(diǎn)加全局 SX 鎖(SX 鎖是行鎖),然后從根節(jié)點(diǎn)到葉子節(jié)點(diǎn)可能修改的節(jié)點(diǎn)加 X 鎖。

在整個(gè) SMO 過程中,根節(jié)點(diǎn)始終持有 SX 鎖(SX 鎖表示有意向修改這個(gè)保護(hù)的范圍,SX 鎖與 SX 鎖、X 鎖沖突,與 S 鎖不沖突),此時(shí)其他的 SMO 則需要等待。

因此,InnoDB 對(duì)于簡(jiǎn)單的主鍵查詢比較快,因?yàn)閿?shù)據(jù)都存儲(chǔ)在葉子節(jié)點(diǎn)中,但對(duì)于數(shù)據(jù)量大且改操作比較多的 TP 型業(yè)務(wù),并發(fā)會(huì)有很嚴(yán)重的瓶頸問題。

在對(duì)葉子節(jié)點(diǎn)的修改操作中,InnoDB 可以實(shí)現(xiàn)較好的 1 與 1、1 與 2 的并發(fā),但是無法解決 2 的并發(fā)。因?yàn)樵诜绞?2 中,根節(jié)點(diǎn)始終持有 SX 鎖,必須串行執(zhí)行,等待上一個(gè) SMO 操作完成。這樣在具有大量的 SMO 操作時(shí),InnoDB 的 B+Tree 實(shí)現(xiàn)就會(huì)出現(xiàn)很嚴(yán)重的性能瓶頸。

解決方案

目前業(yè)界有一個(gè)更好的方案 B-Link Tree,與 B+Tree 相比,B-Link Tree 優(yōu)化了 B+Tree 結(jié)構(gòu)調(diào)整時(shí)的鎖粒度,只需要逐層加鎖,無需對(duì) root 節(jié)點(diǎn)加全局鎖。因此,可以做到在 SMO 過程中寫操作的并發(fā)執(zhí)行,保持高并發(fā)下性能的穩(wěn)定。

B-Link Tree 主要改進(jìn)點(diǎn)有 2 個(gè):

1. 中間節(jié)點(diǎn)增加 link 指針,指向右兄弟節(jié)點(diǎn);

2. 每個(gè)節(jié)點(diǎn)內(nèi)增加字段 high key,存儲(chǔ)該節(jié)點(diǎn)中最大的 key 值。

新增的 link 指針是為了解決 SMO 過程中并發(fā)寫的問題,在 SMO 過程中,B-Link Tree 對(duì)修改節(jié)點(diǎn)逐層加鎖,修改完一層即可放鎖,然后去加上一層節(jié)點(diǎn)的鎖繼續(xù)修改。這樣在 InnoDB 引擎中被 SMO 阻塞的寫操作可以有機(jī)會(huì)在 SMO 操作過程中并發(fā)進(jìn)行。

如下圖所示,在節(jié)點(diǎn) 2 分裂為節(jié)點(diǎn) 2 和 4 的過程中,只需要在最后一步將父節(jié)點(diǎn) 1 指向新節(jié)點(diǎn) 4 時(shí),對(duì)父節(jié)點(diǎn) 1 加鎖,其他操作均無需對(duì)父節(jié)點(diǎn)加鎖,更無需對(duì) root 節(jié)點(diǎn)加鎖,因此,大大提升了 SMO 過程中寫操作的并發(fā)度。

圖片圖片

由此可見,與 B+Tree 全局加鎖對(duì)比,B-Link Tree 在高并發(fā)操作下的性能是顯著優(yōu)于 B+Tree 的。GaussDB 當(dāng)前采用的就是 B-Link Tree 索引數(shù)據(jù)結(jié)構(gòu)。

InnoDB 的索引組織表更容易觸發(fā) SMO

索引組織表的葉子節(jié)點(diǎn),存儲(chǔ)主鍵以及應(yīng)對(duì)行的數(shù)據(jù),InnoDB 默認(rèn)頁面為 16K,若每行數(shù)據(jù)的大小為 1000 字節(jié),每個(gè)葉子節(jié)點(diǎn)僅能存儲(chǔ) 16 行數(shù)據(jù)。

在索引組織表中,當(dāng)葉子節(jié)點(diǎn)的扇出值過低時(shí),SMO 的觸發(fā)將更加頻繁,進(jìn)而放大了 SMO 無法并發(fā)寫的缺陷。

目前業(yè)界有一個(gè)堆組織表的數(shù)據(jù)組織方案,也是華為云數(shù)據(jù)庫 GaussDB 采用的方案。它的葉子節(jié)點(diǎn)存儲(chǔ)索引鍵以及對(duì)應(yīng)的行指針(所在的頁面編號(hào)及頁內(nèi)偏移),堆組織表葉子節(jié)點(diǎn)可以存更多的數(shù)據(jù),分析可得在同樣的數(shù)據(jù)量與業(yè)務(wù)并發(fā)量下,堆組織表會(huì)比索引組織表發(fā)生 SMO 概率低許多。

性能對(duì)比

在 8U32G 的兩臺(tái)服務(wù)器分別搭建了 MySQL(B+Tree 和索引組織表)與 GaussDB(B-Link Tree 和堆組織表)的環(huán)境,進(jìn)行了如下性能驗(yàn)證:

實(shí)驗(yàn)場(chǎng)景:在基礎(chǔ)表的場(chǎng)景上,測(cè)試增量隨機(jī)插入性能。

1. 基礎(chǔ)表總大小 10G,包含主鍵隨機(jī)分布的 1000w 行數(shù)據(jù),每行數(shù)據(jù) 1k;

2. 插入主鍵隨機(jī)分布的 1000w 行數(shù)據(jù),每行數(shù)據(jù)大小 1k,測(cè)試并發(fā)插入性能。

結(jié)論:隨著并發(fā)數(shù)的上升,GaussDB 能穩(wěn)步提升系統(tǒng)的 TPS,而 MySQL 并發(fā)數(shù)的提高并不能帶來 TPS 的顯著提升。

綜上所述,MySQL 無法支持大數(shù)據(jù)量下并發(fā)修改的根本原因,是由于其索引并發(fā)控制協(xié)議的缺陷造成的,而 MySQL 選擇索引組織表,又放大了這一缺陷。所以,開源 MySQL 數(shù)據(jù)庫更適用于主鍵查詢?yōu)橹鞯暮?jiǎn)單業(yè)務(wù)場(chǎng)景,如互聯(lián)網(wǎng)類應(yīng)用,對(duì)于復(fù)雜的商業(yè)場(chǎng)景限制比較明顯。

責(zé)任編輯:華軒 來源: 微技術(shù)之家
相關(guān)推薦

2022-10-31 08:29:37

MySQL單表參數(shù)

2019-09-10 09:06:01

MySQL經(jīng)驗(yàn)數(shù)值黃金鐵律

2019-06-23 15:04:42

MySQL單表數(shù)據(jù)數(shù)值

2019-06-27 16:40:30

MySQL單表數(shù)據(jù)數(shù)據(jù)庫

2018-10-15 09:20:08

代碼軟件工程師

2009-08-20 16:34:50

Linux源代碼紅帽Linux內(nèi)核

2021-03-02 13:56:24

Linux 5.12代碼驅(qū)動(dòng)

2024-08-05 10:44:32

MySQL磁盤I/O

2018-12-05 09:20:02

MySQL數(shù)據(jù)庫索引

2019-01-03 09:29:15

Linux 系統(tǒng) 數(shù)據(jù)

2023-06-28 14:18:06

2020-02-24 16:27:19

開源大數(shù)據(jù)計(jì)算引擎

2009-07-21 08:44:14

微軟Linux內(nèi)核開源操作系統(tǒng)

2018-05-13 15:24:33

工程師程序windows

2017-03-23 14:07:55

代碼程序員

2015-09-01 16:26:18

Linux內(nèi)核

2020-05-27 14:10:50

代碼開發(fā)工具

2020-08-17 17:10:54

機(jī)器學(xué)習(xí)聚類開發(fā)

2009-07-21 08:51:33

微軟發(fā)布Linux設(shè)備微軟開源虛擬化

2011-05-03 09:10:12

項(xiàng)目管理程序員
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)