自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

分庫(kù)分表實(shí)戰(zhàn):尋根問底—MySQL索引是如何形成的?

數(shù)據(jù)庫(kù) MySQL
正確的使用索引,我們就能有效的把磁盤IO的次數(shù)降到常數(shù)級(jí),這樣查詢速度將會(huì)變得非???,接下來讓我們深入了解下MySQL的索引。

問題分析:為什么查詢變慢呢?

我們知道了MySQL查詢的全過程,也知道了整個(gè)過程的瓶頸在于磁盤IO,那怎么降低磁盤IO次數(shù)呢?

答案就是索引。

正確的使用索引,我們就能有效的把磁盤IO的次數(shù)降到常數(shù)級(jí),這樣查詢速度將會(huì)變得非常快,接下來讓我們深入了解下MySQL的索引。

無索引時(shí),為什么查詢會(huì)很慢呢?

在磁盤中,MYSQL存放數(shù)據(jù)的基本單位是數(shù)據(jù)頁,數(shù)據(jù)是放在數(shù)據(jù)頁中的,每個(gè)數(shù)據(jù)頁中都有很多的數(shù)據(jù)行,如下圖:

分庫(kù)分表實(shí)戰(zhàn)(5):尋根問底—MySQL索引是如何形成的?

可以看到,在數(shù)據(jù)頁的數(shù)據(jù)區(qū)中存放著很多數(shù)據(jù)行,這些數(shù)據(jù)行就對(duì)應(yīng)數(shù)據(jù)表中的一行行數(shù)據(jù),它們都是通過單向鏈表方式連接組合起來的。

而多個(gè)數(shù)據(jù)頁之間又是通過雙向鏈表的方式連接起來的,如下圖:

分庫(kù)分表實(shí)戰(zhàn)(5):尋根問底—MySQL索引是如何形成的?

而一個(gè)數(shù)據(jù)頁的大小默認(rèn)為16KB,16KB的大小肯定是不可能放得下一整張表的數(shù)據(jù)的,所以MYSQL表中的數(shù)據(jù),比如我們的訂單表中的訂單數(shù)據(jù),會(huì)通過這樣雙向鏈表的結(jié)構(gòu)放在多個(gè)數(shù)據(jù)頁中。

如果我們要查詢一條數(shù)據(jù)的話,就要沿著雙向鏈表一個(gè)個(gè)去尋找。比如,我們要查詢主鍵為1的那條數(shù)據(jù),我們可以從數(shù)據(jù)頁1開始查詢。

首先,將數(shù)據(jù)頁1從磁盤中加載到MYSQL內(nèi)存中,如果發(fā)現(xiàn)數(shù)據(jù)頁1中沒有找到我們想要的那條數(shù)據(jù),我們就要沿著雙向鏈表一直尋找下去。

最糟糕的情況,就是我們沿著數(shù)據(jù)頁1、數(shù)據(jù)頁2、一直到最后,我們?cè)谧詈笠粋€(gè)數(shù)據(jù)頁100中才找到我們想要的那條數(shù)據(jù),但在這之前,我們得要把數(shù)據(jù)頁1一直到數(shù)據(jù)頁100,將這100個(gè)數(shù)據(jù)頁通過磁盤IO加載到內(nèi)存中,相當(dāng)于是全表掃描了。

就算MYSQL中有預(yù)讀機(jī)制存在,可能會(huì)預(yù)先發(fā)生幾次磁盤IO,提前加載一些數(shù)據(jù)頁到內(nèi)存中,但這100個(gè)數(shù)據(jù)頁同樣至少會(huì)導(dǎo)致幾十次磁盤IO了,而磁盤IO這個(gè)過程是很耗費(fèi)性能的。

MYSQL的索引是如何形成的呢?

那有沒有什么辦法,能夠讓我們盡量快的定位到數(shù)據(jù)頁,而不至于全表掃描呢?

這件事,就要交給索引來處理了。

順著數(shù)據(jù)頁的雙向鏈表數(shù)據(jù)結(jié)構(gòu)一個(gè)個(gè)去尋找,未免顯得太費(fèi)力了,我們可以為每個(gè)數(shù)據(jù)頁創(chuàng)建一個(gè)目錄,查詢數(shù)據(jù)時(shí),先到目錄里看一樣有沒有自己想要的數(shù)據(jù),這樣不就快很多了嗎。

首先,我們看下數(shù)據(jù)頁內(nèi)部的構(gòu)造:

分庫(kù)分表實(shí)戰(zhàn)(5):尋根問底—MySQL索引是如何形成的?

比如,我們以數(shù)據(jù)頁1舉例,數(shù)據(jù)頁1中有很多的數(shù)據(jù)行,數(shù)據(jù)行之間都是用指針連接,并且以單向鏈表的方式組織起來的,并且單向鏈表中主鍵一定是保證有序的,無序的數(shù)據(jù)是沒法創(chuàng)建索引的。

可以看到,數(shù)據(jù)行前面的 0、2、3 表示記錄的類型,也就是數(shù)據(jù)行的類型,0表示普通類型,就是表中的一行普通數(shù)據(jù),2表示最小記錄,3表示最大記錄,因?yàn)槲覀兌贾罃?shù)據(jù)行對(duì)應(yīng)的主鍵都是有順序的。

這里為了方便展示索引,我們假設(shè)每個(gè)數(shù)據(jù)頁中都有20條數(shù)據(jù),當(dāng)我們建立索引之后,如下圖:

分庫(kù)分表實(shí)戰(zhàn)(5):尋根問底—MySQL索引是如何形成的?

可以看到,索引頁中會(huì)記錄每個(gè)數(shù)據(jù)頁中最小的主鍵即id的值,以及對(duì)應(yīng)的數(shù)據(jù)頁號(hào),而索引頁就發(fā)揮了我們剛提到的數(shù)據(jù)頁目錄的效果。

索引頁其實(shí)也是數(shù)據(jù)頁,只不過是我們拿來專門存放數(shù)據(jù)頁的目錄信息而已,可以看到索引頁中的記錄類型,除了2和3之外還有1,1表示的是目錄的類型,因?yàn)樗侵赶蚓唧w的某個(gè)數(shù)據(jù)頁的。

而如果數(shù)據(jù)頁很多的話,一個(gè)索引頁中肯定就放不下這些目錄信息,此時(shí),MYSQL會(huì)把超出索引頁的目錄信息放到新的索引頁中,然后向上再擴(kuò)展出一個(gè)索引頁,如下圖:

分庫(kù)分表實(shí)戰(zhàn)(5):尋根問底—MySQL索引是如何形成的?

可以看到,數(shù)據(jù)頁3和數(shù)據(jù)頁4的目錄信息,被放到了索引頁2中,然后索引3作為擴(kuò)展出來的索引頁,記錄索引頁1和索引頁2中的最小主鍵值以及索引頁號(hào),也就是說索引頁3中記錄的信息,就相當(dāng)于更上一層索引的目錄信息了。

如果索引頁3中的容量也不夠了,這個(gè)時(shí)候,同樣會(huì)把超出索引頁3的信息,放到新的一個(gè)同層級(jí)的索引頁中,然后再向上擴(kuò)展一層,如下圖:

分庫(kù)分表實(shí)戰(zhàn)(5):尋根問底—MySQL索引是如何形成的?

可以看到,在索引頁3中的信息放不下之后,就會(huì)放到索引頁4中,然后向上再拓展一層索引5,索引5中存放的就是索引3和索引4的目錄信息,規(guī)律都是一樣的。

而圖片中,我們可以看到,索引頁逐層的往上擴(kuò)展,看起來就像一棵樹一樣,這也就是我們經(jīng)常說的B+索引樹,圖片中索引的高度為3層,一般就可以存放千萬級(jí)別的數(shù)據(jù)了。

為什么利用索引查詢就能變快呢?

我們?cè)賮砜聪聞偛胚@張圖:

分庫(kù)分表實(shí)戰(zhàn)(5):尋根問底—MySQL索引是如何形成的?

有了索引之后,如果我們要查詢主鍵為1的那條數(shù)據(jù),就可以從B+索引樹最上面的那個(gè)索引頁開始查詢。

如圖,我們可以把索引頁5先加載到內(nèi)存,此時(shí)會(huì)發(fā)生一次磁盤IO,然后再通過二分法,根據(jù)主鍵值1,到索引頁5中快速的和各個(gè)目錄項(xiàng)中的最小主鍵值對(duì)比一下,然后找到下一個(gè)索引頁3,通過索引頁3又可以定位到下一個(gè)索引頁1。

在這顆B+索引樹中,通過二分法對(duì)比最小主鍵值的方式,最終在索引頁1中發(fā)現(xiàn),原來主鍵值為1的那條數(shù)據(jù),是位于數(shù)據(jù)頁1中,此時(shí),我們就可以針對(duì)性的把數(shù)據(jù)頁1加載到內(nèi)存,然后在內(nèi)存中就可以查到主鍵為1的數(shù)據(jù)了。

通過這樣的方式可以發(fā)現(xiàn),我們不需要像之前無索引一樣全表掃描,挨個(gè)加載數(shù)據(jù)頁到內(nèi)存中,而是利用索引頁,通過高效的二分法查找,很快就可以定位到數(shù)據(jù)具體是在哪個(gè)數(shù)據(jù)頁中。

并且這個(gè)過程中我們也發(fā)現(xiàn),就算是上千萬級(jí)別的數(shù)據(jù)量,我們也可以做到只發(fā)生個(gè)位數(shù)磁盤IO,就可以查詢到數(shù)據(jù),這也是為什么用了索引之后查詢的效率明顯提高的原因。

所以,接下來的sql優(yōu)化,關(guān)鍵在于要想辦法讓sql語句能利用索引查數(shù)據(jù),這樣的話查詢的效率才會(huì)上來,但是有時(shí)會(huì)有很多因素,導(dǎo)致不能正常讓sql語句使用索引,這也是接下來sql優(yōu)化的一個(gè)關(guān)鍵點(diǎn)。

結(jié)束語

好了,通過剛才的索引原理,我們知道千萬級(jí)的數(shù)據(jù)量,B+樹基本也就是三到四層,那么如果正常使用到了索引,性能通常不是問題,所以問題原因基本可以確定是因?yàn)閟ql沒有使用到索引,也就是索引失效了。

責(zé)任編輯:武曉燕 來源: 今日頭條
相關(guān)推薦

2022-01-21 07:56:39

MySQL索引數(shù)據(jù)

2022-10-13 17:43:10

MySQL存放數(shù)據(jù)

2021-09-08 09:48:39

數(shù)據(jù)庫(kù)工具技術(shù)

2020-11-18 09:39:02

MySQL數(shù)據(jù)庫(kù)SQL

2022-10-10 17:37:59

分庫(kù)分表訂單業(yè)務(wù)

2022-07-11 08:16:47

NewSQL關(guān)系數(shù)據(jù)庫(kù)系統(tǒng)

2022-10-11 17:51:49

分庫(kù)分表數(shù)據(jù)庫(kù)

2020-07-28 09:04:09

NewSQL分庫(kù)分表

2020-07-30 17:59:34

分庫(kù)分表SQL數(shù)據(jù)庫(kù)

2022-06-30 07:34:46

分庫(kù)分表外賣訂單系統(tǒng)

2022-07-01 10:37:18

分庫(kù)分表數(shù)據(jù)庫(kù)

2018-09-21 15:50:58

數(shù)據(jù)庫(kù)MySQL分庫(kù)分表

2019-07-31 09:27:23

數(shù)據(jù)庫(kù)MySQLSQL

2019-01-29 19:24:06

分庫(kù)分表數(shù)據(jù)庫(kù)

2021-07-28 15:44:52

Java開發(fā)數(shù)據(jù)庫(kù)

2019-11-12 09:54:20

分庫(kù)分表數(shù)據(jù)

2024-11-22 15:32:19

2024-07-26 00:16:11

2021-01-25 20:50:10

MySQL海量存儲(chǔ)InnoDB

2019-05-13 15:00:14

MySQLMyCat數(shù)據(jù)庫(kù)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)