自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<blockquote id="pka8u"><p id="pka8u"></p></blockquote>

<legend id="pka8u"><strong id="pka8u"></strong></legend>

<legend id="pka8u"><track id="pka8u"></track></legend>

<cite id="pka8u"></cite>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓

鴻蒙開發(fā)者社區(qū)

WOT技術大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設置退出

分庫分表實戰(zhàn)：尋根問底 — MySQL索引是如何形成的？

作者：儒猿技術團隊 2022-01-21 07:56:39

數(shù)據(jù)庫 MySQL

我們知道了MySQL查詢的全過程，也知道了整個過程的瓶頸在于磁盤IO，那怎么降低磁盤IO次數(shù)呢？

問題分析：為什么查詢變慢呢?

接上期，我們知道了MySQL查詢的全過程，也知道了整個過程的瓶頸在于磁盤IO，那怎么降低磁盤IO次數(shù)呢?

答案就是索引。

正確的使用索引，我們就能有效的把磁盤IO的次數(shù)降到常數(shù)級，這樣查詢速度將會變得非?？?，接下來讓我們深入了解下MySQL的索引。

無索引時，為什么查詢會很慢呢?

在磁盤中，MYSQL存放數(shù)據(jù)的基本單位是數(shù)據(jù)頁，數(shù)據(jù)是放在數(shù)據(jù)頁中的，每個數(shù)據(jù)頁中都有很多的數(shù)據(jù)行，如下圖：

可以看到，在數(shù)據(jù)頁的數(shù)據(jù)區(qū)中存放著很多數(shù)據(jù)行，這些數(shù)據(jù)行就對應數(shù)據(jù)表中的一行行數(shù)據(jù)，它們都是通過單向鏈表方式連接組合起來的。

而多個數(shù)據(jù)頁之間又是通過雙向鏈表的方式連接起來的，如下圖：

而一個數(shù)據(jù)頁的大小默認為16KB，16KB的大小肯定是不可能放得下一整張表的數(shù)據(jù)的，所以MYSQL表中的數(shù)據(jù)，比如我們的訂單表中的訂單數(shù)據(jù)，會通過這樣雙向鏈表的結構放在多個數(shù)據(jù)頁中。

如果我們要查詢一條數(shù)據(jù)的話，就要沿著雙向鏈表一個個去尋找。比如，我們要查詢主鍵為1的那條數(shù)據(jù)，我們可以從數(shù)據(jù)頁1開始查詢。

首先，將數(shù)據(jù)頁1從磁盤中加載到MYSQL內存中，如果發(fā)現(xiàn)數(shù)據(jù)頁1中沒有找到我們想要的那條數(shù)據(jù)，我們就要沿著雙向鏈表一直尋找下去。

最糟糕的情況，就是我們沿著數(shù)據(jù)頁1、數(shù)據(jù)頁2、一直到最后，我們在最后一個數(shù)據(jù)頁100中才找到我們想要的那條數(shù)據(jù)，但在這之前，我們得要把數(shù)據(jù)頁1一直到數(shù)據(jù)頁100，將這100個數(shù)據(jù)頁通過磁盤IO加載到內存中，相當于是全表掃描了。

就算MYSQL中有預讀機制存在，可能會預先發(fā)生幾次磁盤IO，提前加載一些數(shù)據(jù)頁到內存中，但這100個數(shù)據(jù)頁同樣至少會導致幾十次磁盤IO了，而磁盤IO這個過程是很耗費性能的。

MYSQL的索引是如何形成的呢?

那有沒有什么辦法，能夠讓我們盡量快的定位到數(shù)據(jù)頁，而不至于全表掃描呢?

這件事，就要交給索引來處理了。

順著數(shù)據(jù)頁的雙向鏈表數(shù)據(jù)結構一個個去尋找，未免顯得太費力了，我們可以為每個數(shù)據(jù)頁創(chuàng)建一個目錄，查詢數(shù)據(jù)時，先到目錄里看一樣有沒有自己想要的數(shù)據(jù)，這樣不就快很多了嗎。

首先，我們看下數(shù)據(jù)頁內部的構造：

比如，我們以數(shù)據(jù)頁1舉例，數(shù)據(jù)頁1中有很多的數(shù)據(jù)行，數(shù)據(jù)行之間都是用指針連接，并且以單向鏈表的方式組織起來的，并且單向鏈表中主鍵一定是保證有序的，無序的數(shù)據(jù)是沒法創(chuàng)建索引的。

可以看到，數(shù)據(jù)行前面的 0、2、3 表示記錄的類型，也就是數(shù)據(jù)行的類型，0表示普通類型，就是表中的一行普通數(shù)據(jù)，2表示最小記錄，3表示最大記錄，因為我們都知道數(shù)據(jù)行對應的主鍵都是有順序的。

這里為了方便展示索引，我們假設每個數(shù)據(jù)頁中都有20條數(shù)據(jù)，當我們建立索引之后，如下圖：

可以看到，索引頁中會記錄每個數(shù)據(jù)頁中最小的主鍵即id的值，以及對應的數(shù)據(jù)頁號，而索引頁就發(fā)揮了我們剛提到的數(shù)據(jù)頁目錄的效果。

索引頁其實也是數(shù)據(jù)頁，只不過是我們拿來專門存放數(shù)據(jù)頁的目錄信息而已，可以看到索引頁中的記錄類型，除了2和3之外還有1，1表示的是目錄的類型，因為它是指向具體的某個數(shù)據(jù)頁的。

而如果數(shù)據(jù)頁很多的話，一個索引頁中肯定就放不下這些目錄信息，此時，MYSQL會把超出索引頁的目錄信息放到新的索引頁中，然后向上再擴展出一個索引頁，如下圖：

可以看到，數(shù)據(jù)頁3和數(shù)據(jù)頁4的目錄信息，被放到了索引頁2中，然后索引3作為擴展出來的索引頁，記錄索引頁1和索引頁2中的最小主鍵值以及索引頁號，也就是說索引頁3中記錄的信息，就相當于更上一層索引的目錄信息了。

如果索引頁3中的容量也不夠了，這個時候，同樣會把超出索引頁3的信息，放到新的一個同層級的索引頁中，然后再向上擴展一層，如下圖：

可以看到，在索引頁3中的信息放不下之后，就會放到索引頁4中，然后向上再拓展一層索引5，索引5中存放的就是索引3和索引4的目錄信息，規(guī)律都是一樣的。

而圖片中，我們可以看到，索引頁逐層的往上擴展，看起來就像一棵樹一樣，這也就是我們經(jīng)常說的B+索引樹，圖片中索引的高度為3層，一般就可以存放千萬級別的數(shù)據(jù)了。

為什么利用索引查詢就能變快呢?

我們再來看下剛才這張圖：

有了索引之后，如果我們要查詢主鍵為1的那條數(shù)據(jù)，就可以從B+索引樹最上面的那個索引頁開始查詢。

如圖，我們可以把索引頁5先加載到內存，此時會發(fā)生一次磁盤IO，然后再通過二分法，根據(jù)主鍵值1，到索引頁5中快速的和各個目錄項中的最小主鍵值對比一下，然后找到下一個索引頁3，通過索引頁3又可以定位到下一個索引頁1。

在這顆B+索引樹中，通過二分法對比最小主鍵值的方式，最終在索引頁1中發(fā)現(xiàn)，原來主鍵值為1的那條數(shù)據(jù)，是位于數(shù)據(jù)頁1中，此時，我們就可以針對性的把數(shù)據(jù)頁1加載到內存，然后在內存中就可以查到主鍵為1的數(shù)據(jù)了。

通過這樣的方式可以發(fā)現(xiàn)，我們不需要像之前無索引一樣全表掃描，挨個加載數(shù)據(jù)頁到內存中，而是利用索引頁，通過高效的二分法查找，很快就可以定位到數(shù)據(jù)具體是在哪個數(shù)據(jù)頁中。

并且這個過程中我們也發(fā)現(xiàn)，就算是上千萬級別的數(shù)據(jù)量，我們也可以做到只發(fā)生個位數(shù)磁盤IO，就可以查詢到數(shù)據(jù)，這也是為什么用了索引之后查詢的效率明顯提高的原因。

所以，接下來的sql優(yōu)化，關鍵在于要想辦法讓sql語句能利用索引查數(shù)據(jù)，這樣的話查詢的效率才會上來，但是有時會有很多因素，導致不能正常讓sql語句使用索引，這也是接下來sql優(yōu)化的一個關鍵點。

結束語

好了，通過剛才的索引原理，我們知道千萬級的數(shù)據(jù)量，B+樹基本也就是三到四層，那么如果正常使用到了索引，性能通常不是問題，所以問題原因基本可以確定是因為sql沒有使用到索引，也就是索引失效了。

責任編輯：武曉燕來源：石杉的架構筆記

MySQL 索引數(shù)據(jù)

51CTO技術棧公眾號

業(yè)務
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學堂精培企業(yè)培訓 CTO訓練營

<legend id="k4axo"><abbr id="k4axo"></abbr></legend>