自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<cite id="2c8rs"><rp id="2c8rs"></rp></cite>

<style id="2c8rs"></style>

<sub id="2c8rs"></sub>

<style id="2c8rs"></style>

<p id="2c8rs"><track id="2c8rs"><dfn id="2c8rs"></dfn></track></p>

<thead id="2c8rs"></thead><style id="2c8rs"><rp id="2c8rs"></rp></style>

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設(shè)置退出

納尼？MySQL 中 count(*) 比 count(1) 快？

作者：江南一點(diǎn)雨 2021-12-16 11:41:19

數(shù)據(jù)庫 MySQL

InnoDB 需要將每一行數(shù)據(jù)拿出來，判斷該行數(shù)據(jù)對當(dāng)前會話是否可見，如果可見，就統(tǒng)計該行數(shù)據(jù)，否則不予統(tǒng)計。

今天有人跟我講 MySQL 中 count(1) 比 count(*) 快，這能忍?必須得和他掰扯掰扯。

聲明：以下討論基于 InnoDB 存儲引擎，MyISAM 因為情況特殊我在文末會單獨(dú)說一下。

先說結(jié)論：這兩個性能差別不大。

1.實踐

我準(zhǔn)備了一張有 100W 條數(shù)據(jù)的表，表結(jié)構(gòu)如下：

CREATE TABLE `user` ( 
  `id` int(11) unsigned NOT NULL AUTO_INCREMENT, 
  `username` varchar(255) DEFAULT NULL, 
  `address` varchar(255) DEFAULT NULL, 
  `password` varchar(255) DEFAULT NULL, 
  PRIMARY KEY (`id`) 
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4;

可以看到，有一個主鍵索引。

我們來用兩種方式統(tǒng)計一下表中的記錄數(shù)，如下：

可以看到，兩條 SQL 的執(zhí)行效率其實差不多，都是 0.14s。

再來看另外兩個統(tǒng)計：

id 是主鍵，username 以及 address 則是普通字段。

可以看出，用 id 來統(tǒng)計，也有一丟丟優(yōu)勢。松哥這里因為測試數(shù)據(jù)樣板比較小，所以效果不明顯，小伙伴們可以加大測試數(shù)據(jù)量，那么這種差異會更加明顯。

那么到底是什么原因造成的這種差異，接下來我們就來簡單分析一下。

2. explain 分析

我們先用 explain 來看下這幾個 SQL 不同的執(zhí)行計劃：

可以看到，前三個統(tǒng)計方式的執(zhí)行計劃是一樣的，后面兩個是一樣的。

我這里和大家比較下 explain 中的不同項：

type：前三個的 type 值為 index，表示全索引掃描，就是把整個索引過一遍就行(注意是索引不是整個表);后兩個的 type 值為 all，表示全表掃描，即不會使用索引。
key：這個表示 MySQL 決定采用哪個索引來優(yōu)化對該表的訪問，PRIMARY 表示利用主鍵索引，NULL 表示不用索引。
key_len：這個表示 MySQL 使用的鍵長度，因為我們的主鍵類型是 INT 且非空，所以值為 4。
Extra：這個中的 Using index 表示優(yōu)化器只需要通過訪問索引就可以獲取到需要的數(shù)據(jù)(不需要回表)。

通過 explain 我們其實也能大概看出來前三種統(tǒng)計方式的執(zhí)行效率是要高一些的(因為用到了索引)，而后面兩種的統(tǒng)計效率相對來說要低一些的(沒用索引，需要全表掃描)。

僅有上面的分析還不夠，我們再來從原理角度來分析一下。

3. 原理分析

3.1 主鍵索引與普通索引

在開始原理分析以前，我想先帶領(lǐng)大家看一下 B+ 樹，這對于我們理解接下來的內(nèi)容有重要作用。

大家都知道，InnoDB 中索引的存儲結(jié)構(gòu)都是 B+ 樹(至于什么是 B+ 樹，和 B 樹有什么區(qū)別，這個本文就不討論了，這兩個單獨(dú)都能整出來一篇文章)，主鍵索引和普通索引的存儲又有所不同，如下圖表示主鍵索引：

可以看到，在主鍵索引中，葉子結(jié)點(diǎn)保存了每一行的數(shù)據(jù)。

而在普通索引中，葉子結(jié)點(diǎn)保存的是主鍵值，當(dāng)我們使用普通索引去搜索數(shù)據(jù)的時候，先在葉子結(jié)點(diǎn)中找到主鍵，再拿著主鍵去主鍵索引中查找數(shù)據(jù)，相當(dāng)于做了兩次查找，這也就是我們平常所說的回表操作。

3.2 原理分析

不知道小伙伴們有沒有注意過，我們學(xué)習(xí) MySQL 的時候，count 函數(shù)是歸在聚合函數(shù)那一類的，就是 avg、sum 等，count 函數(shù)和這些歸在一起，說明它也是一個聚合函數(shù)。

既然是聚合函數(shù)，那么就需要對返回的結(jié)果集進(jìn)行一行行的判斷，這里就涉及到一個問題，返回的結(jié)果是啥?我們分別來看：

對于 select count(1) from user; 這個查詢來說，InnoDB 引擎會去找到一個最小的索引樹去遍歷(不一定是主鍵索引)，但是不會讀取數(shù)據(jù)，而是讀到一個葉子節(jié)點(diǎn)，就返回 1，最后將結(jié)果累加。

對于 select count(id) from user; 這個查詢來說，InnoDB 引擎會遍歷整個主鍵索引，然后讀取 id 并返回，不過因為 id 是主鍵，就在 B+ 樹的葉子節(jié)點(diǎn)上，所以這個過程不會涉及到隨機(jī) IO(并不需要回表等操作去數(shù)據(jù)頁拿數(shù)據(jù))，性能也是 OK 的。

對于 select count(username) from user; 這個查詢來說，InnoDB 引擎會遍歷整張表做全表掃描，讀取每一行的 username 字段并返回，如果 username 在定義時候設(shè)置了 not null，那么直接統(tǒng)計 username 的個數(shù);如果 username 在定義的時候沒有設(shè)置 not null，那么就先判斷一下 username 是否為空，然后再統(tǒng)計。

最后再來說說 select count(*) from user; ，這個 SQL 的特殊之處在于它被 MySQL 優(yōu)化過，當(dāng) MySQL 看到 count(*) 就知道你是想統(tǒng)計總記錄數(shù)，就會去找到一個最小的索引樹去遍歷，然后統(tǒng)計記錄數(shù)。

因為主鍵索引(聚集索引)的葉子節(jié)點(diǎn)是數(shù)據(jù)，而普通索引的葉子節(jié)點(diǎn)則是主鍵值，所以普通索引的索引樹要小一些。然而在上文的案例中，我們只有主鍵索引，所以最終使用的就是主鍵索引。

現(xiàn)在，如果我修改上面的表，為 username 字段也添加索引，然后我們再來看 explain select count(*) from user; 的執(zhí)行計劃：

可以看到，此時使用的索引就是 username 索引了，和我們前面的分析結(jié)果是一致的。

從上面的描述中我們就可以看出，第一個查詢性能最高，第二個次之(因為需要讀取 id 并返回)，第三個最差(因為需要全表掃描)，第四個的查詢性能則接近第一個。

4. MyISAM 呢?

可能有小伙伴知道，MyISAM 引擎中的 select count(*) from user; 操作執(zhí)行起來是非常快的，那是因為 MyISAM 把表中的行數(shù)直接存在磁盤中了，需要的時候直接讀取出來就行了，所以非?？?。

MyISAM 引擎之所以這樣做，主要是因為它是不支持事務(wù)的，所以它的統(tǒng)計實際上就非常容易，添加一行記錄一行就行了。

而我們常用的 InnoDB 卻不能這樣做!為啥?因為 InnoDB 支持事務(wù)!為了支持事務(wù)，InnoDB 引入了 MVCC 多版本并發(fā)控制，所以在數(shù)據(jù)讀取的時候可能會有臟讀、幻讀以及不可重復(fù)讀等問題，具體可以參考 https://www.bilibili.com/video/BV14L4y1B7mB 視頻。

所以，InnoDB 需要將每一行數(shù)據(jù)拿出來，判斷該行數(shù)據(jù)對當(dāng)前會話是否可見，如果可見，就統(tǒng)計該行數(shù)據(jù)，否則不予統(tǒng)計。

當(dāng)然，MySQL 中的 MVCC 實際上是一個非常宏大的話題，松哥以后有空了再和大家詳細(xì)介紹 MVCC。

好啦，現(xiàn)在小伙伴們懂了吧?有問題歡迎留言討論。

責(zé)任編輯：武曉燕來源：江南一點(diǎn)雨

MySQL 數(shù)據(jù)InnoDB

點(diǎn)贊

51CTO技術(shù)棧公眾號

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營

<blockquote id="ik3pp"><i id="ik3pp"></i></blockquote>

<legend id="ik3pp"><track id="ik3pp"></track></legend>

<sub id="ik3pp"><p id="ik3pp"></p></sub>