自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

一分鐘帶你了解:為什么MySQL的Count統(tǒng)計(jì)會越來越慢?

數(shù)據(jù)庫 MySQL
今天帶大家了解一下,為什么MySQL的Count函數(shù)會越來越慢,count函數(shù)的實(shí)現(xiàn)邏輯是什么,以及如何解決大數(shù)據(jù)量下的統(tǒng)計(jì)需求?

業(yè)務(wù)發(fā)展初期,為了功能的快速實(shí)現(xiàn),遇到統(tǒng)計(jì)行數(shù)的需求時,我們一般都是簡單的使用count函數(shù)搞定。

但是有的小伙伴可能慢慢會發(fā)現(xiàn),隨著表中的數(shù)據(jù)越來越多,count統(tǒng)計(jì)數(shù)據(jù)的速度越來越慢,耗時也越來越長了。

今天帶大家了解一下,為什么MySQL的count函數(shù)會越來越慢,count函數(shù)的實(shí)現(xiàn)邏輯是什么,以及如何解決大數(shù)據(jù)量下的統(tǒng)計(jì)需求?

count函數(shù)的執(zhí)行邏輯

我們知道,MySQL分為Server層和引擎層,引擎大家基本使用的都是InnoDB,這里就不再重復(fù)強(qiáng)調(diào)了。

那對于下面這樣一條sql,MySQL是如何執(zhí)行的呢?

select count(*) from t;

由于我們并沒有使用where條件,那么對于MySQL來說,從聚簇索引或二級索引來統(tǒng)計(jì)數(shù)據(jù)都是可以的。

并且普通的二級索引只存儲了索引鍵以及主鍵,所以相對于聚簇索引來說,二級索引樹會更矮更胖,MySQL會優(yōu)先使用二級索引,以達(dá)到減少IO提升性能的目的。

MySQL執(zhí)行count的邏輯如下:

  1. Server通過執(zhí)行器調(diào)用InnoDB的查詢接口,嘗試獲取第一條數(shù)據(jù)。
  2. InnoDB引擎在二級索引上找到第一條記錄,并返回給Server層。

注意:這里雖然使用count(*)查詢,但是并不需要到聚簇索引上回表,因?yàn)樽罱K的目的是統(tǒng)計(jì)聚合后的行數(shù),回表并沒有什么意義。InnoDB會給Server返回一個常數(shù)0,表示這一行記錄有效。

3.Server層收到常數(shù)0,并判斷常數(shù)0不是null,認(rèn)為返回值有效,會將統(tǒng)計(jì)值+1。

4.Server通過執(zhí)行器調(diào)用InnoDB查詢接口,獲取下一條記錄。

5.InnoDB順著二級索引找下一條記錄,繼續(xù)返回常數(shù)0。

6.重復(fù)步驟3,4,5,直到將整棵二級索引樹掃描完,最終將統(tǒng)計(jì)的結(jié)果發(fā)給客戶端。

大家可以看到,MySQL在執(zhí)行count函數(shù)時,會遍歷某一個索引樹,查詢樹上所有的記錄進(jìn)行累加統(tǒng)計(jì)。

隨著表中的記錄越來越多,索引樹也會越來越高,越來越胖。

那么整個統(tǒng)計(jì)過程也會越來越耗時。

這就是為什么count函數(shù)會越來越慢的原因。

大數(shù)據(jù)量下的如何快速統(tǒng)計(jì)行數(shù)

這里有兩個考慮的因素:絕對精準(zhǔn)和允許誤差。

如果在極大數(shù)據(jù)量下,允許有誤差產(chǎn)生。那么我們可以提前維護(hù)一個變量count,通過記錄表中的增刪改操作,對這個變量做相應(yīng)的加減。這樣在獲取行數(shù)時,只需要查詢這個變量就可以快速獲取結(jié)果了。

如果要求絕對精準(zhǔn),并且對性能要求也不太高,那么就繼續(xù)使用count函數(shù)吧。不要覺得這個方法low,能滿足業(yè)務(wù)的方法都是好方法。

如果對性能要求也很高,那么OLAP數(shù)據(jù)庫可能會是一個好選擇。

不同count函數(shù)的性能差異

經(jīng)常有小伙伴糾結(jié)count(*)、count(1)、count(主鍵)、count(非索引列)的性能差異。

通過上文我們可以知道,使用count(*)時,InnoDB引擎返回的是常數(shù)0,那么自然count(1)返回的也是常數(shù),這兩個性能可以看做是一致的。

對于count(主鍵),由于二級索引樹上直接保存著主鍵id,所以不會有回表的操作。由于InnoDB返回到Server的是主鍵id,而如果主鍵id又恰巧比較大,比如是一個較長的字符串時,性能會產(chǎn)生稍微的下滑。

對于count(非索引列),由于需要不停的回表,這種方式性能相對是非常差的,也是不推薦的一種做法。

按性能排序:count(*) ≈ count(1) > count(主鍵) > count(非索引列)。

責(zé)任編輯:姜華 來源: 今日頭條
相關(guān)推薦

2022-06-02 08:46:04

網(wǎng)卡網(wǎng)絡(luò)服務(wù)器

2017-07-06 08:12:02

索引查詢SQL

2022-07-18 06:16:07

單點(diǎn)登錄系統(tǒng)

2016-09-12 17:28:45

云存儲應(yīng)用軟件存儲設(shè)備

2020-07-09 07:37:06

數(shù)據(jù)庫Redis工具

2020-07-17 07:44:25

云計(jì)算邊緣計(jì)算IT

2018-08-17 07:19:34

網(wǎng)絡(luò)故障硬件軟件

2021-12-01 15:18:45

MySQL復(fù)制數(shù)據(jù)庫

2017-03-30 19:28:26

HBase分布式數(shù)據(jù)

2016-09-14 15:57:53

架構(gòu)分布式系統(tǒng)負(fù)載均衡

2017-12-26 16:24:36

接口代碼數(shù)據(jù)

2021-08-06 08:50:45

加密貨幣比特幣區(qū)塊鏈

2018-07-31 16:10:51

Redo Undo數(shù)據(jù)庫數(shù)據(jù)

2017-02-21 13:00:27

LoadAverage負(fù)載Load

2020-05-21 19:46:19

區(qū)塊鏈數(shù)字貨幣比特幣

2018-06-26 05:23:19

線程安全函數(shù)代碼

2011-02-21 17:48:35

vsFTPd

2022-02-22 13:20:57

RSA算法加密

2018-01-14 23:19:25

靜態(tài)動態(tài)互聯(lián)網(wǎng)

2015-10-10 14:11:00

互聯(lián)網(wǎng)數(shù)據(jù)挖掘爬蟲
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號