自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

千萬級別的大表分頁查詢非常慢,怎么辦?

數(shù)據(jù)庫 其他數(shù)據(jù)庫
假如每天的訂單量在 4 萬左右,那么一個月的訂單量就是 120 多萬,一年就是 1400 多萬,隨著年數(shù)的增加和單日下單量的增加,訂單表的數(shù)據(jù)量會越來越龐大,訂單數(shù)據(jù)的查詢不會像最初那樣簡單快速,如果查詢關(guān)鍵字段沒有走索引,會直接影響到用戶體驗(yàn),甚至?xí)绊懙椒?wù)是否能正常運(yùn)行!

一、問題復(fù)現(xiàn)

在實(shí)際的軟件系統(tǒng)開發(fā)過程中,隨著使用的用戶群體越來越多,表數(shù)據(jù)也會隨著時間的推移,單表的數(shù)據(jù)量會越來越大。

以訂單表為例,假如每天的訂單量在 4 萬左右,那么一個月的訂單量就是 120 多萬,一年就是 1400 多萬,隨著年數(shù)的增加和單日下單量的增加,訂單表的數(shù)據(jù)量會越來越龐大,訂單數(shù)據(jù)的查詢不會像最初那樣簡單快速,如果查詢關(guān)鍵字段沒有走索引,會直接影響到用戶體驗(yàn),甚至?xí)绊懙椒?wù)是否能正常運(yùn)行!

下面我以某個電商系統(tǒng)的客戶表為例,數(shù)據(jù)庫是 Mysql,數(shù)據(jù)體量在 100 萬以上,詳細(xì)介紹分頁查詢下,不同階段的查詢效率情況(訂單表的情況也是類似的,只不過它的數(shù)據(jù)體量比客戶表更大)。

圖片圖片

圖片圖片

下面我們一起來測試一下,每次查詢客戶表時最多返回 100 條數(shù)據(jù),不同的起始下,數(shù)據(jù)庫查詢性能的差異。

  • 當(dāng)起點(diǎn)位置在 0 的時候,僅耗時:18 ms

圖片圖片

  • 當(dāng)起點(diǎn)位置在 1000 的時候,僅耗時:23 ms

圖片圖片

  • 當(dāng)起點(diǎn)位置在 10000 的時候,僅耗時:54 ms

圖片圖片

  • 當(dāng)起點(diǎn)位置在 100000 的時候,僅耗時:268 ms

圖片圖片

  • 當(dāng)起點(diǎn)位置在 500000 的時候,僅耗時:1.16 s

圖片圖片

  • 當(dāng)起點(diǎn)位置在 1000000 的時候,僅耗時:2.35 s

圖片圖片

可以非常清晰的看出,隨著起點(diǎn)位置越大,分頁查詢效率成倍的下降,當(dāng)起點(diǎn)位置在 1000000 以上的時候,對于百萬級數(shù)據(jù)體量的單表,查詢耗時基本上以秒為單位。

而事實(shí)上,一般查詢耗時超過 1 秒的 SQL 都被稱為慢 SQL,有的公司運(yùn)維組要求的可能更加嚴(yán)格,比如小編我所在的公司,如果 SQL 的執(zhí)行耗時超過 0.2s,也被稱為慢 SQL,必須在限定的時間內(nèi)盡快優(yōu)化,不然可能會影響服務(wù)的正常運(yùn)行和用戶體驗(yàn)。

對于千萬級的單表數(shù)據(jù)查詢,小編我剛剛也使用了一下分頁查詢,起點(diǎn)位置在 10000000,也截圖給大家看看,查詢耗時結(jié)果:39 秒!

圖片

沒有接觸過這么大數(shù)據(jù)體量的同學(xué),可能多少對這種查詢結(jié)果會感到吃驚,事實(shí)上,這還只是數(shù)據(jù)庫層面的耗時,還沒有算后端服務(wù)的處理鏈路時間,以及返回給前端的數(shù)據(jù)渲染時間,以百萬級的單表查詢?yōu)槔?,如果?shù)據(jù)庫查詢耗時 1 秒,再經(jīng)過后端的數(shù)據(jù)封裝處理,前端的數(shù)據(jù)渲染處理,以及網(wǎng)絡(luò)傳輸時間,沒有異常的情況下,差不多在 3~4 秒之間,可能有些同學(xué)對這個請求時長數(shù)值還不太敏感。

據(jù)互聯(lián)網(wǎng)軟件用戶體驗(yàn)報告,當(dāng)平均請求耗時在1秒之內(nèi),用戶體驗(yàn)是最佳的,此時的軟件也是用戶留存度最高的;2 秒之內(nèi),還勉強(qiáng)過的去,用戶能接受;當(dāng)超過 3 秒,體驗(yàn)會稍差;超過 5 秒,基本上會卸載當(dāng)前軟件。

有的公司為了提升用戶體驗(yàn),會嚴(yán)格控制請求時長,當(dāng)請求時長超過 3 秒,自動放棄請求,從而倒逼技術(shù)優(yōu)化調(diào)整 SQL 語句查詢邏輯,甚至調(diào)整后端整體架構(gòu),比如引入緩存中間件 redis,搜索引擎 elasticSearch 等等。

繼續(xù)回到我們本文所需要探討的問題,當(dāng)單表數(shù)據(jù)量到達(dá)百萬級的時候,查詢效率急劇下降,如何優(yōu)化提升呢?

二、解決方案

下面我們一起來看看具體的解決辦法。

2.1、方案一:查詢的時候,只返回主鍵 ID

我們繼續(xù)回到上文給大家介紹的客戶表查詢,將select *改成select id,簡化返回的字段,我們再來觀察一下查詢耗時。

  • 當(dāng)起點(diǎn)位置在 100000 的時候,僅耗時:73 ms

圖片圖片

  • 當(dāng)起點(diǎn)位置在 500000 的時候,僅耗時:274 ms

圖片圖片

  • 當(dāng)起點(diǎn)位置在 1000000 的時候,僅耗時:471 ms

圖片圖片

可以很清晰的看到,通過簡化返回的字段,可以很顯著的成倍提升查詢效率。

實(shí)際的操作思路就是先通過分頁查詢滿足條件的主鍵 ID,然后通過主鍵 ID 查詢部分?jǐn)?shù)據(jù),可以顯著提升查詢效果。

-- 先分頁查詢滿足條件的主鍵ID
select id from bizuser order by id limit 100000,10;

-- 再通過分頁查詢返回的ID,批量查詢數(shù)據(jù)
select * from bizuser where id in (1,2,3,4,.....);

2.2、方案二:查詢的時候,通過主鍵 ID 過濾

這種方案有一個要求就是主鍵ID,必須是數(shù)字類型,實(shí)踐的思路就是取上一次查詢結(jié)果的 ID 最大值,作為過濾條件,而且排序字段必須是主鍵 ID,不然分頁排序順序會錯亂。

  • 查詢 100000~1000100 區(qū)間段的數(shù)據(jù),僅耗時:18 ms

圖片圖片

  • 查詢 500000~5000100 區(qū)間段的數(shù)據(jù),僅耗時:18 ms

圖片圖片

  • 查詢 1000000~1000100 區(qū)間段的數(shù)據(jù),僅耗時:18 ms

圖片圖片

可以很清晰的看到,帶上主鍵 ID 作為過濾條件,查詢性能非常的穩(wěn)定,基本上在20 ms內(nèi)可以返回。

這種方案還是非??尚械?,如果當(dāng)前業(yè)務(wù)對排序要求不多,可以采用這種方案,性能也非常杠!

但是如果當(dāng)前業(yè)務(wù)對排序有要求,比如通過客戶最后修改時間、客戶最后下單時間、客戶最后下單金額等字段來排序,那么上面介紹的【方案一】,比【方案二】查詢效率更高!

2.3、方案三:采用 elasticSearch 作為搜索引擎

當(dāng)數(shù)據(jù)量越來越大的時候,尤其是出現(xiàn)分庫分表的數(shù)據(jù)庫,以上通過主鍵 ID 進(jìn)行過濾查詢,效果可能會不盡人意,例如訂單數(shù)據(jù)的查詢,這個時候比較好的解決辦法就是將訂單數(shù)據(jù)存儲到 elasticSearch 中,通過 elasticSearch 實(shí)現(xiàn)快速分頁和搜索,效果提升也是非常明顯。

關(guān)于 elasticSearch 的玩法,之前有給大家介紹過具體的實(shí)踐,這里不在過多撰書。

三、小結(jié)

不知道大家有沒有發(fā)現(xiàn),上文中介紹的表主鍵 ID 都是數(shù)值類型的,之所以采用數(shù)字類型作為主鍵,是因?yàn)閿?shù)字類型的字段能很好的進(jìn)行排序。

但如果當(dāng)前表的主鍵 ID 是字符串類型,比如 uuid 這種,就沒辦法實(shí)現(xiàn)這種排序特性,而且搜索性能也非常差,因此不建議大家采用 uuid 作為主鍵ID,具體的數(shù)值類型主鍵 ID 的生成方案有很多種,比如自增、雪花算法等等,都能很好的滿足我們的需求。

責(zé)任編輯:武曉燕 來源: 潘志的研發(fā)筆記
相關(guān)推薦

2022-07-28 07:49:29

數(shù)據(jù)庫分頁查詢

2013-09-10 10:20:12

數(shù)據(jù)大數(shù)據(jù)大數(shù)據(jù)應(yīng)用

2022-02-24 10:31:14

前端API命令

2024-07-22 11:48:42

2020-08-06 08:00:51

數(shù)據(jù)分頁優(yōu)化

2015-11-18 13:05:09

2019-12-04 08:44:59

前后端分離開發(fā)

2018-08-16 10:28:56

云端數(shù)據(jù)應(yīng)用

2020-02-21 16:38:28

通信電腦DNS

2021-06-04 10:56:32

分庫數(shù)據(jù)庫查詢

2011-08-23 08:56:06

Ubuntu11.04Wifi

2009-04-10 09:43:00

無線LAN通信

2020-08-20 14:49:22

數(shù)據(jù)查詢數(shù)據(jù)庫

2009-11-03 08:56:02

linux死機(jī)操作系統(tǒng)

2022-12-19 11:31:57

緩存失效數(shù)據(jù)庫

2024-04-22 08:17:23

MySQL誤刪數(shù)據(jù)

2017-02-21 13:11:43

SDN網(wǎng)絡(luò)體系SDN架構(gòu)

2022-05-19 08:01:49

PostgreSQL數(shù)據(jù)庫

2022-10-25 07:24:23

數(shù)據(jù)庫TiDBmysql

2022-09-26 08:28:22

分庫分表數(shù)據(jù)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號