自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問(wèn)答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

賬號(hào)設(shè)置退出

MySQL LEFT JOIN 性能優(yōu)化策略

作者：寫代碼的SharkChili 2025-01-15 08:05:06

數(shù)據(jù)庫(kù)

隨著數(shù)據(jù)量的不斷增長(zhǎng)以及業(yè)務(wù)邏輯的日益復(fù)雜，LEFT JOIN 的性能問(wèn)題逐漸凸顯，本文深入探討了一系列針對(duì) LEFT JOIN 的性能優(yōu)化策略。

連接查詢算是日常比較常用的數(shù)據(jù)庫(kù)關(guān)聯(lián)關(guān)鍵字涉及左外連接、右外連接、內(nèi)連接三種連接方式，本文將從MySQL 8.0的角度針對(duì)連接查詢和優(yōu)化進(jìn)行深入解析，希望對(duì)你有幫助。

一、詳解MySQL left join

1. 關(guān)聯(lián)查詢案例介紹

我們現(xiàn)在有一個(gè)驅(qū)動(dòng)表customer，它存儲(chǔ)客戶id、姓名以及出生日期，默認(rèn)情況下id是主鍵，沒(méi)有任何索引，對(duì)此我們給出DDL語(yǔ)句：

CREATE TABLE `customer` (
  `id` bigint NOT NULL AUTO_INCREMENT,
  `name` varchar(100) DEFAULT NULL,
  `birthday` datetime DEFAULT NULL,
  PRIMARY KEY (`id`)
) ENGINE=InnoDB AUTO_INCREMENT=1 DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_0900_ai_ci;

customer有一張關(guān)聯(lián)表，c_id記錄著與其關(guān)聯(lián)數(shù)據(jù)的id，并用available_balance記錄客戶余額，對(duì)應(yīng)DDL如下，可以看到此時(shí)我們沒(méi)有添加任何索引：

CREATE TABLE `customer_balances` (
  `id` bigint NOT NULL AUTO_INCREMENT,
  `c_id` bigint NOT NULL,
  `available_balance` decimal(10,2) DEFAULT NULL,
  PRIMARY KEY (`id`)
) ENGINE=InnoDB AUTO_INCREMENT=1863126107830751234 DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_0900_ai_ci;

假設(shè)此時(shí)數(shù)據(jù)庫(kù)大約有2000w的數(shù)據(jù)，我們希望查出姓名為if2vbdr1kzk47rdmulrxix48tl2r9finmonxpl25cfrqvv7m0t的用戶的出生日期和可用余額，如果沒(méi)有記錄余額則設(shè)置為null，對(duì)應(yīng)我們給出這樣一條SQL：

SELECT name,birthday from customer c 
left join customer_balances cb on c.id =cb.c_id
 WHERE name='if2vbdr1kzk47rdmulrxix48tl2r9finmonxpl25cfrqvv7m0t';

最終查詢結(jié)果如下，耗時(shí)大約是1s多一些，對(duì)于用戶而言超過(guò)200ms的延遲都是有感知的，所以針對(duì)這個(gè)查詢我們需要進(jìn)行相應(yīng)的優(yōu)化，對(duì)此筆者以市面上常見的面經(jīng)為出發(fā)點(diǎn)，逐步拆解并解決這道問(wèn)題：

name                                              |birthday           |available_balance|
--------------------------------------------------+-------------------+-----------------+
if2vbdr1kzk47rdmulrxix48tl2r9finmonxpl25cfrqvv7m0t|2024-12-01 11:02:35|         25853253|

2. 講講join的原理

join底層關(guān)聯(lián)本質(zhì)上都是基于驅(qū)動(dòng)表(上面的c表)的結(jié)果到被驅(qū)動(dòng)表(上面的cb表)進(jìn)行循環(huán)掃描定位，這里筆者以MySQL5.7、MySQL 8兩個(gè)版本對(duì)join連接的幾種類型進(jìn)行介紹：

(1) Simple Nested-Loop Join：這也就是我們上文中兩張關(guān)聯(lián)表沒(méi)有加索引關(guān)聯(lián)查詢，得到所有驅(qū)動(dòng)表c的數(shù)據(jù)后，直接給cb表走全表掃描定位匹配，極端情況下要查詢count(c)*count(cb)次，也就是我們傳說(shuō)中的時(shí)間復(fù)雜度為O(n^2):

(2) Index Nested-Loop Join：這就是join左右字段都加索引后的查詢，這意味著驅(qū)動(dòng)表的選擇不在于我們自身，而是由MySQL優(yōu)化器決定，當(dāng)驅(qū)動(dòng)表的結(jié)果交給被驅(qū)動(dòng)表時(shí)，被驅(qū)動(dòng)表直接通過(guò)索引定位到關(guān)聯(lián)數(shù)據(jù)并阻塞。

(3) Block Nested-Loop Join：沒(méi)有索引列的情況都會(huì)選擇該算法而不優(yōu)先考慮Simple Nested-Loop Join，Block Nested-Loop Join相比Simple Nested-Loop Join多了一個(gè)中間操作，它會(huì)將驅(qū)動(dòng)表查詢結(jié)果緩存到j(luò)oin buffer，與被驅(qū)動(dòng)表關(guān)聯(lián)時(shí)會(huì)進(jìn)行批量?jī)?nèi)存關(guān)聯(lián)與合并。

(4) HashJoin：這是8.0.18及其之后的版本對(duì)于關(guān)聯(lián)查詢的優(yōu)化，其原理是針對(duì)驅(qū)動(dòng)表join字段進(jìn)行哈希運(yùn)算生成結(jié)果集存入內(nèi)存中，然后掃描被驅(qū)動(dòng)表并直接通過(guò)哈希運(yùn)算定位到驅(qū)動(dòng)表是否存在關(guān)聯(lián)的值已完成結(jié)果合并。當(dāng)然如果驅(qū)動(dòng)表數(shù)據(jù)量大的話，驅(qū)動(dòng)表部分?jǐn)?shù)據(jù)還會(huì)利用磁盤進(jìn)行分片，生成臨時(shí)文件，然后被驅(qū)動(dòng)表同樣是通過(guò)哈希運(yùn)算定位到磁盤分片編號(hào)進(jìn)行物理磁盤IO獲取關(guān)聯(lián)結(jié)果。

3. 能不能說(shuō)說(shuō)這個(gè)LEFT JOIN如何加索引

上文提到查詢耗時(shí)為1s多，針對(duì)索引添加我們優(yōu)先使用explain 來(lái)分析一下SQL的查詢過(guò)程：

explain SELECT c.name,c.birthday,cb.available_balance 
from customer c 
left join customer_balances cb on c.id =cb.c_id 
WHERE name='if2vbdr1kzk47rdmulrxix48tl2r9finmonxpl25cfrqvv7m0t';

以我們的SQL為例該查詢首先查詢驅(qū)動(dòng)表c，它會(huì)基于where條件進(jìn)行全表掃描獲取數(shù)據(jù)，基于查詢結(jié)果緩存到hash join buffer再到關(guān)聯(lián)表即被驅(qū)動(dòng)表的聚簇索引進(jìn)行全表掃描匹配結(jié)果：

這一點(diǎn)我們也可以從執(zhí)行計(jì)劃看出，c表和cb表都走了全表掃描，且關(guān)聯(lián)查詢時(shí)被驅(qū)動(dòng)表cb用到MySQL 8的hash join關(guān)聯(lián)，這種關(guān)聯(lián)方式本質(zhì)上就說(shuō)

id|select_type|table|partitions|type|possible_keys|key|key_len|ref|rows   |filtered|Extra                                     |
--+-----------+-----+----------+----+-------------+---+-------+---+-------+--------+------------------------------------------+
 1|SIMPLE     |c    |          |ALL |             |   |       |   |3079319|    10.0|Using where                               |
 1|SIMPLE     |cb   |          |ALL |             |   |       |   |3447555|   100.0|Using where; Using join buffer (hash join)|

針對(duì)該執(zhí)行計(jì)劃，我們進(jìn)行逐步的調(diào)優(yōu)，針對(duì)驅(qū)動(dòng)表c的查詢，因?yàn)橛玫搅薾ame字段，所以針對(duì)name添加一個(gè)索引：

ALTER TABLE db.customer DROP INDEX customer_name_IDX;
CREATE INDEX customer_name_IDX USING BTREE ON db.customer (name);

經(jīng)過(guò)調(diào)整之后，查詢耗時(shí)提升為0.739s，查看執(zhí)行計(jì)劃，可以看到針對(duì)驅(qū)動(dòng)表的慢查詢已經(jīng)走索引了，現(xiàn)在問(wèn)題就是出在被驅(qū)動(dòng)表cb還是走全表掃描：

id|select_type|table|partitions|type|possible_keys    |key              |key_len|ref  |rows   |filtered|Extra                                     |
--+-----------+-----+----------+----+-----------------+-----------------+-------+-----+-------+--------+------------------------------------------+
 1|SIMPLE     |c    |          |ref |customer_name_IDX|customer_name_IDX|403    |const|      1|   100.0|                                          |
 1|SIMPLE     |cb   |          |ALL |                 |                 |       |     |4566577|   100.0|Using where; Using join buffer (hash join)|

所以我們針對(duì)被驅(qū)動(dòng)表cb的c_id增加一個(gè)索引:

CREATE INDEX customer_balances_c_id_IDX USING BTREE ON db.customer_balances (c_id);

最終查詢耗時(shí)優(yōu)化為0.001s，

id|select_type|table|partitions|type|possible_keys             |key                       |key_len|ref    |rows|filtered|Extra|
--+-----------+-----+----------+----+--------------------------+--------------------------+-------+-------+----+--------+-----+
 1|SIMPLE     |c    |          |ref |customer_name_IDX         |customer_name_IDX         |403    |const  |   1|   100.0|     |
 1|SIMPLE     |cb   |          |ref |customer_balances_c_id_IDX|customer_balances_c_id_IDX|8      |db.c.id|   1|   100.0|     |

4. left join on 左右字段是否都需要加索引？為什么？

回答這個(gè)問(wèn)題，我們首先需要了解左外連接的工作機(jī)制，它本質(zhì)上就是基于驅(qū)動(dòng)表(也就是上文的c表)的id與被驅(qū)動(dòng)表cb進(jìn)行鏈接，如果cb沒(méi)有數(shù)據(jù)則結(jié)果顯示null：

這也就意味著left join左邊的字段是基于where條件的查詢結(jié)果篩選出來(lái)的數(shù)據(jù)，然后遍歷并與被驅(qū)動(dòng)表cb進(jìn)行關(guān)聯(lián)，所以如果left join左邊（也就是我們驅(qū)動(dòng)表c的id）如果不作為查詢條件的情況下，可以不加索引，當(dāng)然我們本次關(guān)聯(lián)的id本身就是主鍵，所以這個(gè)問(wèn)題就沒(méi)有討論的必要了。

對(duì)于left join的右邊，它是作為被驅(qū)動(dòng)表(也就是我們的cb表)的關(guān)聯(lián)查詢條件，從執(zhí)行計(jì)劃就可以看出如果沒(méi)添加索引，它會(huì)基于驅(qū)動(dòng)表c給的關(guān)聯(lián)條件id進(jìn)行全表掃描以找到符合條件的數(shù)據(jù)，所以為了提升被驅(qū)動(dòng)表cb的檢索速度，關(guān)聯(lián)條件c_id是需要增加索引的。

5. 你覺得針對(duì)聯(lián)表查詢還有那些優(yōu)化技巧

除了上述優(yōu)化技巧，針對(duì)關(guān)聯(lián)查詢我們可以從表結(jié)構(gòu)設(shè)計(jì)以及SQL查詢層面考慮優(yōu)化：

如果業(yè)務(wù)上允許的話，可以考慮將關(guān)聯(lián)的字段冗余一份到驅(qū)動(dòng)表上，直接避免關(guān)聯(lián)查詢開銷。
如果驅(qū)動(dòng)表和被驅(qū)動(dòng)都具備篩選能力(即關(guān)聯(lián)的表都可以通過(guò)where查詢到需要的數(shù)據(jù))，可以考慮用數(shù)據(jù)量小的表作為驅(qū)動(dòng)表，采用小表驅(qū)大表的方式完成關(guān)聯(lián)查詢。
非必要不采取left join或者right join，盡可能在關(guān)聯(lián)條件上加索引，然后通過(guò)inner join讓MySQL優(yōu)化器幫我們選擇驅(qū)動(dòng)表并完成數(shù)據(jù)檢索。

二、小結(jié)

在數(shù)據(jù)庫(kù)操作領(lǐng)域，MySQL 的 LEFT JOIN 無(wú)疑是一項(xiàng)極為重要的功能，它為我們提供了從多個(gè)表中獲取關(guān)聯(lián)數(shù)據(jù)的強(qiáng)大能力。然而，隨著數(shù)據(jù)量的不斷增長(zhǎng)以及業(yè)務(wù)邏輯的日益復(fù)雜，LEFT JOIN 的性能問(wèn)題逐漸凸顯，成為開發(fā)者和數(shù)據(jù)庫(kù)管理員需要重點(diǎn)關(guān)注的方面。

本文深入探討了一系列針對(duì) LEFT JOIN 的性能優(yōu)化策略。

首先，我們?cè)敿?xì)分析了合理設(shè)計(jì)表結(jié)構(gòu)對(duì)性能的巨大影響。通過(guò)確保表的主鍵、外鍵以及索引的正確設(shè)置，可以顯著減少數(shù)據(jù)庫(kù)在執(zhí)行 LEFT JOIN 操作時(shí)的搜索范圍，提高查詢效率。例如，為頻繁用于連接條件的列創(chuàng)建合適的索引，能夠讓數(shù)據(jù)庫(kù)快速定位到相關(guān)數(shù)據(jù)，避免全表掃描帶來(lái)的性能損耗。索引優(yōu)化方面，我們了解到復(fù)合索引的巧妙運(yùn)用以及避免索引失效的重要性。

復(fù)合索引可以在多個(gè)列上創(chuàng)建單一索引結(jié)構(gòu)，從而在多條件查詢時(shí)發(fā)揮重要作用。同時(shí)，要注意查詢語(yǔ)句的書寫方式，避免因不當(dāng)?shù)牟僮鞣蚝瘮?shù)使用導(dǎo)致索引失效，確保索引能夠在 LEFT JOIN 操作中充分發(fā)揮作用。查詢語(yǔ)句的優(yōu)化也是關(guān)鍵環(huán)節(jié)。我們學(xué)會(huì)了通過(guò)簡(jiǎn)化查詢邏輯、合理利用子查詢以及使用 STRAIGHT_JOIN 等方式來(lái)引導(dǎo)數(shù)據(jù)庫(kù)優(yōu)化器生成更高效的執(zhí)行計(jì)劃。這些優(yōu)化手段能夠幫助數(shù)據(jù)庫(kù)更好地理解我們的查詢意圖，合理分配資源，從而提升 LEFT JOIN 的執(zhí)行速度。

此外，數(shù)據(jù)庫(kù)的配置參數(shù)對(duì) LEFT JOIN 性能也有著不可忽視的影響。通過(guò)調(diào)整諸如內(nèi)存分配、緩存大小等參數(shù)，可以為數(shù)據(jù)庫(kù)的運(yùn)行提供更有利的環(huán)境，進(jìn)一步提升 LEFT JOIN 的執(zhí)行效率。

在實(shí)際應(yīng)用中，我們應(yīng)當(dāng)根據(jù)具體的業(yè)務(wù)場(chǎng)景和數(shù)據(jù)特點(diǎn)，綜合運(yùn)用這些優(yōu)化策略。同時(shí)，持續(xù)進(jìn)行性能測(cè)試和監(jiān)控，及時(shí)發(fā)現(xiàn)并解決性能瓶頸問(wèn)題。只有這樣，我們才能在充分利用 LEFT JOIN 強(qiáng)大功能的同時(shí)，確保數(shù)據(jù)庫(kù)系統(tǒng)的高效穩(wěn)定運(yùn)行，為業(yè)務(wù)的發(fā)展提供堅(jiān)實(shí)的數(shù)據(jù)支持。希望本文所介紹的優(yōu)化策略能夠幫助讀者在處理 MySQL LEFT JOIN 相關(guān)問(wèn)題時(shí)更加得心應(yīng)手，提升數(shù)據(jù)庫(kù)應(yīng)用的整體性能和質(zhì)量。

責(zé)任編輯：趙寧寧來(lái)源：寫代碼的SharkChili

MySQL LEFT JOIN 數(shù)據(jù)庫(kù)

點(diǎn)贊

51CTO技術(shù)棧公眾號(hào)

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營(yíng)

<style id="nvoz0"><kbd id="nvoz0"></kbd></style>

<sub id="nvoz0"><p id="nvoz0"></p></sub>

<cite id="nvoz0"></cite>

<cite id="nvoz0"></cite>

<li id="nvoz0"><rt id="nvoz0"></rt></li>

<sub id="nvoz0"><s id="nvoz0"></s></sub>