自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<style id="pm3g5"></style>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓

鴻蒙開發(fā)者社區(qū)

WOT技術大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設置退出

看一遍就理解：Order By詳解

作者：撿田螺的小男孩 2021-06-15 07:15:15

數(shù)據(jù)庫 Oracle

日常開發(fā)中，我們經(jīng)常會使用到order by，親愛的小伙伴，你是否知道order by 的工作原理呢?order by的優(yōu)化思路是怎樣的呢?使用order by有哪些注意的問題呢?

[[405503]]

前言

日常開發(fā)中，我們經(jīng)常會使用到order by，親愛的小伙伴，你是否知道order by 的工作原理呢?order by的優(yōu)化思路是怎樣的呢?使用order by有哪些注意的問題呢?本文將跟大家一起來學習，攻克order by~

一個使用order by 的簡單例子

假設用一張員工表，表結構如下：

CREATE TABLE `staff` ( 
`id` BIGINT ( 11 ) AUTO_INCREMENT COMMENT '主鍵id', 
`id_card` VARCHAR ( 20 ) NOT NULL COMMENT '身份證號碼', 
`name` VARCHAR ( 64 ) NOT NULL COMMENT '姓名', 
`age` INT ( 4 ) NOT NULL COMMENT '年齡', 
`city` VARCHAR ( 64 ) NOT NULL COMMENT '城市', 
PRIMARY KEY ( `id`), 
INDEX idx_city ( `city` ) 
) ENGINE = INNODB COMMENT '員工表';

表數(shù)據(jù)如下：

我們現(xiàn)在有這么一個需求：查詢前10個，來自深圳員工的姓名、年齡、城市，并且按照年齡小到大排序。對應的 SQL 語句就可以這么寫：

select name,age,city from staff where city = '深圳' order by age limit 10;

這條語句的邏輯很清楚，但是它的底層執(zhí)行流程是怎樣的呢?

order by 工作原理

explain 執(zhí)行計劃

我們先用Explain關鍵字查看一下執(zhí)行計劃

執(zhí)行計劃的key這個字段，表示使用到索引idx_city
Extra 這個字段的 Using index condition 表示索引條件
Extra 這個字段的 Using filesort表示用到排序

我們可以發(fā)現(xiàn)，這條SQL使用到了索引，并且也用到排序。那么它是怎么排序的呢?

全字段排序

MySQL 會給每個查詢線程分配一塊小內(nèi)存，用于排序的，稱為 sort_buffer。什么時候把字段放進去排序呢，其實是通過idx_city索引找到對應的數(shù)據(jù)，才把數(shù)據(jù)放進去啦。

我們回顧下索引是怎么找到匹配的數(shù)據(jù)的，現(xiàn)在先把索引樹畫出來吧，idx_city索引樹如下：

idx_city索引樹，葉子節(jié)點存儲的是主鍵id。還有一棵id主鍵聚族索引樹，我們再畫出聚族索引樹圖吧：

我們的查詢語句是怎么找到匹配數(shù)據(jù)的呢?先通過idx_city索引樹，找到對應的主鍵id，然后再通過拿到的主鍵id，搜索id主鍵索引樹，找到對應的行數(shù)據(jù)。

加上order by之后，整體的執(zhí)行流程就是：

MySQL 為對應的線程初始化sort_buffer，放入需要查詢的name、age、city字段;
從索引樹idx_city，找到第一個滿足 city='深圳’條件的主鍵 id，也就是圖中的id=9;
到主鍵 id 索引樹拿到id=9的這一行數(shù)據(jù)，取name、age、city三個字段的值，存到sort_buffer;
從索引樹idx_city 拿到下一個記錄的主鍵 id，即圖中的id=13;
重復步驟 3、4 直到city的值不等于深圳為止;
前面5步已經(jīng)查找到了所有city為深圳的數(shù)據(jù)，在 sort_buffer中，將所有數(shù)據(jù)根據(jù)age進行排序;
按照排序結果取前10行返回給客戶端。

執(zhí)行示意圖如下：

將查詢所需的字段全部讀取到sort_buffer中，就是全字段排序。這里面，有些小伙伴可能會有個疑問,把查詢的所有字段都放到sort_buffer，而sort_buffer是一塊內(nèi)存來的，如果數(shù)據(jù)量太大，sort_buffer放不下怎么辦呢?

磁盤臨時文件輔助排序

實際上，sort_buffer的大小是由一個參數(shù)控制的：sort_buffer_size。如果要排序的數(shù)據(jù)小于sort_buffer_size，排序在sort_buffer 內(nèi)存中完成，如果要排序的數(shù)據(jù)大于sort_buffer_size，則借助磁盤文件來進行排序

如何確定是否使用了磁盤文件來進行排序呢?可以使用以下這幾個命令

## 打開optimizer_trace，開啟統(tǒng)計 
set optimizer_trace = "enabled=on"; 
## 執(zhí)行SQL語句 
select name,age,city from staff where city = '深圳' order by age limit 10; 
## 查詢輸出的統(tǒng)計信息 
select * from information_schema.optimizer_trace

可以從 number_of_tmp_files 中看出，是否使用了臨時文件。

number_of_tmp_files 表示使用來排序的磁盤臨時文件數(shù)。如果number_of_tmp_files>0，則表示使用了磁盤文件來進行排序。

使用了磁盤臨時文件，整個排序過程又是怎樣的呢?

從主鍵Id索引樹，拿到需要的數(shù)據(jù)，并放到sort_buffer內(nèi)存塊中。當sort_buffer快要滿時，就對sort_buffer中的數(shù)據(jù)排序，排完后，把數(shù)據(jù)臨時放到磁盤一個小文件中。
繼續(xù)回到主鍵 id 索引樹取數(shù)據(jù)，繼續(xù)放到sort_buffer內(nèi)存中，排序后，也把這些數(shù)據(jù)寫入到磁盤臨時小文件中。
繼續(xù)循環(huán)，直到取出所有滿足條件的數(shù)據(jù)。最后把磁盤的臨時排好序的小文件，合并成一個有序的大文件。

TPS: 借助磁盤臨時小文件排序，實際上使用的是歸并排序算法。

小伙伴們可能會有個疑問，既然sort_buffer放不下，就需要用到臨時磁盤文件，這會影響排序效率。那為什么還要把排序不相關的字段(name，city)放到sort_buffer中呢?只放排序相關的age字段，它不香嗎?可以了解下rowid 排序。

rowid 排序

rowid 排序就是，只把查詢SQL需要用于排序的字段和主鍵id，放到sort_buffer中。那怎么確定走的是全字段排序還是rowid 排序排序呢?

實際上有個參數(shù)控制的。這個參數(shù)就是max_length_for_sort_data，它表示MySQL用于排序行數(shù)據(jù)的長度的一個參數(shù)，如果單行的長度超過這個值，MySQL 就認為單行太大，就換rowid 排序。我們可以通過命令看下這個參數(shù)取值。

show variables like 'max_length_for_sort_data';

max_length_for_sort_data 默認值是1024。因為本文示例中name,age,city長度=64+4+64 =132 < 1024, 所以走的是全字段排序。我們來改下這個參數(shù)，改小一點，

## 修改排序數(shù)據(jù)最大單行長度為32 
set max_length_for_sort_data = 32; 
## 執(zhí)行查詢SQL 
select name,age,city from staff where city = '深圳' order by age limit 10;

使用rowid 排序的話，整個SQL執(zhí)行流程又是怎樣的呢?

MySQL 為對應的線程初始化sort_buffer，放入需要排序的age字段，以及主鍵id;
從索引樹idx_city，找到第一個滿足 city='深圳’條件的主鍵 id，也就是圖中的id=9;
到主鍵 id 索引樹拿到id=9的這一行數(shù)據(jù)，取age和主鍵id的值，存到sort_buffer;
從索引樹idx_city 拿到下一個記錄的主鍵 id，即圖中的id=13;
重復步驟 3、4 直到city的值不等于深圳為止;
前面5步已經(jīng)查找到了所有city為深圳的數(shù)據(jù)，在 sort_buffer中，將所有數(shù)據(jù)根據(jù)age進行排序;
遍歷排序結果，取前10行，并按照 id 的值回到原表中，取出city、name 和 age 三個字段返回給客戶端。

執(zhí)行示意圖如下：

對比一下全字段排序的流程，rowid 排序多了一次回表。

什么是回表?拿到主鍵再回到主鍵索引查詢的過程，就叫做回表”

我們通過optimizer_trace，可以看到是否使用了rowid排序的：

## 打開optimizer_trace，開啟統(tǒng)計 
set optimizer_trace = "enabled=on"; 
## 執(zhí)行SQL語句 
select name,age,city from staff where city = '深圳' order by age limit 10; 
## 查詢輸出的統(tǒng)計信息 
select * from information_schema.optimizer_trace

全字段排序與rowid排序?qū)Ρ?/p>

全字段排序：sort_buffer內(nèi)存不夠的話，就需要用到磁盤臨時文件，造成磁盤訪問。
rowid排序：sort_buffer可以放更多數(shù)據(jù)，但是需要再回到原表去取數(shù)據(jù)，比全字段排序多一次回表。

一般情況下，對于InnoDB存儲引擎，會優(yōu)先使用全字段排序?？梢园l(fā)現(xiàn) max_length_for_sort_data 參數(shù)設置為1024，這個數(shù)比較大的。一般情況下，排序字段不會超過這個值，也就是都會走全字段排序。

order by的一些優(yōu)化思路

我們?nèi)绾蝺?yōu)化order by語句呢?

因為數(shù)據(jù)是無序的，所以就需要排序。如果數(shù)據(jù)本身是有序的，那就不用排了。而索引數(shù)據(jù)本身是有序的，我們通過建立聯(lián)合索引，優(yōu)化order by 語句。
我們還可以通過調(diào)整max_length_for_sort_data等參數(shù)優(yōu)化;

聯(lián)合索引優(yōu)化

再回顧下示例SQL的查詢計劃

explain select name,age,city from staff where city = '深圳' order by age limit 10;

我們給查詢條件city和排序字段age，加個聯(lián)合索引idx_city_age。再去查看執(zhí)行計劃

alter table staff add  index idx_city_age(city,age); 
explain select name,age,city from staff where city = '深圳' order by age limit 10;

可以發(fā)現(xiàn)，加上idx_city_age聯(lián)合索引，就不需要Using filesort排序了。為什么呢?因為索引本身是有序的，我們可以看下idx_city_age聯(lián)合索引示意圖，如下：

整個SQL執(zhí)行流程變成醬紫：

從索引idx_city_age找到滿足city='深圳’ 的主鍵 id
到主鍵 id索引取出整行，拿到 name、city、age 三個字段的值，作為結果集的一部分直接返回
從索引idx_city_age取下一個記錄主鍵id
重復步驟 2、3，直到查到第10條記錄，或者是不滿足city='深圳’ 條件時循環(huán)結束。

流程示意圖如下：

從示意圖看來，還是有一次回表操作。針對本次示例，有沒有更高效的方案呢?有的，可以使用覆蓋索引：

覆蓋索引：在查詢的數(shù)據(jù)列里面，不需要回表去查，直接從索引列就能取到想要的結果。換句話說，你SQL用到的索引列數(shù)據(jù)，覆蓋了查詢結果的列，就算上覆蓋索引了。”

我們給city，name，age 組成一個聯(lián)合索引，即可用到了覆蓋索引，這時候SQL執(zhí)行時，連回表操作都可以省去啦。

調(diào)整參數(shù)優(yōu)化

我們還可以通過調(diào)整參數(shù)，去優(yōu)化order by的執(zhí)行。比如可以調(diào)整sort_buffer_size的值。因為sort_buffer值太小，數(shù)據(jù)量大的話，會借助磁盤臨時文件排序。如果MySQL服務器配置高的話，可以使用稍微調(diào)整大點。

我們還可以調(diào)整max_length_for_sort_data的值，這個值太小的話，order by會走rowid排序，會回表，降低查詢性能。所以max_length_for_sort_data可以適當大一點。

當然，很多時候，這些MySQL參數(shù)值，我們直接采用默認值就可以了。

使用order by 的一些注意點

沒有where條件，order by字段需要加索引嗎

日常開發(fā)過程中，我們可能會遇到?jīng)]有where條件的order by，那么，這時候order by后面的字段是否需要加索引呢。如有這么一個SQL，create_time是否需要加索引：

select * from A order by create_time;

無條件查詢的話，即使create_time上有索引,也不會使用到。因為MySQL優(yōu)化器認為走普通二級索引，再去回表成本比全表掃描排序更高。所以選擇走全表掃描,然后根據(jù)全字段排序或者rowid排序來進行。

如果查詢SQL修改一下：

select * from A order by create_time limit m;

無條件查詢,如果m值較小,是可以走索引的.因為MySQL優(yōu)化器認為，根據(jù)索引有序性去回表查數(shù)據(jù),然后得到m條數(shù)據(jù),就可以終止循環(huán),那么成本比全表掃描小,則選擇走二級索引。

分頁limit過大時，會導致大量排序怎么辦?

假設SQL如下：

select * from A order by a limit 100000,10

可以記錄上一頁最后的id，下一頁查詢時，查詢條件帶上id，如：where id > 上一頁最后id limit 10。

也可以在業(yè)務允許的情況下，限制頁數(shù)。

索引存儲順序與order by不一致，如何優(yōu)化?

假設有聯(lián)合索引 idx_age_name, 我們需求修改為這樣：查詢前10個員工的姓名、年齡，并且按照年齡小到大排序，如果年齡相同，則按姓名降序排。對應的 SQL 語句就可以這么寫：

select name,age from staff  order by age ,name desc limit 10;

我們看下執(zhí)行計劃，發(fā)現(xiàn)使用到Using filesort。

這是因為，idx_age_name索引樹中，age從小到大排序，如果age相同，再按name從小到大排序。而order by 中，是按age從小到大排序，如果age相同，再按name從大到小排序。也就是說，索引存儲順序與order by不一致。

我們怎么優(yōu)化呢?如果MySQL是8.0版本，支持Descending Indexes，可以這樣修改索引：

CREATE TABLE `staff` ( 
  `id` bigint(11) NOT NULL AUTO_INCREMENT COMMENT '主鍵id', 
  `id_card` varchar(20) NOT NULL COMMENT '身份證號碼', 
  `name` varchar(64) NOT NULL COMMENT '姓名', 
  `age` int(4) NOT NULL COMMENT '年齡', 
  `city` varchar(64) NOT NULL COMMENT '城市', 
  PRIMARY KEY (`id`), 
  KEY `idx_age_name` (`age`,`name` desc) USING BTREE 
) ENGINE=InnoDB AUTO_INCREMENT=15 DEFAULT CHARSET=utf8 COMMENT='員工表';

使用了in條件多個屬性時，SQL執(zhí)行是否有排序過程

如果我們有聯(lián)合索引idx_city_name，執(zhí)行這個SQL的話，是不會走排序過程的，如下：

select * from staff where city in ('深圳') order by age limit 10;

但是，如果使用in條件，并且有多個條件時，就會有排序過程。

explain select * from staff where city in ('深圳','上海') order by age limit 10;

這是因為:in有兩個條件，在滿足深圳時，age是排好序的，但是把滿足上海的age也加進來，就不能保證滿足所有的age都是排好序的。因此需要Using filesort。

本文轉(zhuǎn)載自微信公眾號「撿田螺的小男孩」，可以通過以下二維碼關注。轉(zhuǎn)載本文請聯(lián)系撿田螺的小男孩公眾號。

責任編輯：武曉燕來源：撿田螺的小男孩

Oracle 底層 explain

51CTO技術棧公眾號

業(yè)務
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學堂精培企業(yè)培訓 CTO訓練營

<style id="0va8t"></style>

<sub id="0va8t"></sub>

<sub id="0va8t"><p id="0va8t"></p></sub>