自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<button id="eltx1"></button>

<ruby id="eltx1"></ruby><ruby id="eltx1"></ruby>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓

鴻蒙開發(fā)者社區(qū)

WOT技術大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設置退出

寫一手好SQL很有必要

作者：傾城 2023-11-10 16:08:23

數據庫 SQL Server

SQL語言的設計初衷是把關系數據庫的細節(jié)隱藏起來，解耦操作邏輯與數據展示，暴露給用戶一個簡單的交互接口。嚴格來說，SQL不是編程語言而是表達式，很多非程序員也可以快速掌握。一些產品經理直接通過SQL查詢運營數據，不用等到程序員開發(fā)后臺界面。

SQL語言的設計初衷是把關系數據庫的細節(jié)隱藏起來，解耦操作邏輯與數據展示，暴露給用戶一個簡單的交互接口。嚴格來說，SQL不是編程語言而是表達式，很多非程序員也可以快速掌握。一些產品經理直接通過SQL查詢運營數據，不用等到程序員開發(fā)后臺界面。

當數據量大的時候，優(yōu)化SQL語句和數據庫結構才是一門學問。傳統(tǒng)關系型數據庫就像體育課上的女同學，跑兩步就氣喘吁吁 - 容量小并發(fā)低，常常身體不適要請假 - 約束太多。大家都會搞點分布式，擴容應用程序比數據庫要容易得多，所以傳統(tǒng)關系型數據庫的實施原則是數據庫少干活，應用程序多干活，如下幾點細則：

充分利用但不濫用索引，須知索引也消耗磁盤和CPU。
不推薦使用數據庫函數格式化數據，交給應用程序處理。
不推薦使用外鍵約束，用應用程序保證數據準確性。
寫多讀少的場景，不推薦使用唯一索引，用應用程序保證唯一性。
適當冗余字段，用應用程序計算中間結果，用空間換時間。
不允許執(zhí)行極度耗時的事務，在應用程序中拆分成更小的事務。
預估重要數據表（比如訂單表）的負載和數據增長態(tài)勢，做好優(yōu)化預案。

以下以MySQL為例，分享幾點數據庫優(yōu)化的措施。

1 MySQL配置

1.1 單表數據量

拋開數據量和并發(fā)數，談性能都是耍流氓。MySQL沒有限制單表最大記錄數，它取決于操作系統(tǒng)對文件大小的限制。

文件系統(tǒng)	單文件大小限制
FAT32	最大4G
NTFS	最大64GB
NTFS5.0	最大2TB
EXT2	塊大小為1024字節(jié)，文件最大容量16GB；塊大小為4096字節(jié)，文件最大容量2TB
EXT3	塊大小為4KB，文件最大容量為4TB
EXT4	理論可以大于16TB

《阿里巴巴Java開發(fā)手冊》提出單表行數超過500萬行或者單表容量超過2GB，才推薦分庫分表。性能由綜合因素決定，拋開業(yè)務復雜度，影響程度依次是硬件配置、MySQL配置、數據表設計、索引優(yōu)化。500萬這個值僅供參考，并非鐵律。我曾經操作過超過4億行數據的單表，分頁查詢最新的20條記錄耗時0.6秒，SQL語句大致是select field_1,field_2 from table where id < #{prePageMinId} order by id desc limit 20，prePageMinId是上一頁數據記錄的最小ID。雖然當時查詢速度還湊合，隨著數據不斷增長，有朝一日必定不堪重負。分庫分表是個周期長而風險高的大活兒，應該盡可能在當前結構上優(yōu)化，比如升級硬件、遷移歷史數據等等，實在沒轍了再分。

1.2 最大并發(fā)數

在MySQL中，每個連接通常都對應著一個線程，并發(fā)數代表著一定時間段內，允許訪問數據庫的線程的最大數，由參數 max_connections 和 max_user_connections 決定。max_connections是指數據庫實例的最大連接數，上限值是16384，max_user_connections是指每個數據庫用戶的最大連接數。MySQL會為每個連接提供緩沖區(qū)，意味著消耗更多的內存。如果連接數設置太高硬件吃不消，太低又不能充分利用硬件。一般要求兩者比值超過10%，計算方法如下：

max_used_connections / max_connections * 100% = 3/100 *100% ≈ 3%

查看最大連接數與響應最大連接數：

show variables like '%max_connections%';
show variables like '%max_user_connections%';

在配置文件my.cnf中修改最大連接數

[mysqld]
max_connections = 100
max_used_connections = 20

1.3 慢查詢日志

用戶體驗有一個3秒原則，如果用戶的操作3秒內沒有響應，將會厭煩甚至退出。響應時間=客戶端UI渲染耗時+網絡請求耗時+應用程序處理耗時+查詢數據庫耗時，0.5秒就是留給數據庫1/6的處理時間。建議將單次查詢耗時控制在0.5秒以內，并且配置慢查詢日志。

2 數據表優(yōu)化

2.1 數據類型

盡可能采用更簡單或者占用空間更小的數據類型：

如果長度能夠滿足，整型盡量使用tinyint、smallint、medium_int而非int。
如果字符串長度確定，采用char類型。
如果varchar能夠滿足，不采用text類型。
精度要求較高的使用decimal類型，也可以使用BIGINT，比如精確兩位小數就乘以100后保存。
盡量采用timestamp而非datetime。

類型	字節(jié)	描述
datetime	8字節(jié)	'1000-01-01 00:00:00.000000' to '9999-12-31 23:59:59.999999
timestamp	4字節(jié)	'1970-01-01 00:00:01.000000' to '2038-01-19 03:14:07.999999'

相比datetime，timestamp占用更少的空間，以UTC的格式儲存自動轉換時區(qū)。

2.2 避免空值

MySQL中字段為NULL時依然占用空間，會使索引、索引統(tǒng)計更加復雜。從NULL值更新到非NULL無法做到原地更新，容易發(fā)生索引分裂影響性能。盡可能將NULL值用有意義的值代替，也能避免SQL語句里面包含is not null的判斷。

2.3 優(yōu)化text類型

text字段用于儲存大量數據，容易導致單表容量過快膨脹，影響其他字段的查詢性能。建議抽取出來放在子表里，用業(yè)務主鍵關聯(lián)。

3 索引優(yōu)化

3.1 索引分類

普通索引：最基本的索引。
組合索引：多個字段上建立的索引，能夠加速復合查詢條件的檢索。
唯一索引：與普通索引類似，但索引列的值必須唯一，允許有空值。
組合唯一索引：列值的組合必須唯一。
主鍵索引：特殊的唯一索引，用于唯一標識數據表中的某一條記錄，不允許有空值，一般用primary key約束。
全文索引：用于海量文本的查詢，MySQL5.6之后的InnoDB和MyISAM均支持全文索引。由于查詢精度以及擴展性不佳，更多的企業(yè)選擇Elasticsearch。

3.2 索引優(yōu)化

單次查詢數據量超過30%時，優(yōu)化器認為全表掃描比走索引更好，此時索引失效。
單表索引數不超過5個、單個索引字段數不超過5個。
字符串可使用前綴索引，前綴長度控制在5-8個字符。
字段唯一性太低，增加索引沒有意義，比如性別。
合理使用覆蓋索引，如下所示：

select login_name, nick_name from member where login_name = ?

login_name, nick_name兩個字段建立組合索引，比login_name簡單索引要更快

4 SQL優(yōu)化

4.1 分批處理

你見過魚塘挖開堤岸放水嗎？水面有各種漂浮物比如浮萍、樹葉、樹枝，浮萍總能順利通過出水口，而樹枝可能卡住出口，擋住其他物體通過。數據庫是魚塘，最大并發(fā)數就是出水口，一般的用戶SQL是浮萍，影響大量數據行的select、update操作是樹枝，舉例如下：

更新用戶所有已過期的優(yōu)惠券為不可用狀態(tài)。
update status=0 FROM `coupon` WHERE expire_date <= #{currentDate} and status=1;

如果大量優(yōu)惠券需要更新為不可用狀態(tài)，執(zhí)行這條SQL可能會堵死其他SQL，分批處理偽代碼如下：

int pageNo = 1;
int PAGE_SIZE = 100;
while(true) {
    List<Integer> batchIdList = queryList('select id FROM `coupon` WHERE expire_date <= #{currentDate} and status = 1 limit #{(pageNo-1) * PAGE_SIZE},#{PAGE_SIZE}');
    if (CollectionUtils.isEmpty(batchIdList)) {
        return;
    }
    update('update status = 0 FROM `coupon` where status = 1 and id in #{batchIdList}')
    pageNo ++;
}

4.2 操作符優(yōu)化

通常<>操作符無法使用索引，舉例如下，查詢金額不為100元的訂單：

select id from orders where amount  != 100;

如果金額為100的訂單極少，這種數據分布嚴重不均的情況下，有可能使用索引。鑒于這種不確定性，采用union聚合搜索結果，改寫方法如下：

(select id from orders where amount > 100)
 union all
(select id from orders where amount < 100 and amount > 0)

4.3 OR優(yōu)化

在Innodb引擎下or無法使用組合索引，比如：

select id，product_name from orders where mobile_no = '13421800407' or user_id = 100;

OR無法命中mobile_no + user_id的組合索引，可采用union，如下所示：

(select id，product_name from orders where mobile_no = '13421800407')
 union
(select id，product_name from orders where user_id = 100);

此時id和product_name字段都有索引，查詢才最高效。

4.4 IN優(yōu)化

IN適合主表大子表小，EXIST適合主表小子表大。由于查詢優(yōu)化器的不斷升級，很多場景這兩者性能差不多一樣了。舉例如下：

select id from orders where user_id in (select id from user where level = 'VIP');

改造為 Join：

select o.id from orders o left join user u on o.user_id = u.id where u.level = 'VIP';

4.5 不做列運算

在查詢條件列運算會導致索引失效，如下所示：

查詢當日訂單
select id from order where date_format(create_time，'%Y-%m-%d') = '2019-07-01';

date_format函數會導致這個查詢無法使用索引，改寫后：

select id from order where create_time between '2019-07-01 00:00:00' and '2019-07-01 23:59:59';

4.6 避免Select all

如果不查詢表中所有的列，避免使用SELECT *，它會進行全表掃描，不能有效利用索引。

4.7 Like優(yōu)化

like用于模糊查詢，舉個例子（field已建立索引）：

SELECT column FROM table WHERE field like '%keyword%';

這個查詢未命中索引，換成下面的寫法：

SELECT column FROM table WHERE field like 'keyword%';

去除了前面的%查詢將會命中索引，但是產品經理一定要前后模糊匹配呢？全文索引fulltext可以嘗試一下，但Elasticsearch才是終極武器。

4.8 Join優(yōu)化

Join的原理通過驅動表的結果集作為基礎數據，將該結果數據作為過濾條件到下一個表中循環(huán)查詢數據，然后合并結果。如果有多個join，則將前面的結果集作為循環(huán)數據，再次到后一個表中查詢數據。

驅動表和被驅動表盡可能增加查詢條件，滿足ON的條件而少用Where，用小結果集驅動大結果集。
被驅動表的join字段上加上索引，無法建立索引的時候，設置足夠的Join Buffer Size。
禁止join連接三個以上的表，嘗試增加冗余字段。

4.9 Limit優(yōu)化

limit用于分頁查詢時越往后翻性能越差，解決的原則：縮小掃描范圍，如下所示：

select * from orders order by id desc limit 100000,10 
耗時0.4秒


select * from orders order by id desc limit 1000000,10
耗時5.2秒

先篩選出ID縮小查詢范圍，寫法如下：

select * from orders where id > (select id from orders order by id desc  limit 1000000, 1) order by id desc limit 0,10
耗時0.5秒

如果查詢條件僅有主鍵ID，寫法如下：

select id from orders where id between 1000000 and 1000010 order by id desc
耗時0.3秒

5 NoSQL數據庫

NoSQL 數據庫通常指非關系型數據庫，是一種基于數據鍵值對存儲、高度分布式、支持動態(tài)查詢的數據管理系統(tǒng)。NoSQL 數據庫的設計目的是為了解決傳統(tǒng)關系型數據庫無法處理的大型應用程序的數據存儲和管理問題。它們通常具有以下特點：

靈活性：NoSQL 數據庫沒有固定的表結構和查詢語言，允許在一個數據元素里存儲不同類型的數據，從而支持靈活的數據存儲和管理。
可擴展性：NoSQL 數據庫通常采用分布式存儲和并行處理技術，可以在需要時輕松擴展以支持更大的數據量和更高的并發(fā)訪問。
高可用：NoSQL 數據庫通常采用多副本復制技術，以確保數據的高可用性和容錯能力。
弱一致性：與傳統(tǒng)的關系型數據庫不同，NoSQL 數據庫通常采用最終一致性模型，這意味著在分布式系統(tǒng)中，數據可能不會立即同步，但在一段時間后將趨于一致。

后端開發(fā)人員不光要精通MySQL或Oracle等傳統(tǒng)關系數據庫，也要學會采用NoSQL數據庫解決特定場景下的性能瓶頸。

責任編輯：華軒來源：編碼專家

51CTO技術棧公眾號

業(yè)務
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學堂精培企業(yè)培訓 CTO訓練營

<thead id="zxai7"><option id="zxai7"><listing id="zxai7"></listing></option></thead>

<blockquote id="zxai7"><ul id="zxai7"></ul></blockquote>

<button id="zxai7"></button>