自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

MySQL千萬級大表優(yōu)化,看這一篇就忘不掉了!

數(shù)據(jù)庫 MySQL
千萬級大表如何優(yōu)化,這是一個很有技術(shù)含量的問題,通常我們的直覺思維都會跳轉(zhuǎn)到拆分或者數(shù)據(jù)分區(qū),在此我想做一些補充和梳理,想和大家做一些這方面的經(jīng)驗總結(jié),也歡迎大家提出建議。

千萬級大表如何優(yōu)化,這是一個很有技術(shù)含量的問題,通常我們的直覺思維都會跳轉(zhuǎn)到拆分或者數(shù)據(jù)分區(qū),在此我想做一些補充和梳理,想和大家做一些這方面的經(jīng)驗總結(jié),也歡迎大家提出建議。 

[[314569]] 

圖片來自 Pexels

從一開始腦海里火光四現(xiàn),到不斷的自我批評,后來也參考了一些團隊的經(jīng)驗,我整理了下面的大綱內(nèi)容。 

 

既然要吃透這個問題,我們勢必要回到本源,我把這個問題分為三部分:“千萬級”,“大表”,“優(yōu)化”,也分別對應(yīng)我們在圖中標(biāo)識的“數(shù)據(jù)量”,“對象”和“目標(biāo)”。

我來逐步展開說明一下,從而給出一系列的解決方案。

數(shù)據(jù)量:千萬級

千萬級其實只是一個感官的數(shù)字,就是我們印象中的數(shù)據(jù)量大。

這里我們需要把這個概念細(xì)化,因為隨著業(yè)務(wù)和時間的變化,數(shù)據(jù)量也會有變化,我們應(yīng)該是帶著一種動態(tài)思維來審視這個指標(biāo),從而對于不同的場景我們應(yīng)該有不同的處理策略。

①數(shù)據(jù)量為千萬級,可能達到億級或者更高

通常是一些數(shù)據(jù)流水,日志記錄的業(yè)務(wù),里面的數(shù)據(jù)隨著時間的增長會逐步增多,超過千萬門檻是很容易的一件事情。

②數(shù)據(jù)量為千萬級,是一個相對穩(wěn)定的數(shù)據(jù)量

如果數(shù)據(jù)量相對穩(wěn)定,通常是在一些偏向于狀態(tài)的數(shù)據(jù),比如有 1000 萬用戶,那么這些用戶的信息在表中都有相應(yīng)的一行數(shù)據(jù)記錄,隨著業(yè)務(wù)的增長,這個量級相對是比較穩(wěn)定的。

③數(shù)據(jù)量為千萬級,不應(yīng)該有這么多的數(shù)據(jù)

這種情況是我們被動發(fā)現(xiàn)的居多,通常發(fā)現(xiàn)的時候已經(jīng)晚了,比如你看到一個配置表,數(shù)據(jù)量上千萬;或者說一些表里的數(shù)據(jù)已經(jīng)存儲了很久,99% 的數(shù)據(jù)都屬于過期數(shù)據(jù)或者垃圾數(shù)據(jù)。

數(shù)據(jù)量是一個整體的認(rèn)識,我們需要對數(shù)據(jù)做更近一層的理解,這就可以引出第二個部分的內(nèi)容。

對象:數(shù)據(jù)表

數(shù)據(jù)操作的過程就好比數(shù)據(jù)庫中存在著多條管道,這些管道中都流淌著要處理的數(shù)據(jù),這些數(shù)據(jù)的用處和歸屬是不一樣的。

一般根據(jù)業(yè)務(wù)類型把數(shù)據(jù)分為三種:

①流水型數(shù)據(jù)

流水型數(shù)據(jù)是無狀態(tài)的,多筆業(yè)務(wù)之間沒有關(guān)聯(lián),每次業(yè)務(wù)過來的時候都會產(chǎn)生新的單據(jù)。

比如交易流水、支付流水,只要能插入新單據(jù)就能完成業(yè)務(wù),特點是后面的數(shù)據(jù)不依賴前面的數(shù)據(jù),所有的數(shù)據(jù)按時間流水進入數(shù)據(jù)庫。

②狀態(tài)型數(shù)據(jù)

狀態(tài)型數(shù)據(jù)是有狀態(tài)的,多筆業(yè)務(wù)之間依賴于有狀態(tài)的數(shù)據(jù),而且要保證該數(shù)據(jù)的準(zhǔn)確性,比如充值時必須要拿到原來的余額,才能支付成功。

③配置型數(shù)據(jù)

此類型數(shù)據(jù)數(shù)據(jù)量較小,而且結(jié)構(gòu)簡單,一般為靜態(tài)數(shù)據(jù),變化頻率很低。

至此,我們可以對整體的背景有一個認(rèn)識了,如果要做優(yōu)化,其實要面對的是這樣的 3*3 的矩陣,如果要考慮表的讀寫比例(讀多寫少,讀少寫多...),那么就會是 3*3*4=24 種,顯然做窮舉是不顯示的,而且也完全沒有必要,可以針對不同的數(shù)據(jù)存儲特性和業(yè)務(wù)特點來指定不同的業(yè)務(wù)策略。

對此我們采取抓住重點的方式,把常見的一些優(yōu)化思路梳理出來,尤其是里面的核心思想,也是我們整個優(yōu)化設(shè)計的一把尺子,而難度決定了我們做這件事情的動力和風(fēng)險。 

 

而對于優(yōu)化方案,我想采用面向業(yè)務(wù)的維度來進行闡述。

目標(biāo):優(yōu)化

在這個階段,我們要說優(yōu)化的方案了,總結(jié)的有點多,相對來說是比較全了。整體分為五個部分: 

 

其實我們通常所說的分庫分表等方案只是其中的一小部分,如果展開之后就比較豐富了。 

 

不難理解,我們要支撐的表數(shù)據(jù)量是千萬級別,相對來說是比較大了,DBA 要維護的表肯定不止一張,如何能夠更好的管理,同時在業(yè)務(wù)發(fā)展中能夠支撐擴展,同時保證性能,這是擺在我們面前的幾座大山。

我們分別來說一下這五類改進方案:

  • 規(guī)范設(shè)計
  • 業(yè)務(wù)層優(yōu)化
  • 架構(gòu)層優(yōu)化
  • 數(shù)據(jù)庫優(yōu)化
  • 管理優(yōu)化

規(guī)范設(shè)計

在此我們先提到的是規(guī)范設(shè)計,而不是其他高大上的設(shè)計方案。

黑格爾說:秩序是自由的第一條件。在分工協(xié)作的工作場景中尤其重要,否則團隊之間互相牽制太多,問題多多。

我想提到如下的幾個規(guī)范,其實只是屬于開發(fā)規(guī)范的一部分內(nèi)容,可以作為參考。 

 

規(guī)范的本質(zhì)不是解決問題,而是有效杜絕一些潛在問題,對于千萬級大表要遵守的規(guī)范,我梳理了如下的一些細(xì)則,基本可以涵蓋我們常見的一些設(shè)計和使用問題。

比如表的字段設(shè)計不管三七二十一,都是 varchar(500),其實是很不規(guī)范的一種實現(xiàn)方式,我們來展開說一下這幾個規(guī)范。

配置規(guī)范:

  • MySQL 數(shù)據(jù)庫默認(rèn)使用 InnoDB 存儲引擎。
  • 保證字符集設(shè)置統(tǒng)一,MySQL 數(shù)據(jù)庫相關(guān)系統(tǒng)、數(shù)據(jù)庫、表的字符集都使用 UTF8,應(yīng)用程序連接、展示等可以設(shè)置字符集的地方也都統(tǒng)一設(shè)置為 UTF8 字符集。
  • 注:UTF8 格式是存儲不了表情類數(shù)據(jù),需要使用 UTF8MB4,可在 MySQL 字符集里面設(shè)置。在 8.0 中已經(jīng)默認(rèn)為 UTF8MB4,可以根據(jù)公司的業(yè)務(wù)情況進行統(tǒng)一或者定制化設(shè)置。
  • MySQL 數(shù)據(jù)庫的事務(wù)隔離級別默認(rèn)為 RR(Repeatable-Read),建議初始化時統(tǒng)一設(shè)置為 RC(Read-Committed),對于 OLTP 業(yè)務(wù)更適合。
  • 數(shù)據(jù)庫中的表要合理規(guī)劃,控制單表數(shù)據(jù)量,對于 MySQL 數(shù)據(jù)庫來說,建議單表記錄數(shù)控制在 2000W 以內(nèi)。
  • MySQL 實例下,數(shù)據(jù)庫、表數(shù)量盡可能少;數(shù)據(jù)庫一般不超過 50 個,每個數(shù)據(jù)庫下,數(shù)據(jù)表數(shù)量一般不超過 500 個(包括分區(qū)表)。

建表規(guī)范:

  • InnoDB 禁止使用外鍵約束,可以通過程序?qū)用姹WC。
  • 存儲精確浮點數(shù)必須使用 DECIMAL 替代 FLOAT 和 DOUBLE。
  • 整型定義中無需定義顯示寬度,比如:使用 INT,而不是 INT(4)。
  • 不建議使用 ENUM 類型,可使用 TINYINT 來代替。
  • 盡可能不使用 TEXT、BLOB 類型,如果必須使用,建議將過大字段或是不常用的描述型較大字段拆分到其他表中;另外,禁止用數(shù)據(jù)庫存儲圖片或文件。
  • 存儲年時使用 YEAR(4),不使用 YEAR(2)。
  • 建議字段定義為 NOT NULL。
  • 建議 DBA 提供 SQL 審核工具,建表規(guī)范性需要通過審核工具審核后。

命名規(guī)范:

  • 庫、表、字段全部采用小寫。
  • 庫名、表名、字段名、索引名稱均使用小寫字母,并以“_”分割。
  • 庫名、表名、字段名建議不超過 12 個字符。(庫名、表名、字段名支持最多 64 個字符,但為了統(tǒng)一規(guī)范、易于辨識以及減少傳輸量,統(tǒng)一不超過 12 字符)
  • 庫名、表名、字段名見名知意,不需要添加注釋。

對于對象命名規(guī)范的一個簡要總結(jié)如下表所示,供參考: 

 

命名列表

索引規(guī)范:

  • 索引建議命名規(guī)則:idx_col1_col2[_colN]、uniq_col1_col2[_colN](如果字段過長建議采用縮寫)。
  • 索引中的字段數(shù)建議不超過 5 個。
  • 單張表的索引個數(shù)控制在 5 個以內(nèi)。
  • InnoDB 表一般都建議有主鍵列,尤其在高可用集群方案中是作為必須項的。
  • 建立復(fù)合索引時,優(yōu)先將選擇性高的字段放在前面。
  • UPDATE、DELETE 語句需要根據(jù) WHERE 條件添加索引。
  • 不建議使用 % 前綴模糊查詢,例如 LIKE “%weibo”,無法用到索引,會導(dǎo)致全表掃描。
  • 合理利用覆蓋索引,例如:SELECT email,uid FROM user_email WHERE uid=xx,如果 uid 不是主鍵,可以創(chuàng)建覆蓋索引 idx_uid_email(uid,email)來提高查詢效率。
  • 避免在索引字段上使用函數(shù),否則會導(dǎo)致查詢時索引失效。
  • 確認(rèn)索引是否需要變更時要聯(lián)系 DBA。

應(yīng)用規(guī)范:

  • 避免使用存儲過程、觸發(fā)器、自定義函數(shù)等,容易將業(yè)務(wù)邏輯和DB耦合在一起,后期做分布式方案時會成為瓶頸。
  • 考慮使用 UNION ALL,減少使用 UNION,因為 UNION ALL 不去重,而少了排序操作,速度相對比 UNION 要快,如果沒有去重的需求,優(yōu)先使用 UNION ALL。
  • 考慮使用 limit N,少用 limit M,N,特別是大表或 M 比較大的時候。
  • 減少或避免排序,如:group by 語句中如果不需要排序,可以增加 order by null。
  • 統(tǒng)計表中記錄數(shù)時使用 COUNT(*),而不是 COUNT(primary_key) 和 COUNT(1)。
  • InnoDB 表避免使用 COUNT(*) 操作,計數(shù)統(tǒng)計實時要求較強可以使用 Memcache 或者 Redis,非實時統(tǒng)計可以使用單獨統(tǒng)計表,定時更新。
  • 做字段變更操作(modify column/change column)的時候必須加上原有的注釋屬性,否則修改后,注釋會丟失。
  • 使用 prepared statement 可以提高性能并且避免 SQL 注入。
  • SQL 語句中 IN 包含的值不應(yīng)過多。
  • UPDATE、DELETE 語句一定要有明確的 WHERE 條件。
  • WHERE 條件中的字段值需要符合該字段的數(shù)據(jù)類型,避免 MySQL 進行隱式類型轉(zhuǎn)化。
  • SELECT、INSERT 語句必須顯式的指明字段名稱,禁止使用 SELECT * 或是 INSERT INTO table_name values()。
  • INSERT 語句使用 batch 提交(INSERT INTO table_name VALUES(),(),()……),values 的個數(shù)不應(yīng)過多。

業(yè)務(wù)層優(yōu)化

業(yè)務(wù)層優(yōu)化應(yīng)該是收益最高的優(yōu)化方式了,而且對于業(yè)務(wù)層完全可見,主要有業(yè)務(wù)拆分,數(shù)據(jù)拆分和兩類常見的優(yōu)化場景(讀多寫少,讀少寫多)! 

 

①業(yè)務(wù)拆分

業(yè)務(wù)拆分分為如下兩個方面:

  • 將混合業(yè)務(wù)拆分為獨立業(yè)務(wù)
  • 將狀態(tài)和歷史數(shù)據(jù)分離

業(yè)務(wù)拆分其實是把一個混合的業(yè)務(wù)剝離成為更加清晰的獨立業(yè)務(wù),這樣業(yè)務(wù) 1,業(yè)務(wù) 2......獨立的業(yè)務(wù)使得業(yè)務(wù)總量依舊很大,但是每個部分都是相對獨立的,可靠性依然有保證。

對于狀態(tài)和歷史數(shù)據(jù)分離,我可以舉一個例子來說明。

例如:我們有一張表 Account,假設(shè)用戶余額為 100。 

 

我們需要在發(fā)生數(shù)據(jù)變更后,能夠追溯數(shù)據(jù)變更的歷史信息,如果對賬戶更新狀態(tài)數(shù)據(jù),增加 100 的余額,這樣余額為 200。

這個過程可能對應(yīng)一條 update 語句,一條 insert 語句。對此我們可以改造為兩個不同的數(shù)據(jù)源,account 和 account_hist。

在 account_hist 中就會是兩條 insert 記錄,如下:

 

而在 account 中則是一條 update 語句,如下: 

 

這也是一種很基礎(chǔ)的冷熱分離,可以大大減少維護的復(fù)雜度,提高業(yè)務(wù)響應(yīng)效率。

②數(shù)據(jù)拆分

按照日期拆分:這種使用方式比較普遍,尤其是按照日期維度的拆分,其實在程序?qū)用娴母膭雍苄?,但是擴展性方面的收益很大。

  • 數(shù)據(jù)按照日期維度拆分,如 test_20191021。
  • 數(shù)據(jù)按照周月為維度拆分,如 test_201910。
  • 數(shù)據(jù)按照季度,年維度拆分,如 test_2019。

采用分區(qū)模式:分區(qū)模式也是常見的使用方式,采用 hash,range 等方式會多一些。

在 MySQL 中我是不大建議使用分區(qū)表的使用方式,因為隨著存儲容量的增長,數(shù)據(jù)雖然做了垂直拆分,但是歸根結(jié)底,數(shù)據(jù)其實難以實現(xiàn)水平擴展,在 MySQL 中是有更好的擴展方式。

③讀多寫少優(yōu)化場景

采用緩存,采用 Redis 技術(shù),將讀請求打在緩存層面,這樣可以大大降低 MySQL 層面的熱點數(shù)據(jù)查詢壓力。

④讀少寫多優(yōu)化場景

讀少寫多優(yōu)化場景,可以采用三步走:

  • 采用異步提交模式,異步對于應(yīng)用層來說最直觀的就是性能的提升,產(chǎn)生最少的同步等待。
  • 使用隊列技術(shù),大量的寫請求可以通過隊列的方式來進行擴展,實現(xiàn)批量的數(shù)據(jù)寫入。
  • 降低寫入頻率,這個比較難理解,我舉個例子:

對于業(yè)務(wù)數(shù)據(jù),比如積分類,相比于金額來說業(yè)務(wù)優(yōu)先級略低的場景,如果數(shù)據(jù)的更新過于頻繁,可以適度調(diào)整數(shù)據(jù)更新的范圍(比如從原來的每分鐘調(diào)整為 10 分鐘)來減少更新的頻率。

例如:更新狀態(tài)數(shù)據(jù),積分為 200,如下圖所示: 

 

可以改造為,如下圖所示: 

 

如果業(yè)務(wù)數(shù)據(jù)在短時間內(nèi)更新過于頻繁,比如 1 分鐘更新 100 次,積分從 100 到 10000,則可以根據(jù)時間頻率批量提交。

例如:更新狀態(tài)數(shù)據(jù),積分為 100,如下圖所示: 

 

無需生成 100 個事務(wù)(200 條 SQL 語句)可以改造為 2 條 SQL 語句,如下圖所示: 

 

對于業(yè)務(wù)指標(biāo),比如更新頻率細(xì)節(jié)信息,可以根據(jù)具體業(yè)務(wù)場景來討論決定。

架構(gòu)層優(yōu)化

架構(gòu)層優(yōu)化其實就是我們認(rèn)為的那種技術(shù)含量很高的工作,我們需要根據(jù)業(yè)務(wù)場景在架構(gòu)層面引入一些新的花樣來。 

 

①系統(tǒng)水平擴展場景

采用中間件技術(shù):可以實現(xiàn)數(shù)據(jù)路由,水平擴展,常見的中間件有 MyCAT,ShardingSphere,ProxySQL 等。 

 

采用讀寫分離技術(shù):這是針對讀需求的擴展,更側(cè)重于狀態(tài)表,在允許一定延遲的情況下,可以采用多副本的模式實現(xiàn)讀需求的水平擴展,也可以采用中間件來實現(xiàn),如 MyCAT,ProxySQL,MaxScale,MySQL Router 等。  

 

采用負(fù)載均衡技術(shù):常見的有 LVS 技術(shù)或者基于域名服務(wù)的 Consul 技術(shù)等。

②兼顧 OLTP+OLAP 的業(yè)務(wù)場景

可以采用 NewSQL,優(yōu)先兼容 MySQL 協(xié)議的 HTAP 技術(shù)棧,如 TiDB。

③離線統(tǒng)計的業(yè)務(wù)場景

有幾類方案可供選擇:

  • 采用 NoSQL 體系,主要有兩類,一類是適合兼容 MySQL 協(xié)議的數(shù)據(jù)倉庫體系,常見的有 Infobright 或者 ColumnStore,另外一類是基于列式存儲,屬于異構(gòu)方向,如 HBase 技術(shù)。
  • 采用數(shù)倉體系,基于 MPP 架構(gòu),如使用 Greenplum 統(tǒng)計,如 T+1 統(tǒng)計。

數(shù)據(jù)庫優(yōu)化

數(shù)據(jù)庫優(yōu)化,其實可打的牌也不少,但是相對來說空間沒有那么大了,我們來逐個說一下。 

 

①事務(wù)優(yōu)化

根據(jù)業(yè)務(wù)場景選擇事務(wù)模型,是否是強事務(wù)依賴。對于事務(wù)降維策略,我們來舉出幾個小例子來。

降維策略 1:存儲過程調(diào)用轉(zhuǎn)換為透明的 SQL 調(diào)用

對于新業(yè)務(wù)而言,使用存儲過程顯然不是一個好主意,MySQL 的存儲過程和其他商業(yè)數(shù)據(jù)庫相比,功能和性能都有待驗證,而且在目前輕量化的業(yè)務(wù)處理中,存儲過程的處理方式太“重”了。

有些應(yīng)用架構(gòu)看起來是按照分布式部署的,但在數(shù)據(jù)庫層的調(diào)用方式是基于存儲過程,因為存儲過程封裝了大量的邏輯,難以調(diào)試,而且移植性不高。

這樣業(yè)務(wù)邏輯和性能壓力都在數(shù)據(jù)庫層面了,使得數(shù)據(jù)庫層很容易成為瓶頸,而且難以實現(xiàn)真正的分布式。

所以有一個明確的改進方向就是對于存儲過程的改造,把它改造為 SQL 調(diào)用的方式,可以極大地提高業(yè)務(wù)的處理效率,在數(shù)據(jù)庫的接口調(diào)用上足夠簡單而且清晰可控。

降維策略 2:DDL 操作轉(zhuǎn)換為 DML 操作

有些業(yè)務(wù)經(jīng)常會有一種緊急需求,總是需要給一個表添加字段,搞得 DBA 和業(yè)務(wù)同學(xué)都挺累,可以想象一個表有上百個字段,而且基本都是 name1,name2……name100,這種設(shè)計本身就是有問題的,更不用考慮性能了。

究其原因,是因為業(yè)務(wù)的需求動態(tài)變化,比如一個游戲裝備有 20 個屬性,可能過了一個月之后就增加到了 40 個屬性,這樣一來,所有的裝備都有 40 個屬性,不管用沒用到,而且這種方式也存在諸多的冗余。

我們在設(shè)計規(guī)范里面也提到了一些設(shè)計的基本要素,在這些基礎(chǔ)上需要補充的是,保持有限的字段,如果要實現(xiàn)這些功能的擴展,其實完全可以通過配置化的方式來實現(xiàn),比如把一些動態(tài)添加的字段轉(zhuǎn)換為一些配置信息。

配置信息可以通過 DML 的方式進行修改和補充,對于數(shù)據(jù)入口也可以更加動態(tài)、易擴展。

降維策略 3:Delete 操作轉(zhuǎn)換為高效操作

有些業(yè)務(wù)需要定期來清理一些周期性數(shù)據(jù),比如表里的數(shù)據(jù)只保留一個月,那么超出時間范圍的數(shù)據(jù)就要清理掉了。

而如果表的量級比較大的情況下,這種 Delete 操作的代價實在太高,我們可以有兩類解決方案來把 Delete 操作轉(zhuǎn)換為更為高效的方式。

第一種是根據(jù)業(yè)務(wù)建立周期表,比如按照月表、周表、日表等維度來設(shè)計,這樣數(shù)據(jù)的清理就是一個相對可控而且高效的方式了。

第二種方案是使用 MySQL rename 的操作方式,比如一張 2 千萬的大表要清理 99% 的數(shù)據(jù),那么需要保留的 1% 的數(shù)據(jù)我們可以很快根據(jù)條件過濾補錄,實現(xiàn)“移形換位”。

②SQL 優(yōu)化

其實相對來說需要的極簡的設(shè)計,很多點都在規(guī)范設(shè)計里面了,如果遵守規(guī)范,八九不離十的問題都會杜絕掉。

在此補充幾點:

  • SQL 語句簡化,簡化是 SQL 優(yōu)化的一大利器,因為簡單,所以優(yōu)越。
  • 盡可能避免或者杜絕多表復(fù)雜關(guān)聯(lián),大表關(guān)聯(lián)是大表處理的噩夢,一旦打開了這個口子,越來越多的需求需要關(guān)聯(lián),性能優(yōu)化就沒有回頭路了,更何況大表關(guān)聯(lián)是 MySQL 的弱項,盡管 Hash Join 才推出,不要像掌握了絕對大殺器一樣,在商業(yè)數(shù)據(jù)庫中早就存在,問題照樣層出不窮。
  • SQL 中盡可能避免反連接,避免半連接,這是優(yōu)化器做得薄弱的一方面,什么是反連接,半連接?
  • 其實比較好理解,舉個例子:not in,not exists 就是反連接,in,exists 就是半連接,在千萬級大表中出現(xiàn)這種問題,性能是幾個數(shù)量級的差異。

③索引優(yōu)化

應(yīng)該是大表優(yōu)化中需要把握的一個度:

  • 首先必須有主鍵,規(guī)范設(shè)計中第一條就是,此處不接收反駁。
  • 其次,SQL 查詢基于索引或者唯一性索引,使得查詢模型盡可能簡單。
  • 最后,盡可能杜絕范圍數(shù)據(jù)的查詢,范圍掃描在千萬級大表情況下還是盡可能減少。

管理優(yōu)化

這部分應(yīng)該是在所有的解決方案中最容易被忽視的部分了,我放在最后,在此也向運維同事致敬,總是為很多認(rèn)為本應(yīng)該正常的問題盡職盡責(zé)(背鍋)。

 

千萬級大表的數(shù)據(jù)清理一般來說是比較耗時的,在此建議在設(shè)計中需要完善冷熱數(shù)據(jù)分離的策略,可能聽起來比較拗口,我來舉一個例子,把大表的 Drop 操作轉(zhuǎn)換為可逆的 DDL 操作。 

Drop 操作是默認(rèn)提交的,而且是不可逆的,在數(shù)據(jù)庫操作中都是跑路的代名詞,MySQL 層面目前沒有相應(yīng)的 Drop 操作恢復(fù)功能,除非通過備份來恢復(fù),但是我們可以考慮將 Drop 操作轉(zhuǎn)換為一種可逆的 DDL 操作。

MySQL 中默認(rèn)每個表有一個對應(yīng)的 ibd 文件,其實可以把 Drop 操作轉(zhuǎn)換為一個 rename 操作,即把文件從 testdb 遷移到 testdb_arch 下面。

從權(quán)限上來說,testdb_arch 是業(yè)務(wù)不可見的,rename 操作可以平滑的實現(xiàn)這個刪除功能,如果在一定時間后確認(rèn)可以清理,則數(shù)據(jù)清理對于已有的業(yè)務(wù)流程是不可見的,如下圖所示: 

 

此外,還有兩個額外建議,一個是對于大表變更,盡可能考慮低峰時段的在線變更,比如使用 pt-osc 工具或者是維護時段的變更,就不再贅述了。

最后總結(jié)一下,其實就是一句話:千萬級大表的優(yōu)化是根據(jù)業(yè)務(wù)場景,以成本為代價進行優(yōu)化的,絕對不是孤立的一個層面的優(yōu)化。

作者:楊建榮

編輯:陶家龍、孫淑娟

出處:轉(zhuǎn)載自微信公眾號楊建榮的學(xué)習(xí)筆記(ID:jianrong-notes)

 

 

責(zé)任編輯:武曉燕 來源: 楊建榮學(xué)習(xí)筆記
相關(guān)推薦

2023-11-18 09:30:42

模型AI

2020-02-18 16:20:03

Redis ANSI C語言日志型

2023-02-10 09:04:27

2022-06-20 09:01:23

Git插件項目

2022-08-01 11:33:09

用戶分析標(biāo)簽策略

2021-04-08 07:37:39

隊列數(shù)據(jù)結(jié)構(gòu)算法

2023-09-11 08:13:03

分布式跟蹤工具

2018-11-12 08:07:04

Nginx優(yōu)化并發(fā)

2019-05-14 09:31:16

架構(gòu)整潔軟件編程范式

2020-07-03 08:21:57

Java集合框架

2018-05-22 08:24:50

PythonPyMongoMongoDB

2023-10-17 08:15:28

API前后端分離

2024-09-23 08:00:00

消息隊列MQ分布式系統(tǒng)

2017-03-11 22:19:09

深度學(xué)習(xí)

2022-04-07 10:39:21

反射Java安全

2022-07-06 12:07:06

Python函數(shù)式編程

2020-10-18 07:32:06

SD-WAN網(wǎng)絡(luò)傳統(tǒng)廣域網(wǎng)

2019-04-01 10:43:59

Linux問題故障

2020-10-21 14:12:02

Single Sign

2022-05-19 08:28:19

索引數(shù)據(jù)庫
點贊
收藏

51CTO技術(shù)棧公眾號