自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

緩沖池(buffer pool),這次徹底懂了?。。?/h1>

開發(fā) 開發(fā)工具 前端
MySQL作為一個存儲系統(tǒng),同樣具有緩沖池(buffer pool)機制,以避免每次查詢數(shù)據(jù)都進(jìn)行磁盤IO。今天,和大家聊一聊InnoDB的緩沖池。

應(yīng)用系統(tǒng)分層架構(gòu),為了加速數(shù)據(jù)訪問,會把最常訪問的數(shù)據(jù),放在緩存(cache)里,避免每次都去訪問數(shù)據(jù)庫。

操作系統(tǒng),會有緩沖池(buffer pool)機制,避免每次訪問磁盤,以加速數(shù)據(jù)的訪問。

MySQL作為一個存儲系統(tǒng),同樣具有緩沖池(buffer pool)機制,以避免每次查詢數(shù)據(jù)都進(jìn)行磁盤IO。

今天,和大家聊一聊InnoDB的緩沖池。

InnoDB的緩沖池緩存什么?有什么用?

緩存表數(shù)據(jù)與索引數(shù)據(jù),把磁盤上的數(shù)據(jù)加載到緩沖池,避免每次訪問都進(jìn)行磁盤IO,起到加速訪問的作用。

速度快,那為啥不把所有數(shù)據(jù)都放到緩沖池里?

凡事都具備兩面性,拋開數(shù)據(jù)易失性不說,訪問快速的反面是存儲容量?。?/p>

  • 緩存訪問快,但容量小,數(shù)據(jù)庫存儲了200G數(shù)據(jù),緩存容量可能只有64G;
  • 內(nèi)存訪問快,但容量小,買一臺筆記本磁盤有2T,內(nèi)存可能只有16G;

因此,只能把“最熱”的數(shù)據(jù)放到“最近”的地方,以“***限度”的降低磁盤訪問。

如何管理與淘汰緩沖池,使得性能***化呢?

在介紹具體細(xì)節(jié)之前,先介紹下“預(yù)讀”的概念。

什么是預(yù)讀?

磁盤讀寫,并不是按需讀取,而是按頁讀取,一次至少讀一頁數(shù)據(jù)(一般是4K),如果未來要讀取的數(shù)據(jù)就在頁中,就能夠省去后續(xù)的磁盤IO,提高效率。

預(yù)讀為什么有效?

數(shù)據(jù)訪問,通常都遵循“集中讀寫”的原則,使用一些數(shù)據(jù),大概率會使用附近的數(shù)據(jù),這就是所謂的“局部性原理”,它表明提前加載是有效的,確實能夠減少磁盤IO。

按頁(4K)讀取,和InnoDB的緩沖池設(shè)計有啥關(guān)系?

  • 磁盤訪問按頁讀取能夠提高性能,所以緩沖池一般也是按頁緩存數(shù)據(jù);
  • 預(yù)讀機制啟示了我們,能把一些“可能要訪問”的頁提前加入緩沖池,避免未來的磁盤IO操作;

InnoDB是以什么算法,來管理這些緩沖頁呢?

最容易想到的,就是LRU(Least recently used)。

畫外音:memcache,OS都會用LRU來進(jìn)行頁置換管理,但MySQL的玩法并不一樣。

傳統(tǒng)的LRU是如何進(jìn)行緩沖頁管理?

最常見的玩法是,把入緩沖池的頁放到LRU的頭部,作為最近訪問的元素,從而最晚被淘汰。這里又分兩種情況:

  • 頁已經(jīng)在緩沖池里,那就只做“移至”LRU頭部的動作,而沒有頁被淘汰;
  • 頁不在緩沖池里,除了做“放入”LRU頭部的動作,還要做“淘汰”LRU尾部頁的動作;

如上圖,假如管理緩沖池的LRU長度為10,緩沖了頁號為1,3,5…,40,7的頁。

假如,接下來要訪問的數(shù)據(jù)在頁號為4的頁中:

  • 頁號為4的頁,本來就在緩沖池里;
  • 把頁號為4的頁,放到LRU的頭部即可,沒有頁被淘汰;

畫外音:為了減少數(shù)據(jù)移動,LRU一般用鏈表實現(xiàn)。

假如,再接下來要訪問的數(shù)據(jù)在頁號為50的頁中:

  • 頁號為50的頁,原來不在緩沖池里;
  • 把頁號為50的頁,放到LRU頭部,同時淘汰尾部頁號為7的頁;

傳統(tǒng)的LRU緩沖池算法十分直觀,OS,memcache等很多軟件都在用,MySQL為啥這么矯情,不能直接用呢?

這里有兩個問題:

  • 預(yù)讀失效;
  • 緩沖池污染;

什么是預(yù)讀失效?

由于預(yù)讀(Read-Ahead),提前把頁放入了緩沖池,但最終MySQL并沒有從頁中讀取數(shù)據(jù),稱為預(yù)讀失效。

如何對預(yù)讀失效進(jìn)行優(yōu)化?

要優(yōu)化預(yù)讀失效,思路是:

  • 讓預(yù)讀失敗的頁,停留在緩沖池LRU里的時間盡可能短;
  • 讓真正被讀取的頁,才挪到緩沖池LRU的頭部;

以保證,真正被讀取的熱數(shù)據(jù)留在緩沖池里的時間盡可能長。

具體方法是:

(1)將LRU分為兩個部分:

  • 新生代(new sublist)
  • 老生代(old sublist)

(2)新老生代收尾相連,即:新生代的尾(tail)連接著老生代的頭(head);

(3)新頁(例如被預(yù)讀的頁)加入緩沖池時,只加入到老生代頭部:

  • 如果數(shù)據(jù)真正被讀取(預(yù)讀成功),才會加入到新生代的頭部
  • 如果數(shù)據(jù)沒有被讀取,則會比新生代里的“熱數(shù)據(jù)頁”更早被淘汰出緩沖池

舉個例子,整個緩沖池LRU如上圖:

  • 整個LRU長度是10;
  • 前70%是新生代;
  • 后30%是老生代;
  • 新老生代首尾相連;

假如有一個頁號為50的新頁被預(yù)讀加入緩沖池:

  • 50只會從老生代頭部插入,老生代尾部(也是整體尾部)的頁會被淘汰掉;
  • 假設(shè)50這一頁不會被真正讀取,即預(yù)讀失敗,它將比新生代的數(shù)據(jù)更早淘汰出緩沖池;

假如50這一頁立刻被讀取到,例如SQL訪問了頁內(nèi)的行row數(shù)據(jù):

  • 它會被立刻加入到新生代的頭部;
  • 新生代的頁會被擠到老生代,此時并不會有頁面被真正淘汰;

改進(jìn)版緩沖池LRU能夠很好的解決“預(yù)讀失敗”的問題。

畫外音:但也不要因噎廢食,因為害怕預(yù)讀失敗而取消預(yù)讀策略,大部分情況下,局部性原理是成立的,預(yù)讀是有效的。

新老生代改進(jìn)版LRU仍然解決不了緩沖池污染的問題。

什么是MySQL緩沖池污染?

當(dāng)某一個SQL語句,要批量掃描大量數(shù)據(jù)時,可能導(dǎo)致把緩沖池的所有頁都替換出去,導(dǎo)致大量熱數(shù)據(jù)被換出,MySQL性能急劇下降,這種情況叫緩沖池污染。

例如,有一個數(shù)據(jù)量較大的用戶表,當(dāng)執(zhí)行:

select * from user where name like "%shenjian%";

雖然結(jié)果集可能只有少量數(shù)據(jù),但這類like不能***索引,必須全表掃描,就需要訪問大量的頁:

  • 把頁加到緩沖池(插入老生代頭部);
  • 從頁里讀出相關(guān)的row(插入新生代頭部);
  • row里的name字段和字符串shenjian進(jìn)行比較,如果符合條件,加入到結(jié)果集中;
  • …直到掃描完所有頁中的所有row…

如此一來,所有的數(shù)據(jù)頁都會被加載到新生代的頭部,但只會訪問一次,真正的熱數(shù)據(jù)被大量換出。

怎么這類掃碼大量數(shù)據(jù)導(dǎo)致的緩沖池污染問題呢?

MySQL緩沖池加入了一個“老生代停留時間窗口”的機制:

  • 假設(shè)T=老生代停留時間窗口;
  • 插入老生代頭部的頁,即使立刻被訪問,并不會立刻放入新生代頭部;
  • 只有滿足“被訪問”并且“在老生代停留時間”大于T,才會被放入新生代頭部;

繼續(xù)舉例,假如批量數(shù)據(jù)掃描,有51,52,53,54,55等五個頁面將要依次被訪問。

如果沒有“老生代停留時間窗口”的策略,這些批量被訪問的頁面,會換出大量熱數(shù)據(jù)。

加入“老生代停留時間窗口”策略后,短時間內(nèi)被大量加載的頁,并不會立刻插入新生代頭部,而是優(yōu)先淘汰那些,短期內(nèi)僅僅訪問了一次的頁。

而只有在老生代呆的時間足夠久,停留時間大于T,才會被插入新生代頭部。

上述原理,對應(yīng)InnoDB里哪些參數(shù)?

有三個比較重要的參數(shù)。

(1) 參數(shù):innodb_buffer_pool_size

介紹:配置緩沖池的大小,在內(nèi)存允許的情況下,DBA往往會建議調(diào)大這個參數(shù),越多數(shù)據(jù)和索引放到內(nèi)存里,數(shù)據(jù)庫的性能會越好。

(2) 參數(shù):innodb_old_blocks_pct

介紹:老生代占整個LRU鏈長度的比例,默認(rèn)是37,即整個LRU中新生代與老生代長度比例是63:37。

畫外音:如果把這個參數(shù)設(shè)為100,就退化為普通LRU了。

(3) 參數(shù):innodb_old_blocks_time

介紹:老生代停留時間窗口,單位是毫秒,默認(rèn)是1000,即同時滿足“被訪問”與“在老生代停留時間超過1秒”兩個條件,才會被插入到新生代頭部。

總結(jié)

(1) 緩沖池(buffer pool)是一種常見的降低磁盤訪問的機制;

(2) 緩沖池通常以頁(page)為單位緩存數(shù)據(jù);

(3) 緩沖池的常見管理算法是LRU,memcache,OS,InnoDB都使用了這種算法;

(4) InnoDB對普通LRU進(jìn)行了優(yōu)化:

  • 將緩沖池分為老生代和新生代,入緩沖池的頁,優(yōu)先進(jìn)入老生代,頁被訪問,才進(jìn)入新生代,以解決預(yù)讀失效的問題
  • 頁被訪問,且在老生代停留時間超過配置閾值的,才進(jìn)入新生代,以解決批量數(shù)據(jù)訪問,大量熱數(shù)據(jù)淘汰的問題

【本文為51CTO專欄作者“58沈劍”原創(chuàng)稿件,轉(zhuǎn)載請聯(lián)系原作者】

 

戳這里,看該作者更多好文

責(zé)任編輯:趙寧寧 來源: 51CTO專欄
相關(guān)推薦

2019-06-26 06:31:56

緩沖緩沖池查詢數(shù)據(jù)

2022-03-22 15:05:15

MySQL緩沖池

2023-10-07 15:56:49

三鏈表緩存頁flush鏈表

2022-03-26 08:49:13

MySQL數(shù)據(jù)存儲

2019-06-26 09:41:44

分布式事務(wù)微服務(wù)

2022-03-30 09:23:15

MySQL緩沖

2020-07-08 08:07:23

高并發(fā)系統(tǒng)消息隊列

2022-10-12 08:52:00

內(nèi)存緩沖管理

2022-04-25 09:03:16

JavaScript代碼

2025-03-17 00:21:00

2023-12-11 11:29:35

2021-03-01 18:37:15

MySQL存儲數(shù)據(jù)

2021-04-28 09:27:56

MySQLInnoDB數(shù)據(jù)庫

2024-06-21 08:32:24

2010-05-07 19:15:18

Oracle flas

2024-10-23 08:47:46

2025-04-08 08:20:00

2022-06-07 08:14:35

PGPAGETUPLE

2020-08-10 07:52:30

MySQL數(shù)據(jù)庫

2023-05-03 21:34:34

MySQL狀態(tài)變量
點贊
收藏

51CTO技術(shù)棧公眾號