SQL Server如何利用硬盤原理減少IO
硬盤的原理簡介
一個典型的硬盤如圖1所示。
圖1.一個典型的硬盤
由圖1可以看到,硬盤上磁盤進行高速旋轉(zhuǎn),磁頭臂在磁盤上來回移動進行數(shù)據(jù)的讀取和寫入。這也是為什么我們說硬盤是一個機械部件的原因。通過圖2我們可以更抽象的來看磁盤讀取數(shù)據(jù)的方式。磁盤由圓心向外被劃分為多個磁道,所謂擺臂在磁道上來回移動也就是擺臂在磁道間的來回移動,
圖2.更抽象的硬盤原理
除了磁道之外,一個磁道還會被劃分為多個扇區(qū),如圖3所示。
圖3.磁道,扇區(qū)和簇
我們可以看到,扇區(qū)是硬盤尋址的最小單位,但實際上分配空間時最小的單位是簇(Clusters)。這也就是為什么硬盤上文件的實際大小和占用空間不同的原因。
磁盤讀寫數(shù)據(jù)所花費的時間
在了解了硬盤的基本原理之后,不難推算出,磁盤上數(shù)據(jù)讀取和寫入所花費的時間可以分為三個部分。
1.尋道時間
所謂尋道時間,其實就是磁臂移動到指定磁道所需要的時間,這部分時間又可以分為兩部分:
尋道時間=啟動磁臂的時間+常數(shù)*所需移動的磁道數(shù)
其中常數(shù)和驅(qū)動器的的硬件相關(guān),啟動磁臂的時間也和驅(qū)動器的硬件相關(guān)
2.旋轉(zhuǎn)延遲
旋轉(zhuǎn)延遲指的是把扇區(qū)移動到磁頭下面的時間。這個時間和驅(qū)動器的轉(zhuǎn)數(shù)有關(guān),我們通常所說的7200轉(zhuǎn)的硬盤的轉(zhuǎn)就是這個。
平均旋轉(zhuǎn)延遲=1/(2*轉(zhuǎn)數(shù)每秒)
比如7200轉(zhuǎn)的硬盤的平均旋轉(zhuǎn)延遲等于1/2*120≈4.17ms
旋轉(zhuǎn)延遲只和硬件有關(guān)。
3.傳輸時間
傳輸時間指的是從磁盤讀出或?qū)?shù)據(jù)寫入磁盤的時間。
這個時間等于:所需要讀寫的字節(jié)數(shù)/每秒轉(zhuǎn)速*每扇區(qū)的字節(jié)數(shù)
磁盤調(diào)度算法
通過上面硬盤讀寫數(shù)據(jù)所分的三部分時間不難看出,大部分參數(shù)是和硬件相關(guān)的,操作系統(tǒng)無力優(yōu)化。只有所需移動的磁道數(shù)是可以通過操作系統(tǒng)來進行控制的,所以減少所需移動的磁道數(shù)是減少整個硬盤的讀寫時間的唯一辦法。
因為操作系統(tǒng)內(nèi)可能會有很多進程需要調(diào)用磁盤進行讀寫,因此合理的安排磁頭的移動以減少尋道時間就是磁盤調(diào)度算法的目的所在,幾種常見的磁盤調(diào)度算法如下。
1.先來先服務(wù)算法(FCFS)
這種算法將對磁盤的IO請求進行排隊,按照先后順序依次調(diào)度磁頭。這種算法的特點是簡單,合理,但沒有減少尋道時間
2.最短尋道時間算法(SSFT)
這種算法優(yōu)先執(zhí)行所需讀寫的磁道離當前磁頭最近的請求。這保證了平均尋道時間的最短,但缺點顯而易見:離當前磁頭比較遠的尋道請求有可能一直得不到執(zhí)行,這也就是所謂的“饑餓現(xiàn)象”。
3.掃描算法(SCAN)
這種算法在磁頭的移動方向上選擇離當前磁頭所在磁道最近的請求作為下一次服務(wù)對象,這種改進有效避免了饑餓現(xiàn)象,并且減少了尋道時間。但缺點依然存在,那就是不利于最遠一端的磁道訪問請求。
3.循環(huán)掃描算法(CSCAN)
也就是俗稱的電梯算法,這種算法是對最短尋道時間算法的改進。這種算法就像電梯一樣,只能從1樓上到15樓,然后再從15樓下到1樓。這種算法的磁頭調(diào)度也是如此,磁頭只能從最里磁道到磁盤最外層磁道。然后再由最外層磁道移動到最里層磁道,磁頭是單向移動的,在此基礎(chǔ)上,才執(zhí)行和最短尋道時間算法一樣的,離當前磁頭最近的尋道請求。這種算法改善了SCAN算法,消除了對兩端磁道請求的不公平。
其它優(yōu)化手段以及SQL Server是如何利用這些手段
除去上面通過磁盤調(diào)度算法來減少尋道時間之外。還有一些其它的手段同樣可以利用,在開始之前,我首先想講一下局部性原理。
局部性原理
所謂的局部性原理分為時間和空間上的。由于程序是順序執(zhí)行的,因此當前數(shù)據(jù)段附近的數(shù)據(jù)有可能在接下來的時間被訪問到。這就是所謂的空間局部性。而程序中還存在著循環(huán),因此當前被訪問的數(shù)據(jù)有可能在短時間內(nèi)被再次訪問,這就是所謂的時間局部性原理。
因此在了解了局部性原理之后,我們可以通過以下幾個手段來減少磁盤的IO。
提前讀(Read-Ahead)
提前讀也被稱為預(yù)讀。根據(jù)磁盤原理我們不難看出,在磁盤讀取數(shù)據(jù)的過程中,真正讀取數(shù)據(jù)的時間只占了很小一部分,而大部分時間花在了旋轉(zhuǎn)延遲和尋道時間上,因此根據(jù)空間局部性原理,SQL Server每次讀取數(shù)據(jù)的時間不僅僅讀取所需要的數(shù)據(jù),還將所請求數(shù)據(jù)附近的數(shù)據(jù)進行讀取。這在SQL Server中被稱為預(yù)讀。SQL Server通過預(yù)讀可以有效的減少IO請求。
延遲寫(Delayed write)
同樣,根據(jù)時間局部性原理,最近被訪問的數(shù)據(jù)有可能再次被訪問,因此當數(shù)據(jù)更改之后不馬上寫回磁盤,而是繼續(xù)放在內(nèi)存中,以備接下來的請求讀取或者修改,是減少磁盤IO的另一個有效手段,在SQL Server中,實現(xiàn)延遲寫是buffer pool,當一個修改請求被commit之后,并不會立刻寫回磁盤,而是將修改的頁標記為“臟”,然后根據(jù)某種機制通過checkpoint或lazy writer寫回磁盤,關(guān)于checkpoint和lazy writer的原理,可以參考我之前的文章:淺談SQL Server中的事務(wù)日志(二)----事務(wù)日志在修改數(shù)據(jù)時的角色.
優(yōu)化物理分布
根據(jù)磁盤原理不難看出,如果所請求的數(shù)據(jù)在磁盤物理磁道之間是連續(xù)的,那么會減少磁頭的移動距離,從而減少了尋道時間。因此相關(guān)的數(shù)據(jù)放在連續(xù)的物理空間上會減少尋道時間。SQL Server中,通過聚集索引使得數(shù)據(jù)根據(jù)主鍵在物理磁盤上連續(xù),從而減少了尋道時間。
總結(jié)
本文談了硬盤的原理,讀寫數(shù)據(jù)所花費的時間以及如何減少讀寫數(shù)據(jù)所花的時間,并且簡單概述了SQL Server是如何利用這些特性減少IO的占用。理解磁盤的原理是進行性能調(diào)優(yōu)的基礎(chǔ)之一。
原文鏈接:http://www.cnblogs.com/CareySon/archive/2012/08/20/2647017.html
【編輯推薦】