自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

存儲(chǔ)性能瓶頸的背后,這篇文章帶來(lái)的參考價(jià)值

存儲(chǔ) 存儲(chǔ)軟件
在項(xiàng)目實(shí)戰(zhàn)中,需根據(jù)業(yè)務(wù)真實(shí)訴求,針對(duì)業(yè)務(wù)模型進(jìn)行最佳實(shí)踐分析和洞察,從主機(jī)端口、存儲(chǔ)系統(tǒng)、后端磁盤等端到端進(jìn)行分析和評(píng)估,才能提供比較切合業(yè)務(wù)訴求的配置。

在項(xiàng)目實(shí)戰(zhàn)中,需根據(jù)業(yè)務(wù)真實(shí)訴求,針對(duì)業(yè)務(wù)模型進(jìn)行***實(shí)踐分析和洞察,從主機(jī)端口、存儲(chǔ)系統(tǒng)、后端磁盤等端到端進(jìn)行分析和評(píng)估,才能提供比較切合業(yè)務(wù)訴求的配置。

那么,通常有哪些因素會(huì)影響對(duì)性能的準(zhǔn)確評(píng)估呢?在本文中會(huì)把項(xiàng)目性能評(píng)估中遇到的難點(diǎn)話題依次羅列,希望對(duì)大家有所幫助。

[[211273]]

一、IO聚合優(yōu)化寫(xiě)懲罰

IO聚合成滿分條大小的情況下,無(wú)需做預(yù)讀操作,不會(huì)觸發(fā)RAID寫(xiě)懲罰,RAID寫(xiě)懲罰在不是滿分條寫(xiě)的時(shí)候,才會(huì)觸發(fā)預(yù)讀的流程。以RAID5-5小寫(xiě)為例,寫(xiě)一個(gè)數(shù)據(jù)位,需要預(yù)讀兩次,寫(xiě)校驗(yàn)位一次。可以認(rèn)為是一個(gè)IO被放大成了四個(gè)IO。

而滿分條寫(xiě)的時(shí)候,同時(shí)寫(xiě)四個(gè)數(shù)據(jù)位,不需要預(yù)讀,只需要額外寫(xiě)一次校驗(yàn)位,可以認(rèn)為是四個(gè)IO被放大成了五個(gè)IO 。對(duì)比非滿分條寫(xiě),效率大大提高。

存儲(chǔ)的IO合并能力對(duì)于數(shù)據(jù)庫(kù)業(yè)務(wù)是否各家都能做到IO合并呢?一般存儲(chǔ)針對(duì)不同類型的IO有不同的合并能力;數(shù)據(jù)庫(kù)業(yè)務(wù)主要是隨機(jī)IO,各廠商都做不到完全滿分條IO合并。存儲(chǔ)收到的IO是否能夠合并,主要取決于兩個(gè)方面。

1、主機(jī)側(cè)發(fā)下來(lái)的業(yè)務(wù)IO是否順序,是否連續(xù),與主機(jī)業(yè)務(wù)軟件本身、主機(jī)側(cè)塊設(shè)備、卷管理策略、HBA卡拆分策略等相關(guān)。主機(jī)下發(fā)的IO越順序、越連續(xù),到達(dá)陣列后的合并效果越好。

2、IO路徑上的Cache、存儲(chǔ)塊設(shè)備、硬盤等模塊都會(huì)對(duì)IO進(jìn)行排序與合并的操作,試圖盡可能將小IO合成大IO下盤。

對(duì)于順序小IO而言,基本上能夠?qū)崿F(xiàn)將IO都合并成滿分條后下盤。而對(duì)于IO隨機(jī)程度較高的數(shù)據(jù)庫(kù)業(yè)務(wù),各廠商都無(wú)法確保所有IO都能夠合并,只能盡量通過(guò)排序和合并,將相鄰地址的小IO合成大IO,但合并程度由于算法實(shí)現(xiàn)和內(nèi)存大小等因素可能會(huì)有所差異。

二、場(chǎng)景的業(yè)務(wù)模型

OLTP、OLAP、VDI和SPC-1是當(dāng)前性能評(píng)估中常見(jiàn)的三類業(yè)務(wù)場(chǎng)景。SPC-1是業(yè)界通用的隨機(jī)IOPS型的IO模型,在不清楚實(shí)際業(yè)務(wù)類型的條件下,常用此模型來(lái)進(jìn)行性能評(píng)估。四種模型的簡(jiǎn)單IO特征如下表所示。

1、OLTP業(yè)務(wù)模型和特征:

每個(gè)事務(wù)的讀,寫(xiě),更改涉及的數(shù)據(jù)量非常小,同時(shí)有很多用戶連接到數(shù)據(jù)庫(kù),使用數(shù)據(jù)庫(kù),要求數(shù)據(jù)庫(kù)有很快的響應(yīng)時(shí)間,通常一個(gè)事務(wù)在幾秒內(nèi)完成,時(shí)延要求一般在10-20ms。

針對(duì)Data LUN,主要是隨機(jī)小IO,IO大小主要為8KB(IO大小與數(shù)據(jù)庫(kù)的Block塊大小一致),讀寫(xiě)比約為3:2,讀全隨機(jī),寫(xiě)有一定合并。 針對(duì)LOG LUN,多路順序小IO,大小不定,幾乎都是寫(xiě)IO。

2、OLAP業(yè)務(wù)模型和特征:

一般很少有數(shù)據(jù)修改,除非在批量加載數(shù)據(jù)時(shí);系統(tǒng)調(diào)用非常復(fù)雜的查詢語(yǔ)句,同時(shí)掃描非常多的行;一個(gè)查詢將花費(fèi)數(shù)小時(shí),甚至數(shù)天;主要取決于查詢語(yǔ)句的復(fù)雜程度;查詢的輸出通常是一個(gè)統(tǒng)計(jì)值,由group by與order by得出;當(dāng)讀取操作進(jìn)行時(shí),發(fā)生的寫(xiě)操作通常在臨時(shí)表空間內(nèi);平常對(duì)在線日志寫(xiě)入很少,除非在批量加載數(shù)據(jù)時(shí);分析型業(yè)務(wù),一般對(duì)時(shí)延沒(méi)有要求。

針對(duì)Data LUN,多路順序大IO(可以近似認(rèn)為是隨機(jī)大IO),IO大小與主機(jī)側(cè)設(shè)置的分條大小有關(guān)(如512KB),90%以上為讀業(yè)務(wù),混合間斷讀寫(xiě)。針對(duì)TMP LUN,隨機(jī)IO,讀寫(xiě)混合(先寫(xiě)后讀,計(jì)算時(shí)寫(xiě),讀臨時(shí)表時(shí)讀,大部分是寫(xiě),占整個(gè)業(yè)務(wù)中很少部分的IO),IO大小基本為200KB以上大IO。

3、VDI業(yè)務(wù)模型和特征

可以分為啟動(dòng)風(fēng)暴、登錄風(fēng)暴和平穩(wěn)狀態(tài)幾個(gè)常見(jiàn)場(chǎng)景,在不同的狀態(tài)下,業(yè)務(wù)壓力相差很大。啟動(dòng)風(fēng)暴,即大量虛擬機(jī)同時(shí)啟動(dòng)時(shí)的突發(fā)狀態(tài),是讀密集型操作。登錄風(fēng)暴,即大量用戶同時(shí)登錄到桌面,導(dǎo)致共享存儲(chǔ)產(chǎn)生大量爆發(fā)性負(fù)載的情況,是寫(xiě)密集型的,很難通過(guò)技術(shù)方式避免。平穩(wěn)狀態(tài),即所有用戶在同時(shí)使用桌面時(shí),產(chǎn)生負(fù)載波動(dòng)較小的狀態(tài)。不同的用戶類型,平穩(wěn)狀態(tài)的負(fù)載有所不同。時(shí)延要求一般在10ms左右。

平穩(wěn)狀態(tài)下,讀寫(xiě)比例約為2:8,多路順序小IO,主要是寫(xiě),存在一定的合并,IO大小從512B到16KB都有;少量的讀IO,基本都是16KB,在負(fù)載穩(wěn)定之后,Cache***率在80%以上。

4、SPC-1業(yè)務(wù)模型和特征

SPC-1設(shè)計(jì)一個(gè)專門為測(cè)試存儲(chǔ)系統(tǒng)在典型業(yè)務(wù)應(yīng)用場(chǎng)合下的負(fù)載模型,這個(gè)負(fù)載模型連續(xù)不斷地對(duì)業(yè)務(wù)系統(tǒng)并發(fā)的做查詢和更新的工作,因此其主要由隨機(jī)I/O組成。這些隨機(jī)I/O的操作主要涉及數(shù)據(jù)庫(kù)型的OLTP應(yīng)用以及E-mail系統(tǒng)應(yīng)用,能夠很好地衡量存儲(chǔ)系統(tǒng)的IOPS指標(biāo)。

它抽象的測(cè)試區(qū)域稱為ASU,包括ASU1臨時(shí)數(shù)據(jù)區(qū)域,ASU2用戶數(shù)據(jù)區(qū)域和ASU3日志區(qū)域。對(duì)整體而言,讀寫(xiě)比約為4:6,順序IO與隨機(jī)IO的比例約為3:7,IO大小主要為4KB,有較明顯的熱點(diǎn)訪問(wèn)區(qū)域。

三、如何考慮校驗(yàn)對(duì)性能的影響

對(duì)于順序?qū)憳I(yè)務(wù),IO經(jīng)過(guò)cache的IO合并后下發(fā)到RAID層,基本能夠確保都是滿分條寫(xiě)。對(duì)于RAID5-5(4D+1P)這種配置來(lái)說(shuō),每4個(gè)數(shù)據(jù)IO(D)下盤同時(shí)會(huì)有一個(gè)校驗(yàn)IO(P)需要下盤。校驗(yàn)IO下盤所占的硬盤帶寬用于保障數(shù)據(jù)的可靠性,而對(duì)于用戶上層業(yè)務(wù)來(lái)說(shuō)并沒(méi)有提供可用帶寬,因此需要扣除掉校驗(yàn)位下盤所占的帶寬開(kāi)銷。

對(duì)于順序讀業(yè)務(wù),在滿分條的情況下,在每個(gè)分條內(nèi)部只需要讀數(shù)據(jù)位所在的磁盤,不需要讀校驗(yàn)位所在的磁盤。

例如,某一款產(chǎn)品,能夠提供的***寫(xiě)帶寬為3200MB,規(guī)劃配置96塊600GB 15k SAS盤(推薦單盤寫(xiě)帶寬為30MB),部署RAID6-6(4D+2P),估算這款產(chǎn)品能夠提供的有效寫(xiě)帶寬。

硬盤提供的有效寫(xiě)帶寬 = 單盤順序?qū)憥?* 硬盤數(shù)量 * (RAID數(shù)據(jù)盤數(shù)量/RAID總盤數(shù))= 30MB * 96 * (4/6)= 1920 MB

產(chǎn)品能提供的有效寫(xiě)帶寬 = MIN(產(chǎn)品能提供的***寫(xiě)帶寬,硬盤提供的有效寫(xiě)帶寬)= MIN(3200MB,1920MB)= 1920 MB

四、讀寫(xiě)比和對(duì)性能影響

讀寫(xiě)比指的是上層應(yīng)用下發(fā)的讀IO和寫(xiě)IO的比例分布。此數(shù)據(jù)是存儲(chǔ)規(guī)劃的重要參考依據(jù)。讀業(yè)務(wù)與寫(xiě)業(yè)務(wù)消耗的存儲(chǔ)資源差異很大。下面是一些典型業(yè)務(wù)模型的常見(jiàn)讀寫(xiě)比例

確切了解上層應(yīng)用的讀寫(xiě)比例直接影響到對(duì)cache策略、RAID級(jí)別和LUN配置的選擇。寫(xiě)業(yè)務(wù)比讀業(yè)務(wù)會(huì)消耗更多的存儲(chǔ)系統(tǒng)資源。

1、在回寫(xiě)的場(chǎng)景下,寫(xiě)IO下發(fā)到cache之后需要通過(guò)交換通道“鏡像”到對(duì)端控制器,IO路徑更長(zhǎng),并需要占用交換通道的帶寬;

2、為保證寫(xiě)數(shù)據(jù)的可靠性和一致性,智能存儲(chǔ)通常會(huì)采用一些可靠性技術(shù),例如writehole方案,需要將寫(xiě)數(shù)據(jù)額外保存一份在cache或磁盤上;

3、對(duì)于不同的RAID級(jí)別而言,寫(xiě)懲罰的存在會(huì)造成更大的時(shí)延和資源的開(kāi)銷;此外對(duì)于磁盤(包括SSD盤)而言,寫(xiě)速度低于讀速度。

而對(duì)于讀業(yè)務(wù)來(lái)說(shuō),通常消耗較少的系統(tǒng)資源。例如,讀業(yè)務(wù)不需要生成額外的數(shù)據(jù)來(lái)保證數(shù)據(jù)一致。此外,絕大部分存儲(chǔ)設(shè)備的讀速度都比寫(xiě)速度要快。當(dāng)讀IO發(fā)現(xiàn)它所需讀取的數(shù)據(jù)已經(jīng)在Cache中(讀***)時(shí),可以直接返回而不需要再下盤讀取。在讀***的情況下,通常意味著最短的響應(yīng)時(shí)延。

同樣數(shù)量的主機(jī)IO,如果讀寫(xiě)比例不同,最終需要下盤的IO數(shù)量不同,意味著需要提供的磁盤能力不同。

五、RAID級(jí)別對(duì)性能影響

由于各RAID級(jí)別的寫(xiě)懲罰不同,對(duì)于相同的業(yè)務(wù)類型、同樣數(shù)量的硬盤而言,選擇不同的RAID算法,能夠提供給主機(jī)的性能是不相等的。

針對(duì)各種典型場(chǎng)景的RAID10、RAID5和RAID6的性能對(duì)比,其中假設(shè)某存儲(chǔ)設(shè)備上所有硬盤能夠提供的性能為100%,按照各個(gè)應(yīng)用場(chǎng)景的讀寫(xiě)比例,經(jīng)過(guò)寫(xiě)懲罰系數(shù)的折算,得到配置成各個(gè)RAID級(jí)別后能提供給用戶的實(shí)際性能。

從數(shù)據(jù)中也可以看出,對(duì)于不同的業(yè)務(wù)類型、同樣數(shù)量的硬盤、相同的RAID算法,寫(xiě)比例越大,性能越差。以SPC-1場(chǎng)景配置RAID6為例,假設(shè)用戶實(shí)際性能為x(0.4x + 0.6x * 6 = 100%),實(shí)際性能只是磁盤能提供的x = 25%。

由于RAID算法的實(shí)現(xiàn)原理不同(RAID10的鏡像、RAID5/6的校驗(yàn)盤),對(duì)于同樣大小的裸容量來(lái)說(shuō),選擇不同的RAID算法,可提供給用戶的可用容量是不同的(不考慮熱備空間和系統(tǒng)預(yù)留的影響)。

從可靠性的層面來(lái)看,RAID6的可靠性***,RAID10次之,RAID5最差。RAID6和RAID10都支持同時(shí)壞2塊盤不丟數(shù)據(jù),但是RAID10對(duì)壞的2塊盤是有條件要求的。

六、順序、隨機(jī)特性對(duì)性能影響

在磁盤層面,順序IO的性能優(yōu)于隨機(jī)IO。這是由于傳統(tǒng)的機(jī)械磁盤讀寫(xiě)數(shù)據(jù)需要盤片轉(zhuǎn)動(dòng)和磁頭移動(dòng),使得隨機(jī)讀寫(xiě)的盤片旋轉(zhuǎn)和磁頭尋道時(shí)間要遠(yuǎn)大于順序讀寫(xiě)。

在智能存儲(chǔ)系統(tǒng)層面,通常情況下,順序IO的性能同樣大大優(yōu)于隨機(jī)IO,特別是對(duì)于小IO的IOPS性能而言。

1、小IO讀:通過(guò)順序流識(shí)別和預(yù)取算法,系統(tǒng)提前在磁盤上讀取大塊的連續(xù)數(shù)據(jù)存放在cache中,后續(xù)的大量順序小IO在cache中***,無(wú)需下盤處理。而隨機(jī)小IO在cache中***率極低,只能逐個(gè)下盤讀。

2、小IO寫(xiě):通過(guò)IO合并,系統(tǒng)將多個(gè)順序小IO合并成一個(gè)較大的IO下盤。如果在RAID5或RAID6場(chǎng)景,IO聚合成滿分條大小的情況下,無(wú)需做預(yù)讀操作,不會(huì)觸發(fā)RAID寫(xiě)懲罰,效率很高。而隨機(jī)小IO無(wú)法合并,只能逐個(gè)下盤寫(xiě),且會(huì)觸發(fā)寫(xiě)懲罰,導(dǎo)致性能更為低下。典型業(yè)務(wù)場(chǎng)景的順序/隨機(jī)特性,以下是一些典型業(yè)務(wù)場(chǎng)景的順序/隨機(jī)特性。

七、IO大小對(duì)性能的影響

IO的大小取決于上層應(yīng)用程序本身。對(duì)性能而言,小IO一般用IOPS來(lái)衡量,大IO一般用帶寬來(lái)衡量。例如我們熟悉的SPC-1,主要衡量存儲(chǔ)系統(tǒng)在隨機(jī)小IO負(fù)荷下的IOPS,而SPC-2則主要衡量在各種高負(fù)荷連續(xù)讀寫(xiě)應(yīng)用場(chǎng)合下存儲(chǔ)系統(tǒng)的帶寬。

就單個(gè)IO而言,大IO從微觀角度相比小IO會(huì)需要更多的處理資源。對(duì)于隨機(jī)IO而言,隨著隨機(jī)IO塊大小的增加,IOPS會(huì)隨之降低。例如,當(dāng)隨機(jī)IO大小大于16KB時(shí),機(jī)械硬盤的IOPS會(huì)呈線性下降。因此,我們通常SPC-1測(cè)試的IOPS值很高,但因?yàn)橛脩魳I(yè)務(wù)模型不同,IO大小不同,性能值也是變化的。

不過(guò)對(duì)于智能存儲(chǔ)系統(tǒng)來(lái)說(shuō),會(huì)盡可能通過(guò)排序、合并、填充等方法對(duì)IO進(jìn)行整合,將多個(gè)小IO組合成單個(gè)大IO。例如,典型的Web Server Log業(yè)務(wù),一般是8KB大小的順序小IO,在分條大小設(shè)置為128KB的存儲(chǔ)設(shè)備上,最終會(huì)將16個(gè)8KB大小的小IO合并成一個(gè)128KB的大IO下發(fā)到硬盤上。在這種情況下,對(duì)比處理多個(gè)小IO,處理單個(gè)大IO的速度更快、開(kāi)銷更小。

IO的大小,影響到磁盤選型,緩存、RAID類型、LUN的一些屬性和策略的調(diào)優(yōu)。例如,隨機(jī)小IO的場(chǎng)景,由于SSD盤具有快速隨機(jī)讀寫(xiě)的特性,選用SSD盤對(duì)比SAS盤能夠大幅提升性能;但如果是隨機(jī)大IO,選用帶寬性能相當(dāng)、價(jià)錢便宜的SAS盤更有優(yōu)勢(shì)。

八、緩存Cache對(duì)性能影響

Cache是存儲(chǔ)中最重要的模塊之一,對(duì)于IOPS性能而言,Cache的主要作用是加速。對(duì)于寫(xiě)業(yè)務(wù),Cache加速體現(xiàn)在三個(gè)方面。

1、回寫(xiě)情況下,主機(jī)側(cè)下到陣列側(cè)的數(shù)據(jù)只需要下到CACHE處而不需要真正寫(xiě)到磁盤即可以返回通知主機(jī)寫(xiě)完成,當(dāng)寫(xiě)CACHE的數(shù)據(jù)積累到一定程度(水位),陣列才把數(shù)據(jù)刷到磁盤。由此可以將速度較差的“同步單個(gè)寫(xiě)”轉(zhuǎn)為“異步批量寫(xiě)”,在通常情況下,回寫(xiě)的性能約是透寫(xiě)性能的兩倍以上。

2、寫(xiě)***?;貙?xiě)條件下,新寫(xiě)到Cache中的數(shù)據(jù)發(fā)現(xiàn)在Cache中已經(jīng)有準(zhǔn)備寫(xiě)到相同地址但還沒(méi)有刷盤的數(shù)據(jù)。在這種情況下,只需要將新寫(xiě)入的數(shù)據(jù)下盤即可。

3、寫(xiě)合并。例如小IO下到Cache中,Cache會(huì)盡可能對(duì)IO進(jìn)行排序與合并,將多個(gè)小IO合成單個(gè)大IO再下盤。

對(duì)于讀業(yè)務(wù),Cache加速主要體現(xiàn)在讀***。例如智能預(yù)取策略,Cache會(huì)主動(dòng)識(shí)別IO流的特征,如果發(fā)現(xiàn)是順序IO流,Cache會(huì)在下盤讀IO的同時(shí),主動(dòng)讀取相鄰區(qū)域的大塊數(shù)據(jù)放到Cache中。當(dāng)順序IO下發(fā)到Cache時(shí),發(fā)現(xiàn)Cache中已存放了需要的數(shù)據(jù),則直接將此數(shù)據(jù)返回即可,不需要再下盤讀。其中的一個(gè)特例是“全***”。在全***條件下,業(yè)務(wù)需要讀取的數(shù)據(jù)已經(jīng)全部保存到Cache中,完全不需要再下盤處理,即所有IO到Cache層就返回了,路徑和時(shí)延最短。全***讀的IOPS值,往往是一款存儲(chǔ)產(chǎn)品能夠提供的***IOPS值。

 

責(zé)任編輯:武曉燕 來(lái)源: 架構(gòu)師技術(shù)聯(lián)盟
相關(guān)推薦

2017-12-08 11:28:58

MySQL性能調(diào)優(yōu)技巧

2017-12-05 09:30:27

2010-08-12 14:20:41

CISCO常見(jiàn)問(wèn)題

2018-09-05 09:32:42

高性能網(wǎng)絡(luò)模型

2021-10-14 06:36:38

存儲(chǔ)云存儲(chǔ)本地存儲(chǔ)

2019-10-31 09:48:53

MySQL數(shù)據(jù)庫(kù)事務(wù)

2022-04-14 10:10:59

Nginx開(kāi)源Linux

2017-03-30 22:41:55

虛擬化操作系統(tǒng)軟件

2009-07-30 10:59:44

Scala和Erlan多核

2019-09-25 09:17:43

物聯(lián)網(wǎng)技術(shù)信息安全

2021-09-30 09:59:23

OSPF網(wǎng)絡(luò)協(xié)議網(wǎng)絡(luò)技術(shù)

2013-05-12 21:54:26

移動(dòng)App設(shè)計(jì)iOS7

2017-12-12 12:53:09

2021-07-13 12:21:34

PythonRPC通信

2017-03-10 21:04:04

Android適配

2021-02-24 07:38:50

Redis

2018-10-31 17:22:25

AI人工智能芯片

2018-04-13 16:24:59

區(qū)塊鏈數(shù)據(jù)庫(kù)去中心化

2017-03-07 15:35:26

Android適配 界面

2021-11-10 07:47:48

Traefik邊緣網(wǎng)關(guān)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)