【工程師筆記】第三期:如何評估應用的存儲性能需求?
做技術的朋友可能有過類似這樣的感覺——每天都會遇到新的問題,或者學到新的知識。然而一個人的時間和精力畢竟有限,不是所有的崗位都能做到總是親力親為,每人最擅長的領域也各不相同。為了使工程師自己踩過的坑、那些實用的心得體會也能給大家?guī)韼椭?,把?jīng)驗記錄和分享出來就顯得尤為可貴,這就是我們開設《工程師筆記》專欄的目的。
當企業(yè)用戶意識到他們的應用瓶頸出在存儲上,并打算升級設備來解決時,怎樣評估需要多高的性能,以便做到有的放矢地選擇和配置存儲系統(tǒng)呢?
在本文中,我們將介紹一個用戶的實際測試案例,希望能給大家?guī)碛幸娴膮⒖肌?/p>
某公司使用SQL Server進行精算,原有設備和IT架構需要用21小時(4 同步+17計算)才能完成精算任務??蛻粝肟s短精算完成的時間,大幅度改善數(shù)據(jù)的實時性從而提高精算數(shù)據(jù)的價值。
DPACK是戴爾為客戶提供的免費增值工具,專門收集主機端性能信息,以此協(xié)助存儲解決方案的規(guī)劃和選型。所收集的數(shù)據(jù)會生成專業(yè)報告(涵蓋多種不同語言),客戶可以更好了解自己的環(huán)境,基于報告做出最佳的業(yè)務決策。
首先在用戶現(xiàn)有的環(huán)境中運行DPACK。通過對抓取的DPACK報告進行分析,發(fā)現(xiàn)系統(tǒng)的IOPS需求最高達到15000,而當前的P2000存儲(12*600GB 15K)遠不能滿足應用對IO的需求,所以決定用SC4020全閃寸陣列來進行相關的測試。
注:DPACK能夠對用戶的存儲過程進行拆分分析——包括應用下發(fā)到存儲,以及存儲設備自身的處理兩部分。以判斷在存儲不成為瓶頸的情況下,應用能夠跑多快。
上面的B拓撲圖中,在A拓撲圖的基礎上增加了一臺Dell Storage SC4020全閃存陣列。測試結果如下:
DPACK報告顯示磁盤吞吐帶寬可達1112MB/S約8Gb/s
從這里看到SC4020全閃存已經(jīng)起到了效果,但還沒有達到客戶預期的期望值,進一步分析基于拓撲B的DPACK報告,發(fā)現(xiàn)系統(tǒng)的I/O帶寬為8Gbps。由于客戶測試環(huán)境的限制,SC4020只用了一個8Gbps SAN光纖交換機端口;同時在DPACK報告中發(fā)現(xiàn)客戶處理器的利用率為90%, 基于以上分析,采用一臺全新的戴爾PowerEdge R730服務器 + 8口8Gbps SAN Switch + SC4020的架構。
如上圖,在拓撲圖C中增加了一臺R730服務器(配置2顆Xeon E5-2650v3 CPU)以及一個FC SAN交換機。提高處理性能的同時增加了服務器到SC4020陣列之間的存儲網(wǎng)絡帶寬。
處理器利用率:從DPACK報告分析原配置處理器利用率最高接近90%(圖中上半部分);更換處理器后的DPACK報告顯示處理器利用率明顯降下來了,最高只有20%(圖中下半部分)。
此時CPU已經(jīng)不再是瓶頸,那為什么精算時間沒有進一步縮短呢?
進一步分析,當前客戶采用的數(shù)據(jù)庫為SQL Server 2005無法完全發(fā)揮E5-2600v3處理器的性能,建議客戶升級到SQL Server 2012。
最終測試結果導入到日志文件中,2:02-8:06,共6時4分
如上圖,采用SQL Server 2012后,精算時間提高到了6小時,這個值是目前客戶比較滿意的值了。
進一步測試,SC4020上增加6塊WI(寫密集型)固態(tài)盤試圖提高系統(tǒng)性能,但結果沒有變化。說明當前的SC4020配置已經(jīng)可以滿足客戶的需求了,這個時候的系統(tǒng)性能與磁盤系統(tǒng)的IO性能關系不大。
參考測試環(huán)境:
1. PowerEdge R730服務器:2*E5-2650v3 CPU,128GB內存,四口千兆網(wǎng)卡,2*300GB 10K硬盤,單塊雙口FC HBA卡
2. SC4020:8Gbps FC主機接口,6個400 WI SSD+6個1.6 TB RI SSD
3. Brocade B300光纖交換機:使用8個8Gbps
4. 操作系統(tǒng):Windows Server 2008 R2
5. 數(shù)據(jù)庫環(huán)境:SQL Server 2012
經(jīng)過多輪測試,我們得出這樣的結論:客戶業(yè)務性能的提升不只是單純靠某一個子系統(tǒng)(計算、磁盤等)性能的提升,要進行認真詳細的分析才能得出最后的結論。而且只有硬件的提升是不夠的,需要軟件進行相關的配合。
Dell的DPACK工具是一個非常好用的系統(tǒng)性能分析工具,可以細致的分析客戶當前IT環(huán)境瓶頸所在。Dell的Power Edge R730+Brocade B300+Compellent SC4020的基礎架構組合與SQL Server 2012配合起來,使得精算時間縮短了將近70%,大幅提高了客戶的數(shù)據(jù)價值。
像DRACK這類軟件,有些用戶擔心會不會有安全的問題?在這方面戴爾明確表示并承諾:該工具只收集系統(tǒng)使用信息!不收集也沒有讀取任何用戶的數(shù)據(jù)信息!另外我們再給出幾條DPACK的最佳實踐建議供讀者參考:
a. 如果您預期某天會出現(xiàn)性能高峰使用,建議在那一天運行DPACK信息收集!不建議在低負載時期執(zhí)行DPACK(報告的意義不大?。?/p>
b. 建議DPACK收集超過一天,因為24小時內能收集的有用信息太有限了。
c. DPACK不提供任何應用程序或數(shù)據(jù)庫信息,自己要清楚收集是什么應用的信息。
相關內容導讀
↓↓↓
【工程師筆記】第一期:小議Linux下磁盤亂序問題
【工程師筆記】第二期:巧用iDRAC批量修改PXE網(wǎng)卡啟動順序