VCenter監(jiān)控可實現(xiàn)精細故障排除
如果VMware環(huán)境中出現(xiàn)問題,管理員可使用vCenter監(jiān)控功能來收集數(shù)據(jù),這些數(shù)據(jù)比傳統(tǒng)操作系統(tǒng)的數(shù)據(jù)更詳細。
通常情況下,IT管理員和經(jīng)理會認為應(yīng)用程序崩潰是由于VMware或者在虛擬化前從未發(fā)生的特定問題。然而,VMware的vCenter及其相關(guān)虛擬化產(chǎn)品給數(shù)據(jù)中心帶來革命性變化。
硬件是可以看到且可讓人觸摸到的東西,硬件令人放心。雖然很多企業(yè)已經(jīng)擁抱虛擬化,但仍然有些人持懷疑態(tài)度。而通過利用vCenter監(jiān)控和日志記錄功能,可讓虛擬管理員消除這種顧慮并解決問題。
VMware vCenter與傳統(tǒng)監(jiān)控工具的運作方式不同。vCenter監(jiān)控數(shù)據(jù)來自訪客操作系統(tǒng)下的網(wǎng)絡(luò)層,而vCenter和基于vCenter的監(jiān)控工具(包括提取這些數(shù)據(jù)的第三方工具)直接在虛擬硬件級別直接查看操作系統(tǒng)層下面的情況。
傳統(tǒng)基于Windows的監(jiān)控工具無法達到這種水平。Windows是從軟件驅(qū)動程序和API獲取數(shù)據(jù),但這些數(shù)據(jù)依靠Windows對所見的解釋。這意味著,如果每個人都是用Windows工具而不是vCenter工具,那么可能會導(dǎo)致嚴重的混淆,因為不同的人會看到不同的數(shù)據(jù)。
這里明顯的例子是Windows內(nèi)的內(nèi)存使用情況。例如,分配有10GB內(nèi)存的應(yīng)用程序通常會在Windows工具(例如任務(wù)管理器和資源管理器)中顯示此信息。然而,分配的內(nèi)存不同于使用的內(nèi)存,并且,如果不使用VMware工具的Perfmon插件,幾乎不可能從Windows內(nèi)確定這一點。
而vCenter監(jiān)控使這項工作變得很簡單,因為虛擬機使用的內(nèi)存不是真實的—而是基于軟件。這樣vCenter可區(qū)分已分配和正在使用的內(nèi)存。盡管可能分配了10GB RAM,但可能只使用幾GB。如果應(yīng)用程序所有者僅看到Windows數(shù)值,他們可能會認為虛擬機資源有限,而vCenter顯示的情況并非如此。
當工作負載被虛擬化,訪客方面通常會發(fā)生改變,但這通常是一種改進。這里的挑戰(zhàn)會從資源缺乏轉(zhuǎn)移到資源分配。
通過vCenter監(jiān)控加強故障診斷
虛擬化故障診斷的關(guān)鍵是確保工作負載沒有在等待資源。當服務(wù)器專用于每個硬件平臺的一個應(yīng)用程序時,那么,除升級外并沒有太多選擇。
在虛擬化環(huán)境中,規(guī)則是不同的。我們可以查看存儲中隊列深度等信息以查找I/O延遲的原因;檢查CPU就緒時間來查看虛擬機等待CPU訪問的時間以及它們是否受CPU限制;以及對比內(nèi)存分配與正在使用的數(shù)值,以查看可能是什么在交換或緩存RAM。
所有這些vCenter監(jiān)控設(shè)置都支持深度檢查,并可通過共享和資源池幫助調(diào)整資源分配。通常情況下,一個工作負載的變更可能會對另一個負載產(chǎn)生負面影響,畢竟,這是共享環(huán)境。
同時,性能指標可幫助解答有關(guān)日志和其他事件的問題。例如,虛擬機出現(xiàn)問題時,vMotion是否也同時發(fā)生問題?vCenter日志數(shù)據(jù)可以解釋當時發(fā)生的事件,但vCenter中的性能數(shù)據(jù)將顯示事件是否真正導(dǎo)致問題。這意味著我們可利用這兩者來全面了解正在發(fā)生的事情。
另外,請不要完全遺漏操作系統(tǒng)日志和事件。它們可幫助填補任何空白,但要注意硬件和性能方面,因為操作系統(tǒng)對這些方面沒有深入了解。
虛擬機管理程序給應(yīng)用程序故障排查增添了另一層復(fù)雜性。但是,這個額外層可在應(yīng)用程序和操作系統(tǒng)堆棧創(chuàng)建傳統(tǒng)硬件沒有的窗口。這里的挑戰(zhàn)是在這個層面整合數(shù)據(jù)以及進行適當調(diào)整。
總的來說,一個小錯誤可能會擾亂整個虛擬環(huán)境,因此,我們始終應(yīng)該從小調(diào)整開始,而不是部署大規(guī)模變更。