VMware vCenter Operations Manager圖解說(shuō)明
譯文為vSphere實(shí)現(xiàn)智能監(jiān)控
VMware的vCenter Operations Manager讓管理員們得以深入了解各自的虛擬化基礎(chǔ)設(shè)施。Operations Manager可以不斷監(jiān)控每一個(gè)對(duì)象:從虛擬機(jī)、主機(jī)到存儲(chǔ)系統(tǒng),并且收集性能和可用性方面的一大堆度量指標(biāo)。根據(jù)這些數(shù)據(jù),它隨后為每個(gè)虛擬機(jī)、主機(jī)和集群估算出正常的操作級(jí)別,并確定哪里可能存在著問(wèn)題。
虛擬化基礎(chǔ)設(shè)施含有許多的不定因素,而vCenter Operations Manager非常適合密切關(guān)注所有這些不定因素。
儀表板視圖:World
使用一套評(píng)分和標(biāo)記系統(tǒng),Operations Manager的儀表板視圖清楚地顯示了基礎(chǔ)設(shè)施的健康狀況、風(fēng)險(xiǎn)和效率等級(jí)別。我們?cè)谶@里可以看到關(guān)于“World”(即每一個(gè)受到監(jiān)控的vCenter Server實(shí)例)的儀表板視圖。Operations Manager報(bào)告,這個(gè)環(huán)境處于良好的健康狀況,但是效率不是非常高,113個(gè)虛擬處理器、280GB內(nèi)存和690GB磁盤(pán)空間實(shí)際上被浪費(fèi)掉了。
儀表板視圖:集群
在Operations Manager的儀表板視圖中,你可以深入探究每一個(gè)對(duì)象(集群、主機(jī)和虛擬機(jī)等),以便在更低的層面同樣來(lái)評(píng)估健康狀況、風(fēng)險(xiǎn)和效率。我們?cè)谶@里可以看到關(guān)于單個(gè)集群的儀表板視圖,顯示了與前一個(gè)視圖一樣的度量指標(biāo),但現(xiàn)在是專(zhuān)門(mén)針對(duì)該集群,而不是針對(duì)整個(gè)基礎(chǔ)設(shè)施而編制的。
操作視圖:集群
針對(duì)任何一個(gè)受到監(jiān)控的對(duì)象,只要點(diǎn)擊Operations(操作)選項(xiàng)卡,即可顯示關(guān)鍵的度量指標(biāo)和總體健康狀況。比如說(shuō)在這個(gè)集群的操作視圖中,我們可以看到左上角顯示總體健康狀況的圖表,下面則是顯示每一個(gè)度量指標(biāo)(處理器、內(nèi)存、網(wǎng)絡(luò)輸入/輸出和磁盤(pán)輸入/輸出)的圖形。在右邊,我們看到顯示一段時(shí)間內(nèi)異常度量指標(biāo)的圖形。
操作視圖:虛擬機(jī)
我們?cè)谶@里可以看到虛擬機(jī)的操作視圖,詳細(xì)描述了總體工作負(fù)載、處理器、內(nèi)存和輸入/輸出等方面的度量指標(biāo)。工作負(fù)載條旁邊或上面的長(zhǎng)括號(hào)則顯示了正常的操作范圍。很容易看到,處理器、內(nèi)存和網(wǎng)絡(luò)輸入/輸出等級(jí)別狀況良好,而磁盤(pán)輸入/輸出遠(yuǎn)大于正常值。
分析視圖:集群
vCenter Operations Manager中的Analysis(分析)選項(xiàng)卡可以根據(jù)性能特點(diǎn),幫助你著重監(jiān)控主機(jī)、虛擬機(jī)及其他對(duì)象。比如說(shuō),這個(gè)集群的分析視圖顯示了哪些虛擬機(jī)存在很高的工作負(fù)載(可能歸因于長(zhǎng)期壓力)。你完全能同樣快地發(fā)現(xiàn)哪些主機(jī)擁有最多的閑置資源、壓力最小,或哪些虛擬機(jī)面臨最高的處理器需求和資源爭(zhēng)奪,等等,另外附有因而獲得的熱圖(heat map)及下面的詳細(xì)說(shuō)明。
為未來(lái)增長(zhǎng)而規(guī)劃
如果在諸多選項(xiàng)卡之間來(lái)回點(diǎn)擊,你很快會(huì)發(fā)現(xiàn)哪里存在目前的問(wèn)題或預(yù)測(cè)的問(wèn)題,你可以徹底而全面地考慮活動(dòng)警報(bào)。此外,你可以使用Planning(規(guī)劃)工具,創(chuàng)建不同的假設(shè)分析場(chǎng)景,這些場(chǎng)景對(duì)于規(guī)劃添加、移除當(dāng)前的物理主機(jī)或重新為其分配資源大有幫助。在這里,在Planning(規(guī)劃)選項(xiàng)卡下方,Summary(概要)視圖顯示:按整個(gè)環(huán)境目前的資源消耗速度來(lái)看,目前的資源至少可以夠用一年。
避免錯(cuò)誤警報(bào)
Operations Manager可以挖掘分析虛擬化基礎(chǔ)設(shè)施中每一個(gè)對(duì)象方面的歷史數(shù)據(jù),避免錯(cuò)誤警報(bào),只有在活動(dòng)偏離事先設(shè)定的標(biāo)準(zhǔn)范圍時(shí)才觸發(fā)警報(bào)——甚至考慮到了一天中哪個(gè)時(shí)間段和一周中哪一天。在這里,在集群的警報(bào)視圖中,我們可以看到一段時(shí)間來(lái)警報(bào)的視圖以及底部的特定警報(bào)列表。
事先定義的報(bào)告
Operations Manager提供了許多事先定義的報(bào)告,可以按計(jì)劃運(yùn)行,也可以根據(jù)需要來(lái)運(yùn)行。這些報(bào)告包括過(guò)小或過(guò)大的虛擬機(jī)、閑置虛擬機(jī)、主機(jī)利用率和容量概況等方面的報(bào)告。不過(guò)要注意的是,無(wú)法從圖形用戶(hù)界面(GUI)里面生成自定義報(bào)告。