如何通過(guò)云平臺(tái)充分發(fā)揮私有云的價(jià)值?
隨著云計(jì)算技術(shù)和產(chǎn)品的逐步成熟,以及對(duì)安全性和可控性的要求,不少大中型企業(yè)已經(jīng)建成或者正在建設(shè)私有云。私有云對(duì)企業(yè)帶來(lái)的效益包括提高 IT 資源利用率、提高 IT 運(yùn)維效率、降低信息化 TCO、提升 IT 服務(wù)質(zhì)量、加快業(yè)務(wù)系統(tǒng)的 TTM 等等很多方面。但實(shí)際情況是公司花了大把資金建設(shè)了一個(gè)甚至多個(gè)高大上的云平臺(tái),但感覺(jué)資源發(fā)放還是慢,資源利用率依然低,運(yùn)維起來(lái)反而更復(fù)雜,完全沒(méi)有收獲當(dāng)初廠商承諾的效益。
資源的發(fā)放不僅僅是通過(guò)鏡像克隆一臺(tái)虛擬機(jī)實(shí)例那么簡(jiǎn)單,還需要做很多配置拉通工作,例如配置 VLAN、安全策略、路由等等,這些網(wǎng)絡(luò)配置環(huán)節(jié)如果沒(méi)有自動(dòng)化,就會(huì)拖慢整個(gè)資源發(fā)放的速度,這樣的云平臺(tái)就不算是一個(gè)完整功能的云平臺(tái)。
影響資源發(fā)放速度的原因之一是沒(méi)有做端到端的自動(dòng)化,大多數(shù)情況下是沒(méi)有引入網(wǎng)絡(luò)自動(dòng)化功能,這個(gè)可以通過(guò)啟用 SDN、VXLAN 等技術(shù)來(lái)實(shí)現(xiàn),本文不做進(jìn)一步討論;二是在資源發(fā)放流程中引入了人工審批環(huán)節(jié),這個(gè)問(wèn)題和資源利用率低、運(yùn)維效率低等問(wèn)題都是因?yàn)闆](méi)有用好云平臺(tái)而導(dǎo)致的,不是云平臺(tái)本身的問(wèn)題。本文主要介紹怎么用云平臺(tái)才能充分發(fā)揮私有云的價(jià)值。
任何一種新技術(shù)或新系統(tǒng)都需要在流程和組織結(jié)構(gòu)上進(jìn)行適配,十幾年前很多企業(yè)實(shí)施 ERP 系統(tǒng),效益好的都是哪些在流程和組織上進(jìn)行適配的企業(yè),這幾年熱推的 DevOps,也是需要做好流程和組織適配才能充分發(fā)揮 DevOps 的價(jià)值,私有云也是一樣。
1、調(diào)整系統(tǒng)建設(shè)模式
在傳統(tǒng) IT 環(huán)境下,業(yè)務(wù)系統(tǒng)的建設(shè)流程通常如下圖所示。
私有云平臺(tái)建成投產(chǎn)后,業(yè)務(wù)系統(tǒng)建設(shè)的基本流程沒(méi)有變化,但要求在某些環(huán)節(jié)的具體操作上作出改變,以適配云計(jì)算的特點(diǎn),進(jìn)而發(fā)揮出云計(jì)算的價(jià)值。我把需要作出調(diào)整的環(huán)節(jié)加亮顯示了。
首先,由于云平臺(tái)為企業(yè)搭建了統(tǒng)一的資源池,并提供了業(yè)務(wù)系統(tǒng)所需要的 IaaS 和 PaaS 層云服務(wù),所以單個(gè)業(yè)務(wù)系統(tǒng)的建設(shè)過(guò)程中不再需要獨(dú)立采購(gòu)硬件設(shè)備和基礎(chǔ)軟件(操作系統(tǒng)、虛擬化軟件、中間件),而是在私有云初始建設(shè)過(guò)程中或未來(lái)的資源池?cái)U(kuò)展過(guò)程中對(duì)硬件設(shè)備和基礎(chǔ)軟件進(jìn)行集中采購(gòu)并集中部署。單個(gè)業(yè)務(wù)系統(tǒng)的建設(shè)過(guò)程中僅需要采購(gòu)云服務(wù)未包含的專有軟件,并通過(guò)申請(qǐng)?jiān)品?wù)的形式來(lái)使用底層 IT 基礎(chǔ)設(shè)施資源和基礎(chǔ)軟件。
第二,由于云平臺(tái)通過(guò)自動(dòng)化技術(shù)完成了硬件設(shè)備和基礎(chǔ)軟件的部署和配置,業(yè)務(wù)系統(tǒng)的實(shí)施過(guò)程中不再需要部署和配置硬件設(shè)備和基礎(chǔ)軟件了,只需要在申請(qǐng)的云服務(wù)(虛擬機(jī)服務(wù)、存儲(chǔ)服務(wù)、中間間云服務(wù)等)基礎(chǔ)上部署和配置業(yè)務(wù)系統(tǒng)的專有軟件。所以上述的“硬件安裝及配置”和“基礎(chǔ)軟件部署及配置”兩個(gè)環(huán)節(jié)可以省掉。
第三,由于云平臺(tái)提供了豐富的 PaaS 服務(wù),包括各種云中間件、各種 API、微服務(wù)框架等,完全可以基于這些 PaaS 服務(wù)進(jìn)行應(yīng)用軟件的架構(gòu)設(shè)計(jì)、開(kāi)發(fā)及測(cè)試,并將通過(guò)驗(yàn)收測(cè)試的應(yīng)用軟件直接部署在云平臺(tái)上。這樣的應(yīng)用軟件從架構(gòu)設(shè)計(jì)到部署運(yùn)行都是在云平臺(tái)之上進(jìn)行,也就是我們常說(shuō)的 Cloud Native 應(yīng)用,通過(guò)這種方式才充分發(fā)揮了云平臺(tái)的價(jià)值。
經(jīng)過(guò)改造適配后的業(yè)務(wù)系統(tǒng)建設(shè)流程如下圖所示:
2、引入資源配額機(jī)制
不同于公有云,在私有云中云服務(wù)是不收費(fèi)的,如果我們不做任何審批或限制,租戶都傾向于申請(qǐng)比實(shí)際需求多得多的資源,人為導(dǎo)致了資源的浪費(fèi)。所以我們需要去評(píng)審云服務(wù)申請(qǐng)的合理性,不合理的云服務(wù)申請(qǐng)統(tǒng)統(tǒng)拒絕。但問(wèn)題又來(lái)了,如果在每一次租戶申請(qǐng)?jiān)品?wù)的過(guò)程中都去人為審批該次服務(wù)申請(qǐng)的合理性,帶來(lái)的工作量足以讓人崩潰,而且加入人為審批環(huán)節(jié)也將拖慢資源發(fā)放的速度,顯然這不是好的方式。
我們改進(jìn)一下流程,引入資源配額機(jī)制。業(yè)務(wù)系統(tǒng)是云平臺(tái)上的租戶,在業(yè)務(wù)系統(tǒng)申請(qǐng)?jiān)品?wù)之前,讓業(yè)務(wù)系統(tǒng)管理員(也就是租戶管理員)先根據(jù)業(yè)務(wù)系統(tǒng)的需求申請(qǐng)一定數(shù)量的資源配額,云平臺(tái)管理員或上級(jí)租戶管理員對(duì)其資源配額申請(qǐng)的業(yè)務(wù)合理性進(jìn)行評(píng)估,如果沒(méi)有問(wèn)題,就在云平臺(tái)上給該租戶分配資源配額。后面租戶管理員申請(qǐng)具體的云服務(wù)時(shí),云平臺(tái)檢查該租戶名下的可用配額是否足夠,足夠的話就不再進(jìn)行人工審批,自動(dòng)進(jìn)行資源的發(fā)放;如果不足夠再提醒租戶管理員對(duì)配額進(jìn)行擴(kuò)展。
3、引入資源考核機(jī)制
資源配額機(jī)制能夠避免云服務(wù)的濫用,但是否能保證資源利用率的提升呢,答案是未必,因?yàn)橘Y源配額評(píng)審時(shí)是沒(méi)法評(píng)估到資源利用率的。那為了提升云平臺(tái)整體資源池的利用率,我們還需要以租戶為單位引入資源考核機(jī)制,按照一定周期(月度、季度、年度)對(duì)租戶的資源利用率進(jìn)行晾曬排名,針對(duì)資源利用率高的租戶在業(yè)績(jī)上給予獎(jiǎng)勵(lì),針對(duì)資源利用率低的租戶,在業(yè)績(jī)上進(jìn)行懲罰,并在其下一次擴(kuò)展資源配額時(shí)進(jìn)行更為嚴(yán)格的審批。另外也需要考核配額的使用率,針對(duì)申請(qǐng)大量配額而不申請(qǐng)實(shí)際資源的租戶進(jìn)行懲罰。
4、調(diào)整系統(tǒng)運(yùn)維模式
業(yè)務(wù)系統(tǒng)建成投產(chǎn)后即進(jìn)入系統(tǒng)運(yùn)維階段。傳統(tǒng) IT 環(huán)境下,業(yè)務(wù)系統(tǒng)獨(dú)自占用網(wǎng)絡(luò)、存儲(chǔ)、服務(wù)器、操作系統(tǒng)、中間件和數(shù)據(jù)庫(kù)等 IT 資源,IT 資源沒(méi)有在企業(yè)范圍內(nèi)進(jìn)行共享。這就導(dǎo)致在系統(tǒng)運(yùn)維方面,各業(yè)務(wù)系統(tǒng)會(huì)組建專門(mén)的團(tuán)隊(duì)負(fù)責(zé)運(yùn)維該業(yè)務(wù)系統(tǒng)獨(dú)自占用的 IT 基礎(chǔ)設(shè)施資源、基礎(chǔ)軟件和應(yīng)用軟件,一個(gè)業(yè)務(wù)系統(tǒng)的運(yùn)維團(tuán)隊(duì)和另一個(gè)業(yè)務(wù)系統(tǒng)的運(yùn)維團(tuán)隊(duì)是相互隔離的,沒(méi)有實(shí)現(xiàn)運(yùn)維人員、運(yùn)維技術(shù)和運(yùn)維工具的共享;另外,同一個(gè)運(yùn)維團(tuán)隊(duì)中的人往往同時(shí)負(fù)責(zé)運(yùn)維存儲(chǔ)、網(wǎng)絡(luò)、服務(wù)器甚至操作系統(tǒng)等,沒(méi)有實(shí)現(xiàn)運(yùn)維人員的專業(yè)化分工,整體運(yùn)維效率低下。如下圖左半部分所示。
私有云平臺(tái)建成后,由于網(wǎng)絡(luò)、存儲(chǔ)、服務(wù)器、操作系統(tǒng)、中間件和數(shù)據(jù)庫(kù)等由云平臺(tái)統(tǒng)一部署和配置,故這些 IT 資源也由云平臺(tái)運(yùn)維團(tuán)隊(duì)負(fù)責(zé)統(tǒng)一運(yùn)維,而不再是由原來(lái)分散在不同業(yè)務(wù)系統(tǒng)的小型運(yùn)維團(tuán)隊(duì)負(fù)責(zé),具體做法可以是將這些小型運(yùn)維團(tuán)隊(duì)合并精簡(jiǎn)成一個(gè)大型的云平臺(tái)運(yùn)維團(tuán)隊(duì),實(shí)現(xiàn)運(yùn)維人員、運(yùn)維技術(shù)、運(yùn)維工具的共享和***化利用。另外,云平臺(tái)運(yùn)維團(tuán)隊(duì)負(fù)責(zé)管理的資源規(guī)模比較龐大,由一個(gè)人同時(shí)負(fù)責(zé)網(wǎng)絡(luò)運(yùn)維和存儲(chǔ)運(yùn)維的做法已經(jīng)不切實(shí)際,所以需要針對(duì)每一種資源設(shè)立獨(dú)立的專業(yè)小組進(jìn)行運(yùn)維,達(dá)成運(yùn)維工作的專業(yè)化分工,這種專業(yè)分工結(jié)合運(yùn)維自動(dòng)化技術(shù)將大幅提高運(yùn)維效率。如圖右半部分所示。
需要注意的是,由于云平臺(tái)不負(fù)責(zé)業(yè)務(wù)系統(tǒng)應(yīng)用軟件的部署和配置,所以應(yīng)用軟件的運(yùn)維工作還是會(huì)落在業(yè)務(wù)系統(tǒng)項(xiàng)目組這邊,而且由于各個(gè)業(yè)務(wù)系統(tǒng)的應(yīng)用軟件有各自的特點(diǎn),所以還是采取單獨(dú)運(yùn)維的方式。
5、調(diào)整 IT 組織結(jié)構(gòu)
業(yè)務(wù)系統(tǒng)的建設(shè)模式和運(yùn)維模式調(diào)整之后,還需要對(duì) IT 組織結(jié)構(gòu)進(jìn)行調(diào)整,這樣才能確保這些調(diào)整后的模式能夠正常運(yùn)作。
傳統(tǒng) IT 環(huán)境下的 IT 組織結(jié)構(gòu)大致如下圖所示,IT 部門(mén)在 IT 管理領(lǐng)導(dǎo)下主要按照業(yè)務(wù)系統(tǒng)劃分成不同的項(xiàng)目組,每個(gè)業(yè)務(wù)系統(tǒng)項(xiàng)目組負(fù)責(zé)該系統(tǒng)的建設(shè),同時(shí)也負(fù)責(zé)該系統(tǒng)的 IT 基礎(chǔ)設(shè)施資源、基礎(chǔ)軟件和應(yīng)用軟件的運(yùn)維。除了業(yè)務(wù)系統(tǒng)項(xiàng)目組之外,針對(duì)跨系統(tǒng)的支撐型工作成立專項(xiàng)項(xiàng)目組,例如信息安全、數(shù)據(jù)中心和整體 IT 規(guī)劃等。
而私有云建成后,云平臺(tái)作為一個(gè)統(tǒng)一管理 IT 基礎(chǔ)設(shè)施資源和基礎(chǔ)軟件的平臺(tái),也需要同信息安全和數(shù)據(jù)中心一樣,成立專門(mén)的項(xiàng)目組。云平臺(tái)項(xiàng)目組負(fù)責(zé)云平臺(tái)的建設(shè)及運(yùn)維、IT 基礎(chǔ)設(shè)施資源池的建設(shè)和運(yùn)維、基礎(chǔ)軟件的部署和運(yùn)維,因此,業(yè)務(wù)系統(tǒng)項(xiàng)目組不再需要負(fù)責(zé) IT 基礎(chǔ)設(shè)施資源池和基礎(chǔ)軟件的運(yùn)維,僅需負(fù)責(zé)應(yīng)用軟件的運(yùn)維。另外,由于云平臺(tái)項(xiàng)目組統(tǒng)一建設(shè)和運(yùn)維網(wǎng)絡(luò)資源池,則數(shù)據(jù)中心項(xiàng)目組也無(wú)需再負(fù)責(zé)網(wǎng)絡(luò)環(huán)境的建設(shè)和運(yùn)維,僅需負(fù)責(zé)數(shù)據(jù)中心風(fēng)火水電的建設(shè)及運(yùn)維。為了更好地發(fā)揮出云計(jì)算的價(jià)值,還需要成立專門(mén)的軟件研發(fā)團(tuán)隊(duì),專門(mén)致力于設(shè)計(jì)、開(kāi)發(fā)及測(cè)試 Cloud Native 的應(yīng)用。
私有云模式下的 IT 組織結(jié)構(gòu)大致如下圖所示。
6、總結(jié)
私有云為企業(yè)搭建統(tǒng)一的 IT 基礎(chǔ)設(shè)施資源池,并將底層 IT 基礎(chǔ)設(shè)施資源和基礎(chǔ)軟件封裝為云服務(wù),這些資源池和云服務(wù)由企業(yè)獨(dú)占使用,并由該企業(yè)完全控制和管理。為了充分發(fā)揮私有云的價(jià)值,要求業(yè)務(wù)系統(tǒng)建設(shè)時(shí)通過(guò)申請(qǐng)?jiān)品?wù)的方式進(jìn)行業(yè)務(wù)系統(tǒng)的搭建,也要求在業(yè)務(wù)系統(tǒng)運(yùn)維時(shí)將 IT 基礎(chǔ)設(shè)施資源和基礎(chǔ)軟件進(jìn)行統(tǒng)一運(yùn)維,還要求引入資源配額機(jī)制和資源考核機(jī)制來(lái)提高資源的利用率,同時(shí)要求成立專門(mén)的云平臺(tái)項(xiàng)目組負(fù)責(zé)云平臺(tái)和資源池的建設(shè)及運(yùn)維。
作者:傅飛,15 年 IT 行業(yè)經(jīng)驗(yàn),目前就職于華為公司,主要關(guān)注云計(jì)算和大數(shù)據(jù)解決方案的架構(gòu)設(shè)計(jì)。