云后端技術(shù)管理體系架構(gòu)的十項(xiàng)修煉
在云計(jì)算產(chǎn)品迭代的時(shí)候,提供給用戶的操作界面是可以參考當(dāng)前的主流思想進(jìn)行對(duì)比和設(shè)計(jì)的,但是作為不暴露給用戶的云管理端技術(shù)體系該如何構(gòu)建,這是一個(gè)比較復(fù)雜的問題。
360安全云產(chǎn)品和技術(shù)團(tuán)隊(duì)結(jié)合公司私有云體系的相關(guān)經(jīng)驗(yàn),已經(jīng)著手設(shè)計(jì)并形成了完整的云后端技術(shù)管理體系架構(gòu),在本文中將與大家分享。
在云計(jì)算技術(shù)體系架構(gòu)中,后端技術(shù)管理提供IaaS、PaaS、SaaS三層資源的全生命周期管理工作,不但需要實(shí)現(xiàn)物理資源和虛擬資源的統(tǒng)一管 理,更為重要的是,還需要提供資源管理、統(tǒng)計(jì)、監(jiān)控調(diào)度、服務(wù)監(jiān)控等端到端的綜合管控能力。在這種場景下,產(chǎn)品設(shè)計(jì)必然會(huì)和公司內(nèi)部的傳統(tǒng)運(yùn)維模式產(chǎn)生差異。
修煉之一:數(shù)據(jù)集中化
為了避免出現(xiàn)傳統(tǒng)系統(tǒng)各個(gè)層面數(shù)據(jù)各自為政的情況,云計(jì)算中需要將機(jī)房信息、網(wǎng)絡(luò)信息、主機(jī)信息、虛擬資源信息、產(chǎn)品業(yè)務(wù)信息、功能邏輯信息等各種信息統(tǒng)一用一套信息管理系統(tǒng)進(jìn)行整理,并提供標(biāo)準(zhǔn)的接口和權(quán)限識(shí)別能力,并允許其他系統(tǒng)間的相互調(diào)用。
修煉之二:資源池化
云計(jì)算體系下所有的原始資源,如機(jī)器、存儲(chǔ)、網(wǎng)絡(luò)等需要做到可標(biāo)識(shí)、無狀態(tài),并將同類體系的資源全部通過資源池進(jìn)行管控;對(duì)申請(qǐng)的新資源在資源池內(nèi)進(jìn)行合理的規(guī)劃分配,保證資源的利用率;對(duì)釋放的資源進(jìn)行垃圾回收,并定期對(duì)資源池內(nèi)資源分布進(jìn)行定期的歸并收斂操作。
修煉之三:自動(dòng)化
在云計(jì)算層面的管理和運(yùn)維,需要收集、索引和分析各個(gè)云資源的基礎(chǔ)數(shù)據(jù),并對(duì)系統(tǒng)進(jìn)行容量、性能、穩(wěn)定性等方面的預(yù)測。這些操作需要功能強(qiáng)大的數(shù)據(jù)收集、傳輸、處理、分析和展示工具,并能夠在短時(shí)間內(nèi)將系統(tǒng)的狀態(tài)進(jìn)行匯總和告警。
整個(gè)告警系統(tǒng)除了針對(duì)配置、性能和狀態(tài)三個(gè)維度采集信息并分析告警外,云計(jì)算的運(yùn)維自動(dòng)化還包括持續(xù)不斷的基于云基礎(chǔ)設(shè)施開發(fā)和維護(hù)各種自動(dòng)化運(yùn)維 工具。比如配置管理工具用來設(shè)置參數(shù)或者開啟一個(gè)新服務(wù)器上的服務(wù);命令執(zhí)行工具可以讓管理員在緊急情況下不受各種體系的制約地對(duì)各類服務(wù)器執(zhí)行操作;服 務(wù)器自動(dòng)構(gòu)建工具可以加速部署速度,并可以在短時(shí)間內(nèi)大規(guī)模部署服務(wù)器,同時(shí)也可以讓構(gòu)建過程更容易復(fù)制,并且在發(fā)生嚴(yán)重故障時(shí),還可以重建架構(gòu)。
#p#
修煉之四:流程化
云計(jì)算下的管理和運(yùn)維比傳統(tǒng)方式要復(fù)雜許多,需要新的流程化技術(shù)方案以提高管理效率,降低系統(tǒng)資源投入。
360云在運(yùn)維架構(gòu)設(shè)計(jì)上除了引入了ITIL的技術(shù)框架外,還結(jié)合當(dāng)前公司的運(yùn)維體系,針對(duì)事故管理、問題管理、配置管理、變更管理、可用性管理、 能力管理、服務(wù)水平管理、例常報(bào)告、定期巡檢、用戶反饋等十幾種管理需求設(shè)計(jì)了豐富且有效的技術(shù)方案,使整個(gè)流程能夠快速有效地運(yùn)轉(zhuǎn)。
修煉之五:個(gè)性化
云計(jì)算的管理除了適配當(dāng)前的技術(shù)方案外,還需要不斷適應(yīng)當(dāng)前新技術(shù)和新用戶的需求。為了能夠快速適應(yīng)變化,除了適配當(dāng)前的主流運(yùn)維體系,360還創(chuàng) 新地使用一些新技術(shù)、新理念,不斷地孵化新的運(yùn)維工具和運(yùn)維方式。有些工具和技術(shù)方案已經(jīng)開源,并在開源領(lǐng)域有了一定的影響力,它有效地降低了云計(jì)算的門 檻,正在幫助越來越多的小型開發(fā)團(tuán)隊(duì)涉足云計(jì)算領(lǐng)域。
例如我們開發(fā)了功能完善的后臺(tái)管理門戶系統(tǒng),該系統(tǒng)不但支撐基礎(chǔ)設(shè)施資源、平臺(tái)資源和應(yīng)用資源以服務(wù)的方式交互給用戶,還提供基礎(chǔ)設(shè)施資源、平臺(tái)資 源和應(yīng)用資源服務(wù)的定價(jià)、檢索、資源使用情況統(tǒng)計(jì)等自服務(wù)功能,而且還可以根據(jù)不同的用戶需要提供不同的展示,并有效隔離多用戶的數(shù)據(jù)。
修煉之六:權(quán)限與用戶管理
權(quán)限本身是為了提供數(shù)據(jù)存取方面的安全控制,這在云計(jì)算中尤為重要。我們?cè)谠乒芾硐到y(tǒng)中會(huì)提供身份訪問管理能力,只有授權(quán)的用戶才能訪問相應(yīng)的功能和數(shù)據(jù),未授權(quán)的用戶在使用之前必須對(duì)資源服務(wù)提出使用申請(qǐng),經(jīng)批準(zhǔn)后才能正確使用。
除此之外,還收集、儲(chǔ)存并實(shí)時(shí)更新的用戶的信息,狀態(tài),等級(jí)等內(nèi)容,并在此基礎(chǔ)上完成工單、銷售、客服等支持功能,后續(xù)還可以融入需求分析和智能推薦等高級(jí)功能。
修煉之七:產(chǎn)品與服務(wù)管理
云管理端還需要建設(shè)完善的產(chǎn)品與服務(wù)管理體系。產(chǎn)品與服務(wù)管理定義了云平臺(tái)提供的基礎(chǔ)設(shè)施資源的名稱,定價(jià)以及前端的套餐等,除此之外,還需要定義 云服務(wù)的名稱、基本信息、服務(wù)區(qū)域、配額和權(quán)限,并提供云服務(wù)信息的注冊(cè)、配置、發(fā)布、注銷、變更、查詢等管理功能供用戶使用。
服務(wù)質(zhì)量管理則需要遵循SLA要求,主動(dòng)按期審核和管理資源的實(shí)際使用情況,針對(duì)未達(dá)到預(yù)先約定的SLA要求,自動(dòng)化地進(jìn)行資源調(diào)配,并對(duì)產(chǎn)品功能進(jìn)行迭代演進(jìn),以滿足SLA的要求。
修煉之八:調(diào)度管理
調(diào)度管理是云計(jì)算中重要一環(huán),服務(wù)調(diào)度是其中之一。360云服務(wù)調(diào)度系統(tǒng)基于各個(gè)云服務(wù)的特點(diǎn),接受上層的請(qǐng)求,進(jìn)行資源的調(diào)度、運(yùn)行順序邏輯的管理,并進(jìn)行展示和存儲(chǔ)。
資源調(diào)度是云計(jì)算調(diào)度體系里的另一環(huán),通過查詢基礎(chǔ)資源和服務(wù)資源,判斷當(dāng)前資源狀態(tài),提供不同種類資源的合理分配算法,并配合調(diào)度系統(tǒng)來分配、部 署資源,實(shí)現(xiàn)實(shí)時(shí)響應(yīng)服務(wù)請(qǐng)求,并根據(jù)需求實(shí)現(xiàn)云服務(wù)的自動(dòng)化生成、分配、回收、遷移、數(shù)據(jù)收斂等工作,用以支持云計(jì)算的資源彈性特性。
修煉之九:安全運(yùn)維管理
一個(gè)穩(wěn)定的云平臺(tái),必須具備健康狀態(tài)的自我感知能力。這部分360采用了內(nèi)部一套自研的安全運(yùn)維系統(tǒng),負(fù)責(zé)對(duì)底層資源和對(duì)外提供服務(wù)的上層資源進(jìn)行 分別的監(jiān)控管理。對(duì)外提供服務(wù)的監(jiān)控管理通過自定義插件形式實(shí)現(xiàn),能夠進(jìn)行實(shí)時(shí)監(jiān)控、捕獲資源部署狀態(tài),獲得使用和運(yùn)行指標(biāo)、各類告警信息并按自定義的邏 輯發(fā)送給對(duì)應(yīng)的人或組。通過安全運(yùn)維系統(tǒng),可以實(shí)時(shí)保障云平臺(tái)的高可用性,給用戶提供不間斷的云服務(wù)。
而資產(chǎn)統(tǒng)計(jì)巡檢則按照資源的實(shí)際使用情況進(jìn)行統(tǒng)計(jì)和分析,每天按照?qǐng)?bào)表的形式通過云統(tǒng)計(jì)功能的維度進(jìn)行資源的匯總和告警。
修煉之十:財(cái)務(wù)管理
如果提供一個(gè)成熟的公有云平臺(tái),那么一個(gè)完善的財(cái)務(wù)系統(tǒng)是必不可少的,其中重要部分是訂單和計(jì)費(fèi)系統(tǒng)。360會(huì)按照當(dāng)前的業(yè)務(wù)模型和產(chǎn)品邏輯,記錄 用戶的購買歷史,在計(jì)費(fèi)方式上實(shí)現(xiàn)包年、包月、按量計(jì)費(fèi)的收費(fèi)模型。在業(yè)務(wù)邏輯上能夠?qū)崿F(xiàn)單產(chǎn)品代金券、多產(chǎn)品通用代金券等擴(kuò)展功能;在用戶邏輯上能夠?qū)?現(xiàn)獲取用戶等級(jí)并進(jìn)行相應(yīng)的扣費(fèi)。
除了計(jì)費(fèi),還需要支持賬單管理。需要系統(tǒng)能夠針對(duì)用戶的充值、發(fā)票,消費(fèi)賬單等進(jìn)行記錄,能夠從多維度查找信息并支持后臺(tái)的靈活操作,能夠定期與公司的財(cái)務(wù)系統(tǒng)進(jìn)行對(duì)賬和結(jié)算。
后記
上述云后端管理系統(tǒng)雖然從功能架構(gòu)上看非常復(fù)雜,但是作為一套完整的公有云體系則又是必須的功能,因此需要產(chǎn)品、前端、服務(wù)端、后端開發(fā)和運(yùn)維等團(tuán) 隊(duì)進(jìn)行跨部門協(xié)作,同時(shí)還需要有一個(gè)完整的QA體系來保證每一部分的質(zhì)量,這本身就是一件***挑戰(zhàn)的事情,360云團(tuán)隊(duì)會(huì)用心為用戶打造一個(gè)安全云平臺(tái)。