多云已成現(xiàn)實(shí),企業(yè)如何更好地實(shí)現(xiàn)多云管理?
很多人不斷地在鼓吹企業(yè)上云是 “ 大勢(shì)所趨 ” ,但他們只是鼓吹上云的好處,從來(lái)不提上云的壞處。不管是由于歷史遺留還是出于監(jiān)管要求等原因,不少企業(yè)目前都建設(shè)了好幾朵云,如何高效地整合使用這些不同的云資源?很多企業(yè)都有云管產(chǎn)品,但很多都是眉毛胡子一把抓,龐大而復(fù)雜,如何定位多云管理、云管和應(yīng)用管理之間的關(guān)系?
不管是由于歷史遺留還是出于監(jiān)管要求等原因,不少企業(yè)目前都建設(shè)了好幾朵云,面臨著多云管理的問(wèn)題,如何高效地整合使用這些不同的云資源,是一個(gè)非常值得探討的問(wèn)題。國(guó)內(nèi)很多企業(yè)都有云管產(chǎn)品,但很多都是眉毛胡子一把抓,什么都對(duì)接,什么都管,依然是傳統(tǒng)單體系統(tǒng)建設(shè)的思路,龐大而復(fù)雜。對(duì)于云管管理的邊界和范圍、如何實(shí)現(xiàn)多云管理、云管和應(yīng)用管理之間的關(guān)系、云管和容器云平臺(tái)之間的關(guān)系、企業(yè)內(nèi)多云管理是否有必要實(shí)現(xiàn)計(jì)費(fèi)等等問(wèn)題,都是需要認(rèn)真考慮的。考慮清楚了這些問(wèn)題,也才能建設(shè)真正合適的多云管理平臺(tái),真正助力企業(yè)數(shù)字化轉(zhuǎn)型。
多云管理需求由來(lái)
前些年云平臺(tái)建設(shè)過(guò)程中,很多企業(yè)對(duì)云并沒(méi)有那么深的理解,抱著試一試的態(tài)度,所以在選型的時(shí)候就不是一次到位。另外不同的部門(mén)也可能選擇不同廠商的云平臺(tái),經(jīng)過(guò)一段時(shí)間的建設(shè),企業(yè)內(nèi)部往往會(huì)好幾朵云并存。這些云彼此之間廠商不同、架構(gòu)不同、接口不同、界面不同等等,所以難以統(tǒng)一進(jìn)行管理和維護(hù),不得不考慮封裝一層來(lái)實(shí)現(xiàn)統(tǒng)一管理,這就是多云管理的需求。
很多人不斷地在鼓吹企業(yè)上云是 “ 大勢(shì)所趨 ” ,但他們只是鼓吹上云的好處,從來(lái)不提上云的壞處。而大部分客戶(hù)并不真正的理解云計(jì)算所帶來(lái)的優(yōu)勢(shì)和不足,跟著別人隨大流,購(gòu)買(mǎi)了公有云,建設(shè)了私有云等等,使企業(yè) IT 架構(gòu)日益復(fù)雜化。IT 成本并沒(méi)有因此減少,而是在不斷攀升。
一種技術(shù)解決不了所有問(wèn)題,上云并不是唯一選擇。決定上不上云之前一定要理解云計(jì)算所能解決的核心問(wèn)題,一定要有自己的思考和選擇。云計(jì)算解決的是分布式網(wǎng)格計(jì)算問(wèn)題,也就是算力問(wèn)題。也就等同于利用 CPU 、內(nèi)存、存儲(chǔ)、網(wǎng)絡(luò)等基礎(chǔ)設(shè)施資源實(shí)現(xiàn)分布式計(jì)算、網(wǎng)格計(jì)算能力,通過(guò)提供標(biāo)準(zhǔn)化的基礎(chǔ)設(shè)施資源計(jì)算服務(wù)( IaaS 服務(wù)),支撐不同企業(yè)的大數(shù)據(jù)量計(jì)算和存儲(chǔ)等需求。在 IaaS 之上,有廠商構(gòu)建了平臺(tái)服務(wù)能力( PaaS ),為企業(yè)和個(gè)人提供應(yīng)用的開(kāi)發(fā)、部署、托管、運(yùn)維等能力,這樣就不用直接去關(guān)心和運(yùn)維基礎(chǔ)設(shè)施資源,只要有網(wǎng)絡(luò)就可以完成在線(xiàn)的應(yīng)用開(kāi)發(fā)、托管、運(yùn)維運(yùn)營(yíng),節(jié)省大量的人力成本等。而在 IaaS 和 PaaS 之上也可以部署開(kāi)發(fā)好的應(yīng)用,比如財(cái)務(wù)軟件、客戶(hù)管理軟件等,直接向用戶(hù)提供軟件服務(wù)( SaaS ),實(shí)現(xiàn)開(kāi)箱即用,一鍵注冊(cè)使用能力,這樣對(duì)小企業(yè)和個(gè)人客戶(hù)就更便利,完全不用自己搭建 IT 系統(tǒng)和平臺(tái),直接按需使用,方便快捷。
正因?yàn)椴煌膹S商、不同的平臺(tái)、不同技術(shù)、不同的架構(gòu)、不同的服務(wù)、不同的安全能力等等帶來(lái)了上云的不同選擇。有報(bào)告顯示企業(yè)平均會(huì)使用 2.2 個(gè)公有云和 2.2 個(gè)私有云?!?多云 ” 其實(shí)就是 “ 上云 ” 所帶來(lái)的額外成本。這些云彼此之間相互隔離,無(wú)法實(shí)現(xiàn)統(tǒng)一的資源管控,就需要多云管理平臺(tái)來(lái)實(shí)現(xiàn)統(tǒng)一管理。
既然多云已成現(xiàn)實(shí),那么如何更好地實(shí)現(xiàn)多云管理,如何定義多云管理的邊界和功能范圍,是多云管理平臺(tái)產(chǎn)品化的關(guān)鍵。
多云管理的邊界和范圍
在 2020 年 Gartner CMP 魔力象限中,定義了 CMP 涉及的八項(xiàng)功能:調(diào)配和編排、服務(wù)請(qǐng)求、庫(kù)存和分類(lèi)、監(jiān)控和分析、成本管理和工作負(fù)載優(yōu)化、云遷移備份和災(zāi)難恢復(fù)、安全合規(guī)性和身份管理、打包及交付。其中核心的功能是成本管理和安全。從 Gartner CMP 功能定義來(lái)看,其實(shí)還是站在 CMP 廠商的視角來(lái)看待問(wèn)題的,并沒(méi)有真正從用戶(hù)的視角來(lái)理解多云管理的需求,所以筆者認(rèn)為其對(duì)多云管理的功能需求定位并不準(zhǔn)確。
云計(jì)算解決的核心問(wèn)題是算力問(wèn)題,也就是基礎(chǔ)設(shè)施資源 IaaS 問(wèn)題。所以云管的核心能力應(yīng)該是管理不同云平臺(tái)的基礎(chǔ)設(shè)施資源,提供標(biāo)準(zhǔn)化的基礎(chǔ)設(shè)施資源服務(wù) IaaS 。這樣就屏蔽了底層不同云平臺(tái)的差異,實(shí)現(xiàn)了異構(gòu)云的統(tǒng)一基礎(chǔ)設(shè)施資源服務(wù)。
云管職責(zé)定位
筆者多次提到過(guò),云管平臺(tái)是一個(gè)重要的工具,向下可以管理各種基礎(chǔ)設(shè)施資源,向上支撐容器云或容器化 PaaS 平臺(tái),為容器化 PaaS 平臺(tái)提供資源,而容器云或容器化 PaaS 只使用資源不管理和維護(hù)資源,使容器云和容器化 PaaS 平臺(tái)專(zhuān)注于支撐業(yè)務(wù)應(yīng)用管理,實(shí)現(xiàn)以應(yīng)用管理為核心,這樣容器云、微服務(wù)治理、云管等平臺(tái)就可以有機(jī)整合在一起,成為一體。使云管承上管下。最終是要支撐業(yè)務(wù)應(yīng)用在不同云平臺(tái)資源之間的調(diào)度。以基礎(chǔ)設(shè)施資源的彈性來(lái)更好的支撐業(yè)務(wù)應(yīng)用的彈性。
在實(shí)現(xiàn)云管平臺(tái)時(shí),不是什么都加上去,一定要有所選擇,一定不要搞個(gè)大云管,什么都做。筆者認(rèn)為比較好的定位是讓云管來(lái)管理不同的云基礎(chǔ)設(shè)施資源,至于中間件、中間件服務(wù)、應(yīng)用、其他非 IaaS 云平臺(tái),一定不要放在云管上去做。云管平臺(tái)并不是所有的 “ 云 ” 都要管起來(lái)。云管平臺(tái)兩項(xiàng)基本的能力:
- 納管公有云和私有云 IaaS ,屏蔽異構(gòu)云平臺(tái)底層資源細(xì)節(jié)。
- 為企業(yè)提供統(tǒng)一標(biāo)準(zhǔn)化基礎(chǔ)設(shè)施資源服務(wù) IaaS 能力。
其他的如監(jiān)控、計(jì)費(fèi)、備份、分析、負(fù)載優(yōu)化等功能都是基于這兩項(xiàng)基本能力的擴(kuò)展。
云管是否管容器?
云管平臺(tái)讓很多人混亂的一個(gè)問(wèn)題是是否管理容器和容器云。首先要認(rèn)識(shí)到,提供 “容器服務(wù)” 和提供 “容器云平臺(tái)服務(wù)” 是不一樣的。這是兩個(gè)層次的問(wèn)題。容器服務(wù)可以簡(jiǎn)單看作是 IaaS 層服務(wù),而容器云平臺(tái)服務(wù)則可以看作是 PaaS 層服務(wù)。理論上,云管平臺(tái)可以提供容器服務(wù),但筆者非常不建議直接使用容器,而應(yīng)該通過(guò)容器云平臺(tái)或者 PaaS 平臺(tái)封裝容器服務(wù)。容器云(或 PaaS )平臺(tái)應(yīng)該使用云管的資源,其在云管之上,所以云管不應(yīng)該去納管容器云平臺(tái),更不應(yīng)納管容器化 PaaS 平臺(tái)。
容器、容器云、容器化 PaaS 是不同的概念。筆者之所以要區(qū)分這些概念,就是要明確標(biāo)準(zhǔn),否則你說(shuō)你的,我說(shuō)我的,雞同鴨講,是做不好事情的。很多人喜歡拿概念炒作,一個(gè)詞有很多意思,或者一個(gè)意思用很多詞來(lái)表示,很亂,不知道在說(shuō)什么。做技術(shù)要像數(shù)學(xué)一樣,要嚴(yán)謹(jǐn),概念要清晰明確。云管的職責(zé)定位也是要明確,才能做好云管產(chǎn)品,才能更好地支撐企業(yè)業(yè)務(wù)發(fā)展和創(chuàng)新。
基于上面的考慮,云管的邊界最好定義在 IaaS 層資源管理,納管不同的 IaaS 云平臺(tái)、不同的存儲(chǔ)、網(wǎng)絡(luò)資源,甚至不同的物理機(jī)、虛擬機(jī),為企業(yè)提供所需的各種基礎(chǔ)設(shè)施資源服務(wù),實(shí)現(xiàn)基礎(chǔ)設(shè)施資源的彈性伸縮。云管的功能范圍是基于多云納管和統(tǒng)一的 IaaS 服務(wù)兩項(xiàng)基本能力之上的擴(kuò)展。但云管不會(huì)去納管容器云、中間件等。企業(yè) IT 架構(gòu)需要實(shí)現(xiàn)清晰的功能分層定義,使云管專(zhuān)注于基礎(chǔ)設(shè)施資源的管理和供給。
多云管理設(shè)計(jì)實(shí)現(xiàn)
明確了云管的職責(zé)和功能范圍,在實(shí)現(xiàn)云管平臺(tái)時(shí),就相對(duì)容易很多。很多人認(rèn)為云管是定制化項(xiàng)目,顯然就是沒(méi)有完全理解云管的定位。筆者認(rèn)為云管是可以做成一個(gè)很好的標(biāo)準(zhǔn)化產(chǎn)品,從而實(shí)現(xiàn)敏捷部署和擴(kuò)展。在產(chǎn)品化的時(shí)候,需要站在甲方的需求立場(chǎng)上來(lái)看待問(wèn)題。真正滿(mǎn)足甲方需求了,甲方才能滿(mǎn)意,才能愿意花錢(qián)來(lái)購(gòu)買(mǎi)產(chǎn)品。很多廠商都很聰明,有自己的小九九,但筆者卻認(rèn)為其聰明有余而智慧不足,格局不夠,所以國(guó)內(nèi)的 IT 企業(yè)很難做大。企業(yè) IT 架構(gòu)的發(fā)展趨勢(shì)一定是實(shí)現(xiàn)系統(tǒng)的融合,而不是一個(gè)個(gè)單體,才能真正的實(shí)現(xiàn)敏捷部署和擴(kuò)展,支撐企業(yè)數(shù)字化、智能化轉(zhuǎn)型。因此,未來(lái)各種平臺(tái)之間一定要能做到無(wú)縫整合,這就要求各平臺(tái)、工具不能大而全,要有所取舍,明確定位。那些不開(kāi)放的產(chǎn)品最終會(huì)搬起石頭砸自己的腳,被甲方拋棄。定制化未來(lái)將會(huì)是一條死路,合適的產(chǎn)品定位才是正確選擇。
首先,多云管理是資源納管平臺(tái),實(shí)現(xiàn)基礎(chǔ)設(shè)施資源統(tǒng)一管理和調(diào)度。云管對(duì)于小企業(yè)可能是沒(méi)必要的,面對(duì)的客戶(hù)應(yīng)該是大中企業(yè),大中企業(yè)才可能會(huì)建設(shè)或購(gòu)買(mǎi)使用多種不同的云平臺(tái),從而實(shí)現(xiàn)容災(zāi)、備份等需求。這就要求能夠方便地將應(yīng)用或數(shù)據(jù)從一個(gè)云平臺(tái)調(diào)度到另一個(gè)云平臺(tái),而云管需要具備這樣的能力。比如說(shuō),在騰訊云運(yùn)行的應(yīng)用需要在華為云上也部署,從而實(shí)現(xiàn)備份和容災(zāi)等需求,而對(duì)客戶(hù)來(lái)說(shuō),在云管平臺(tái)上騰訊云和華為云只是兩種不同的資源類(lèi)型而已,可以自由的調(diào)度應(yīng)用到騰訊云或者華為云上,這就屏蔽了頂層異構(gòu)云細(xì)節(jié),可以實(shí)現(xiàn)秒級(jí)的資源調(diào)度。
其次,云管提供場(chǎng)景化標(biāo)準(zhǔn)資源交付,提升資源交付效率。不同企業(yè)有不同的業(yè)務(wù)場(chǎng)景需求,比如說(shuō)中間件集群部署場(chǎng)景、數(shù)據(jù)庫(kù)集群部署場(chǎng)景、應(yīng)用高可用部署場(chǎng)景、應(yīng)用彈性伸縮場(chǎng)景、跨云部署場(chǎng)景等;不同業(yè)務(wù)應(yīng)用對(duì)資源的需求也是不一樣的,比如說(shuō) GPU 機(jī)器學(xué)習(xí)深度學(xué)習(xí)場(chǎng)景、高 CPU 計(jì)算場(chǎng)景、高內(nèi)存緩存場(chǎng)景、大數(shù)據(jù)存儲(chǔ)場(chǎng)景等等。這如同不同的人高矮胖瘦不一樣,所需的衣服長(zhǎng)短大小就不同一樣。通過(guò)預(yù)先定義提供不同場(chǎng)景的資源服務(wù),有針對(duì)性地快速支撐企業(yè)不同的業(yè)務(wù)需求,從而提升資源的匹配性和利用效率,也減少資源準(zhǔn)備時(shí)間,提升資源交付效率。
第三,基于多云的應(yīng)用部署不能放在多云管理平臺(tái)建設(shè)。多云平臺(tái)承上管下,定位在 IaaS 資源管理和資源服務(wù),它理論上還是 IaaS 層。應(yīng)用的部署和管理放在 PaaS 平臺(tái)上,位于 PaaS 層,因此跨云的應(yīng)用部署和管理不要放在多云管理平臺(tái)來(lái)實(shí)現(xiàn)。云計(jì)算的三種服務(wù)(三層服務(wù))給我們一個(gè)很好的啟示,企業(yè)在 IT 建設(shè)中架構(gòu)要分層,無(wú)論云計(jì)算的三層服務(wù),或者前、中、后臺(tái)架構(gòu),其實(shí)都是要進(jìn)行分層,從而實(shí)現(xiàn)復(fù)用,避免重復(fù)建設(shè),節(jié)省成本,提升效率。
第四,中間件、數(shù)據(jù)庫(kù)等可以看作是一種應(yīng)用,因此其可以在 PaaS 層來(lái)管理(筆者建議中間件和數(shù)據(jù)庫(kù)等的容器部署場(chǎng)景僅用于企業(yè)測(cè)試環(huán)境,不建議用于生產(chǎn)環(huán)境)。云管始終定位于異構(gòu)資源的管理和統(tǒng)一資源服務(wù)的供給。其他的可以交給上層的 PaaS 來(lái)負(fù)責(zé)。公有云、行業(yè)云上的中間件和數(shù)據(jù)庫(kù)等的管理相對(duì)要容易些,因?yàn)椴挥每紤]基礎(chǔ)設(shè)施資源的管理,至于使用這些應(yīng)用的計(jì)費(fèi),也可以放在 PaaS 平臺(tái)來(lái)管理。
第五,多云成本管理。云管作為一個(gè)獨(dú)立的產(chǎn)品,需要考慮多云資源使用的計(jì)費(fèi),從而根據(jù)需要調(diào)度到合適的云平臺(tái),實(shí)現(xiàn)成本最優(yōu)化。這也是智能運(yùn)維的一部分關(guān)鍵能力。不過(guò)如果云管跟 PaaS 有機(jī)整合在一起的話(huà),計(jì)費(fèi)和成本管理可以上移放在 PaaS 平臺(tái),由 PaaS 平臺(tái)根據(jù)計(jì)費(fèi)規(guī)則、成本規(guī)則以及資源可靠性、有效性指標(biāo)等來(lái)進(jìn)行智能調(diào)度,實(shí)現(xiàn)最優(yōu)的資源調(diào)度和成本平衡。
多云場(chǎng)景資源調(diào)度一般原則
為了優(yōu)化成本,多云場(chǎng)景下資源調(diào)度可以遵循以下一般原則:
(1) 私有云資源優(yōu)先調(diào)度使用。在私有云資源不足時(shí)才調(diào)度到行業(yè)云(或公有云)。為了節(jié)約成本,首先要使用私有云資源。企業(yè)私有云資源往往是有限的,在某些情況下需要調(diào)度到行業(yè)云、公有云上,比如某些臨時(shí)性的重大促銷(xiāo)活動(dòng)等,就可以在 PaaS 層通過(guò)云管服務(wù)調(diào)度部分應(yīng)用實(shí)例到公有云上。
(2) 按行業(yè)云(或公有云)的計(jì)費(fèi)成本進(jìn)行排序,優(yōu)先調(diào)度到資費(fèi)低的行業(yè)云(或公有云)上。資費(fèi)管理是云管平臺(tái)的一項(xiàng)重要能力。不過(guò)通過(guò)資費(fèi)管理可以更好地進(jìn)行成本管理和優(yōu)化。每家公有云的費(fèi)用可能是不同的,不同時(shí)期資費(fèi)也可能會(huì)發(fā)生變化,如何利用資費(fèi)規(guī)則來(lái)節(jié)約成本是云管平臺(tái)很重要的一個(gè)方面。
(3) 根據(jù)業(yè)務(wù)或數(shù)據(jù)安全等級(jí),對(duì)公有云安全能力進(jìn)行評(píng)價(jià),作為一個(gè)資源調(diào)度參數(shù)度量值進(jìn)行計(jì)算。使用公有云很重要很關(guān)鍵的是要保證數(shù)據(jù)安全,特別對(duì)于大企業(yè)來(lái)說(shuō),數(shù)據(jù)的價(jià)值往往遠(yuǎn)遠(yuǎn)大于使用公有云所節(jié)約的那點(diǎn)費(fèi)用,因此,數(shù)據(jù)安全能力是評(píng)價(jià)公有云的一個(gè)重要指標(biāo)。
(4) 根據(jù)公有云可靠性能力和資源有效性等指標(biāo)進(jìn)行評(píng)價(jià),作為調(diào)度參數(shù)度量值進(jìn)行計(jì)算。國(guó)內(nèi)有公有云廠商曾經(jīng)也出現(xiàn)過(guò)重大的故障,導(dǎo)致客戶(hù)數(shù)據(jù)丟失等難以挽回的損失。對(duì)于某些客戶(hù)來(lái)說(shuō)可能是災(zāi)難性的。因此從容災(zāi)和高可用角度,也需要多云部署來(lái)規(guī)避風(fēng)險(xiǎn)。根據(jù)公有云所提供的資源的有效性(可利用率、性能等)和可靠性(故障頻率、重大故障影響等)來(lái)進(jìn)行度量,選擇合適的公有云。
多云支撐場(chǎng)景
采用多云的優(yōu)勢(shì)在于不依賴(lài)于一家云廠商,通過(guò)競(jìng)爭(zhēng)從而獲得更好的服務(wù)。多云可以滿(mǎn)足以下場(chǎng)景需求:
(1) 應(yīng)用多云部署實(shí)現(xiàn)高可用、容災(zāi)備份。多云其實(shí)相當(dāng)于傳統(tǒng)多個(gè)數(shù)據(jù)中心,滿(mǎn)足于很多企業(yè) “ 兩地三中心 ” 的容災(zāi)備份需求。
(2) 資源彈性伸縮從而支持應(yīng)用的彈性伸縮,實(shí)現(xiàn)應(yīng)用自動(dòng)擴(kuò)展。私有云很大的問(wèn)題是受限于算力資源,往往難以做到按需彈性伸縮??梢越柚袠I(yè)云和公有云實(shí)現(xiàn)某些場(chǎng)景的資源無(wú)限性,按需使用,用完釋放。
(3) 多云協(xié)助優(yōu)化企業(yè)資源配置,專(zhuān)注于企業(yè)核心業(yè)務(wù)的高效基礎(chǔ)設(shè)施資源建設(shè),避免千頭萬(wàn)緒的設(shè)計(jì)需求,使企業(yè)能優(yōu)化私有云基礎(chǔ)設(shè)施資源配置,更好地支撐關(guān)鍵的業(yè)務(wù)和場(chǎng)景。
(4) 多云也助力企業(yè)優(yōu)化資源成本。不同場(chǎng)景對(duì)基礎(chǔ)設(shè)施資源的需求有不同,通用型資源往往會(huì)帶來(lái)浪費(fèi)。使用不同的云平臺(tái)根據(jù)費(fèi)用規(guī)則可以最大化地優(yōu)化資源使用成本,獲得最優(yōu)的資源配置。
多云管理平臺(tái)在企業(yè) IT 架構(gòu)中是一個(gè)承上管下的關(guān)鍵組件,是企業(yè)數(shù)字化、智能化運(yùn)維運(yùn)營(yíng)的基礎(chǔ)支撐平臺(tái)。多云管理平臺(tái)的設(shè)計(jì)定位會(huì)直接影響到企業(yè) IT 架構(gòu)的設(shè)計(jì)。云管 + 容器云平臺(tái) + 微服務(wù)治理 +DevOps 是比較完整的產(chǎn)品體系。如果能基于云管來(lái)支撐容器云 PaaS 以實(shí)現(xiàn)以應(yīng)用管理為中心的產(chǎn)品架構(gòu)體系,那么其發(fā)展?jié)摿?huì)是巨大的。