不看后悔 云計(jì)算成本管理的6個(gè)技巧
為了避免每月云計(jì)算支出超出組織的預(yù)期,組織可以使用容器,容量預(yù)購和更多的云成本管理策略來控制失控的云支出。
在云中運(yùn)營(yíng)組織的業(yè)務(wù)與在本地部署數(shù)據(jù)中心運(yùn)行相比是根本不同的。當(dāng)運(yùn)營(yíng)不同時(shí),其成本的策略也不同。
從財(cái)務(wù)角度來說,數(shù)據(jù)中心需要大量的建筑資本支出,服務(wù)器和軟件許可證的額外資本支出,以及為服務(wù)器和冷卻系統(tǒng)供電以及維護(hù)和管理的雖然較小但重要的運(yùn)營(yíng)支出。
在云計(jì)算中沒有資本支出。相反,卻有顯著的運(yùn)營(yíng)支出,用于服務(wù)器虛擬機(jī)實(shí)例,存儲(chǔ),網(wǎng)絡(luò)流量,軟件許可證和其他細(xì)節(jié)。
從成本管理的角度來看,將計(jì)算負(fù)載轉(zhuǎn)移到云計(jì)算上有顯著的好處,但也存在重大風(fēng)險(xiǎn)。
當(dāng)有人想要在數(shù)據(jù)中心使用新的服務(wù)器機(jī)架時(shí),會(huì)有批準(zhǔn)訂單和思考的理由,整個(gè)過程得到了充分的管理。它需要許可。許多公司也需要6個(gè)月的時(shí)間。一旦機(jī)架被安裝,沒有人注意它有多重或不被使用,除非其負(fù)載太重以至于不能正常工作,因此推動(dòng)數(shù)據(jù)中心中的虛擬機(jī)和容器(如Docker)來提高服務(wù)器利用率。
如果有人想要在云中建立一個(gè)新的虛擬服務(wù)器集群,則可能需要幾分鐘的時(shí)間才能將其遷移。雖然組織可能需要有新的云計(jì)算資源管理審批或?qū)γ總€(gè)部門的云資源進(jìn)行配額管理的政策,但幾乎所有訪問云賬戶的人都可以在需要時(shí)創(chuàng)建自己想要的內(nèi)容。
這種自由是好還是壞,都取決于組織自己的觀點(diǎn)。從業(yè)務(wù)靈活性和功能的角度來看,這是很好的。從財(cái)務(wù)管理的角度來看,如果做到好,可能會(huì)很好,否則這是一個(gè)潛在的災(zāi)難。
在文中,將討論如何避免“云標(biāo)簽震撼”。 將從優(yōu)化云支出的個(gè)人技術(shù)策略開始,以云支出管理的主題結(jié)束。
(1)資產(chǎn)利用率
據(jù)埃森哲公司云計(jì)算全球董事總經(jīng)理Michael Liebow稱,云服務(wù)可能導(dǎo)致產(chǎn)生僵尸服務(wù)器。僵尸服務(wù)器幾乎沒有什么用途:耗費(fèi)了組織的費(fèi)用,但卻沒有做任何事情;orphans是使用組織的資源被刪除后剩下的服務(wù);還有超大的虛擬機(jī)gluttons。這三種病理狀況如果管理不當(dāng),可能會(huì)使組織的云計(jì)算費(fèi)用增加20%至40%。
組織及時(shí)發(fā)現(xiàn)云中未充分利用的資產(chǎn)并不容易。而來自云提供商的賬單每月才提交一次,對(duì)于擁有相當(dāng)大的云產(chǎn)業(yè)的大型企業(yè)來說,可能會(huì)收取巨額的費(fèi)用。如果組織等到收到賬單,就可能會(huì)為虛擬機(jī)和其他已經(jīng)閑置30天的服務(wù)支付大量費(fèi)用,而這些服務(wù)很久以前就被關(guān)閉或縮減了。
當(dāng)組織必須管理多個(gè)云時(shí),每個(gè)云端需要多個(gè)賬戶時(shí),這就更加困難。好消息是,組織每天都可以通過電子方式從其云提供商那里獲取賬單信息;壞消息是組織可能需要許可或開發(fā)新的工具來管理其云資產(chǎn)。
(2)預(yù)購容量
一種減少組織的云資源支出的方法是在一年或幾年內(nèi)使用其基本容量。每個(gè)云提供商都做了一些這樣的工作,并定期更改其計(jì)費(fèi)策略。警告:這是一個(gè)令人困惑的領(lǐng)域,即使供應(yīng)商聲稱對(duì)定價(jià)透明。
亞馬遜公司解釋了其預(yù)購計(jì)劃:
與實(shí)時(shí)定價(jià)實(shí)例相比,保留實(shí)例為組織提供了顯著的折扣(高達(dá)75%)。另外,當(dāng)保留實(shí)例被分配到特定的可用區(qū)域時(shí),它們提供了容量預(yù)留,使組織更有信心在需要時(shí)啟動(dòng)實(shí)例的能力。
對(duì)于具有穩(wěn)定狀態(tài)或可預(yù)測(cè)使用的應(yīng)用程序,與使用按需實(shí)例相比,保留實(shí)例可以顯著地節(jié)省成本。
亞馬遜推薦保留實(shí)例:
- 穩(wěn)態(tài)使用的應(yīng)用
- 可能需要預(yù)留容量的應(yīng)用程序
- 可以承諾在1年或3年任期內(nèi)使用EC2以減少其計(jì)算總成本的客戶
作為一個(gè)具體的例子,考慮運(yùn)行Linux的N. Virginia區(qū)域中的計(jì)算優(yōu)化c4.8xlarge 虛擬機(jī)實(shí)例,每小時(shí)按需支付1.591美元,并提供36個(gè)虛擬CPU和60GB內(nèi)存。如果組織保留實(shí)例一年并完全支付,其價(jià)格可以下降到0.947美元/小時(shí),節(jié)省40%的費(fèi)用。同樣的標(biāo)準(zhǔn)為3年期限,其價(jià)格可降至每小時(shí)0.621美元,節(jié)省61%的費(fèi)用。對(duì)于可兌換3年的期限,可以讓組織更靈活,每小時(shí)收費(fèi)0.739美元,節(jié)省54%的費(fèi)用。前期付款少,有效利率略有上升,但差額大致與時(shí)間成本一致。
客戶可以靈活地更改可用性區(qū)域,實(shí)例大小和標(biāo)準(zhǔn)預(yù)留實(shí)例的網(wǎng)絡(luò)類型。可兌換3年保留實(shí)例提供了額外的靈活性,例如在保留實(shí)例期限內(nèi)使用不同實(shí)例系列,操作系統(tǒng)或租約的能力。
微軟Azure在其通用D32-v3實(shí)例中具有類似大小的虛擬機(jī)(采用更少的CPU,更多的內(nèi)存),它提供32個(gè)虛擬CPU和128GB內(nèi)存,按需支付的費(fèi)用為每小時(shí)1.60美元。微軟Azure不提供保留實(shí)例:相反,它提供了一個(gè)企業(yè)協(xié)議,具有降低價(jià)格的前期貨幣承諾,盡管折扣級(jí)別尚未公布。
谷歌公司提供一個(gè)n1-standard-32虛擬機(jī),32個(gè)虛擬CPU和120GB內(nèi)存,每小時(shí)1.52美元,每月持續(xù)使用折扣。用戶不必承諾延長(zhǎng)使用期限以獲得持續(xù)使用折扣:相反,它將自動(dòng)應(yīng)用于25%,50%和75%使用水平的增量。
谷歌公司還為虛擬機(jī)提供了承諾使用折扣,組織可以通過采購承諾合同的一到三年來激活。任何使用折扣的資源都不符合持續(xù)使用折扣的條件。通過使用折扣,虛擬機(jī)價(jià)格比常規(guī)虛擬機(jī)價(jià)格要低57%。折扣適用于區(qū)域內(nèi)CPU或內(nèi)存的總數(shù),因此不受實(shí)例機(jī)器類型更改的影響。承諾使用折扣沒有預(yù)付費(fèi)用。組織的賬單每個(gè)月都會(huì)使用承諾使用折扣。重要的是,無論組織是否使用它們,都將為其承諾支付費(fèi)用。
(3)Amazon EC2 Spot和低優(yōu)先級(jí)實(shí)例
Amazon EC2 Spot實(shí)例允許組織對(duì)備用的Amazon EC2計(jì)算能力進(jìn)行投標(biāo)定價(jià)。由于Spot實(shí)例與按需定價(jià)相比經(jīng)??梢垣@得折扣,因此可以顯著降低運(yùn)行應(yīng)用程序的成本,增加應(yīng)用程序的計(jì)算容量和吞吐量,從而實(shí)現(xiàn)相同的預(yù)算,并啟用新型云計(jì)算應(yīng)用程序。
當(dāng)組織的投標(biāo)價(jià)格超過Spot價(jià)格時(shí),即可運(yùn)行Spot價(jià)格,并可按需求提供50-90%的折扣。使用Spot實(shí)例,組織將不會(huì)收取超過其指定的***價(jià)格的費(fèi)用。當(dāng)組織的實(shí)例運(yùn)行時(shí),就收取該期間有效的Spot價(jià)格。如果Spot價(jià)格超過組織的指定價(jià)格,Spot將在終止前收到兩分鐘的通知,組織實(shí)例運(yùn)行的部分時(shí)間將不會(huì)被收取費(fèi)用。
如果組織的Spot實(shí)例請(qǐng)求包含持續(xù)時(shí)間要求,組織的實(shí)例將繼續(xù)運(yùn)行,直到選擇終止,或者直到指定的持續(xù)時(shí)間結(jié)束為止,由于Spot價(jià)格的變化,組織的實(shí)例將不會(huì)被終止。目前,一臺(tái)帶有Linux的c4.8xlarge VM的Spot實(shí)例在N. Virginia區(qū)域的每小時(shí)成本為0.3591美元,而按需每小時(shí)1.591美元。
Azure將其等同于AWS Spot實(shí)例稱為“低優(yōu)先級(jí)”。當(dāng)檢查時(shí),在美國(guó)東部的區(qū)域的低優(yōu)先級(jí)D32-v3實(shí)例每小時(shí)成本為0.345美元,而按需小時(shí)為1.6美元。但是,組織無法在其賬戶中選擇此選項(xiàng)。

谷歌公司相當(dāng)于Spot實(shí)例被稱為“可搶占的實(shí)例”。可搶占的虛擬機(jī)是一個(gè)實(shí)例,組織通常以比正常實(shí)例低得多的價(jià)格創(chuàng)建和運(yùn)行。但是,如果計(jì)算引擎需要訪問其他任務(wù)的資源,則可能會(huì)終止(搶占)這些實(shí)例??蓳屨紝?shí)例的計(jì)算引擎容量過大,因此其可用性因使用情況而異。目前,有北弗吉尼亞州區(qū)域的一個(gè)名為n1-standard-32搶先實(shí)例每小時(shí)成本為0.3424美元,而全價(jià)為每小時(shí)1.712美元,持續(xù)使用價(jià)格為每小時(shí)1.52美元。谷歌表示,搶占率通常在每個(gè)項(xiàng)目每7天在5%到15%的范圍內(nèi)變化。
(4)容器
如果組織擁有未充分利用的服務(wù)器,或新機(jī)架的空間有限,可以將其數(shù)據(jù)中心的一些專用服務(wù)器轉(zhuǎn)換為虛擬機(jī)的主機(jī)。然后,當(dāng)虛擬機(jī)主機(jī)中的內(nèi)存使用成為問題時(shí),他們將其部分虛擬機(jī)轉(zhuǎn)換為容器的主機(jī)。
虛擬化與容器之間的基本區(qū)別在于,除了應(yīng)用程序軟件之外,虛擬機(jī)還包含完整的操作系統(tǒng)和一整套虛擬化硬件,而容器僅包含操作系統(tǒng)的一部分,某些庫和應(yīng)用軟件。虛擬機(jī)和容器都與其他應(yīng)用程序隔離,虛擬機(jī)提供更多的隔離和更好的安全性,盡管內(nèi)存使用成本很高。
內(nèi)存是租賃在云中的最昂貴的資源之一,容器通常只需要三分之一的內(nèi)存來運(yùn)行與虛擬機(jī)相同的軟件。這樣就可以將容器中的云產(chǎn)業(yè)運(yùn)作成為有吸引力的成本主張,只要減少隔離度不成問題。
直到最近,容器的使用才被限制在基于Linux的系統(tǒng)中,并且缺乏對(duì)容器的編排,工具支持和檢測(cè)。這些都不是一個(gè)真正的問題,將組織的負(fù)載轉(zhuǎn)移到云中的容器是簡(jiǎn)化操作并減少云支出的好方法。
在AWS的云中,運(yùn)行容器不需要額外的費(fèi)用,組織只需支付底層的虛擬機(jī)和存儲(chǔ)空間。 微軟Azure可以直接從資源池中創(chuàng)建和使用容器,并為每個(gè)創(chuàng)建的實(shí)例收取0.0025美元的費(fèi)用,加上每GB每秒0.0000125美元和每CPU每秒0.0000125美元的費(fèi)用。例如,如果組織一個(gè)月同時(shí)運(yùn)行三個(gè)容器,并且每個(gè)容器使用1GB的內(nèi)存和2個(gè)CPU,那么組織每月將支付少于300美元的費(fèi)用。
谷歌容器引擎在計(jì)算引擎虛擬機(jī)實(shí)例之下運(yùn)行Kubernetes下的集群節(jié)點(diǎn)集群,組織為虛擬機(jī)付費(fèi)。 Kubernetes管理部門收取少量費(fèi)用,6個(gè)或更多個(gè)節(jié)點(diǎn)的集群每小時(shí)為0.15美元。
(5)無服務(wù)器
無服務(wù)器云計(jì)算,或者更準(zhǔn)確地說是功能即服務(wù),有可能大大降低將負(fù)載放入云中所涉及的成本和工作量。AWS Lambda,Bluemix OpenWhisk,Google Cloud Functions和Azure Functions都提供了一個(gè)模型,開發(fā)人員定義了一個(gè)按需運(yùn)行的功能,為該功能創(chuàng)建觸發(fā)器,并設(shè)置了該功能的內(nèi)存分配。云計(jì)算基礎(chǔ)架構(gòu)需要在需要運(yùn)行時(shí)為該功能分配容器,因此開發(fā)人員不必?fù)?dān)心容量或可擴(kuò)展性。
無服務(wù)器成本通?;谟|發(fā)器的數(shù)量,執(zhí)行時(shí)間和使用的內(nèi)存數(shù)量。一個(gè)函數(shù)調(diào)用的運(yùn)行時(shí)間限制為5到10分鐘,具體取決于平臺(tái),但次級(jí)運(yùn)行時(shí)間更常見。大多數(shù)平臺(tái)還限制了可以同時(shí)運(yùn)行的功能數(shù)量,并且每個(gè)月都可以提供捆綁的可用功能。
作為經(jīng)驗(yàn)法則,如果聚合功能執(zhí)行時(shí)間少于每月50萬秒,或大約一個(gè)月的20%的時(shí)間,則使用無服務(wù)器功能比運(yùn)行小型虛擬機(jī)成本要低。提供者的數(shù)字有所不同,以及是否將功能與全價(jià)或折扣的虛擬機(jī)實(shí)例進(jìn)行比較。
在進(jìn)行成本分析時(shí),組織還需要包括開發(fā)人員和操作時(shí)間,對(duì)于無服務(wù)器功能而言通常較低,因?yàn)楦嗟墓芾肀煌扑偷皆铺峁┥獭T陂_發(fā)和運(yùn)營(yíng)成本方面,使用無服務(wù)器功能可以比運(yùn)行小型虛擬機(jī)更便宜,即使總功能執(zhí)行利用率是每月75%。
使用無服務(wù)器功能的一個(gè)缺點(diǎn)是計(jì)費(fèi)的復(fù)雜性。如果組織在虛擬機(jī)中托管的功能,那么該虛擬機(jī)每個(gè)月都會(huì)生成一個(gè)計(jì)費(fèi)行,無論調(diào)用多少次功能。如果組織的無服務(wù)器功能為每月400萬次,則在結(jié)算日志中將有400萬個(gè)事件。
(6)云支出管理
鑒于云定價(jià)的復(fù)雜性以及與數(shù)據(jù)中心管理的差異,許多公司將需要采用新的云計(jì)算支出管理工具。在互聯(lián)網(wǎng)搜索“云支出管理”,“云成本管理”或“云管理平臺(tái)”將會(huì)產(chǎn)生至少六個(gè)可行的可能性,以及一系列無關(guān)緊要的結(jié)果。雖然組織可以使用其本機(jī)的資源標(biāo)簽和報(bào)告功能來管理單個(gè)云平臺(tái)的使用,但如果使用兩個(gè)或多個(gè)云提供商的服務(wù),那么就很難保持使用和成本的優(yōu)勢(shì)。
無論組織使用什么工具,管理云支出的主要關(guān)鍵是標(biāo)注資源。如果組織可以查看一個(gè)結(jié)算行項(xiàng)目,并立即看到它用于與Fizzpop產(chǎn)品相關(guān)的開發(fā)和測(cè)試。如果這個(gè)標(biāo)記進(jìn)入組織的報(bào)告和管理工具,以便組織可以放大圖形中的“僵尸”,并查看其預(yù)期目的和組合關(guān)系,組織可以關(guān)閉循環(huán),并實(shí)際執(zhí)行一些關(guān)于未使用的服務(wù)器虛擬機(jī)。
云成本管理并不容易,而且大多數(shù)IT組織對(duì)其數(shù)據(jù)中心的ITIL流程和工具都無法真正做到這一點(diǎn)。為了有效地管理云端產(chǎn)品,組織需要每天監(jiān)控其成本,并根據(jù)需要進(jìn)行干預(yù),通過關(guān)閉資源,縮小資源或?qū)⑵浞旁谌粘瘫砩希皇且恢边\(yùn)行它們。