實用:公有云使用常見問題解答
(1) 云主機(jī)有沒有安裝常規(guī)服務(wù),大量服務(wù)、應(yīng)用如何批量配置管理?
答:首選,業(yè)務(wù)放到云上并不是一切自動化了,使用云只是服務(wù)器、網(wǎng)絡(luò)等硬件不需要投入,系統(tǒng)由云提供,系統(tǒng)之上的應(yīng)用、服務(wù)還需要自己安裝、配置、管理。
第二,一些常用的服務(wù),比如LAMP,一般公有云都有專用的鏡像,可以拿來就用,但是如果是自己的業(yè)務(wù),比如游戲,公有云肯定不能提供部署好的鏡像。
如果需要大規(guī)模的部署業(yè)務(wù),可以采用以下方案:
1)申請云主機(jī)之后,利用腳本部署,這個實際上和自己在物理機(jī)上部署的過程是一樣的,即將云主機(jī)當(dāng)作物理機(jī)來使用,這種方案比較靈活,需要維護(hù)的是腳本,需要根據(jù)業(yè)務(wù)變化更新腳本。
2)大部分云都支持自定義鏡像,就是自己搞一個模版,然后上傳,載通過自己的模版克隆,這種方案比較快,但是需要維護(hù)自己的鏡像,有變化需要更新鏡像。
3)使用公有云的API接口,完成云主機(jī)創(chuàng)建、業(yè)務(wù)部署完全自動化,這種方案需要公有云提供完善的API接口,運維組目前也在開放這樣的管理平臺,能夠?qū)⒂螒驑I(yè)務(wù)及云主機(jī)部署的自動部署一條線打通。
(2) 公有云提供那些監(jiān)控服務(wù),自己業(yè)務(wù)在云上如何監(jiān)控?
答:大部分云上的監(jiān)控,都是從宿主機(jī)上看到云主機(jī)的資源占用,一般CPU、網(wǎng)絡(luò)、磁盤資源使用可以觀察的比較精確,但是內(nèi)存只能看到占用多少,不能看到實際的內(nèi)容到底是被緩存了還是被使用了,也不能看到SWAP的使用情況,因為從宿主機(jī)上也不能探測云主機(jī)系統(tǒng)內(nèi)部的情況。
也有一些公有云、或者第三方服務(wù)商,比如監(jiān)控寶,可以提供監(jiān)控服務(wù),但是一般都需要在云主機(jī)內(nèi)部案子agent,或者通過snmp這樣的協(xié)議,抓去云主機(jī)的指標(biāo)信息,這樣就有一個信任、安全的問題。
另外,業(yè)務(wù)指標(biāo)的監(jiān)控,一般還需要自己動手,比如游戲業(yè)務(wù)的人數(shù)、游戲幣的消耗等,一方面要監(jiān)控什么指標(biāo),自己最清楚,一方面還有保密的需求。
所以,總的來說,云上的監(jiān)控還是要依靠自己,尤其是業(yè)務(wù)相關(guān)的。
(3) 云上的數(shù)據(jù)庫服務(wù)RDS是否提供監(jiān)控,監(jiān)控類型有哪些?
RDS服務(wù)實際就是將數(shù)據(jù)庫的創(chuàng)建、管理、快照、性能、備份、恢復(fù)等底層維護(hù)交給云管理,云只提供數(shù)據(jù)庫的使用接口給用戶,這樣的好處是用戶不需要專業(yè)的知識也可以很好的使用數(shù)據(jù)庫,不用擔(dān)心數(shù)據(jù)庫的管理維護(hù)問題。
云上的RDS有兩種實施方案:
1)直接使用云主機(jī)實例,數(shù)據(jù)庫服務(wù)實際是一個特殊的云主機(jī)鏡像,需要使用就是生成一臺數(shù)據(jù)庫云主機(jī)鏡像,亞馬遜目前使用的是這種方案。
亞馬遜的RDS提供以下監(jiān)控指標(biāo):
- PU利用率
- 磁盤讀下IOPS
- 磁盤讀寫延時
- 磁盤隊列深度
- 磁盤讀寫吞吐
- 二進(jìn)制日志空間利用率
- SWAP利用率
- 網(wǎng)卡吞吐
詳細(xì)情況請參考亞馬遜RDS申請,使用簡介。
2)使用數(shù)據(jù)庫集群,用戶申請數(shù)據(jù)庫的時候,直接生成一個數(shù)據(jù)庫實例,這種方案資源利用率更高,但是有以下難點:
- 物理機(jī)故障的時候,故障影響面比較大;
- 具體的實例資源使用不好控制;
- 不同的實例要使用不同的端口;
- 同一個數(shù)據(jù)庫集群,數(shù)據(jù)庫版本要求一致。
業(yè)務(wù)的數(shù)據(jù)庫,為保持業(yè)務(wù)穩(wěn)定,為保證業(yè)務(wù)數(shù)據(jù)機(jī)密,建議從申請符合要求的高配云主機(jī),自己搭建數(shù)據(jù)庫開始,并且敏感數(shù)據(jù)加密,數(shù)據(jù)庫做好應(yīng)急預(yù)案,異地備份工作,RDS可以用做備用數(shù)據(jù)庫。
(4) 云上的大數(shù)據(jù)分析如何?
答:以亞馬遜為例,亞馬遜實際提供的是一個大數(shù)據(jù)分析環(huán)境的黑箱,申請亞馬遜大數(shù)據(jù)分析集群,會自動幫助搭建好Hadoop、Hive等環(huán)境,具體可以參考亞馬遜大數(shù)據(jù)服務(wù)簡介。
具體的業(yè)務(wù)方面的大數(shù)據(jù)指標(biāo)獲取還需要自己解決,如果分析、輸出結(jié)果也要依靠自己,總大來說,使用亞馬遜的大數(shù)據(jù)分析服務(wù)需要有一定的大數(shù)據(jù)分析知識,有一定的門檻。
(5) 公有云有那些報警手段?
答:這個問題同第二個問題,公有云最多只能監(jiān)控云主機(jī)的CPU、磁盤、網(wǎng)絡(luò),以亞馬遜為例,能提供的報警也只能是根據(jù)這些閥值設(shè)置報警,報警方式是在控制面板提示,也可以指定將報警發(fā)送到指定郵箱。另外,還可以設(shè)置達(dá)到報警閥值動作,比如關(guān)閉、重啟云主機(jī)。
但是業(yè)務(wù)方面的報警還需和自己的監(jiān)控平臺結(jié)合,然后定制。
(6) 公有云的API如何使用?
答:對業(yè)務(wù)自動化而言,沒有api、sdk的話,也可以按照之前的物理機(jī)來操作,有API、sdk等各類接口的話,在新資源準(zhǔn)備這一塊效率會高很多。
(7) 公有云上的業(yè)務(wù)高可用如何保證?
答:業(yè)務(wù)的高可用建議從業(yè)務(wù)層面保證,而不是云的層面,原因如下:
有的公有云提供云主機(jī)的在線遷移,在線遷移實際遷移的是內(nèi)存,必須云主機(jī)狀態(tài)健康的情況下才能遷移,出故障的情況下是不能遷移的;
有的云提供云主機(jī)的高可用服務(wù),即云主機(jī)在一臺宿主機(jī)上宕機(jī)了,很快在另外一臺宿主機(jī)行自動開機(jī),但是這樣的高可用只是系統(tǒng)層面的高可用,不能保證應(yīng)用恢復(fù);
所以應(yīng)用層面的高可用首先要從應(yīng)用的架構(gòu)開始,設(shè)計架構(gòu)的時候,就假定物理機(jī)或者云主機(jī)是不可靠的,當(dāng)一臺機(jī)器故障的時候,服務(wù)可能會降級,但是不會不可用。在申請云主機(jī)的時候,要申請冗余數(shù)量的云主機(jī),以應(yīng)對突發(fā)狀況。
(8) 公有云內(nèi)網(wǎng)流量收費嗎,多個數(shù)據(jù)中心之間內(nèi)網(wǎng)能否通訊?
答:公有云內(nèi)網(wǎng)流量不收費,有些云提供跨數(shù)據(jù)中心的內(nèi)網(wǎng)聯(lián)通,或者和企業(yè)內(nèi)網(wǎng)的聯(lián)通,需要使用收費專線。一般專線費用比較高。
也可以自己搭建基于公網(wǎng)的VPN,但是一般網(wǎng)絡(luò)質(zhì)量不能保證,尤其是在海外。所以一般建議同一業(yè)務(wù)相關(guān)的支撐系統(tǒng),全部放一個數(shù)據(jù)中心,保證業(yè)務(wù)在一個區(qū)域內(nèi)部的獨立。