OpenStack建設(shè)企業(yè)私有云要解決五大問題
原創(chuàng)OpenStack已經(jīng)成為一種趨勢,但發(fā)行版OpenStack尚不***,企業(yè)要建成私有云必須預(yù)先充分了解發(fā)行版OpenStack的缺點,并尋求專業(yè)OpenStack提供商的幫助與合作,才能揚長避短,真正發(fā)揮OpenStack的優(yōu)勢,建成***化企業(yè)競爭優(yōu)勢的私有云。
OpenStack在企業(yè)里如何用好?還有哪些問題需要著重解決?OpenStack在企業(yè)里怎么才能用好?開發(fā)人員認為是使用姿勢的問題;用戶認為要穩(wěn)定可靠,不能老宕機;老板認為多招幾個牛X的開發(fā)和運維就可以搞定。
其實OpenStack在商用中存在的問題,主要在以下五個方面:穩(wěn)定性、完整性、高可用性、易用性、雙活和容災(zāi)。
先說穩(wěn)定性。一個好的產(chǎn)品,性能并不是***要素,穩(wěn)定性對企業(yè)來說才是最重要的。
a.OpenStack在擴展性和穩(wěn)定性上還遠遠不足,需要精心打磨。
從幾十臺增長到上千臺甚至上萬臺,是否還可以一如既往的穩(wěn)定工作不出問題?實踐證明,隨著規(guī)模的擴大,整體架構(gòu)需要在穩(wěn)定性方面做足功課。
比如需設(shè)計多個NOVA API和多個鏡像、負載均衡和節(jié)點高可用、數(shù)據(jù)庫的并發(fā)響應(yīng)。
另外在社區(qū)中被吐槽最多的升級問題——Nova,Swift,Cinder和Neutron分別使用各自的數(shù)據(jù)庫存儲配置信息,要升級就要修改多個數(shù)據(jù)庫schema,做不到熱升級(在H版后升級問題得到改善)。
再如,某企業(yè)在部署網(wǎng)絡(luò)服務(wù)(Neutron)時,遇到了噩夢般的經(jīng)歷,不得不重寫網(wǎng)絡(luò)組件的代碼才能達到大規(guī)模應(yīng)用的要求。
b.OpenStack缺乏完整性。
一個成熟的云平臺應(yīng)提供計算、存儲、網(wǎng)絡(luò)、安全、數(shù)據(jù)庫、大數(shù)據(jù)、中間件、DevOps、監(jiān)控運維等多種云產(chǎn)品。OpenStack只能提供計算、存儲、網(wǎng)絡(luò)三種云產(chǎn)品,如果企業(yè)客戶需要信息安全保護的產(chǎn)品,則必須自助信息安全平臺,集成第三方的產(chǎn)品。再比如大數(shù)據(jù)分析,通過Sahara可以快速部署Hadoop集群,那又怎么打通OpenStack和Hadoop之間的賬戶、安全、管理和運維監(jiān)控體系?
c.OpenStack的虛擬機級別的高可用做的還不好。
目前并沒有官方聲明OpenStack支持虛擬機級別的高可用性,這個特性在Folsom版本被提出,但是后續(xù)又被放棄了。
目前 OpenStack有一個孵化項目Evacuate, 其作用是為OpenStack提供虛擬機級別高可用支持。Evacuate目前只能是管理員手動發(fā)起,Evacuate沒有考慮VM的部署屬性,導(dǎo)致資源調(diào)度策略失效。主機名的變化會導(dǎo)致nova-compute重啟過程中誤刪所有虛擬機,這個問題的產(chǎn)生主要是因為Evacuate的清理機制。這個BUG在L版中得到修復(fù)。
d.OpenStack的易用性還不夠好。
通過FUEL,可以實現(xiàn)OpenStack快速安裝,但很多配置操作還需要命令行,離自動化部署一鍵交付還有距離。再例如OpenStack上用的比較廣泛的CEPH分布式存儲系統(tǒng),目前還沒有實現(xiàn)界面化的操作和配置。另外OpenStack還缺乏通用的基礎(chǔ)版本。
使用OpenStack不會被廠商鎖定,但OpenStack可下載的廠商定制版有20多個,客戶的選擇非常重要。
e.雙活和容災(zāi)問題。
大型企業(yè)對業(yè)務(wù)連續(xù)性要求比較高,重點核心業(yè)務(wù)有同城雙活和異地容災(zāi)的需求。同城雙活是指用戶關(guān)鍵的業(yè)務(wù)系統(tǒng)同時在同城的兩個數(shù)據(jù)中心運行,同時為用戶提供服務(wù), 當(dāng)某個數(shù)據(jù)中心的應(yīng)用系統(tǒng)出現(xiàn)問題時,有另一個數(shù)據(jù)中心的應(yīng)用來持續(xù)。
異地容災(zāi),顧名思義就是在不同的地域,構(gòu)建一套或者多套相同的應(yīng)用或者數(shù)據(jù)庫,起到災(zāi)難后立刻接管的作用。我們看到OpenStack雖然也有單站點(Smaug+Cinder)和跨站點(Smaug+Swift)的備份和恢復(fù)方案,但離企業(yè)真正的業(yè)務(wù)雙活和異地容災(zāi)還相距甚遠。
再比如Tricircle實現(xiàn)的跨數(shù)據(jù)中心級聯(lián),還是需要Cinder依靠存儲后端自己的能力去進行災(zāi)備,Tricircle本身只是作為一個轉(zhuǎn)發(fā)中繼,為用戶找到正確的需要操作的站點,其本身無法實現(xiàn)跨數(shù)據(jù)中心的容災(zāi)功能,這和VMWARE的SRM是不同的。
我們可以看到,在功能的支持方面和具體的細節(jié)上,OpenStack與VMware還是有差距的,仍然需要不斷進步才能做的更好。但OpenStack作為開源管理框架,設(shè)計初衷是好的。隨著企業(yè)里OpenStack的使用和發(fā)展,必將推動和加速它的成熟。
***就是運維自動化,在大規(guī)模云的運維場景下,需要將重復(fù)度高的工作,基于監(jiān)控數(shù)據(jù)智能決策觸發(fā),實現(xiàn)無人參與的自動操作的運維能力,這部分還有待OpenStack發(fā)掘。
結(jié)語
建設(shè)企業(yè)私有云的過程不是一蹴而就的,而且這將是持續(xù)不斷的投入過程,需要在實踐中不斷摸索前進。在下一個10年,將是云2.0時代,企業(yè)是云化的主力代表。展望未來,擁抱開源。在中國,在亞洲,在全球,OpenStack已經(jīng)成為一種趨勢,我們有理由相信在未來三年,OpenStack將成為企業(yè)去V***。