互聯(lián)網(wǎng)+時代,用OpenStack打造高效運維
互聯(lián)網(wǎng)+的熱度在持續(xù)發(fā)酵,不僅與通信、金融以及商業(yè)結(jié)合創(chuàng)造出驚喜,也給其他行業(yè)帶來了深度改變。運維就是這樣,互聯(lián)網(wǎng)運維蓬勃成長,與云計算碰撞出火花。在由51CTO舉辦的WOT2015互聯(lián)網(wǎng)運維與開發(fā)者大會上,UnitedStack公司創(chuàng)始人兼CEO程輝解讀了《OpenStack與互聯(lián)網(wǎng)運維》,解釋互聯(lián)網(wǎng)+時代應該如何運維。
運維新關鍵:互聯(lián)網(wǎng)+和云計算
“互聯(lián)網(wǎng)+概念炙手可熱,這個時代運維有兩個特點需要突出。” 51CTO傳媒總裁創(chuàng)始人熊平表示。“其一是過去的運維是單獨去構建一個體系,單純的運維,現(xiàn)在運維更多的與開發(fā)向結(jié)合,DevOps趨勢滾滾而來。其二是這個時代,運維更多的不僅僅是內(nèi)部系統(tǒng)的技術和架構,更多的是在云上的服務,需要格外關注PaaS和IaaS。”
OpenStack正在替代傳統(tǒng)IT
任何計算機的問題都可以通過引入一個中間層來解決。 程輝表示,現(xiàn)在大量的IT基礎設施有關的業(yè)務基本上都運行在物理環(huán)境下,而不是運行再一個云計算中間件上,或者是云計算的系統(tǒng)上。“云平臺都是為了解決這樣一個中間層的問題。”為什么需要加入中間層?“為了實現(xiàn)把不同品牌的異構的計算、存儲和網(wǎng)絡資源全部整合起來,變成一個通用的,面向業(yè)務的一個接口,然后通過中間層來解決彈性擴展和接口運維的問題。”OpenStack則提供了一種通用的方案,向上層提供抽象接口,同時屏蔽掉下層不同硬件之間的差異。OpenStack的出現(xiàn),真正實現(xiàn)了在用戶業(yè)務和硬件之間插入中間層,使用戶不需要再關心硬件,而是只需要關注業(yè)務,計算、存儲和網(wǎng)絡都成為了可消費的資源。
為什么那么多互聯(lián)網(wǎng)公司紛紛把基礎設施平臺,尤其是以IaaS和PaaS為基礎的平臺轉(zhuǎn)向了OpenStack呢?“因為OpenStack里面可以解決他們以前的問題,而且還有更好的開發(fā)落在這個項目。考慮非常周全,同時具有非常大的成本優(yōu)勢。”程輝舉例說,“OpenStack有一個項目做統(tǒng)一認證與管理平臺,叫做Keystone。包括了從域、用戶名、項目、決策等等的很多概念。這在之后的研究當中才發(fā)現(xiàn)設計的這樣復雜是有原因的,可以覆蓋絕大多數(shù)的情況。一般很多的互聯(lián)網(wǎng)的基礎設施上需要不斷的重構之前做的,然后再重新做,OpenStack卻從最初就提供了非常好的思路,這是極大的減少的研發(fā)成本和研發(fā)風險。另一個例子是,通過OpenStack搭建測試環(huán)境,所有人都在一個環(huán)境當中做開發(fā)和測試,可以把高昂的服務器成本降低。”
OpenStack商用 從食材到大餐
“OpenStack給云計算帶來了全新的選擇,但是并不意味著OpenStack可以馬上用到用戶的系統(tǒng)當中??梢赃@樣理解,OpenStack提供了豐富的食材,但是完成大餐還需要大廚。”程輝說,比如說***個面臨著整合的問題,和現(xiàn)有的服務如何整合。故障排查也是很難的事情,因為OpenStack有20多萬個代碼,還有底層的存儲,60多萬個代碼,還有其他的內(nèi)容,總共加起來一百多萬代碼,這么龐大的系統(tǒng)出現(xiàn)問題,尤其是有幾百臺的時候,去做災后處理是最難的。此外,SLA保障,還有持續(xù)集成與交付,這都非常重要。
如果想自己建設一個廚師團隊,構建一個基于一百當萬個代碼,幾十個項目的,面對各種各樣的食材的時候,如何把它變成一個能夠?qū)ν?4小時的商用的云服務,需要做哪些事情?程輝算了這樣一筆賬。人員需要覆蓋從虛擬化,存儲網(wǎng)絡,研發(fā)到監(jiān)控、安全、產(chǎn)品經(jīng)理,至少一千萬的成本,持續(xù)投入一到兩年才能把整個系統(tǒng)整合起來。但是如果選擇已經(jīng)成熟的OpenStack提供商就可以很好的規(guī)避這些問題。
“目前我們的UnitedStack云平臺,經(jīng)過了大概兩三年時間的摸索和嘗試、打磨和優(yōu)化,最終我們發(fā)現(xiàn)OpenStack設計***調(diào)的是Open的屬性,還有Stack是從上到下每一層都有非常多的選擇。我們在每一部分都選擇了一種技術,這樣能夠達到的性能或者是達到的體驗,能夠超越任何的商業(yè)產(chǎn)品所能達到的體驗。”程輝說,“當然,硬件設備是沒有任何鎖定的,任何廠商的都可以。”
優(yōu)化設計 激發(fā)系統(tǒng)性能
“正是通過對開源系統(tǒng)的多次架構和源碼分析、整合和二次開發(fā)、運維準備以及持續(xù)的迭代和運營,使得我們能夠把開源項目在互聯(lián)網(wǎng)的更好的落地。”程輝說,“這不只是使用的過程,還是一個優(yōu)化的過程。”
統(tǒng)一存儲就是一個典型的優(yōu)化過程。之前OpenStack各個項目都要用到存儲,而且每一個項目都有自己存儲的去支持,性價比非常低。UnitedStack***的做法是,把OpenStack里面各大存儲底層都換成了Ceph,將Ceph統(tǒng)一作為Nova/Glance/Cinder的存儲后端,實現(xiàn)了統(tǒng)一存儲。這樣就構建了一個大的存儲資源池,這樣基于COW的卷創(chuàng)建和快照操作,實現(xiàn)虛機的秒級創(chuàng)建,全SSD的Ceph存儲,能夠達到1毫秒延遲的急速性能。
“但是,這并不是說使用Ceph就可以把所有存儲的問題都解決了。我們實際遇到的數(shù)據(jù)是兩三萬的IOPS只能做到五千,當時我們碰到這個問題的時候非常難受。我們在前面已經(jīng)做好了源碼分析和整合工作,做好了運維和準備,準備上線的時候,卻發(fā)現(xiàn)極大的性能隱患。”程輝表示,在此之后,UnitedStack通過半年的時間優(yōu)化整個Ceph的路徑,實現(xiàn)了從20毫秒降低到1毫秒的隨機I/O平均延遲。“并且這是要同步到三個機柜上的三臺服務器上,這已經(jīng)接近了商業(yè)的存儲性能。事實上,我們實現(xiàn)了采用開源的分布式存儲而達到商業(yè)存儲陣列的水平。”
目前,UnitedStack已經(jīng)成功打造了自己的兩個公有云,并且?guī)椭芏嗥髽I(yè)部署和運維了自己的開源云平臺,覆蓋互聯(lián)網(wǎng)、金融、IDC等多個行業(yè)。
互聯(lián)網(wǎng)+時代如何運維?用OpenStack打造高效的運維是大勢所趨,程輝總結(jié)道:“UnitedStack不賣硬件,不賣軟件,而是為用戶交付更稀缺、更有商業(yè)價值云計算平臺技術和運維服務。”