運維經(jīng)驗分享:服務(wù)器成本優(yōu)化策略
原創(chuàng)當(dāng)前數(shù)據(jù)中心TCO成本構(gòu)成中,服務(wù)器及機(jī)柜成本是最大成本,約占總成本的54%左右,排在第二位的是供電和制冷,約占21%左右,從中可以看到,服務(wù)器成本優(yōu)化對整個運營成本控制是有關(guān)鍵作用。
當(dāng)前服務(wù)器發(fā)展趨勢是大規(guī)模(高密度、定制化)、更低功耗、更高性能,各大公司主要與OEM廠商合作,根據(jù)各家公司業(yè)務(wù)類型進(jìn)行定制,定制過程對外堅持多品牌,去差異化,對內(nèi)屏蔽品牌信息,套餐化。基于硬件的定制并結(jié)合服務(wù)器分類、分級、分層達(dá)到成本的優(yōu)化有以下幾點分享如下:
服務(wù)器分類
互聯(lián)網(wǎng)公司都有多個產(chǎn)品線,例如騰訊、百度都有近百個產(chǎn)品線,每個產(chǎn)品線又分產(chǎn)品,每個產(chǎn)品又對應(yīng)不同的硬件和網(wǎng)絡(luò),這些產(chǎn)品重要程度和規(guī)模各不相同,需要選擇對應(yīng)的類型的服務(wù)器硬件,如圖11-1所示,以免造成資源閑置和浪費,通常會將服務(wù)器分類如下。
1、接入型服務(wù)器,主要用于WEB接入服務(wù)器,I/O密集型并且CPU處理少,這一類屬于低成本服務(wù)器,要以為單電源模塊和擴(kuò)展插槽、無熱插拔、無RAID等,可以根據(jù)CPU、內(nèi)存、SSD、硬盤等再進(jìn)行2~3種分類,也可以使用高密度服務(wù)器,例如一U兩機(jī)、二U四機(jī),密度提升50%,功耗減少15%,機(jī)架租用成本減少一半。
2、均衡型服務(wù)器,主要用于應(yīng)用服務(wù),可以理解為是通用服務(wù)器,與專用服務(wù)器區(qū)分開來,用于邏輯服務(wù)或中間層服務(wù)均可,可以根據(jù)CPU、內(nèi)存、SSD、硬盤等再進(jìn)行2~3種分類。
3、存儲型服務(wù)器,主要用于線上、線下存儲服務(wù),大硬盤大存儲空間,可以根據(jù)硬盤空間和類型再進(jìn)行2~3種分類,這類服務(wù)器也是各家互聯(lián)網(wǎng)大公司存儲云的主力服務(wù)器。
表11-1 模塊分類及服務(wù)器分類
服務(wù)器分層
根據(jù)產(chǎn)品架構(gòu)分層,每層使用不同類型的服務(wù)器,每一層服務(wù)使用一類服務(wù)器,可以讓性能均衡,最大極度使用服務(wù)器資源,也有益于做容易管理,批量上架擴(kuò)容,批量下架退役,優(yōu)秀的運營規(guī)劃師可以讓每一層的應(yīng)用最合理的使用服務(wù)器資源,進(jìn)而避免資源閑置和浪費。
服務(wù)器分級
根據(jù)產(chǎn)品重要程度,收入大小,上線時間等,可以將對應(yīng)的服務(wù)器進(jìn)行分級,
1、優(yōu)秀產(chǎn)品,例如收益高的產(chǎn)品和明星新產(chǎn)品,各層模塊使用全新、高配服務(wù)器,保持低容量,并準(zhǔn)備充足預(yù)算,每季度提前擴(kuò)容。
2、穩(wěn)定產(chǎn)品,2~3年穩(wěn)定產(chǎn)品服務(wù)器保持高容量外,使用對應(yīng)年限的服務(wù)器進(jìn)行更新擴(kuò)容,甚至根據(jù)容量下線合并服務(wù)器。
3、歷史產(chǎn)品,4年以下產(chǎn)品,這類業(yè)務(wù)歷經(jīng)多年,也歷經(jīng)多個研發(fā),又交叉被多個產(chǎn)品線使用,這類服務(wù)器最終將面臨服務(wù)器老化退役,需要提前將這類業(yè)務(wù)模塊進(jìn)行合并或者平臺化、甚至是剝離下線。
服務(wù)器分類、分級、分層定制適合非云化的公司和產(chǎn)品,優(yōu)秀的運營規(guī)劃師像管家一樣,將線上服務(wù)和成本理料到一個平衡點,最佳使用資源又不浪費。
業(yè)務(wù)分類平臺化減少運營成本
運營資源(各區(qū)域+各IDC的服務(wù)器、帶寬、專線、QOS)與產(chǎn)品線的現(xiàn)有架構(gòu)和實際增量需求(包括未來架構(gòu)變化,擴(kuò)展、優(yōu)化),都與容量管理、成本管理相關(guān),最終驅(qū)動預(yù)算和預(yù)算模型實現(xiàn),最終又通過運營成本體現(xiàn)。
大公司有多個事業(yè)部多個產(chǎn)品,而每一個產(chǎn)品都需要多種運營資源,都需要容量管理、成本和預(yù)算管理,讓每個產(chǎn)品每個團(tuán)隊都具有好的規(guī)劃能力是不現(xiàn)實的,而將產(chǎn)品中的模塊分類抽取合并成平臺,就可以統(tǒng)一規(guī)劃和管理,將運營資源進(jìn)行有效控制,服務(wù)分類平臺化分享如下:
按通用應(yīng)用分類平臺化
談到淘寶,大家應(yīng)該對淘寶的CDN平臺有很深刻的印象,2012年雙十一最高流量達(dá)到2000G,是當(dāng)下互聯(lián)網(wǎng)公司最大規(guī)模的靜態(tài)應(yīng)用平臺,分析淘寶網(wǎng)站不難發(fā)現(xiàn),淘寶80%~90%的流量是由靜態(tài)圖片貢獻(xiàn)的,這個案例可以關(guān)聯(lián)所有的電商類網(wǎng)站、社區(qū)類網(wǎng)站、門戶類網(wǎng)站等,通常平臺主要有以下三個方向。
1、靜態(tài)類平臺,大圖、小圖、文本、JS、下載、視頻等
2、動態(tài)類平臺,邏輯、列隊、消息、推薦、賬號、關(guān)系、PHP、Java等
3、數(shù)據(jù)類平臺,日志、計算、存儲,數(shù)據(jù)庫等
將對平臺化應(yīng)用做到極致
淘寶的CDN是一個例子,規(guī)模、架構(gòu)、硬件、內(nèi)容、速度、成本追求極致,這一個典型的應(yīng)用平臺成功案例,這種應(yīng)用平臺可以做到部門級、公司級平臺,甚至做到業(yè)界最好的平臺。
平臺不是一蹴而就的,從小到大,由粗放到精細(xì),而且不斷吸收歷史及新產(chǎn)品中的同類應(yīng)用,不斷壯大。傳統(tǒng)運維新上線的業(yè)務(wù)如同需要準(zhǔn)備很多原料,再對原料進(jìn)行加工,而平臺化之后,只需要拿組件進(jìn)行組裝即可,而且這些組件不用自己維護(hù)。
混布最大限度提高資源利用率
隨著應(yīng)用平臺化、集約化,應(yīng)用平臺已經(jīng)慢慢取代傳統(tǒng)運維的對象,也就是產(chǎn)品線,而應(yīng)用平臺又由應(yīng)用集群構(gòu)成,所以集群已經(jīng)成為了當(dāng)下的運維基本單位,而隨著各項業(yè)務(wù)的發(fā)展,各種集群規(guī)模以每年以數(shù)倍的速度高速膨脹,大的應(yīng)用平臺服務(wù)器已經(jīng)達(dá)到了數(shù)萬臺服務(wù)器規(guī)模。
而這些平臺的功能和角色各不相同,總體又分CPU密集型、I/O密集型、存儲密集型三大類,如果平均下來,服務(wù)器整體資源利用率卻不高,資源利用不均衡,平臺和集群數(shù)量越大,浪費越多,因歷史擴(kuò)容和服務(wù)器硬件不一致等原因,會加重這種資源的閑置和浪費,這一類有規(guī)模有規(guī)律的資源閑置可以通過服務(wù)的混布來提高資源的使用率。
服務(wù)混布的前提
1、平臺類業(yè)務(wù),平臺類業(yè)務(wù)具有規(guī)模屬性,同時也具備了多區(qū)域和多IDC分布、數(shù)據(jù)分發(fā)、備份等必要的積累,可快速整合進(jìn)行混布上線。
2、非突發(fā)、不同類型業(yè)務(wù),突發(fā)類業(yè)務(wù)因熱點事件可以將負(fù)載提高到平時的數(shù)倍,所以不適合做混布,相同類型業(yè)務(wù)因存在資源競爭,也不適合混布,同類業(yè)務(wù)資源使用率低可根據(jù)資源使用趨勢決定是否混布。
3、硬件配置、網(wǎng)絡(luò)分布接近,在多個產(chǎn)品的生命周期的各環(huán)節(jié),服務(wù)器和服務(wù)器所在的IDC是分批次采購和上線,因為產(chǎn)品不是短時間成規(guī)模的,而硬件幾乎每年都發(fā)生巨大變化,硬件接近可以讓各區(qū)域的模塊性能平衡,如果硬件存在大的差異,會出現(xiàn)"頭重腳輕"的性能不均現(xiàn)象,為了混布可以進(jìn)行硬件升級或置換。
服務(wù)混布的問題
1、集群交叉影響,混布的集群因用戶規(guī)模不同、用戶解析策略不同、資源使用率增漲趨勢不同等,會存在必然的交叉影響,這種影響會發(fā)生在超載的狀態(tài)下,所以容量管理做好的前題下可以有效規(guī)避。
2、硬件交叉影響,硬件故障具有必然性和不確定性,這里的硬件是指所有線上生產(chǎn)環(huán)境的硬件,網(wǎng)絡(luò)硬件、服務(wù)器及機(jī)架硬件等,硬件故障可以導(dǎo)致混布的集群直接不可用,所以混布要依賴平臺健康監(jiān)測和自動恢復(fù)能力。
【作者簡介】
本文作者唐文,著有《海量運維、運營規(guī)劃之道》一書,該書已在京東、當(dāng)當(dāng)、亞馬遜上架。詳情請關(guān)注:http://www.itkoala.com/?p=2777。