有同也有異,對比BAT的運維文化
相信做運維的童鞋都會有這樣的經(jīng)歷,“參加過7*24小時的值班,抗過機器,敲過代碼,偶爾還得玩兩下數(shù)據(jù)。”在一些小公司中,運維童鞋不敢說是全才,但至少是哪里有坑就能夠填哪里。但是,在大公司中運維工作的分類就比較細,例如專注于高反復度工作的操作運維、專注于基礎(chǔ)運維工作的業(yè)務(wù)運維、專注于運維工作項目管理及需求規(guī)劃設(shè)計的規(guī)劃運維、專注于運維工具開發(fā)的開發(fā)運維等等。
大公司中的運維工作不僅面臨著分工的紛繁復雜,同時還要經(jīng)受著峰值流量的沖擊。那么,大公司的運維工作都是如何管理的呢?本文將以BAT為例,為你揭開大型互聯(lián)網(wǎng)公司運維思想的冰山一角。
騰訊:服務(wù)化、標準化、自動化和產(chǎn)品化
當運維團隊只有幾個人的時候,大家的工作狀態(tài)可能是“個人自掃門前雪”,哪里需要救火就去支援哪里,但是當團隊人數(shù)增加到成百上千人時,如果還是這樣的工作狀態(tài),那可能就會有很大的問題。所以騰訊的運維服務(wù)有一個“四化建設(shè)”,即服務(wù)化、標準化、自動化和產(chǎn)品化。
如何理解這“四化”呢?服務(wù)化指的是服務(wù)于業(yè)務(wù),傾向于解決產(chǎn)品的痛點;標準化是自動化的基礎(chǔ),因為業(yè)務(wù)架構(gòu)之間的差異各不相同,所以標準化的粒度和維度也需要進行調(diào)節(jié);自動化,一定要打通企業(yè)內(nèi)的各個信息孤島,只有實現(xiàn)了全流程的自動化才是真正的自動化;產(chǎn)品化,運維平臺也要重視用戶交互,要以產(chǎn)品的理念來建設(shè)。
百度:書同文,車同軌,行同倫
從網(wǎng)上公開的信息來看,百度的運維經(jīng)歷了四個階段,即腳本工具、基礎(chǔ)運維平臺、開放運維平臺和智能運維平臺,運維的核心目標也從之前的提升效果過渡到現(xiàn)在的如何解放運維自身的效率。
在SACC 2017大會上,來自百度的講師曾透露,“百度指導運維的三個思想分別是書同文、車同軌和行同倫。”如何理解呢?書同文指的是一致運維“語言”,如運維應(yīng)用、服務(wù)、機房、集群的定義;車同軌指的是一致運維“方法”,如擴縮容執(zhí)行、流量切換執(zhí)行;行同倫指的是一致運維“模式,如故障診斷策略、彈性伸縮策略、流量調(diào)度策略。

上圖是百度AIOps技術(shù)棧,據(jù)悉該平臺應(yīng)用于百度的內(nèi)部、公有云和私有云客戶。
阿里:普適的“大中臺和小前臺”
似乎每家公司運維的“打怪升級”路線都很相似,阿里也經(jīng)歷了腳本化、工具化、DevOps、自動化再到智能化的過程。在DTCC 2018大會中,阿里技術(shù)專家徐小飛曾將AIOps無人運維和無人駕駛進行了類比,二者都可以分為六個階段,并且每個對應(yīng)的階段都有相同之處。其中AIOps無人運維的六個階段分別是人肉運維、腳本/工具化運維、平臺型運維DevOps、數(shù)據(jù)化運維DataOps、高度智能運維AIOps和完全智能運維AIOps。

了解阿里的人應(yīng)該都聽過,“大中臺和小前臺”這個名詞,這是阿里上上下下所有技術(shù)相關(guān)的部門都奉行的技術(shù)戰(zhàn)略,運維也不例外。

阿里有個大數(shù)據(jù)運維解決方案叫Tesla,該解決方案貫穿了阿里整個大數(shù)據(jù)體系,負責從基礎(chǔ)設(shè)施到基礎(chǔ)平臺到存儲計算平臺的所有產(chǎn)品的運維支撐。運維垂直體系也是一個SPI的分層結(jié)構(gòu),運維IaaS層負責的是提供面向運維管理的基礎(chǔ)操作能力;運維PaaS層提供面向各運維領(lǐng)域的功能服務(wù)以及運維數(shù)據(jù)源與控制服務(wù);運維SaaS層提供面向場景化的自動智能運維應(yīng)用。