自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

WOT架構(gòu)師系列訪談(5)—— 小米方少森

原創(chuàng)
新聞
51CTO 2014 WOT全球軟件技術(shù)峰會將在2014年7月25-26日在北京富力萬麗酒店召開。我們將針對即將參會的架構(gòu)師做一系列的訪談,以便大家進一步了解會議內(nèi)容。本次訪談的對象是小米運維部的高級運維研發(fā)工程師方少森。他主要負責小米運維自動化設(shè)施的設(shè)計和開發(fā)。本次峰會中,他將分享小米的自動化運維整體方案以及生態(tài)圈建設(shè)。

【編者按】 51CTO 2014 WOT全球軟件技術(shù)峰會將在2014年7月25-26日在北京富力萬麗酒店召開。從本周開始,我們將陸續(xù)公布會議內(nèi)容,并針對即將參會的架構(gòu)師訪談,以便大家進一步了解會議內(nèi)容。會議詳細議程見: http://wot.51cto.com/2014/。

本次訪談的對象是方少森。他是小米運維部的高級運維研發(fā)工程師,在本次的WOT軟件技術(shù)峰會中,將分享小米的自動化運維整體方案和核心的運維自動化組件,對此感興趣的朋友們多多關(guān)注吧。

【講師簡歷】

方少森,小米運維部的高級運維研發(fā)工程師,主要負責小米運維自動化設(shè)施的設(shè)計和開發(fā)。在小米成長之初,負責小米應用運維團隊的組件和運維自動化規(guī)劃。曾就職于百度,負責應用運維和運維開發(fā)工作。

方少森  (@方少森

以下是51CTO記者對話方少森的訪談實錄:


記者:您目前所在的團隊規(guī)模大概是什么樣?運維和研發(fā)人員的比例是多少?

方少森:小米公司成立的時間并不長,和很多創(chuàng)業(yè)公司一樣,最開始并沒有專有的運維團隊,都是devs同學兼職的,既要兼顧業(yè)務開發(fā),又要兼顧運行維護,也很辛苦。那時在運維相關(guān)規(guī)劃上還沒有太多的考慮,操作、上線基本都是手工面向單機進行的,且缺少有效的監(jiān)控。畢竟術(shù)業(yè)有專攻,于是公司逐漸認識到運維的重要性,并在2012年成立了運維團隊,我們的自動化建設(shè)是從2012年5月份開始的。截止目前,小米涉及業(yè)務的運維工程師已經(jīng)超過40人,支撐的研發(fā)人員達到500~1000人,并且還在不斷增長中。

記者:請您簡單談談小米當前主要的技術(shù)架構(gòu),涉及哪些方面的技術(shù)?

方少森:這個問題太大了~ 簡單來說是LNMP+大數(shù)據(jù)分析+云存儲,模塊選型上多參考開源方案,整體方案上多為自主設(shè)計。

記者:請您介紹一下小米的自動化運維之路,主要分幾個階段?每個運維階段遇到的困難與挫折、以及克服的原因是什么?

方少森:單看運維自動化,經(jīng)過過三個階段:純體力勞作 -> 系統(tǒng)獨立的自動化推進 -> 整體的自動化。

在運維團隊成立之初,從開發(fā)接過來的服務基本都是手工管理。接手服務之后,對服務進行統(tǒng)一化管理,包括環(huán)境、依賴、管理方式等,并著手開發(fā)配套的運維平臺,包括機器管理、監(jiān)控、服務部署、域名管理等,這個階段是各個系統(tǒng)都有自動化的解決方案,有API可以使用,但是整體上沒有串起來。有了各個系統(tǒng)的自動化方案后,引入資源調(diào)度,合理利用各個系統(tǒng)API逐步整合出現(xiàn)有的整體自動化方案,將機器上架后到服務部署上完全串起來,做到無需登錄機器操作、無需手動配置、無需手動調(diào)整監(jiān)控。

期間遇到的***困難在于如何將服務的現(xiàn)狀逐步牽引到希望的自動化方案上來,經(jīng)歷后的心得主要有以下幾點:

  • 兼顧現(xiàn)狀,理想設(shè)計與現(xiàn)實情況的平衡;
  • 收益與改造成本兼顧,改造不能太多太復雜;
  • 看似一個簡單問題,實際需要很多基礎(chǔ)設(shè)施、開發(fā)模式進行改變。

記者:當服務器遇到大流量(比如說小米手機搶購時間節(jié)點的流量)峰值時,您這邊有沒有專門的應對措施?是如何做性能優(yōu)化的?

方少森:如何應對每次電商活動時的超大流量問題一直是我們在不斷優(yōu)化的事情。整體上包括業(yè)務優(yōu)化和性能優(yōu)化兩部分:業(yè)務優(yōu)化包括登陸購買業(yè)務邏輯的簡化和過大流量的吸收排隊,性能優(yōu)化包括通過ssl加速卡提升nginx性能、cdn、各層級引入cache等進行優(yōu)化。

記者:公司實施自動化運維后,是否真的在本質(zhì)上促進了運維自動化水平的提高?您個人認為還有哪些需要改進的方面?

方少森:自動化對SRE的日常工作影響非常大。自動化能夠?qū)RE從頻繁的環(huán)境搭建/調(diào)整、部署上線、監(jiān)控調(diào)整等瑣事上抽身出來,并且能否規(guī)避大量的人為風險。

目前比較緊迫的還是人力問題,項目處于上升的關(guān)鍵時期,需要人手維護系統(tǒng)和滿足新的需求。

記者:作為運維開發(fā)工程師而言,您目前最關(guān)注的技術(shù)是什么?您自己是如何學習并掌握新技術(shù)的?

方少森:目前在關(guān)注輕量級虛擬化、運維數(shù)據(jù)分析(trace、安全等)、以及資源動態(tài)調(diào)度等方面。了解的方式主要是開源社區(qū)、各個會議以及公司之間的交流等。

記者:以您的經(jīng)驗來看,一名合格的運維研發(fā)工程師應該具備哪些方面的技術(shù)素養(yǎng)與知識儲備?

方少森:其實對于參與運維工作的同學,不管偏開發(fā)還是偏運維,對運維的意識和感覺是必備的技能。只有設(shè)計運維系統(tǒng)的時候充分考慮到使用的場景,才能夠確保將來系統(tǒng)帶來正向的作用。

因此在小米,SRE承擔了運維系統(tǒng)產(chǎn)品設(shè)計和大部分開發(fā)等工作,這樣可以確保運維系統(tǒng)來源于實踐、作用于實踐。包括我在內(nèi)也是兼具SRE和運維開發(fā)。(全文完)

 

阿里、百度、京東、淘寶、谷歌、Facebook、Tesla都到2014 WOT全球軟件技術(shù)峰會了,你還等什么?這些***的公司將***對外公開技術(shù),涵蓋八大主題,共有40+課程,部署實施、運維開發(fā)、大數(shù)據(jù)、Spark、敏捷開發(fā)一個都不少。除了***手的經(jīng)驗之外,還有未來兩三年的技術(shù)趨勢,你會讓自己錯過這樣的技術(shù)大會嗎?

 

責任編輯:黃丹 來源: 51CTO
相關(guān)推薦

2014-06-06 17:01:34

楊光WOT架構(gòu)師WOT2014

2014-05-13 23:24:18

WOT技術(shù)峰會袁斌WOT2014

2014-05-20 10:25:16

劉宇WOT架構(gòu)師WOT2014

2014-05-28 16:32:08

WOT架構(gòu)師WOT2014

2014-05-16 10:13:34

WOT架構(gòu)師WOT2014朱金清

2014-06-05 13:27:13

孔德亮WOT架構(gòu)師WOT2014

2014-05-29 10:05:34

wot架構(gòu)師王川WOT2014

2014-05-26 09:22:02

WOT技術(shù)峰會楊立東WOT2014

2015-10-10 17:43:01

360劉鵬大數(shù)據(jù)

2015-07-01 17:32:05

WOT2015運維安全朱磊

2015-06-26 10:36:17

WOT2015

2015-07-09 13:53:35

WOTDBA

2012-08-21 14:17:24

2012云計算架構(gòu)師峰

2015-04-27 17:27:01

WOT云智慧

2016-11-10 13:29:34

WOT2016會前采訪歐陽辰

2012-09-06 13:12:41

架構(gòu)師ArchSummit

2020-08-24 08:50:12

架構(gòu)師TL技術(shù)

2009-12-18 10:22:50

Ray Ozzie架構(gòu)師

2015-07-27 15:47:54

2018-07-03 15:46:24

Java架構(gòu)師源碼
點贊
收藏

51CTO技術(shù)棧公眾號