自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

Facebook運維內(nèi)幕曝光:一人管理2萬臺服務(wù)器

運維 系統(tǒng)運維
目前,F(xiàn)acebook 已經(jīng)憑借它在網(wǎng)絡(luò)基礎(chǔ)建設(shè)上的可擴展能力成為了行業(yè)的領(lǐng)軍者。近日,F(xiàn)acebook 數(shù)據(jù)中心運維主管 Delfina Eberly曝光了Facebook背后的運維故事,服務(wù)器數(shù)量驚人,一人管理2萬臺,運維工作不輕松。

目前,F(xiàn)acebook 已經(jīng)憑借它在網(wǎng)絡(luò)基礎(chǔ)建設(shè)上的可擴展能力成為了行業(yè)的領(lǐng)軍者。Facebook 數(shù)據(jù)中心運維主管 Delfina Eberly(下圖人物) 在“7x24 Exchange 2013 秋季會議”上的演講中為我們透露了 Facebook 部分內(nèi)部運維數(shù)據(jù),下面我們來具體了解下。

[[90275]]

Facebook 數(shù)據(jù)中心運維主管 Delfina Eberly

服務(wù)器數(shù)量驚人,一人管理 2 萬臺

Facebook 服務(wù)器數(shù)量驚人,其硬件方面的工作重點主要放在“可服務(wù)性”上,內(nèi)容也涉及服務(wù)器的初期設(shè)計,一系列工作的目標就是為了保證數(shù)據(jù)機房的設(shè)備維修最簡單、最省時。她介紹說,每個 Facebook 數(shù)據(jù)中心的運維工作人員管理了至少 20,000 臺服務(wù)器,其中部分員工會管理數(shù)量高達 26,000 多個的系統(tǒng)。

近期 Facebook 的服務(wù)器與管理人數(shù)比又創(chuàng)下了新高,目前已經(jīng)超過 10000:1,可以查看文章高擴展性對此進行更加詳細的了解。

大數(shù)據(jù)洶涌,運維工作不輕松

在 Facebook 數(shù)據(jù)中心做運維工作并不輕松,對工作人員的能力要求很高。他們每天面對的是海量數(shù)據(jù)。

據(jù)統(tǒng)計,F(xiàn)acebook 目前擁有 11.5 億用戶,日常登錄用戶約 7.2 億。每天 Facebook 用戶分享的內(nèi)容達到 47.5 億條,“贊”按鈕點擊次數(shù)近 45 億次。Facebook 目前存儲了 2400 億張照片,每月照片存儲容量約增加 7 PB(注,單位換算:1PB=1024TB)。

動故障診斷系統(tǒng):原為留住人才

為了管理運維工作,F(xiàn)acebook 已經(jīng)開發(fā)了相應(yīng)軟件來自動化處理日常運維任務(wù),如 CYBORG 可自動檢測服務(wù)器問題并進行修復(fù)。如果 CYBORG 無法自動修復(fù)檢查出的問題,系統(tǒng)將自動給訂單系統(tǒng)發(fā)送警告,并分派給數(shù)據(jù)中心工作人員,以對相應(yīng)問題進行詳細追蹤與分析。

Eberly 提到,自動化工作的目標是盡量避免將技術(shù)人員派往現(xiàn)場解決問題,除非必須對服務(wù)器進行現(xiàn)場處理。強調(diào)自動化不是因為 Facebook 對打造無人數(shù)據(jù)中心感興趣,原因在于 Facebook 重視自己的員工。

Eberly 解釋說:我們要留住人才,因為大家更喜歡高水平的任務(wù),公司希望讓他們留下來與我們一起進步成長,這對 Facebook 來說至關(guān)重要。

“可服務(wù)性”主導(dǎo)服務(wù)器設(shè)計:節(jié)時 54%

在 Facebook,運維團隊的時間與工作量是根據(jù) Facebook 硬件設(shè)計來安排的。比方說,全部服務(wù)器從頭開始就堅持“可服務(wù)性”這一原則來進行設(shè)計,那么數(shù)據(jù)中心的工作人員就沒有必要老鉆機房了;服務(wù)器被設(shè)計成無需工具就可以對磁盤和組件進行替換。這樣做的結(jié)果就是:Facebook 用來修理服務(wù)器的時間減少了 54%。

Eberly 介紹說,F(xiàn)acebook 運維團隊會仔細跟蹤設(shè)備故障率,這一數(shù)據(jù)會為公司的采購提供參考。公司的財產(chǎn)管理和訂單系統(tǒng)用序列號來跟蹤硬盤和其他組件,這方便完整了解每個硬件的生命周期。

Eberly 還提到,雖然這些系統(tǒng)很復(fù)雜,但并不需要太多開發(fā)者。Facebook 的運維團隊僅有 3 名軟件工程師,但他們對數(shù)據(jù)中心的工作來講至關(guān)重要。

最后

從 Eberly 的介紹中,我們可以看到 Facebook 在可擴展性網(wǎng)絡(luò)建設(shè)上的實力。同時,這也為行業(yè)提供了一些可參考的經(jīng)驗,如:開發(fā)自動故障系統(tǒng),根據(jù)“可服務(wù)性”設(shè)計基礎(chǔ)架構(gòu)。同時,運維也是一個系統(tǒng)工程,需要得到其他部門的配合支持才行。

Via Datacenterknowledge

責任編輯:黃丹 來源: iteye.com
相關(guān)推薦

2018-05-11 09:40:10

服務(wù)器運維運營商

2017-12-06 09:17:50

運維服務(wù)器自動化

2020-02-19 11:07:40

運維架構(gòu)技術(shù)

2016-09-21 10:25:20

私有云360私有云平臺Syndic

2016-07-12 10:40:35

服務(wù)器

2019-10-22 09:35:46

服務(wù)器微博宕機

2025-03-10 09:00:00

Ansible腳本服務(wù)器

2016-08-16 15:21:19

服務(wù)器

2017-09-15 14:10:01

系統(tǒng)運維服務(wù)器

2016-11-11 14:58:48

IBM 服務(wù)器

2016-03-30 11:53:51

Cobbler運維運維自動化

2024-02-20 14:18:13

2020-10-05 21:41:58

漏洞網(wǎng)絡(luò)安全網(wǎng)絡(luò)攻擊

2023-09-05 09:32:07

服務(wù)器Redis

2009-09-22 16:49:01

第一臺服務(wù)器

2018-12-06 09:07:59

Ansible服務(wù)器運維

2018-05-16 14:28:28

運維工具服務(wù)器

2018-05-15 10:34:55

2013-07-22 10:37:51

微軟服務(wù)器數(shù)據(jù)中心

2018-01-10 09:50:22

服務(wù)器監(jiān)控體系
點贊
收藏

51CTO技術(shù)棧公眾號