自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

關(guān)于故障復(fù)盤的一些總結(jié)

運維 系統(tǒng)運維
有句話說,常在河邊走,哪有不濕鞋。我身邊經(jīng)常會看到不少數(shù)據(jù)故障。每每碰到這些問題,原因都是讓人唏噓不已。

[[344209]]

有句話說,常在河邊走,哪有不濕鞋。我身邊經(jīng)常會看到不少數(shù)據(jù)故障。每每碰到這些問題,原因都是讓人唏噓不已。

而碰到故障的時候,除了通常都會說的后續(xù)改進,其實很多人對于問題的認識和理解還不夠深入,這里主要包含幾個方面:

1)害怕承擔(dān)更多責(zé)任,會選擇性的縮小問題影響范圍和通知范圍

2)如果問題不是出在自己身上,切身的感受不夠深刻,覺得是在討論別人的事情,持旁觀態(tài)度

3)對于問題的改進方向錯誤,比如說因為手工誤操作導(dǎo)致故障,如果反思是直接杜絕任何手工操作,就簡單粗暴,而且很難落地了

4)關(guān)注的還是問題本身,沒有從更高的角度來看待問題,通常故障都是和規(guī)范,標(biāo)準(zhǔn),流程相關(guān)的

所以對于故障的復(fù)盤,我覺得可以從兩個大的方向來進行思考和總結(jié),也參考了很多資料,直接搬過來了。

1)如果快速高效的處理故障,是直面故障時信息的快速上傳下達

2)如何避免后續(xù)出現(xiàn)此類故障,潛臺詞就是可以規(guī)避,如果規(guī)避不了,參考第1條。

所以順著故障的背景信息來展開,我們可以嘗試用如下的兩個表格來進行故障復(fù)盤和總結(jié)。

1)如何快速高效的處理故障

復(fù)盤項

問題點

總結(jié)改進

監(jiān)控報警

監(jiān)控是否足夠完備?

流程監(jiān)控

報警是否足夠及時?

秒級監(jiān)控、自動報障

故障響應(yīng)

故障響應(yīng)時間是否過長、能否縮短、如何縮短?

故障電話、主備負責(zé)人

故障定位

故障定位時間是否過長、能否縮短、如何縮短?

故障看板、調(diào)用網(wǎng)格

故障修復(fù)

故障修復(fù)時間是否過長、能否縮短、如何縮短?

故障緊急發(fā)布通道、大招系統(tǒng)

故障流程

故障信息同步是否及時?

故障信息流轉(zhuǎn)系統(tǒng)

用戶投訴反饋是否關(guān)注到?

投訴反饋自動聚合上報

客戶端故障公告是否按預(yù)期周知到位?

聯(lián)動客服,定期演習(xí);及時彈公告安撫用戶

是否還存在不符合流程規(guī)范的問題

引起二次故障的一些操作等

2)如何避免后續(xù)出現(xiàn)此類故障

復(fù)盤項

問題點

總結(jié)改進

防患于未然

有沒有故障征兆?

系統(tǒng)缺陷的發(fā)現(xiàn)機制:運維系統(tǒng)風(fēng)險工單

故障征兆為何沒有及時扼殺?

系統(tǒng)缺陷的跟進與升級機制

不可抗力

挖斷光纖

備用專線

機房斷電

柴發(fā)續(xù)供

上聯(lián)交換機故障

帶狀態(tài)服務(wù)打散,避免交換機聚集

外網(wǎng)故障

客戶端容災(zāi),自研解析

用戶群體性行為

容量靈活伸縮能力

驅(qū)動因素

為什么要做這個變更操作?

必要性把關(guān)

變更方案和代碼變動有沒有審核review?

變更風(fēng)險評估

影響面控制

是否先發(fā)布到測試環(huán)境和預(yù)發(fā)布環(huán)境驗證效果?

增加變更測試和預(yù)發(fā)布驗證的強制流程

測試環(huán)境和預(yù)發(fā)布環(huán)境,為什么沒有感知和攔截異常?

預(yù)發(fā)布驗證流程監(jiān)控反饋建設(shè)

這個變更操作有沒有灰度

強制灰度

這個變更操作是否支持回退?

變更前置的回退評估

回退是否足夠及時快速?

升級加速渠道

系統(tǒng)架構(gòu)

過載保護是否符合預(yù)期

review分析有效輸出比例

環(huán)境耦合情況評估

頂層高扇出,底層高扇入

是否柔性可用

有損大招機制

變更管理

變更權(quán)限管理

按負責(zé)人收斂權(quán)限

變更計劃性

嚴控緊急上線行為

變更時間窗口

非工作時間限制變更

變更質(zhì)量反饋

變更監(jiān)控建設(shè)

上面的這些問題感覺還是挺不錯的,可以作為一個復(fù)盤總結(jié)時的切入點,把大大小小的故障和問題的處理過程都總結(jié)出來。

運維無小事,如果按照復(fù)盤的思維總結(jié)很多問題,那么你的知識集會越來越豐富。而相應(yīng)的處理機制也會越來越健全。

我經(jīng)常和團隊成員說:你怎么證明你做的事情是正確的,如果能夠按照這種自證的方式解決問題,那么完全就是一種自驅(qū)模式,前途不可限量。

本文轉(zhuǎn)載自微信公眾號「楊建榮的學(xué)習(xí)筆記 」,可以通過以下二維碼關(guān)注。轉(zhuǎn)載本文請聯(lián)系楊建榮的學(xué)習(xí)筆記公眾號。

 

責(zé)任編輯:武曉燕 來源: 楊建榮的學(xué)習(xí)筆記
相關(guān)推薦

2020-05-19 14:35:42

Shell腳本循環(huán)

2020-04-10 08:50:37

Shell腳本循環(huán)

2023-02-10 09:46:04

bash腳本變量

2017-09-05 09:17:47

Java編程用法總結(jié)

2011-07-13 09:13:56

Android設(shè)計

2013-04-07 10:40:55

前端框架前端

2009-06-18 09:51:25

Java繼承

2009-06-22 15:36:00

如何學(xué)好java

2011-07-12 09:47:53

WebService

2011-11-28 15:57:26

MySQL數(shù)據(jù)庫主從配置

2015-12-08 09:05:41

Java內(nèi)部類

2009-09-27 11:09:42

API設(shè)計

2012-09-25 10:03:56

JavaJava封面Java開發(fā)

2009-07-15 16:16:22

JDBC下載

2010-08-05 13:58:33

NFS故障

2021-05-26 10:40:28

Vue3TypeScript前端

2023-04-12 00:00:40

Node.jsMonoreponpm

2009-06-04 16:28:43

EJB常見問題

2011-03-11 09:27:11

Java性能監(jiān)控

2012-04-19 10:06:55

微軟Windows 8 E
點贊
收藏

51CTO技術(shù)棧公眾號