程序員:報警快把我折騰瘋了
本文轉載自微信公眾號「小姐姐味道」,作者小姐姐養(yǎng)的狗 。轉載本文請聯系小姐姐味道公眾號。
本文力求通過故事,來探討報警的頻度和功效。你有沒有碰到這樣的事情呢?
昨天早晨,接到電話,被臭罵一頓。
一個關鍵服務,發(fā)生了問題。沒有人知曉這個事情,造成了響應滯后。領導語中帶氣:“做的報警系統(tǒng)有個鳥用!什么Promethus?我看就是個狗屁!”
我很委屈。要是服務出了問題,肯定會被提前預知的。于是我翻了報警記錄,終于在一大堆報警信息中找到了“報警信息”。
我把截圖發(fā)了過去,證明自己的清白,但內心還是忐忑的。
這些報警信息,其實是給神看的,給鬼看的。就是不是給人看的。
我的思緒不由得飄向了我的自行車。
時刻警惕
為了鍛煉身體,xjjdog入手了一輛美利達山地車。廣告費買的,感謝大家的點擊,在此請收下我的膝蓋。
每天最讓人開心的事,就是看別人堵車,笛聲長鳴。前不久我還在他們的隊伍之中,如今我已經變成局外人。
和我相遇的最多的,變成了公路上形形色色的電動車,還有各式各樣的三蹦子。它們橫沖直撞,往往嚇得我花容失色。
尤其是停車的時候,不小心蹭到周遭的車子,就有一輛,像碰不得的小媳婦一樣,尖聲叫起來。
一輛車子開始叫,帶動附近其他的車子也開始叫,不一會就亂成一鍋粥。
這種場景,只有在渡劫時天雷下罰,才能達到這種效果。
我希望有一位勇士站出來,質問我一下,我到底是不是竊格爾瓦,好歹給這些亂叫的報警器一個面子。
可是有更多的人從我旁邊目不斜視的走過,無視這種響動。于是我釋然,明白了精神領袖為什么能夠屢屢得手。
瞎安什么報警器!
報警是有力的武器
為了能夠實時掌握系統(tǒng)的狀態(tài),對一些異常情況及時響應,報警系統(tǒng)基本上成為了公司內部必備的組件?,F在的信息推送渠道非常的多,除了微信、釘釘,還可以發(fā)送短信,甚至打電話。
公司剛普及報警系統(tǒng)的時候,大家都很興奮,感覺所有BUG都會被機器自動解決一樣,把希望全部寄托在上面。
想想看,系統(tǒng)的任何波動,都可以被掌控的感覺,就像是宙斯的感覺一樣。每天最興奮的事,就是在擴展顯示屏上打開監(jiān)控界面。看監(jiān)控數據波動,就像是看股票波動一樣讓人著迷,著迷于你的判斷力得到驗證的那一刻。
“把你們的監(jiān)控群也拉我一下吧!” 領導看了也比較眼饞,想要體驗一下報警信息的洗禮。
這當然沒問題,成果除了它本身是成果,被領導承認的成果才是真正的成果。毫不猶豫的,領導被拉進了一大堆報警群。
接下來是群成員的噩夢。
領導好像對這些報警特別的感興趣,也特別的關注系統(tǒng)的穩(wěn)定性。群里出現一條報警信息,很多會被領導再次截圖發(fā)到群里,然后@ 某某人:“這是什么問題,趕緊解決一下”。
“CPU的使用超過50%了,有哪位同學能夠處理一下”。
“Load報警了 @xjjdog,你趕緊處理一下”。
這種事情多了,報警處理小組不太滿意了,有同學和我說,”這領導太耳鼻了,不知道這是正常的波動么“。我私下里向領導反映,這都是比較正常的報警信息,就是一個提示。
”正常的報警信息!”,領導把正常和報警兩個詞讀的很重,“那到底是正常還是異常,你們這個系統(tǒng)做什么用的?”
我唯唯諾諾的退了下來,腦中往事翻騰。
我自然知道將報警分級,聚合,升級,甚至不同級別的報警,通知方式也不太一樣。但我還知道另外一點:報警組件,其實是內部斗爭的強大武器。
很久之前有一家公司,內部就存在一個拿著報警組件做文章的人。每到了下班時間,或者很多人已經睡下了,他就開始截圖一些微不足道的報警信息,發(fā)到研發(fā)的大群里,并@他想要@的人,督促解決。
這是殺人誅心的行為。
- 如果你不響應,群里很多人會認為你沒有責任心
- 如果你認為沒影響不回復,群里大多數人認為你沒有責任心,長此以往人將不人
- 如果你多次不響應,你的直屬領導或者更高領導會被@,但他們往往不懂技術,你就等著電話吧
- 如果你直接回復“正常波動,沒影響”,這時候如果正好碰到故障,你將會被大多數人懷疑能力有問題
- 如果你被多次@,脾氣不好,回復沖動了,你的形象將一落千丈
你權衡了一下,大多數時候,就只能老老實實的回答:”好的,我看一下“。
溫馨提示:看到這個技巧,奉勸你千萬不要拿報警組件做文章,否則xjjdog就是個罪人。
泛濫的指標
那么接下來的操作就顯而易見了。眼不見心不煩,要么把領導從群里給 T 出去,要么把報警的閾值給調高,甚至別報了。我們選擇了后者,因為那些無關緊要的信息,自己看著都眼煩。
就這樣,報警群突然間就安靜了下來,大家彼此都很滿意。
時間的車輪在旋轉,部門做完了年度任務,突然間也安靜下來,很多人都閑了下來。喝喝茶、劃劃水,一天就那么過去了。領導看在眼里急在心里。
你忙的熱火朝天的時候,領導是沒有愧疚感的;但一看到你竟然能夠閑下來,大多數領導就開始渾身難受??诳诼暵暯Y果導向,但一看你的過程舒舒服服的,就覺得你的目標定的太低。
領導對報警組件提出了質疑:“我聽說把很多報警的指標都給去掉了,這怎么可以。系統(tǒng)的隱患要及時暴露出來,提前消滅掉!”
領導給定下指標,每臺機器,每個業(yè)務系統(tǒng),必須湊夠100個監(jiān)控項,把系統(tǒng)無死角的監(jiān)控起來。
就像巨石落進水潭,盤活了沉睡的碼農,恢復了往日的忙碌。無數的報警群被創(chuàng)建開來,信息從早到晚響個不停。大伙兒目光呆滯的盯著屏幕,或者直接將幾百條未讀短信批量置成已讀。
這里要再看一下電動車報警器了。在某寶上一搜,產品有很多個,賣的也不錯。但,這有個鳥用。
報警信息泛濫,和沒有報警的效果是一樣的。你的報警器就是喊破喉嚨,也沒人多看你的愛車一眼,因為我們早已經麻木了。
真正的報警信息,被淹沒在無效報警的海洋里。系統(tǒng)的隱患,就這樣慢慢開始腐爛,無人問津。
End
這個問題肯定是要解決的。福報來了。痛定思痛,會議確定了以下內容:
加大報警組件建設的投入力度,確保報警經過了嚴格的分級
所有報警信息,無論影響大小,全部需要給出處理意見,落實到人
每天早會對報警信息進行盤點,規(guī)范處方式
每周總結報警的條數、影響、改進,持續(xù)優(yōu)化
我覺得這樣的安排沒有破綻,能夠打造一支一流的隊伍,你覺得呢?
“只要蠻力大,我們就不懼方法的對錯!” 領導的名言貌似很有道理。
作者簡介:小姐姐味道 (xjjdog),一個不允許程序員走彎路的公眾號。聚焦基礎架構和Linux。十年架構,日百億流量,與你探討高并發(fā)世界,給你不一樣的味道。我的個人微信xjjdog0,歡迎添加好友,進一步交流。