自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

運維工作經(jīng)驗總結(jié):逃離系統(tǒng)故障的十個心得

運維 系統(tǒng)運維
系統(tǒng)故障,對于 DBA或是運維人員來說,都是心中永遠的痛。每次創(chuàng)傷、都是一次成熟、這便是運維人員的真實寫照。本文是作者對自己運維工作的經(jīng)驗總結(jié),分享了逃離系統(tǒng)故障的十個心得,希望對大家有幫助。

  系統(tǒng)故障,對于 DBA或是運維人員來說,都是心中永遠的痛。而避免故障的原則卻是殊途同歸,現(xiàn)列如下,與君共勉。

  一、變更要能回滾、先在同樣的環(huán)境測試過

  佛說:每次創(chuàng)傷、都是一次成熟、這便是運維人員的真實寫照。從某種意義上講、運維是一門經(jīng)驗的學科、是一門試錯的學科。沒有做過的東西、總是會給你不期而遇的痛擊,請保護現(xiàn)場,讓變更有回頭的機會。

  二、對破壞性的操作謹慎小心

  什么是破壞性的操作?

  比如:對 Oracle 而言:truncate table_name、delete table_name、drop table_name,這些語句執(zhí)行起來輕松簡單也愜意極了、但記住!即便數(shù)據(jù)可被回滾、代價也是非常大!

  對 Linux 而言:rm -r 所有當前及其子目錄的所有數(shù)據(jù)都將被刪除。經(jīng)歷過這種故障的人、大多會給 rm 上個別名

  alias rm='rm -i'

  同理、cp 和 mv 也可以有同樣的選項:

  alias cp='cp -i'
  alias mv='mv -i'

  三、設(shè)置好命令提示

  在操作之前、先理清你所在的是主庫、備庫?當前目錄?哪個 schema?session?時間?

  比如:

  對 Oracle 來講:

  [plain] view plaincopy
  idle> set sqlprompt 'RAC-node1-primary@10g>>'
  RAC-node1-primary@10g>>

  當然、你也可以在 glogin.sql 里面設(shè)置。

  • 對于 Linux 而言、bash 環(huán)境的提醒可設(shè)置 PS1 來知道當前目錄、登陸用戶名和主機信息等;
  • 對 PS1 更多理解、請見:man PS1

四、備份并驗證備份的有效性

  人非圣賢、豈能無過?是機器總有計劃內(nèi)或計劃外崩潰的一天。怎么辦?備份?。?!備份的學問很大、按照不同的維度可以分:冷備和熱備;實時和非實時;物理和邏輯。OLTP 7*24 在線業(yè)務(wù)、DB 就需要有實時熱備。這樣就可以了嗎?

  如果開發(fā)人員的一個不帶任何條件的 delete 誤刪所有數(shù)據(jù),此時你除了實時、還需要有非實時的備份、把 DB 從邏輯錯誤中恢復出來。

  備份有了、可以高忱無憂了嗎?不行!尚須驗證備份的有效性。一個總有那么幾次、備份無法保證 100% 恢復,簡單的驗證就是找個空庫恢復出來。

五、對生產(chǎn)環(huán)境永保敬畏之心

  會計人員在從業(yè)之前、都有個職業(yè)操守的訓練。同理、這也應(yīng)該是運維人員進入行業(yè)首先需要具備的素養(yǎng)。

  比如:

  • 于 Oracle 而言、你可以跑一個 RDA 巡檢 DB 的健康狀況;
  • 于 Linux 而言、是否有 password aging、隔離外網(wǎng)等。

  六、交接和休假最容易出故障、變更請謹慎

  • 接手別人的工作要一而再,再而三的確認變更方案。請教人并不見得就是能力不行的表現(xiàn);
  • 休假前***各種可以做好的事情,***能夠準備一份文檔,指明在什么情況下怎么做和聯(lián)系哪些人;
  • 在別人放假的時候接手工作,“能拖則拖”,實在需要執(zhí)行:必須不厭其煩的跟原運維者確認各個操作細節(jié)。

  七、搭建報警、及時獲取出錯信息;搭建性能監(jiān)控、預(yù)測趨勢

  運維人員賴于生存的工具就是報警和監(jiān)控。

  • 報警可以讓你及時知道系統(tǒng)出現(xiàn)了什么異常、以便及時跟進、把故障扼殺于搖籃;
  • 監(jiān)控可以讓你了解系統(tǒng)的歷史性能信息、以歷為鑒、可以知興替嘛、早做優(yōu)化。

  報警和優(yōu)化是衣寬帶水的好兄弟、相鋪相成、互相促進。

  八、自動卻換需謹慎

  比如:Oracle 存儲級的HA方案:Data Guard,主庫提交了一筆訂單,結(jié)果發(fā)生了 switchover,這筆訂單沒有同步到備庫,那么賣家損失了一個銷售單、對客戶、對公司都是損失。

  九、仔細一點,偏執(zhí)一點,檢查,檢查,再檢查

  有這么一個人:

 ?、?他在做一個變更的時候,會先提前一兩周發(fā)送郵件并電話手機通知相關(guān)人

  ② 在測試機上寫好腳本,召集大家 review 操作步驟和腳本

 ?、?測試完成以后拷貝到生產(chǎn)環(huán)境

 ?、?登錄對應(yīng)機器,“打開,關(guān)閉,打開,關(guān)閉”該腳本

 ?、?跟相關(guān)人員再次確認執(zhí)行的操作,順序,時間點,可能的影響和回滾是否都準備好了

  ⑥ 執(zhí)行前還要退出這個機器,然后再登錄進去,“打開,關(guān)閉”腳本

  ⑦ ***才在后臺運行腳本,同時在另外一個窗口登錄著,隨時ps和查看結(jié)果輸出

  期間姿勢端正,呼吸急促而均勻,眼神凝重。操作的人不覺得累,倒是一邊學習的人很累。

  十、簡單即是美

  這有點禪的意境、和 GNU/Linux 的思想不謀而合。

  我們總是面臨各種誘惑:新的系統(tǒng)架構(gòu),新的更智能的命令和工具,***的硬件平臺,功能更全的HA軟件...你可以在線下安裝,測試,怎么做都行。但是如果想要在生產(chǎn)環(huán)境下使用起來、請三思?。?/p>

  • 能夠使用系統(tǒng)內(nèi)置命令的話,就不用考慮其他要專門下載安裝的軟件了
  • 腳本本身就能完成的功能,就沒有必要專門找一個功能豐富的軟件來做
  • Linux本身自帶的字符界面比那些復雜的圖形界面要簡潔方便

  ......

  ***祝大家運維工作一帆風順,多福多壽,不出故障。

責任編輯:黃丹 來源: 博客
相關(guān)推薦

2018-05-29 19:39:26

IT經(jīng)驗技術(shù)

2015-10-26 09:12:59

SOHO設(shè)計師經(jīng)驗總結(jié)

2018-12-04 09:07:36

運維問題排查

2021-11-05 11:56:34

運維規(guī)則書籍

2014-04-02 10:56:21

2011-02-28 16:14:55

布線故障

2020-05-29 11:48:01

安全運維信息安全網(wǎng)絡(luò)安全

2020-11-12 11:00:42

運維IT架構(gòu)

2012-09-03 10:39:13

Hadoop管理員

2022-08-24 09:50:40

系統(tǒng)運維

2018-09-03 09:11:37

經(jīng)驗總結(jié)運維

2023-12-12 17:46:33

系統(tǒng)kswapd0內(nèi)核

2019-04-24 13:28:17

大數(shù)據(jù)大數(shù)據(jù)開發(fā)可視化

2019-09-05 10:23:34

運維監(jiān)控技術(shù)

2019-10-17 10:15:04

運維監(jiān)控報警

2021-11-19 10:05:43

運維規(guī)則書籍

2010-06-02 10:26:06

SVN源代碼管理

2010-06-01 13:42:37

TortoiseSVN

2018-01-15 15:22:15

Java開發(fā)經(jīng)驗面試

2010-08-06 11:12:38

FlexCairngorm框架
點贊
收藏

51CTO技術(shù)棧公眾號