自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

mysqld實例服務hang住的檢測思路及方案

數據庫 MySQL 數據庫運維
對于mysql數據庫架構為雙主復制模式的不少技術朋友都非常困惑,如何準確判斷mysqld服務是否能正常提供服務,以及能否自動判斷并且進行主機的切換?同時,對mysqld服務的檢測機制要求消耗資源少、判斷簡單且準確、開發(fā)和維護成本低等。我們在實際的生產環(huán)境檢測過程中,也曾經犯過錯誤,為此寫一篇短小的文章,把相關經驗、思路、做法分享給大家,為更多的技術朋友起到答疑解惑。

對于mysql數據庫架構為雙主復制模式的不少技術朋友都非常困惑,如何準確判斷mysqld服務是否能正常提供服務,以及能否自動判斷并且進行主機的切換?同時,對mysqld服務的檢測機制要求消耗資源少、判斷簡單且準確、開發(fā)和維護成本低等。我們在實際的生產環(huán)境檢測過程中,也曾經犯過錯誤,為此寫一篇短小的文章,把相關經驗、思路、做法分享給大家,為更多的技術朋友起到答疑解惑。

要想做到自動切換提供數據庫服務請求的主備服務器關鍵,就是要確定雙主復制架構中的mysql數據庫實例是否能正常提供服務請求,最讓人頭疼的就是mysqld服務出現hang住的情況。那么mysqld服務hang住的時候,會有哪些表象呢?先列出本人及圈內朋友們出現過的情況:

● 不能對數據庫中的對象或數據執(zhí)行修改性操作,但能正常執(zhí)行查詢操作;

● 能對系統(tǒng)數據庫(備注:mysql、information_schema)的對象或數據進行查詢操作,不能對非系統(tǒng)數據庫的對象和數據;

● 只能對虛擬數據庫(備注: information_schema)的對象及數據進行查詢操作,不能對其他數據庫的對象和數據;

● 不能對對任何數據庫的對象或數據進行查詢操作,但是能執(zhí)行SHOW PROCESSLIST;

● 不能對對任何數據庫的對象或數據進行查詢操作,也不能執(zhí)行SHOW PROCESSLIST,但是可以執(zhí)行部分SHOW操作,例如:SHOW STATUS;

● 其他,還未發(fā)現的狀態(tài)信息;

針對上述mysqld服務hang住的情況做一個分析及匯總,可以發(fā)現其有一些共同特征,總結如下:

● mysqld服務存在,且能ping或telnet;

● 能接受客戶端發(fā)送過來的請求,但是不繼續(xù)處理,而是停留在其發(fā)生hang住的當下SQL執(zhí)行的狀態(tài);

● 若能執(zhí)行SHOW PROCESSLIST的話,能看到所有的SQL執(zhí)行狀態(tài)停留不變;

● 數據庫服務器的LOAD會突然下降,甚至LOAD下降為0,CPU、IO等都會接近沒負荷狀態(tài);

● 若mysqld服務發(fā)生hang住的時候,一般都無法對數據庫的對象或數據執(zhí)行修改性質的操作;

文章開篇描述了mysqld服務hang住的時候,mysqld接受、處理服務請求的情況,以及數據庫服務器的狀態(tài)信息,既然可以發(fā)現這些特征,那么對于常用檢測mysqld服務是否還活著或者網絡是否通的辦法:

● ping或telnet mysqld服務的端口;

● 通過執(zhí)行SHOW 命令;

● 通過執(zhí)行SELECT查詢操作;

上述三類檢測辦法是否能真正做到準確檢測呢?答案是:NO,只能準確監(jiān)測到mysqld進程是否活著、程序與數據庫服務器之間的網絡是否暢通,對于mysqld服務能否正常接收和完成處理請求,就無法做到或者部分做到,綜合上述分析信息,以及從目前我們將近三年實施效果看,對數據庫中的數據進行修改操作,再配合程序對數據修改操作的判斷邏輯是最穩(wěn)妥的方法,詳細步驟:

● 檢測頻率為:每隔10S,對當前提供服務的mysqld數據庫實例上的檢測表,做一次UPDATE操作,探測數據庫實例是否正常提供服務;

● 若上一次數據庫實例服務檢測操作,沒有正常返回更新信息,則每隔1S做一次數據庫檢測表的UPDATE操作,總共做2次探測;

● 若前兩個步驟的數據庫實例服務探測結束,當前提供服務的數據庫實例服務都沒恢復正常,則每隔5MS對數據庫檢測表再做一次UPDATE操作,總共檢測三次,若還是沒有正常返回信息,則認定此數據庫實例服務不能正常接收服務請求;

用于執(zhí)行數據庫實例服務檢測的表結構和UPDATE操作SQL為:

  1. CREATE TABLE monitor_db(  
  2.       ID SMALLINT UNSIGNED NOT NULL AUTO_INCREMNET,  
  3.       CreateDate TIMESTAMP NOT NULL DEFAULT '0000-00-00 00:00:00',  
  4.       PRIMARY KEY(ID)  
  5.       )ENGINE=InnoDB CHARACTER SET 'utf8' COLLATE 'utf8_general_ci';  
  6. INSERT INTO monitor_db VALUES(1,NOW()),(2,DATE_ADD(NOW(),INTERVAL -1 DAY)) 

 

 

● MySQL5.0及以下版本的UPDATE操作SQL

  1. UPDATE monitor_db SET CreateDate =NOW() WHERE ID=1; 

● MySQL5.1及以上版本的UPDATE操作SQL

  1. SET SESSION sql_log_bin=0;  
  2. UPDATE monitor_db SET CreateDate=NOW() WHERE ID=1; 

備注:

對于支持MIXED、ROW復制模式的版本,必須規(guī)避MySQL雙主復制過程中,可能出現主從執(zhí)行更新操作SQL語句的被修改數據不一致的問題,從而導致復制中斷,為此我們對數據庫實例服務檢測的更新操作不記錄到二進制日志文件中,也即不會復制到其各自的從服務器。

另外,建議大家把monitor_db表創(chuàng)建到test數據庫,或者類似test功能的數據庫中,存儲引擎建議一定要是:InnoDB,對于檢測頻率可以根據自己對數據安全性要求,而調整為自己能接受的。

若mysqld服務出現hang住的時候,正常關閉mysqld服務的辦法都無效,只有對mysqld服務進程進行操作系統(tǒng)級別的kill -9 操作,然后再啟動mysqld服務實例,等待其自動進行回滾操作結束,才算啟動成功,建議大家別用mysql5.0.82及前后版本,存在一些BUG,很容易導致出現hang的情況。

 

【編輯推薦】

  1. SQL與NoSQL——MySQL與NoSQL的融合
  2. MySQL中的NoSQL插件
  3. HandlerSocket是神馬
  4. 主流NoSQL數據庫評測之HandlerSocket
  5. 如何抓住蝴蝶效應中的那只蝴蝶

 

責任編輯:艾婧 來源: it168
相關推薦

2009-05-18 10:23:43

文件上傳PHPFILE函數

2010-09-26 15:38:33

JVM內存泄漏

2011-03-16 08:59:29

.NET強名稱

2009-09-02 18:44:19

C#遞歸

2014-09-25 13:14:53

2009-12-29 16:25:51

VPN服務器配置

2011-07-14 15:28:11

服務器

2013-08-20 16:16:19

2014-03-28 09:35:11

MongoDBSharding

2021-07-14 23:38:02

PostgreSQLOracle模式

2009-08-14 16:32:50

C#啟動Windows

2020-04-09 10:43:12

長事務P0故障

2010-01-07 11:12:50

華為交換機vlan

2020-04-08 11:12:37

Linux開發(fā)工具

2018-12-18 08:53:47

2012-08-16 10:43:10

GC

2018-02-05 09:30:23

高性能高并發(fā)服務

2021-12-15 09:32:41

Linux系統(tǒng)負載

2022-04-03 19:51:38

linux服務性能

2010-04-20 16:34:31

點贊
收藏

51CTO技術棧公眾號