自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

Pciessd異常Readonly致Mysql反復(fù)crash如何處理?

系統(tǒng) Windows
去年10月份發(fā)生一起fio卡變?yōu)閞eadonly(和雙十一無關(guān)),發(fā)生一起fio卡變?yōu)閞eadonly,造成mysql crash的故障,整理如下。

去年10月份發(fā)生一起fio卡變?yōu)閞eadonly(和雙十一無關(guān)),發(fā)生一起fio卡變?yōu)閞eadonly,造成mysql crash的故障,整理如下。

【機器配置】

  1. System | Dell Inc.; PowerEdge R710;  
  2. Processors | physical = 2cores = 12virtual = 24hyperthreading = yes 
  3. # Memory #####################################################  
  4. Total | 94.40G  
  5. Free | 555.50M  
  6. Swappiness | vm.swappiness = 0 
  7. # Disk #####################################################  
  8. 2 ioMemory devices in this system  
  9. Fusion-io driver version: 3.1.5 build 126  
  10. Fusion-io ioDrive 640GB *2 –> mdadm –>/dev/md0  
  11. ibdata,ib_logfile,bin_log,relay_log on SAS 600GB raid1  

【問題表現(xiàn)】

    13:28,監(jiān)控發(fā)出***個db_ping告警

    mysql的alert log如下:

  1. /u01/mysql/libexec/mysqld: Can’t create/write to file ‘/u01/mysql/tmp/ibU5kXB4′ (   Errcode: 30)  
  2. 121104 13:28:10  InnoDB: Error: unable to create temporary file; errno: 30  
  3. 121104 13:28:10 [ERROR] Plugin ‘InnoDB’ init function returned error.  
  4. 121104 13:28:10 [ERROR] Plugin ‘InnoDB’ registration as a STORAGE ENGINE failed.  
  5. 121104 13:28:10 [ERROR] Aborting  
  6. InnoDB: Error: tried to read 16384 bytes at offset 0 41517056.  
  7. InnoDB: Was only able to read -1.  
  8. 121104 13:14:59  InnoDB: Operating system error number 5 in a file operation.  
  9. InnoDB: Error number 5 means ‘Input/output error’.  
  10. InnoDB: Some operating system error numbers are described at  
  11. InnoDB: http://dev.mysql.com/doc/refman/5.1/en/operating-system-error-codes.html  
  12. InnoDB: File operation call: ‘read’.  
  13. InnoDB: Cannot continue operation.  
  14. mysqld: my_new.cc:51: int __cxa_pure_virtual(): Assertion `! “Aborted: pure virtual     method called.”‘ failed.  
  15. 121104 13:14:59 – mysqld got signal 6 ; 

    由上判斷IO設(shè)備有問題,此時touch /u01/mysql/tmp/ibd:    

 touch: cannot touch `/u01/mysql/tmp/ibd’: Read-only file system

    由于是核心集群,有數(shù)據(jù)強一致需求,通過DBA手工強制主備切換,故障排除。

【問題原因】

  1. fusionIO卡出現(xiàn)readonly  
  2. /var/log/message  
  3. Nov  4 13:14:59 my160130.cm6 kernel: : fioerr Fusion-io ioDrive 640GB 0000:07:00.0: Single Bit Event Upset Error Dete4ted – interrupt: val[0]: 000ff16  
  4. fio-status -a  
  5. fct1    Failed: DEVICE IS OFFLINE. ALL READS AND WRITES WILL FAIL!  
  6. ioDrive 640GB MLC, Product Number:2TTK9, SN:436946  
  7. !! —> There are active errors or warnings on this device!  Read below for details.  
  8. ioDrive 640GB MLC, PN:00214401201  
  9. Located in slot 0 Center of Pseudo Low-Profile ioDIMM Adapter SN:436946  
  10. WARNING: READ-ONLY MODE. ALL WRITES WILL FAIL!  
  11. ACTIVE ERRORS:  
  12. The ioMemory has encountered an internal error and has been  
  13. temporarily disabled.  All reads and writes will fail.  
  14. The ioMemory is not allowing write operations. 

【問題分析】

    •SEUs are transient soft errors, and are non-destructive. A reset or rewriting of the device results in normal device behavior thereafter

    fio的控制模塊是跑在fpga上的,元數(shù)據(jù)存儲在DRAM和SSD上,斷電可恢復(fù)。2.x的驅(qū)動發(fā)生該錯誤后,會rewriting進行修復(fù)。3.x的驅(qū)動提高了安全性,發(fā)生該錯誤后,會直接reset,卡read_only等待power recycle

    •SEU class errors are caused by cosmic ray particles making it’s way into the NAND controller or by a failing NAND controller

    FPGA本身的介質(zhì)損壞或者宇宙射線,都是該錯誤的誘因。五月份message中有類似Write Path報錯,2.x驅(qū)動自動rewrite修復(fù)了,3.x的驅(qū)動安全級別更高,reset后置為readonly

    •Write Path Parity Error

    這個錯誤是SEU錯誤的前驅(qū),絕大多數(shù)可修復(fù)。同集群中,有3臺發(fā)生過并自動修復(fù)。

    •FPGA的成本相比開芯片低廉很多,編程迭代迅速,但健壯性不開芯片

【數(shù)據(jù)丟失】

    因undo,redo,binlog都在u02的SAS盤上日志完整,備庫基本沒有延遲,故沒有數(shù)據(jù)丟失;

但由于SEU可能導(dǎo)致當(dāng)時寫入的block錯誤,造成data不一致,保險起見還是重做備庫,利用binlog同步所有數(shù)據(jù)。

    •SEU class of error my result in data on the device being corrupted.The database should be verified or restored from backup

【改進措施】

    FPGA老化后,有一定幾率發(fā)生Single Event Upset錯誤,核心庫要及時替換;

    FPGA對宇宙射線敏感,需要控制機房環(huán)境,并分散機柜上架;

    改進更敏感的message,dmesg告警。

責(zé)任編輯:黃丹 來源: taobaodba.com
相關(guān)推薦

2023-03-09 12:21:38

2019-09-20 08:38:51

Python編程語言Java

2024-08-26 10:47:22

2024-08-29 08:54:35

2023-02-02 08:56:25

線程池線程submit

2023-04-06 15:19:51

2021-01-26 13:40:44

mysql數(shù)據(jù)庫

2012-12-12 09:49:41

2017-03-13 13:21:34

Git處理大倉庫

2020-12-29 09:11:33

LinuxLinux內(nèi)核

2019-08-15 10:20:19

云計算技術(shù)安全

2018-07-11 19:41:47

MySQL定義異常異常處理

2022-04-19 09:00:52

ReactTypeScript

2021-05-31 10:47:17

SpringSecuritySession

2010-05-17 10:04:45

2023-07-03 13:50:13

ReactonResize事件

2017-05-26 11:32:44

程序應(yīng)用測試

2017-10-26 08:43:18

JavaScript內(nèi)存處理

2019-12-23 10:20:12

Web圖片優(yōu)化前端

2021-03-01 07:31:53

消息支付高可用
點贊
收藏

51CTO技術(shù)棧公眾號