自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

Keepalived的原理和Web服務(wù)高可用實(shí)踐

開發(fā) 架構(gòu)
Keepalived軟件起初是專為L(zhǎng)VS負(fù)載均衡軟件設(shè)計(jì)的,用來管理并監(jiān)控LVS集群系統(tǒng)中各個(gè)服務(wù)節(jié)點(diǎn)的狀態(tài),后來又加入了可以實(shí)現(xiàn)高可用的VRRP功能。

[[424472]]

溫故而知新,每次學(xué)習(xí)都有不一樣的收獲,今天就來爬爬keepalived的坑。

一、Keepalived介紹

摘抄自官網(wǎng)的介紹:

Keepalived is a routing software written in C.

The main goal of this project is to provide simple and robust facilities for loadbalancing and high-availability to Linux system and Linux based infrastructures.

項(xiàng)目地址:https://github.com/acassen/keepalived

Keepalived的作用是檢測(cè)服務(wù)器狀態(tài),如果一臺(tái)服務(wù)器宕機(jī)或者出現(xiàn)其他故障導(dǎo)致當(dāng)前服務(wù)器不可用,keep alived就會(huì)檢測(cè)到并將故障的服務(wù)器從系統(tǒng)中剔除,同時(shí)使用備用服務(wù)器替代該服務(wù)器的工作,當(dāng)服務(wù)器工作正常后Keepalived自動(dòng)將服務(wù)器加入到服務(wù)器群中,這些工作全部自動(dòng)完成,不需要人工干涉,需要人工做的只是修復(fù)故障的服務(wù)器。

Keepalived軟件起初是專為L(zhǎng)VS負(fù)載均衡軟件設(shè)計(jì)的,用來管理并監(jiān)控LVS集群系統(tǒng)中各個(gè)服務(wù)節(jié)點(diǎn)的狀態(tài),后來又加入了可以實(shí)現(xiàn)高可用的VRRP功能。因此,Keepalived除了能夠管理LVS軟件外,還可以作為其他服務(wù)(例如:Nginx、Haproxy、MySQL等)的高可用解決方案軟件。

Keepalived軟件主要是通過VRRP協(xié)議實(shí)現(xiàn)高可用功能的。VRRP是Virtual Router RedundancyProtocol(虛擬路由器冗余協(xié)議)的縮寫,VRRP出現(xiàn)的目的就是為了解決靜態(tài)路由單點(diǎn)故障問題的,它能夠保證當(dāng)個(gè)別節(jié)點(diǎn)宕機(jī)時(shí),整個(gè)網(wǎng)絡(luò)可以不間斷地運(yùn)行。

所以,Keepalived 一方面具有配置管理LVS的功能,同時(shí)還具有對(duì)LVS下面節(jié)點(diǎn)進(jìn)行健康檢查的功能,另一方面也可實(shí)現(xiàn)系統(tǒng)網(wǎng)絡(luò)服務(wù)的高可用功能。

二、Keepalived的應(yīng)用場(chǎng)景

管理LVS軟件

基于VRRP實(shí)現(xiàn)高可用

健康檢查,故障切換

通過官網(wǎng)的介紹我們可以看到Keepalived提供了兩個(gè)重要的功能:loadbalancing和high-availability。最初是專門為L(zhǎng)VS負(fù)載均衡軟件設(shè)計(jì),可以用來管理并監(jiān)控LVS集群系統(tǒng)中各個(gè)服務(wù)節(jié)點(diǎn)的狀態(tài),后來的版本中又加入了可以實(shí)現(xiàn)高可用的VRRP功能。

因此,Keeaplived主要有兩種應(yīng)用場(chǎng)景,一個(gè)是通過配置keepalived結(jié)合ipvs做到負(fù)載均衡(LVS+Keepalived);另一個(gè)是通過自身健康檢查、資源接管等功能做高可用(雙機(jī)熱備),實(shí)現(xiàn)故障轉(zhuǎn)移,功能近似于Heartbeat。

目前全球監(jiān)控的分布式MySQL集群,使用了Keeaplived來實(shí)現(xiàn)proxy的雙機(jī)熱備功能,所以下面只介紹在高可用場(chǎng)景下的相關(guān)知識(shí)。

三、Keepalived的工作原理

1.VRRP協(xié)議

keepalived是以VRRP協(xié)議為實(shí)現(xiàn)基礎(chǔ)的,VRRP全稱Virtual Router Redundancy Protocol,即虛擬路由冗余協(xié)議,可以認(rèn)為是實(shí)現(xiàn)路由器高可用的協(xié)議。

  • VRRP是用來實(shí)現(xiàn)路由器冗余的協(xié)議。
  • VRRP協(xié)議是為了消除在靜態(tài)缺省路由環(huán)境下路由器單點(diǎn)故障引起的網(wǎng)絡(luò)失效而設(shè)計(jì)的主備模式的協(xié)議,使得發(fā)生故障而進(jìn)行設(shè)計(jì)設(shè)備功能切換時(shí)可以不影響內(nèi)外數(shù)據(jù)通信,不需要再修改內(nèi)部網(wǎng)絡(luò)的網(wǎng)絡(luò)參數(shù)。
  • VRRP協(xié)議需要具有IP備份,優(yōu)先路由選擇,減少不必要的路由器通信等功能。
  • VRRP協(xié)議將兩臺(tái)或多臺(tái)路由器設(shè)備虛擬成一個(gè)設(shè)備,對(duì)外提供虛擬路由器IP(一個(gè)或多個(gè))。然而,在路由器組內(nèi)部,如果實(shí)際擁有這個(gè)對(duì)外IP的路由器如果工作正常的話,就是master,或者是通過算法選舉產(chǎn)生的,MASTER實(shí)現(xiàn)針對(duì)虛擬路由器IP的各種網(wǎng)絡(luò)功能,如ARP請(qǐng)求,ICMP,以及數(shù)據(jù)的轉(zhuǎn)發(fā)等,其他設(shè)備不具有該IP,狀態(tài)是BACKUP。除了接收MASTER的VRRP狀態(tài)通告信息外,不執(zhí)行對(duì)外的網(wǎng)絡(luò)功能,當(dāng)主機(jī)失效時(shí),BACKUP將接管原先MASTER的網(wǎng)絡(luò)功能。
  • VRRP協(xié)議配置時(shí),需要配置每個(gè)路由器的虛擬路由ID(VRID)和優(yōu)先權(quán)值,使用VRID將路由器進(jìn)行分組,具有相同VRID值的路由器為同一個(gè)組,VRID是一個(gè)0-255的整整數(shù);同一個(gè)組中的路由器通過使用優(yōu)先權(quán)值來選舉MASTER。優(yōu)先權(quán)大者為MASTER,優(yōu)先權(quán)也是一個(gè)0-255的正整數(shù)。

對(duì)應(yīng)到高可用的場(chǎng)景,實(shí)際上就是把路由器換成了服務(wù)器或者服務(wù)器上的應(yīng)用:

通常情況下是將兩臺(tái)linux服務(wù)器組成一個(gè)熱備組(master-backup),同一時(shí)間熱備組內(nèi)只有一臺(tái)主服務(wù)器(master)提供服務(wù),同時(shí)master會(huì)虛擬出一個(gè)共用IP地址(VIP),這個(gè)VIP只存在master上并對(duì)外提供服務(wù)。

如果keepalived檢測(cè)到master宕機(jī)或服務(wù)故障,備服務(wù)器(backup)會(huì)自動(dòng)接管VIP成為master,keepalived并將master從熱備組移除,當(dāng)master恢復(fù)后,會(huì)自動(dòng)加入到熱備組,默認(rèn)再搶占成為master,起到故障轉(zhuǎn)移功能。

2.核心組件

keepalived是模塊化設(shè)計(jì),不同模塊負(fù)責(zé)不同的功能,主要有三個(gè)模塊,分別是core、check和VRRP,其中:

  • core模塊:為keepalived的核心組件,負(fù)責(zé)主進(jìn)程的啟動(dòng)、維護(hù)以及全局配置文件的加載和解析;
  • check:負(fù)責(zé)健康檢查,包括常見的各種檢查方式,這里的配置決定了工作在哪個(gè)層;
  • VRRP模塊:是來實(shí)現(xiàn)VRRP協(xié)議的。

此外還有:

  • system call:系統(tǒng)調(diào)用
  • watch dog:監(jiān)控check和vrrp進(jìn)程的看管者
  • libipfwc:iptables(ipchains)庫,配置LVS會(huì)用到
  • libipvs*:配置LVS會(huì)用到

3.分層工作

keepalived做負(fù)載均衡時(shí)工作在TCP/IP協(xié)議的3/4/5層,做高可用時(shí)工作在OSI七層協(xié)議模型的3/4/7層,基本上是一樣的,叫法不同而已

分層 功能 相關(guān)協(xié)議
應(yīng)用層 網(wǎng)絡(luò)服務(wù)和最終用戶的一個(gè)接口 TFTP,HTTP,SNMP,DNS,FTP,SMTP,TELNET
表示層 數(shù)據(jù)的表示、安全、壓縮 無協(xié)議
會(huì)話層 會(huì)話的建立、管理、中止 無協(xié)議
傳輸層 定義傳輸數(shù)據(jù)的協(xié)議端口號(hào),以及流控和差錯(cuò)校驗(yàn) TCP,UDP
網(wǎng)絡(luò)層 進(jìn)行邏輯地址尋址,實(shí)現(xiàn)不同網(wǎng)絡(luò)之間的路徑選擇 IP,ICMP,RIP,OSPF,BGP,IGMP
數(shù)據(jù)鏈路層 建立邏輯連接、硬件地址尋址、差錯(cuò)校驗(yàn)等功能 SLIP,CSLIP,PPP,ARP,RARP,MTU
物理層 建立、連接、斷開物理連接 ISO2110,IEEE802,IEEE802.2

Layer3:工作在三層時(shí),keepalived會(huì)定期向熱備組中的服務(wù)器發(fā)送一個(gè)ICMP數(shù)據(jù)包,來判斷某臺(tái)服務(wù)器是否故障,如果沒有響應(yīng)則將這臺(tái)服務(wù)器從熱備組移除。

Layer4:工作在四層時(shí),keepalived以TCP端口的狀態(tài)判斷服務(wù)器是否故障,比如檢測(cè)MySQL的3306端口,如果無法訪問則將這臺(tái)服務(wù)器從熱備組移除。

Layer7:工作在七層時(shí),keepalived根據(jù)用戶設(shè)定的策略判斷服務(wù)器上的程序是否正常運(yùn)行,比如使用HTTP請(qǐng)求的方式,如果返回錯(cuò)誤的狀態(tài)碼則將這臺(tái)服務(wù)器從熱備組移除。

在Keepalived服務(wù)器群之間,只有作為主的服務(wù)器不斷發(fā)送VRRP廣播包,告訴備它還活著,此時(shí)備不會(huì)搶占主,只有當(dāng)主不可用,既備接受不到主的VRRP廣播包,這時(shí)候備就會(huì)啟動(dòng)相關(guān)的服務(wù)接管主的任務(wù)向外提供服務(wù),以保證服務(wù)的正常使用。

4.工作狀態(tài)

keepalived正常啟動(dòng)的時(shí)候,共啟動(dòng)3個(gè)進(jìn)程:

一個(gè)是父進(jìn)程,負(fù)責(zé)監(jiān)控其子進(jìn)程;一個(gè)是VRRP子進(jìn)程,另外一個(gè)是checkers子進(jìn)程;

兩個(gè)子進(jìn)程都被系統(tǒng)watchlog看管,Healthcheck子進(jìn)程檢查各自服務(wù)器的健康狀況。

如果healthchecks進(jìn)程檢查到master上服務(wù)不可用了,就會(huì)通知本機(jī)上的VRRP子進(jìn)程,讓他刪除通告,并且去掉虛擬IP,轉(zhuǎn)換為BACKUP狀態(tài)。

四、Keepalived使用

1.配置介紹

keepalived配置文件按層級(jí)和模塊劃分的,每層由"{ }"來界定。在主配置文件中可以通過include來涵蓋多個(gè)子配置文件。

詳細(xì)語法說明:官方文檔

配置文件包括以下幾個(gè)模塊:

  • LOBAL CONFIGURATION
  • BFD CONFIGURATION
  • VRRPD CONFIGURATION
  • LVS CONFIGURATION
  1. [root@localhost ~]# cat /etc/keepalived/keepalived.conf 
  2. ! Configuration File for keepalived 
  3. global_defs {                                     #全局定義部分 
  4.     notification_email {                          #設(shè)置報(bào)警郵件地址,可設(shè)置多個(gè) 
  5.         acassen@firewall.loc                      #接收通知的郵件地址 
  6.     } 
  7.     notification_email_from test0@163.com         #設(shè)置 發(fā)送郵件通知的地址 
  8.     smtp_server smtp.163.com                      #設(shè)置 smtp server 地址,可是ip或域名.可選端口號(hào) (默認(rèn)25) 
  9.     smtp_connect_timeout 30                       #設(shè)置 連接 smtp server的超時(shí)時(shí)間 
  10.     router_id LVS_DEVEL                           #主機(jī)標(biāo)識(shí),用于郵件通知 
  11.     vrrp_skip_check_adv_addr 
  12.     vrrp_strict                                   #嚴(yán)格執(zhí)行VRRP協(xié)議規(guī)范,此模式不支持節(jié)點(diǎn)單播 
  13.     vrrp_garp_interval 0 
  14.     vrrp_gna_interval 0 
  15.     script_user keepalived_script                 #指定運(yùn)行腳本的用戶名和組。默認(rèn)使用用戶的默認(rèn)組。如未指定,默認(rèn)為keepalived_script 用戶,如無此用戶,則使用root 
  16.     enable_script_security                        #如果路徑為非root可寫,不要配置腳本為root用戶執(zhí)行。 
  17.   
  18. vrrp_instance VI_1 {                              #vrrp 實(shí)例部分定義,VI_1自定義名稱 
  19.     state MASTER                                  #指定 keepalived 的角色,必須大寫 可選值:MASTER|BACKUP 
  20.     interface ens33                               #網(wǎng)卡設(shè)置,lvs需要綁定在網(wǎng)卡上,realserver綁定在回環(huán)口。區(qū)別:lvs對(duì)訪問為外,realserver為內(nèi)不易暴露本機(jī)信息 
  21.     virtual_router_id 51                          #虛擬路由標(biāo)識(shí),是一個(gè)數(shù)字,同一個(gè)vrrp 實(shí)例使用唯一的標(biāo)識(shí),MASTER和BACKUP 的 同一個(gè) vrrp_instance 下 這個(gè)標(biāo)識(shí)必須保持一致 
  22.     priority 100                                  #定義優(yōu)先級(jí),數(shù)字越大,優(yōu)先級(jí)越高。 
  23.     advert_int 1                                  #設(shè)定 MASTER 與 BACKUP 負(fù)載均衡之間同步檢查的時(shí)間間隔,單位為秒,兩個(gè)節(jié)點(diǎn)設(shè)置必須一樣 
  24.     authentication {                              #設(shè)置驗(yàn)證類型和密碼,兩個(gè)節(jié)點(diǎn)必須一致 
  25.         auth_type PASS 
  26.         auth_pass 1111 
  27.     } 
  28.     virtual_ipaddress {                           #設(shè)置虛擬IP地址,可以設(shè)置多個(gè)虛擬IP地址,每行一個(gè) 
  29.         192.168.119.130 
  30.     } 
  31.     track_script {                                #腳本監(jiān)控狀態(tài) 
  32.         chk_nginx_service                         #可加權(quán)重,但會(huì)覆蓋聲明的腳本權(quán)重值。chk_nginx_service weight -20 
  33.     } 
  34.         notify_master "/etc/keepalived/start_haproxy.sh start"  #當(dāng)前節(jié)點(diǎn)成為master時(shí),通知腳本執(zhí)行任務(wù) 
  35.         notify_backup "/etc/keepalived/start_haproxy.sh stop"   #當(dāng)前節(jié)點(diǎn)成為backup時(shí),通知腳本執(zhí)行任務(wù) 
  36.         notify_fault  "/etc/keepalived/start_haproxy.sh stop"   #當(dāng)當(dāng)前節(jié)點(diǎn)出現(xiàn)故障,執(zhí)行的任務(wù); 
  37.   
  38. virtual_server 192.168.119.130 80  {          #定義RealServer對(duì)應(yīng)的VIP及服務(wù)端口,IP和端口之間用空格隔開 
  39.     delay_loop 6                              #每隔6秒查詢r(jià)ealserver狀態(tài) 
  40.     lb_algo rr                                #后端調(diào)試算法(load balancing algorithm) 
  41.     lb_kind DR                                #LVS調(diào)度類型NAT/DR/TUN 
  42.     #persistence_timeout 60                   同一IP的連接60秒內(nèi)被分配到同一臺(tái)realserver 
  43.     protocol TCP                              #用TCP協(xié)議檢查realserver狀態(tài) 
  44.     real_server 192.168.119.120 80 { 
  45.         weight 1                              #權(quán)重,最大越高,lvs就越優(yōu)先訪問 
  46.         TCP_CHECK {                           #keepalived的健康檢查方式HTTP_GET | SSL_GET | TCP_CHECK | SMTP_CHECK | MISC 
  47.             connect_timeout 10                #10秒無響應(yīng)超時(shí) 
  48.             retry 3                           #重連次數(shù)3次 
  49.             delay_before_retry 3              #重連間隔時(shí)間 
  50.             connect_port 80                   #健康檢查realserver的端口 
  51.         } 
  52.     } 

2.使用keepalived對(duì)nginx進(jìn)行高可用搭建

2.1 環(huán)境準(zhǔn)備

主機(jī)ip 角色 部署軟件
192.168.73.135 master keepalived、nginx
192.168.73.136 salve keepalived、nginx
192.168.73.100 虛ip  

2.2 nginx軟件安裝和配置

在192.168.73.136操作為例,135上把index改成135即可

  1. [root@localhost ~]# yum -y install nginx 
  2. [root@localhost ~]# cd /usr/share/nginx/html/ 
  3. [root@localhost html]# mv index.html index.html.back 
  4. [root@localhost html]# echo "I am 192.168.73.136" > index.html 
  5. [root@localhost html]# systemctl start nginx 
  6. [root@localhost html]# curl 192.168.73.136 
  7. I am 192.168.73.136 

2.3 Keepalived軟件安裝

  1. [root@localhost ~]# yum install keepalived -y 
  2. [root@localhost ~]# rpm -ql keepalived 
  3. /etc/keepalived 
  4. /etc/keepalived/keepalived.conf  # 主配置文件 
  5. /etc/sysconfig/keepalived 
  6. /usr/bin/genhash 
  7. /usr/lib/systemd/system/keepalived.service 
  8. /usr/libexec/keepalived 
  9. /usr/sbin/keepalived 

2.4 監(jiān)聽存活腳本

  1. [root@localhost ~]# vim /etc/keepalived/check_port.sh 
  2. #!/bin/bash 
  3. #keepalived 監(jiān)控端口腳本 
  4. #使用方法: 
  5. #在keepalived的配置文件中 
  6. #vrrp_script check_port {#創(chuàng)建一個(gè)vrrp_script腳本,檢查配置 
  7. #    script "/etc/keepalived/check_port.sh 80" #配置監(jiān)聽的端口 
  8. #    interval 2 #檢查腳本的頻率,單位(秒) 
  9. #} 
  10. CHK_PORT=$1 
  11. if [ -n "$CHK_PORT" ];then 
  12.         PORT_PROCESS=`ss -lnt|grep $CHK_PORT|wc -l` 
  13.         if [ $PORT_PROCESS -eq 0 ];then 
  14.                 echo "Port $CHK_PORT Is Not Used,End." 
  15.                 exit 1 
  16.         fi 
  17. else 
  18.         echo "Check Port Cant Be Empty!" 
  19. fi 
  20. [root@localhost ~]# chmod  +x /etc/keepalived/check_port.sh 

2.5 最終配置文件

(1)Master配置

  1. [root@localhost ~]# vim /etc/keepalived/keepalived.conf 
  2. ! Configuration File for keepalived 
  3. global_defs { 
  4.    router_id 192.168.73.136 
  5. vrrp_script chk_nginx { 
  6.     script "/etc/keepalived/check_port.sh 80" 
  7.     interval 2 
  8.     weight -20 
  9. vrrp_instance VI_1 { 
  10.     state MASTER 
  11.     interface ens33 
  12.     virtual_router_id 251 
  13.     priority 100 
  14.     advert_int 1 
  15.     authentication { 
  16.         auth_type PASS 
  17.         auth_pass 11111111 
  18.     } 
  19.     track_script { 
  20.          chk_nginx 
  21.     } 
  22.     virtual_ipaddress { 
  23.         192.168.73.100 
  24.     } 

(2)Slave配置

  1. ! Configuration File for keepalived 
  2. global_defs { 
  3.         router_id 192.168.73.135 
  4. vrrp_script chk_nginx { 
  5.         script "/etc/keepalived/check_port.sh 80" 
  6.         interval 2 
  7.         weight -20 
  8. vrrp_instance VI_1 { 
  9.         state BACKUP 
  10.         interface ens33 
  11.         virtual_router_id 251 
  12.         priority 90 
  13.         advert_int 1 
  14.         authentication { 
  15.                 auth_type PASS 
  16.                 auth_pass 11111111 
  17.         } 
  18.         track_script { 
  19.                 chk_nginx 
  20.         } 
  21.         virtual_ipaddress { 
  22.                 192.168.73.100 
  23.         } 

2.6 啟動(dòng)主從的Keepalived

  1. [root@localhost ~]]systemctl start keepalived && systemctl enable keepalive 

2.7 查看VIP是否啟動(dòng)

  1. [root@localhost keepalived]# ip addr 
  2. 1: lo: <LOOPBACK,UP,LOWER_UP> mtu 65536 qdisc noqueue state UNKNOWN group default qlen 1000 
  3.     link/loopback 00:00:00:00:00:00 brd 00:00:00:00:00:00 
  4.     inet 127.0.0.1/8 scope host lo 
  5.        valid_lft forever preferred_lft forever 
  6.     inet6 ::1/128 scope host 
  7.        valid_lft forever preferred_lft forever 
  8. 2: ens33: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc pfifo_fast state UP group default qlen 1000 
  9.     link/ether 00:0c:29:6f:74:0a brd ff:ff:ff:ff:ff:ff 
  10.     inet 192.168.73.136/24 brd 192.168.73.255 scope global noprefixroute ens33 
  11.        valid_lft forever preferred_lft forever 
  12.     inet 192.168.73.100/32 scope global ens33 
  13.        valid_lft forever preferred_lft forever 
  14.     inet6 fe80::af0e:a936:d997:18da/64 scope link noprefixroute 
  15.        valid_lft forever preferred_lft forever 

2.8 測(cè)試

首先在瀏覽器中訪問vip,可以看到我們?cè)L問的是BACKUP上的web地址

關(guān)掉master上的nginx,查看VIP是否漂移到備機(jī)。

  1. # 關(guān)閉主nginx 
  2. [root@localhost ~]# systemctl stop nginx 
  3. # 查看備上的IP信息,我們發(fā)現(xiàn)vip已經(jīng)偏移到備機(jī)上了 
  4. [root@localhost ~]# ip addr 
  5. 1: lo: <LOOPBACK,UP,LOWER_UP> mtu 65536 qdisc noqueue state UNKNOWN group default qlen 1000 
  6.     link/loopback 00:00:00:00:00:00 brd 00:00:00:00:00:00 
  7.     inet 127.0.0.1/8 scope host lo 
  8.        valid_lft forever preferred_lft forever 
  9.     inet6 ::1/128 scope host 
  10.        valid_lft forever preferred_lft forever 
  11. 2: ens33: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc pfifo_fast state UP group default qlen 1000 
  12.     link/ether 00:0c:29:6f:74:0a brd ff:ff:ff:ff:ff:ff 
  13.     inet 192.168.73.136/24 brd 192.168.73.255 scope global noprefixroute ens33 
  14.        valid_lft forever preferred_lft forever 
  15.     inet6 fe80::af0e:a936:d997:18da/64 scope link noprefixroute 
  16.        valid_lft forever preferred_lft forever 

在瀏覽器中訪問vip,可以看到我們?cè)L問的是master上的web地址

五、需要注意的問題

1.腦裂介紹

在高可用系統(tǒng)中,如果兩個(gè)節(jié)點(diǎn)的心跳線斷開,本來兩個(gè)節(jié)點(diǎn)為一個(gè)整體、動(dòng)作協(xié)調(diào)的一個(gè)HA系統(tǒng),現(xiàn)在由于兩個(gè)之間的心跳線斷開導(dǎo)致它們分裂成了兩個(gè)單獨(dú)的個(gè)體。由于雙方互相失去了聯(lián)系,都會(huì)以為對(duì)方出了故障。這時(shí)候這兩個(gè)單獨(dú)的個(gè)體就像"腦裂人"一樣互相爭(zhēng)搶共享資源、爭(zhēng)用應(yīng)用服務(wù),這樣就會(huì)造成嚴(yán)重問題:

共享資源被瓜分,兩邊服務(wù)都起不來;

兩邊服務(wù)都起來了,同時(shí)提供服務(wù),同時(shí)讀寫存儲(chǔ),導(dǎo)致數(shù)據(jù)不一致甚至損壞。

1.1 產(chǎn)生腦裂的原因

一般來說,腦裂的發(fā)生,有以下幾種原因:

(1)HA服務(wù)器之間心跳線故障,導(dǎo)致無法正常通信;

(2)HA服務(wù)器上開啟了防火墻,阻擋了心跳線的信息傳輸;

(3)HA服務(wù)器上心跳網(wǎng)卡配置不正確,導(dǎo)致心跳信息發(fā)送失敗;

(4)其他服務(wù)器配置不當(dāng)?shù)脑?。比如心跳方式不同,心跳廣播沖突,軟件BUG等;

(5)Keepalived配置里同一 VRRP實(shí)例中如果 virtualrouterid兩端參數(shù)配置不一致也會(huì)導(dǎo)致裂腦問題發(fā)生。

1.2 常見的解決辦法

在實(shí)際環(huán)境中,我們可以從以下幾個(gè)方面來防止腦裂的問題:

(1)同時(shí)使用串行線路或者以太網(wǎng)電纜連接,同時(shí)使用兩條心跳線路,如果一條壞了,另外一條還能正常提供服務(wù);

(2)當(dāng)檢測(cè)到腦裂時(shí)強(qiáng)行關(guān)閉一個(gè)節(jié)點(diǎn)(該功能需要特殊設(shè)備支持,如Stonith,feyce),相當(dāng)于備節(jié)點(diǎn)接受不到心跳消息,通過單獨(dú)的線路發(fā)送關(guān)機(jī)命令關(guān)閉主節(jié)點(diǎn)的電源;

(3)做好腦裂監(jiān)控報(bào)警(用zabbix等來監(jiān)控),在問題發(fā)生時(shí)能在第一時(shí)間介入仲裁,降低損失。

(4)啟動(dòng)磁盤鎖。正在服務(wù)一方鎖住共享磁盤,“裂腦”發(fā)生時(shí),讓對(duì)方完全“搶不走”共享磁盤資源。但使用鎖磁盤也會(huì)有一個(gè)不小的問題,如果占用共享盤的一方不主動(dòng)“解鎖”,另一方就永遠(yuǎn)得不到共享磁盤?,F(xiàn)實(shí)中假如服務(wù)節(jié)點(diǎn)突然死機(jī)或崩潰,就不可能執(zhí)行解鎖命令。后備節(jié)點(diǎn)也就接管不了共享資源和應(yīng)用服務(wù)。于是有人在HA中設(shè)計(jì)了“智能”鎖。即:正在服務(wù)的一方只在發(fā)現(xiàn)心跳線全部斷開(察覺不到對(duì)端)時(shí)才啟用磁盤鎖,平時(shí)就不上鎖了;

(5)加入仲裁機(jī)制。例如設(shè)置網(wǎng)關(guān)IP,當(dāng)腦裂發(fā)生時(shí),兩個(gè)節(jié)點(diǎn)都各自ping以下這個(gè)網(wǎng)關(guān)IP,不通則表明斷點(diǎn)就在本端,不僅“心跳”、還兼對(duì)外“服務(wù)”的本端網(wǎng)絡(luò)鏈路斷了,即使啟動(dòng)(或繼續(xù))應(yīng)用服務(wù)也沒有用了,那就主動(dòng)放棄競(jìng)爭(zhēng),讓能夠ping通網(wǎng)關(guān)IP的一端去起服務(wù)。更保險(xiǎn)一些,ping不通網(wǎng)關(guān)IP的一方干脆就自我重啟,以徹底釋放有可能還占用著的那些共享資源。

1.3 Keepalived監(jiān)控nginx防止腦裂

(1)執(zhí)行腳本,用來檢測(cè)

  1. [root@zdd211-11 ~]# vim /etc/keepalived/check_keepalived.sh 
  2. #!/bin/bash 
  3. NGINX_SBIN="which nginx" 
  4. NGINX_PORT=80 
  5. function check_nginx(){ 
  6.      NGINX_STATUS="nmap localhost -p ${NGINX_PORT} | grep "80/tcp open" | awk '{print $2}'" 
  7.      NGINX_PROCESS="ps -ef | grep nginx|grep -v grep|wc -l" 
  8. check_nginx 
  9. if [ "$NGINX_STATUS" != "open"  -o  $NGINX_PROCESS -lt 2 ] 
  10. then 
  11.     ${NGINX_SBIN} -s stop 
  12.     ${NGINX_SBIN} 
  13.     sleep 3 
  14.     check_nginx 
  15.     if [ "$NGINX_STATUS" != "open"  -o  $NGINX_PROCESS -lt 2 ];then 
  16.         systemctl stop keepalived 
  17.     fi 
  18.  fi 
  19.  [root@localhost ~]# chmod  +x /etc/keepalived/check_port.sh 

(2)安裝nmap

因?yàn)樯厦婺_本有用到這個(gè)工具,因此兩個(gè)主機(jī)都需要安裝

  1. [root@localhost ~]# yum install nmap -y 

(3) 修改master配置

  1. [root@localhost ~]# vim /etc/keepalived/keepalived.conf 
  2. ! Configuration File for keepalived 
  3. global_defs { 
  4.    router_id 192.168.73.136 
  5. vrrp_script chk_nginx { 
  6.     script "/etc/keepalived/check_port.sh 80" 
  7.     interval 2 
  8.     weight -20 
  9. vrrp_script chk_nginx { 
  10.     script "/etc/keepalived/check_keepalive.sh" # 腳本路徑 
  11.     interval 2                                  # 執(zhí)行時(shí)間間隔 
  12.     weight -5                                   # 計(jì)算權(quán)重值,腳本結(jié)果導(dǎo)致的優(yōu)先級(jí)變更,檢測(cè)失?。_本返回非0)則優(yōu)先級(jí) -5 
  13.     fall 3                                      # 檢測(cè)連續(xù)3次失敗才算確定是真失敗。會(huì)用weight減少優(yōu)先級(jí)(1-255之間) 
  14.     rise 2                                      # 檢測(cè)2次成功就算成功。但不修改優(yōu)先級(jí) 
  15. vrrp_instance VI_1 { 
  16.     state MASTER 
  17.     interface ens33 
  18.     virtual_router_id 251 
  19.     priority 100 
  20.     advert_int 1 
  21.     authentication { 
  22.         auth_type PASS 
  23.         auth_pass 11111111 
  24.     } 
  25.     track_script { 
  26.          chk_nginx 
  27.     } 
  28.     virtual_ipaddress { 
  29.         192.168.73.100 
  30.     } 

(4) 修改Slave配置配置

  1. ! Configuration File for keepalived 
  2. global_defs { 
  3.         router_id 192.168.73.135 
  4. vrrp_script chk_nginx { 
  5.     script "/etc/keepalived/check_keepalive.sh" 
  6.     interval 2                     # 執(zhí)行時(shí)間間隔 
  7.     weight -5                      # 計(jì)算權(quán)重值,腳本結(jié)果導(dǎo)致的優(yōu)先級(jí)變更,檢測(cè)失敗(腳本返回非0)則優(yōu)先級(jí) -5 
  8.     fall 3                         # 檢測(cè)連續(xù)3次失敗才算確定是真失敗。會(huì)用weight減少優(yōu)先級(jí)(1-255之間) 
  9.     rise 2                         # 檢測(cè)2次成功就算成功。但不修改優(yōu)先級(jí) 
  10. vrrp_instance VI_1 { 
  11.         state BACKUP 
  12.         interface ens33 
  13.         virtual_router_id 251 
  14.         priority 90 
  15.         advert_int 1 
  16.         authentication { 
  17.                 auth_type PASS 
  18.                 auth_pass 11111111 
  19.         } 
  20.         track_script { 
  21.                 chk_nginx 
  22.         } 
  23.         virtual_ipaddress { 
  24.                 192.168.73.100 
  25.         } 

2.Keepalived設(shè)置故障恢復(fù)后不重新?lián)尰豓IP

通常生產(chǎn)環(huán)境是不允許VIP來回漂移,當(dāng)主機(jī)的業(yè)務(wù)出問題之后,vip漂移到備機(jī)上保證業(yè)務(wù)不中斷,就算故障恢復(fù)keepalived也不會(huì)把vip切到主機(jī)上;需要進(jìn)行對(duì)應(yīng)的問題問題,確認(rèn)主機(jī)環(huán)境沒有問題之后手動(dòng)重啟主機(jī)上keepalived服務(wù),讓vip切回到主機(jī)上。

為了滿足這樣的業(yè)務(wù)場(chǎng)景,可以使用nopreempt參數(shù),不搶占VIP的機(jī)制實(shí)現(xiàn)

修改master配置如下:

  1. [root@localhost ~]# vim /etc/keepalived/keepalived.conf 
  2. ! Configuration File for keepalived 
  3. global_defs { 
  4.    router_id 192.168.73.136 
  5. vrrp_script chk_nginx { 
  6.     script "/etc/keepalived/check_keepalive.sh" # 腳本路徑 
  7.     interval 2                                  # 執(zhí)行時(shí)間間隔 
  8.     weight -5                                   # 計(jì)算權(quán)重值,腳本結(jié)果導(dǎo)致的優(yōu)先級(jí)變更,檢測(cè)失?。_本返回非0)則優(yōu)先級(jí) -5 
  9.     fall 3                                      # 檢測(cè)連續(xù)3次失敗才算確定是真失敗。會(huì)用weight減少優(yōu)先級(jí)(1-255之間) 
  10.     rise 2                                      # 檢測(cè)2次成功就算成功。但不修改優(yōu)先級(jí) 
  11. vrrp_instance VI_1 { 
  12.     state MASTER 
  13.     interface ens33 
  14.     virtual_router_id 251 
  15.     priority 100 
  16.     advert_int 1 
  17.     nopreempt    ##不搶VIP 機(jī)制 
  18.     authentication { 
  19.         auth_type PASS 
  20.         auth_pass 11111111 
  21.     } 
  22.     track_script { 
  23.          chk_nginx 
  24.     } 
  25.     virtual_ipaddress { 
  26.         192.168.73.100 
  27.     } 

可以自己重啟keepalived,然后停止web,然后再啟動(dòng)web,驗(yàn)證是否能夠自動(dòng)漂移回主機(jī)

3.組播地址沖突問題

當(dāng)在同一個(gè)局域網(wǎng)內(nèi)部署了多組keepalived服務(wù)器時(shí),可能會(huì)發(fā)生高可用接管的嚴(yán)重故障問題。

因?yàn)閗eepalived高可用功能是通過VRRP協(xié)議實(shí)現(xiàn)的,VRRP協(xié)議默認(rèn)通過IP多播的形式實(shí)現(xiàn)高可用對(duì)之間的通信,如果同一個(gè)局域網(wǎng)內(nèi)存在多組Keepalived服務(wù)器對(duì),就會(huì)造成IP多播地址沖突問題,導(dǎo)致接管錯(cuò)亂.

不同組的keepalived都會(huì)使用默認(rèn)的224.0.0.18作為多播地址。此時(shí)的解決辦法是,在同組的keepalived服務(wù)器所有的配置文件里指定獨(dú)一無二的多播地址,配置如下:

  1. global_defs 
  2.   ``router_id LVS_19 
  3.   ``vrrp_mcast_group4 224.0.0.19` `#指定多播地址 
責(zé)任編輯:武曉燕 來源: 運(yùn)維開發(fā)故事
相關(guān)推薦

2022-05-31 08:04:03

Redis高可用集群

2019-07-30 10:18:06

NginxKeepalived

2019-09-26 09:04:22

NginxKeepalived服務(wù)器

2023-05-15 08:20:56

2011-09-30 13:02:10

51CTO博客一周熱門Web架構(gòu)

2019-10-11 10:52:42

Web架構(gòu)MongoDB

2010-06-21 14:37:18

2024-01-10 07:23:52

高可用策略實(shí)踐

2022-07-22 20:00:01

高可用路由

2024-11-11 16:29:54

負(fù)載均衡器系統(tǒng)

2015-10-21 12:58:58

keepalived集群Linux

2018-09-11 09:33:49

Redis高可用架構(gòu)

2010-12-08 08:57:11

keepalivedMySQL-HA

2012-02-15 00:01:34

2022-06-21 07:51:06

Redis高可用哨兵進(jìn)程

2017-05-04 12:48:18

WOT網(wǎng)易NDC

2024-12-26 08:02:36

API?Navigator嵌套路由

2023-10-13 18:57:22

2019-10-09 16:02:16

NginxKeepalivedLvs

2011-10-10 09:47:32

HAProxy負(fù)載均衡Keepalived
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)