自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

一個(gè)小需求,自動(dòng)重啟k8s集群中日志不刷新的POD

云計(jì)算
日常工作中,所有項(xiàng)目都不是完美的,筆者就經(jīng)常遇到這種情況,pod狀態(tài)是running,但是程序卻沒(méi)有響應(yīng)。發(fā)生這種情況的原因有很多種,有可能是因?yàn)閗8s健康檢查的原因,比如使用ps檢查進(jìn)程;或者是程序內(nèi)部死循環(huán),但是不退出;再或者網(wǎng)絡(luò)閃斷,程序無(wú)法重連等等。

一個(gè)小需求,自動(dòng)重啟k8s集群中日志不刷新的POD
k8s

需求

日常工作中,所有項(xiàng)目都不是完美的,筆者就經(jīng)常遇到這種情況,pod狀態(tài)是running,但是程序卻沒(méi)有響應(yīng)。發(fā)生這種情況的原因有很多種,有可能是因?yàn)閗8s健康檢查的原因,比如使用ps檢查進(jìn)程;或者是程序內(nèi)部死循環(huán),但是不退出;再或者網(wǎng)絡(luò)閃斷,程序無(wú)法重連等等。

無(wú)論什么原因,都會(huì)有解決辦法,但是優(yōu)化需要時(shí)間,在未完全解決之前,問(wèn)題不能不解決,于是想到了一個(gè)臨時(shí)方案,因?yàn)楣P者公司項(xiàng)目日志是直接打印在stdout的,發(fā)生了程序無(wú)響應(yīng)的情況,比較簡(jiǎn)單的一個(gè)辦法是判斷日志輸出的時(shí)間?;诖?,可以簡(jiǎn)單寫一個(gè)小腳本,發(fā)現(xiàn)日志長(zhǎng)時(shí)間不輸出的時(shí)候,重啟pod。

思路

使用kubectl logs命令查看最后一條日志輸出的時(shí)間戳,與服務(wù)器時(shí)間對(duì)比,差值大于閾值,則重啟相應(yīng)POD。當(dāng)然,這只是一個(gè)簡(jiǎn)單的思路,并不適用于大部分場(chǎng)景,但是適合筆者公司,因?yàn)楹诵捻?xiàng)目請(qǐng)求量很大,但凡是超過(guò)1分鐘日志不刷新,基本可以斷定100%出現(xiàn)問(wèn)題了。

此思路其實(shí)也是拋磚引玉,希望能給大家一些靈感,如果有什么更好的辦法,也可以與筆者溝通交流。

簡(jiǎn)單實(shí)現(xiàn)

shell比較簡(jiǎn)單,直接與服務(wù)器交互也比較友好,就是用shell來(lái)寫吧。

  1. #!/bin/sh 
  2. # 獲取當(dāng)前UTC時(shí)間utc_now=`date -u` 
  3. # 將時(shí)間轉(zhuǎn)換為timestamptimestamp_now=`date -d "$utc_now" +%s` 
  4. function restart_pod() { 
  5.     for i in `kubectl get pod -n iot|grep PODNAME|awk '{print $1}'`;do 
  6.         for time in `kubectl logs  --tail=1 --timestamps $i -n iot | awk '{print $1}'`;do 
  7.             timestamp_pod=`date -d "$time" +%s` 
  8.             delay=$(($timestamp_now-$timestamp_pod))            echo $i:$delay            if [ "$delay" -ge "30" ];then 
  9.                 echo "Pod $i 30S內(nèi)沒(méi)有最新日志產(chǎn)生,重啟pod!" 
  10.                 echo $i                kubectl delete pod $i -n iot --force --grace-period=0 
  11.                 curlwxFunc "Pod $i 30S內(nèi)沒(méi)有最新日志產(chǎn)生,重啟pod!(生產(chǎn)環(huán)境)" 
  12.             fi        done    done}function curlwxFunc() { 
  13.     JSON='{ 
  14.             "msgtype""text"
  15.             "text": { 
  16.                 "content""'$1'" 
  17.             } 
  18.         }' 
  19.     curl 'https://qyapi.weixin.qq.com/cgi-bin/webhook/send?key=xxx' \ 
  20.     -H 'Content-Type:application/json' \ 
  21.     -d "${JSON}" 
  22. }restart_pod 

腳本很簡(jiǎn)單,先查詢pod,然后看pod最后一條日志時(shí)間,與服務(wù)器時(shí)間對(duì)比,延遲超過(guò)30s就重啟pod,并且調(diào)用企業(yè)微信接口發(fā)一條通知。

后記

此方法也是治標(biāo)不治本,治標(biāo)還需要從源頭解決,不過(guò)需要時(shí)間,再?zèng)]有解決之前,先用這個(gè)小腳本抗一抗吧。也歡迎大家拍磚。

責(zé)任編輯:未麗燕 來(lái)源: 今日頭條
相關(guān)推薦

2021-04-22 09:46:35

K8SCluster Aut集群

2023-07-04 07:30:03

容器Pod組件

2020-02-29 15:20:18

K8SKubernetes集群

2020-02-29 15:23:15

Kubernetes集群程序

2023-03-05 21:50:46

K8s集群容量

2023-09-03 23:58:23

k8s集群容量

2022-11-02 10:21:41

K8s pod運(yùn)維

2022-06-01 09:38:36

KubernetesPod容器

2021-11-04 07:49:58

K8SStatefulSetMySQL

2022-05-09 09:52:28

K8sLens開源

2023-11-06 01:17:25

主機(jī)容器選項(xiàng)

2024-02-01 09:48:17

2021-06-07 08:32:06

K8S集群Poddebug

2022-04-22 13:32:01

K8s容器引擎架構(gòu)

2023-11-06 07:16:22

WasmK8s模塊

2024-03-18 15:44:48

K8S故障運(yùn)維

2021-07-28 10:10:57

K8SMount PVCPod

2022-12-28 10:52:34

Etcd備份

2024-05-27 00:00:10

KubernetesK8s云原生

2022-02-23 08:01:04

KubernetesK8sPod
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)