自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

[云原生] Kubernetes(k8s)健康檢查詳解與實(shí)戰(zhàn)演示(就緒性探針 和 存活性探針)

云計(jì)算 云原生
liveness probes? 在線檢查機(jī)制,檢查應(yīng)用是否可用,如死鎖,無(wú)法響應(yīng),異常時(shí)將根據(jù)restartPolicy來(lái)設(shè)置 Pod 狀態(tài)會(huì)自動(dòng)重啟容器,如果容器不提供存活探針,則默認(rèn)狀態(tài)為 Success。

一、概述

Kubernetes中的健康檢查主要使用 就緒性探針(readinessProbes?)和 存活性探針(livenessProbes) 來(lái)實(shí)現(xiàn),service即為負(fù)載均衡,k8s保證 service 后面的 pod 都可用,是k8s中自愈能力的主要手段,主要基于這兩種探測(cè)機(jī)制,可以實(shí)現(xiàn)如下需求:

  • 異常實(shí)例自動(dòng)剔除,并重啟新實(shí)例
  • 多種類(lèi)型探針檢測(cè),保證異常pod不接入流量
  • 不停機(jī)部署,更安全的滾動(dòng)升級(jí)

圖片官方文檔:https://kubernetes.io/zh-cn/docs/tasks/configure-pod-container/configure-liveness-readiness-startup-probes/Kubernetes(k8s)環(huán)境部署可以參考我這篇文章:Kubernetes(k8s)最新版最完整版環(huán)境部署+master高可用實(shí)現(xiàn)(k8sV1.24.1+dashboard+harbor)

1)k8s中的探針?lè)N類(lèi)

1、就緒檢查(readinessProbe,就緒探針)

readiness probes? 準(zhǔn)備就緒檢查,通過(guò)readiness是否準(zhǔn)備接受流量,準(zhǔn)備完畢加入到Endpoint,否則剔除。如果容器不提供就緒探針,則默認(rèn)狀態(tài)為 Success。

2、存活檢查(livenessProbe,存活探針)

liveness probes? 在線檢查機(jī)制,檢查應(yīng)用是否可用,如死鎖,無(wú)法響應(yīng),異常時(shí)將根據(jù)restartPolicy來(lái)設(shè)置 Pod 狀態(tài)會(huì)自動(dòng)重啟容器,如果容器不提供存活探針,則默認(rèn)狀態(tài)為 Success。

restartPolicy有三個(gè)可選值:

  • Always:當(dāng)容器終止退出后,總是重啟容器,默認(rèn)策略。
  • OnFailure:當(dāng)容器異常退出(退出狀態(tài)碼非0)時(shí),才重啟容器。
  • Never:當(dāng)容器終止退出,從不重啟容器。

3、啟動(dòng)檢查(startupProbe,啟動(dòng)探針,1.17 版本新增)

  • startupProbes 啟動(dòng)檢查機(jī)制,應(yīng)用一些啟動(dòng)緩慢的業(yè)務(wù),避免業(yè)務(wù)長(zhǎng)時(shí)間啟動(dòng)而被前面的探針kill掉。
  • 判斷容器內(nèi)的應(yīng)用程序是否已啟動(dòng),主要針對(duì)于不能確定具體啟動(dòng)時(shí)間的應(yīng)用。如果匹配了startupProbes 探測(cè),則在 startupProbes 狀態(tài)為 Success 之前,其他所有探針都處于無(wú)效狀態(tài),直到它成功后其他探針才起作用。
  • 如果startupProbe 失敗,kubelet 將殺死容器,容器將根據(jù) restartPolicy 來(lái)重啟。如果容器沒(méi)有配置 startupProbe,則默認(rèn)狀態(tài)為 Success。其實(shí)一般主要是設(shè)置上面兩種即可。

就緒、存活兩種探針的區(qū)別:

readinessProbe 和 livenessProbe 可以使用相同探測(cè)方式,只是對(duì) Pod 的處置方式不同。

  • livenessProbe 當(dāng)檢測(cè)失敗后,將殺死容器并根據(jù) Pod 的重啟策略來(lái)決定作出對(duì)應(yīng)的措施。
  • readinessProbe 當(dāng)檢測(cè)失敗后,將 Pod 的 IP:Port 從對(duì)應(yīng)的 EndPoint 列表中刪除。

2)k8s中的三種探測(cè)方式

每種探測(cè)機(jī)制支持三種健康檢查方法,分別是命令行exec,httpGet和tcpSocket,其中exec通用性最強(qiáng),適用與大部分場(chǎng)景,tcpSocket適用于TCP業(yè)務(wù),httpGet適用于web業(yè)務(wù)。

  • exec(自定義健康檢查):在容器中執(zhí)行指定的命令,如果執(zhí)行成功,退出碼為 0 則探測(cè)成功。
  • httpGet:通過(guò)容器的IP地址、端口號(hào)及路徑調(diào)用 HTTP Get方法,如果響應(yīng)的狀態(tài)碼大于等于200且小于400,則認(rèn)為容器 健康。
  • tcpSocket:通過(guò)容器的 IP 地址和端口號(hào)執(zhí)行 TCP 檢 查,如果能夠建立 TCP 連接,則表明容器健康。

探針探測(cè)結(jié)果有以下值:

  • Success:表示通過(guò)檢測(cè)。
  • Failure:表示未通過(guò)檢測(cè)。
  • Unknown:表示檢測(cè)沒(méi)有正常進(jìn)行。

二、readinessProbe(就緒性探針)

  • readiness probe 就緒性探針,用于判斷容器內(nèi)的程序是否存活(或者說(shuō)是否健康),只有程序(服務(wù))正常, 容器開(kāi)始對(duì)外提供網(wǎng)絡(luò)訪問(wèn)(啟動(dòng)完成并就緒);
  • 容器啟動(dòng)后按照readiness probe配置進(jìn)行探測(cè),無(wú)問(wèn)題后結(jié)果為成功即狀態(tài)為 Success;
  • pod的READY狀態(tài)為 true,從0/1變?yōu)?/1。如果失敗繼續(xù)為0/1,狀態(tài)為 false;
  • 若未配置就緒探針,則默認(rèn)狀態(tài)容器啟動(dòng)后為Success?。對(duì)于此pod、此pod關(guān)聯(lián)的Service資源、EndPoint 的關(guān)系也將基于 Pod 的 Ready 狀態(tài)進(jìn)行設(shè)置;
  • 如果 Pod 運(yùn)行過(guò)程中Ready 狀態(tài)變?yōu)?false,則系統(tǒng)自動(dòng)從 Service?資源 關(guān)聯(lián)的 EndPoint?列表中去除此pod,屆時(shí)service資源接收到GET請(qǐng)求后,kube-proxy將一定不會(huì)把流量引入此pod中,通過(guò)這種機(jī)制就能防止將流量轉(zhuǎn)發(fā)到不可用的 Pod 上。
  • 如果Pod 恢復(fù)為 Ready 狀態(tài)。將再會(huì)被加回 Endpoint? 列表。kube-proxy也將有概率通過(guò)負(fù)載機(jī)制會(huì)引入流量到此pod中。

三、livenessProbe(存活性探針)

  • liveness probe存活性探針,用于判斷容器是不是健康,如果不滿足健康條件,那么 Kubelet 將根據(jù) Pod 中設(shè)置的 restartPolicy (重啟策略)來(lái)判斷,Pod 是否要進(jìn)行重啟操作;
  • LivenessProbe按照配置去探測(cè) (進(jìn)程、或者端口、或者命令執(zhí)行后是否成功等等),來(lái)判斷容器是不是正常;
  • 如果探測(cè)不到,代表容器不健康(可以配置連續(xù)多少次失敗才記為不健康),則 kubelet 會(huì)殺掉該容器,并根據(jù)容器的重啟策略做相應(yīng)的處理;
  • 如果未配置存活探針,則默認(rèn)容器啟動(dòng)為通過(guò)(Success)狀態(tài)。即探針?lè)祷氐闹涤肋h(yuǎn)是 Success。即Success后pod狀態(tài)是RUNING。

四、實(shí)戰(zhàn)演示

常用的探針可選參數(shù):

參數(shù)名稱(chēng)

默認(rèn)值

最小值

描述

initialDelaySeconds

0秒

0秒

探測(cè)延遲時(shí)長(zhǎng),容器啟動(dòng)后多久開(kāi)始進(jìn)行第一次探測(cè)工作。

periodSeconds

10秒

1秒

探測(cè)頻度,頻率過(guò)高會(huì)對(duì)pod帶來(lái)較大的額外開(kāi)銷(xiāo),頻率過(guò)低則無(wú)法及時(shí)反映容器產(chǎn)生的錯(cuò)誤。

timeoutSeconds

1秒

1秒

探測(cè)的超時(shí)時(shí)長(zhǎng)。

failureThreshold

3

1

處于成功狀態(tài)時(shí),探測(cè)連續(xù)失敗幾次可被認(rèn)為失敗。

successThreshold

1

1

處于失敗狀態(tài)時(shí),探測(cè)連續(xù)成功幾次,被認(rèn)為成功。

1)exec方式

cat >exec-liveness.yaml<<EOF
apiVersion: v1
kind: Pod
metadata:
labels:
test: liveness
name: liveness-exec
spec:
# 為了測(cè)試方便,指定調(diào)度機(jī)器
nodeName: local-168-182-110
containers:
- name: liveness
image: registry.aliyuncs.com/google_containers/busybox
args:
- /bin/sh
- -c
- touch /tmp/healthy; sleep 30; rm -f /tmp/healthy; sleep 600
livenessProbe:
exec:
command:
- cat
- /tmp/healthy
initialDelaySeconds: 5
periodSeconds: 5
EOF

解釋?zhuān)?/p>

  • initialDelaySeconds 字段告訴 kubelet 在執(zhí)行第一次探測(cè)前應(yīng)該等待 5 秒。
  • periodSeconds 字段指定了 kubelet 應(yīng)該每 5 秒執(zhí)行一次存活探測(cè)。
  • kubelet 在容器內(nèi)執(zhí)行命令cat /tmp/healthy 來(lái)進(jìn)行探測(cè)。
  • 如果命令執(zhí)行成功并且返回值為 0,kubelet 就會(huì)認(rèn)為這個(gè)容器是健康存活的。
  • 如果這個(gè)命令返回非 0 值,kubelet 會(huì)殺死這個(gè)容器并重新啟動(dòng)它。
  • 當(dāng)容器啟動(dòng)時(shí),執(zhí)行如下的命令:
/bin/sh -c "touch /tmp/healthy; sleep 30; rm -f /tmp/healthy; sleep 600"
  • 這個(gè)容器生命的前 30 秒,/tmp/healthy 文件是存在的。 所以在這最開(kāi)始的 30 秒內(nèi),執(zhí)行命令 cat /tmp/healthy 會(huì)返回成功代碼。 30 秒之后,執(zhí)行命令 cat /tmp/healthy 就會(huì)返回失敗代碼。

創(chuàng)建 Pod:

# 最好先拉取鏡像,如果是使用docker,就換成docker就行
crictl pull registry.aliyuncs.com/google_containers/busybox

kubectl apply -f exec-liveness.yaml

【問(wèn)題】ERRO[0000] unable to determine image API version: rpc error: code = Unavailable desc = connection error: desc = “transport: Error while dialing dial unix /var/run/dockershim.sock: connect: no such file or directory”【解決】原因:未配置endpoints

crictl config runtime-endpoint unix:///run/containerd/containerd.sock
crictl config image-endpoint unix:///run/containerd/containerd.sock

查看

kubectl describe pod liveness-exec

圖片

【現(xiàn)象】30s之后檢查失敗后就重啟pod了,又正常了。

2)httpGet 方式

cat >http-liveness.yaml<<EOF
apiVersion: v1
kind: Pod
metadata:
name: liveness-httpget
namespace: default
spec:
# 為了測(cè)試方便,指定調(diào)度機(jī)器
nodeName: local-168-182-110
containers:
- name: liveness-httpget-container
image: nginx
imagePullPolicy: IfNotPresent
ports:
- name: nginx
containerPort: 80
livenessProbe:
httpGet:
port: nginx
path: /index.html
initialDelaySeconds: 1
periodSeconds: 3
timeoutSeconds: 10
EOF

解釋?zhuān)?/p>

  • initialDelaySeconds字段告訴 kubelet 在執(zhí)行第一次探測(cè)前應(yīng)該等待 1 秒。
  • periodSeconds 字段指定了 kubelet 每隔 3 秒執(zhí)行一次存活探測(cè)。
  • kubelet 會(huì)向容器內(nèi)運(yùn)行的服務(wù)(服務(wù)在監(jiān)聽(tīng) 80 端口)發(fā)送一個(gè) HTTP GET 請(qǐng)求來(lái)執(zhí)行探測(cè)。
  • 如果服務(wù)器上/index.html路徑下的處理程序返回成功代碼,則 kubelet 認(rèn)為容器是健康存活的。
  • 如果處理程序返回失敗代碼,則 kubelet 會(huì)殺死這個(gè)容器并將其重啟。
  • 返回大于或等于 200? 并且小于 400 的任何代碼都標(biāo)示成功,其它返回代碼都標(biāo)示失敗。

執(zhí)行并查看

crictl pull nginx
kubectl apply -f http-liveness.yaml
kubectl describe pod liveness-httpget

圖片

刪除 Pod 的 index.html 文件

kubectl exec -it liveness-httpget -- rm -rf /usr/share/nginx/html/index.html
# 再查看
kubectl describe pod liveness-httpget
kubectl get pod liveness-httpget

圖片

  • 重啟原因是 HTTP 探測(cè)得到的狀態(tài)返回碼是 404,Liveness probe failed: HTTP probe failed with statuscode: 404。
  • 重啟完成后,不會(huì)再次重啟,因?yàn)橹匦吕〉溺R像中包含了 index.html 文件。

HTTP Probes 允許針對(duì) httpGet 配置額外的字段:

  • host:連接使用的主機(jī)名,默認(rèn)是 Pod 的 IP。也可以在 HTTP 頭中設(shè)置 “Host” 來(lái)代替。
  • scheme :用于設(shè)置連接主機(jī)的方式(HTTP 還是 HTTPS)。默認(rèn)是 "HTTP"。
  • path:訪問(wèn) HTTP 服務(wù)的路徑。默認(rèn)值為 "/"。
  • httpHeaders:請(qǐng)求中自定義的 HTTP 頭。HTTP 頭字段允許重復(fù)。
  • port:訪問(wèn)容器的端口號(hào)或者端口名。如果數(shù)字必須在 1~65535 之間。

你可以通過(guò)為探測(cè)設(shè)置 .httpHeaders 來(lái)重載默認(rèn)的頭部字段值;例如:

livenessProbe:
httpGet:
httpHeaders:
- name: Accept
value: application/json

startupProbe:
httpGet:
httpHeaders:
- name: User-Agent
value: MyUserAgent

3)tcpSocket 方式

cat >tcp-liveness-readiness.yaml<<EOF
apiVersion: v1
kind: Pod
metadata:
name: liveness-readiness-tcpsocket
labels:
app: liveness-readiness-tcpsocket
spec:
# 為了測(cè)試方便,指定調(diào)度機(jī)器
nodeName: local-168-182-110
containers:
- name: liveness-readiness-tcpsocket
image: nginx
ports:
- containerPort: 80
readinessProbe:
tcpSocket:
port: 80
initialDelaySeconds: 5
periodSeconds: 10
livenessProbe:
tcpSocket:
port: 80
initialDelaySeconds: 15
periodSeconds: 20
EOF

解釋?zhuān)?/p>

  • kubelet 會(huì)在容器啟動(dòng) 5 秒后發(fā)送第一個(gè)就緒探測(cè)(livenessProbe)。
  • 探測(cè)器會(huì)嘗試連接 goproxy 容器的 80 端口。 如果探測(cè)成功,這個(gè) Pod 會(huì)被標(biāo)記為就緒狀態(tài),kubelet 將繼續(xù)每隔 10 秒運(yùn)行一次檢測(cè)。
  • 除了就緒探測(cè),這個(gè)配置包括了一個(gè)存活探測(cè)(livenessProbe)。
  • kubelet 會(huì)在容器啟動(dòng)15 秒后進(jìn)行第一次存活探測(cè)(livenessProbe)。
  • 與就緒探測(cè)類(lèi)似,活躍探測(cè)器會(huì)嘗試連接 goproxy 容器的 80 端口。 如果存活探測(cè)失敗,容器會(huì)被重新啟動(dòng)。執(zhí)行
kubectl apply -f tcp-liveness-readiness.yaml
kubectl get pod liveness-readiness-tcpsocket
kubectl describe pod liveness-readiness-tcpsocket

圖片

4)使用命名端口

對(duì)于 HTTP 或者 TCP 存活檢測(cè)可以使用命名的 port。

ports:
- name: nginx
containerPort: 80
hostPort: 80

livenessProbe:
httpGet:
path: /index.html
port: nginx

完整版配置

ports:
- name: nginx
containerPort: 80
hostPort: 80

# readinessProbe,就緒探針
livenessProbe:
httpGet:
path: /index.html
port: nginx
# 延遲多久后開(kāi)始探測(cè)
initialDelaySeconds: 10
# 執(zhí)行探測(cè)頻率() 【 每隔秒執(zhí)行一次 】
periodSeconds: 10
# 超時(shí)時(shí)間
timeoutSeconds: 1
# 處于成功狀態(tài)時(shí),探測(cè)連續(xù)失敗幾次可被認(rèn)為失敗。
failureThreshold: 3
# 處于失敗狀態(tài)時(shí),探測(cè)連續(xù)成功幾次,被認(rèn)為成功。
successThreshold: 1

# livenessProbe,存活探針
livenessProbe:
httpGet:
path: /index.html
port: nginx
# 延遲多久后開(kāi)始探測(cè)
initialDelaySeconds: 10
# 執(zhí)行探測(cè)頻率() 【 每隔秒執(zhí)行一次 】
periodSeconds: 10
# 超時(shí)時(shí)間
timeoutSeconds: 1
# 處于成功狀態(tài)時(shí),探測(cè)連續(xù)失敗幾次可被認(rèn)為失敗。
failureThreshold: 3
# 處于失敗狀態(tài)時(shí),探測(cè)連續(xù)成功幾次,被認(rèn)為成功。
successThreshold: 1

# startupProbe,啟動(dòng)探針
startupProbe:
httpGet:
path: /index.html
port: nginx
# 延遲多久后開(kāi)始探測(cè)
initialDelaySeconds: 10
# 執(zhí)行探測(cè)頻率() 【 每隔秒執(zhí)行一次 】
periodSeconds: 10
# 超時(shí)時(shí)間
timeoutSeconds: 1
# 處于成功狀態(tài)時(shí),探測(cè)連續(xù)失敗幾次可被認(rèn)為失敗。
failureThreshold: 3
# 處于失敗狀態(tài)時(shí),探測(cè)連續(xù)成功幾次,被認(rèn)為成功。
successThreshold: 1

一般使用控制器去創(chuàng)建管理pod,對(duì)k8s 控制器不清晰的小伙伴,可以參考我之前的文章:Kubernetes(k8s)Deployment、StatefulSet、DaemonSet、Job、CronJob五種控制器詳解

下面是一個(gè)完整版的示例:

apiVersion: apps/v1
kind: Deployment
metadata:
name: deployment-probe
spec:
replicas: 3
selector:
matchLabels:
app: deployment-probe
template:
metadata:
labels:
app: deployment-probe
spec:
containers:
- name: nginx
image: nginx:1.17.1

# readinessProbe,就緒探針
readinessProbe:
httpGet:
path: /index.html
port: nginx
# 延遲多久后開(kāi)始探測(cè)
initialDelaySeconds: 10
# 執(zhí)行探測(cè)頻率() 【 每隔秒執(zhí)行一次 】
periodSeconds: 10
# 超時(shí)時(shí)間
timeoutSeconds: 1
# 處于成功狀態(tài)時(shí),探測(cè)連續(xù)失敗幾次可被認(rèn)為失敗。
failureThreshold: 3
# 處于失敗狀態(tài)時(shí),探測(cè)連續(xù)成功幾次,被認(rèn)為成功。
successThreshold: 1

# livenessProbe,存活探針
livenessProbe:
httpGet:
path: /index.html
port: nginx
# 延遲多久后開(kāi)始探測(cè)
initialDelaySeconds: 10
# 執(zhí)行探測(cè)頻率() 【 每隔秒執(zhí)行一次 】
periodSeconds: 10
# 超時(shí)時(shí)間
timeoutSeconds: 1
# 處于成功狀態(tài)時(shí),探測(cè)連續(xù)失敗幾次可被認(rèn)為失敗。
failureThreshold: 3
# 處于失敗狀態(tài)時(shí),探測(cè)連續(xù)成功幾次,被認(rèn)為成功。
successThreshold: 1

# startupProbe,啟動(dòng)探針
startupProbe:
httpGet:
path: /index.html
port: nginx
# 延遲多久后開(kāi)始探測(cè)
initialDelaySeconds: 10
# 執(zhí)行探測(cè)頻率() 【 每隔秒執(zhí)行一次 】
periodSeconds: 10
# 超時(shí)時(shí)間
timeoutSeconds: 1
# 處于成功狀態(tài)時(shí),探測(cè)連續(xù)失敗幾次可被認(rèn)為失敗。
failureThreshold: 3
# 處于失敗狀態(tài)時(shí),探測(cè)連續(xù)成功幾次,被認(rèn)為成功。
successThreshold: 1

執(zhí)行查看

crictl pull nginx:1.17.1
kubectl apply -f deployment-probe.yaml
kubectl get pod,deploy

Kubernetes(k8s)健康檢查詳解與實(shí)戰(zhàn)演示就先到這里了,健康檢查會(huì)伴隨所有k8s編排任務(wù),所以非常重要,其實(shí)也不難,小伙伴有什么疑問(wèn),歡迎給我留言哦~

責(zé)任編輯:武曉燕 來(lái)源: 大數(shù)據(jù)與云原生技術(shù)分享
相關(guān)推薦

2020-09-10 13:51:48

Kubernetes云原生容器

2023-10-14 15:36:14

PodKubernetes

2023-11-27 13:54:00

kubernetes高可用

2023-05-09 07:34:25

Docker健康檢查方式

2023-03-06 07:19:50

2023-03-02 07:20:10

GRPC服務(wù)健康檢查協(xié)議

2023-03-03 07:54:21

2022-11-08 08:55:31

2023-03-07 07:56:37

Sqoopk8s底層

2022-10-14 07:42:50

LuceneHTTPWeb

2022-09-05 08:26:29

Kubernetes標(biāo)簽

2023-03-03 08:19:35

KubernetesgRPC

2022-11-06 21:31:11

云原生Sentinel集群模式

2023-03-01 07:42:12

HBase編排部署數(shù)據(jù)

2024-09-26 09:50:07

2022-05-19 07:01:34

架構(gòu)

2024-06-12 13:21:06

2024-06-26 00:22:35

2020-09-15 08:46:26

Kubernetes探針服務(wù)端

2025-02-18 00:00:00

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)