自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

從Helm到 Operator:Kubernetes應用管理的進化

云計算 云原生
helm 的本質(zhì)上和 kubectl apply yaml 一樣的,只是我們在定義 value.yaml 時幫我們處理了許多不需要用戶低頻修改的參數(shù)。

Helm 的作用

在開始前需要先對 kubernetes  Operator 有個簡單的認識。

以為我們在編寫部署一些簡單 Deployment 的時候只需要自己編寫一個 yaml 文件然后 kubectl apply 即可。

apiVersion: apps/v1  
kind: Deployment  
metadata:  
  labels:  
    app: k8s-combat  
  name: k8s-combat  
spec:  
  replicas: 1  
  selector:  
    matchLabels:  
      app: k8s-combat  
  template:  
    metadata:  
      labels:  
        app: k8s-combat  
    spec:  
      containers:  
        - name: k8s-combat  
          image: crossoverjie/k8s-combat:v1  
          imagePullPolicy: Always  
          resources:  
            limits:  
              cpu: "1"  
              memory: 300Mi  
            requests:  
              cpu: "0.1"  
              memory: 30Mi
kubectl apply -f deployment.yaml

這對于一些并不復雜的項目來說完全夠用了,但組件一多就比較麻煩了。

這里以 Apache Pulsar 為例:它的核心組件有:

  • Broker
  • Proxy
  • Zookeeper
  • Bookkeeper
  • Prometheus(可選)
  • Grafana(可選) 等組件,每個組件的啟動還有這依賴關系。

必須需要等 Zookeeper 和 Bookkeeper 啟動之后才能將流量放進來。

此時如何還繼續(xù)使用 yaml 文件一個個部署就會非常繁瑣,好在社區(qū)有提供 Helm 一鍵安裝程序,使用它我們只需要在一個同意的 yaml 里簡單的配置一些組件,配置就可以由 helm 來部署整個復雜的 Pulsar 系統(tǒng)。

components:  
  # zookeeper  
  zookeeper: true  
  # bookkeeper  
  bookkeeper: true  
  # bookkeeper - autorecovery  
  autorecovery: true  
  # broker  
  broker: true  
  # functions  
  functions: false  
  # proxy  
  proxy: true  
  # toolset  
  toolset: true  
  # pulsar manager  
  pulsar_manager: false  
monitoring:  
  # monitoring - prometheus  
  prometheus: true  
  # monitoring - grafana  
  grafana: true  
  # monitoring - node_exporter  
  node_exporter: true  
  # alerting - alert-manager  
  alert_manager: false

比如在 helm 的 yaml 中我們可以選擇使用哪些 components,以及是否啟用監(jiān)控組件。

最后直接使用這個文件進行安裝:

helm install pulsar apache/pulsar \
 --values charts/pulsar/values.yaml \
 --set namespace=pulsar \
    --set initialize=true

它就會自動生成各個組件的 yaml 文件,然后統(tǒng)一執(zhí)行。

所以 helm 的本質(zhì)上和 kubectl apply yaml 一樣的,只是我們在定義 value.yaml 時幫我們處理了許多不需要用戶低頻修改的參數(shù)。

我們可以使用 helm 將要執(zhí)行的 yaml 輸出后人工審核

helm install pulsar apache/pulsar --dry-run --debug > debug.yaml

Operator 是什么

Helm 的痛點

Helm 雖然可以幫我們部署或者升級一個大型應用,但他卻沒法幫我們運維這個應用。

舉個例子:比如我希望當 Pulsar Broker 的流量或者內(nèi)存達到某個閾值后就指定擴容 Broker,閑時再自動回收。

或者某個 Bookkeeper 的磁盤使用率達到閾值后可以自動擴容磁盤,這些僅僅使用 Helm 時都是無法實現(xiàn)的。

以上這些需求我們目前也是通過監(jiān)控系統(tǒng)發(fā)出報警,然后再由人工處理。

其中最大的痛點就是進行升級:

  • 升級ZK
  • 關閉auto recovery
  • 升級Bookkeeper
  • 升級Broker
  • 升級Proxy
  • 開啟auto recovery

因為每次升級是有先后順序的,需要依次觀察每個組件運行是否正常才能往后操作。

如果有 Operator 理性情況下下我們只需要更新一下鏡像版本,它就可以自動執(zhí)行以上的所有步驟最后將集群升級完畢。

所以相對于 Helm 來說 Operator 是可以站在一個更高的視角俯視整個應用系統(tǒng),它能發(fā)現(xiàn)系統(tǒng)哪個地方需要它從而直接修復。

CRD(Custom Resource Definitions)

而提到 Operator 那就不得不提到 CRD(Custom Resource Definitions)翻譯過來就是自定義資源。

這是 kubernetes 提供的一個 API 擴展機制,類似于內(nèi)置的 Deployment/StatefulSet/Services 資源,CRD 是一種自定義的資源。

這里以我們常用的 prometheus-operator 和 VictoriaMetrics-operator 為例:

Prometheus:

  • **Prometheus**:用于定義 Prometheus 的 Deployment
  • **Alertmanager**:用于定義 Alertmanager
  • **ScrapeConfig**:用于定會抓取規(guī)則
apiVersion: monitoring.coreos.com/v1alpha1
kind: ScrapeConfig
metadata:
  name: static-config
  namespace: my-namespace
  labels:
    prometheus: system-monitoring-prometheus
spec:
  staticConfigs:
    - labels:
        job: prometheus
      targets:
        - prometheus.demo.do.prometheus.io:9090

使用時的一個很大區(qū)別就是資源的 kind: ScrapeConfig 為自定義的類型。

VictoriaMetrics 的 CRD:

  • VMPodScrape:Pod 的抓取規(guī)則
  • VMCluster:配置 VM 集群
  • VMAlert:配置 VM 的告警規(guī)則
  • 等等
# vmcluster.yaml
apiVersion: operator.victoriametrics.com/v1beta1
kind: VMCluster
metadata:
  name: demo
spec:
  retentionPeriod: "1"
  replicationFactor: 2
  vmstorage:
    replicaCount: 2
    storageDataPath: "/vm-data"
    storage:
      volumeClaimTemplate:
        spec:
          resources:
            requests:
              storage: "10Gi"
    resources:
      limits:
        cpu: "1"
        memory: "1Gi"
  vmselect:
    replicaCount: 2
    cacheMountPath: "/select-cache"
    storage:
      volumeClaimTemplate:
        spec:
          resources:
            requests:
              storage: "1Gi"
    resources:
      limits:
        cpu: "1"
        memory: "1Gi"
      requests:
        cpu: "0.5"
        memory: "500Mi"
  vminsert:
    replicaCount: 2

以上是用于創(chuàng)建一個 VM 集群的 CRD 資源,應用之后就會自動創(chuàng)建一個集群。

Operator 原理

Operator 通常是運行在 kubernetes API server 的 webhook 之上,簡單來說就是在一些內(nèi)置資源的關鍵節(jié)點 API-server 會調(diào)用我們注冊的一個 webhook,在這個 webhook 中我們根據(jù)我們的 CRD 做一些自定義的操作。

理論上我們可以使用任何語言都可以寫 Operator,只需要能處理 api-server 的回調(diào)即可。

只是 Go 語言有很多成熟的工具,比如常用的 kubebuilder 和 operator-sdk.

他們內(nèi)置了許多命令行工具,可以幫我們節(jié)省需要工作量。

這里以 operator-sdk 為例:

$ operator-sdk create webhook --group cache --version v1alpha1 --kind Memcached --defaulting --programmatic-validation

會直接幫我們創(chuàng)建好一個標準的 operator 項目:

├── Dockerfile
├── Makefile
├── PROJECT
├── api
│   └── v1alpha1
│       ├── memcached_webhook.go
│       ├── webhook_suite_test.go
├── config
│   ├── certmanager
│   │   ├── certificate.yaml
│   │   ├── kustomization.yaml
│   │   └── kustomizeconfig.yaml
│   ├── default
│   │   ├── manager_webhook_patch.yaml
│   │   └── webhookcainjection_patch.yaml
│   └── webhook
│       ├── kustomization.yaml
│       ├── kustomizeconfig.yaml
│       └── service.yaml
├── go.mod
├── go.sum
└── main.go

其中 Makefile 中包含了開發(fā)過程中常用的工具鏈(包括根據(jù)聲明的結(jié)構體自動生成 CRD 資源、部署k8s 環(huán)境測試等等)、Dockerfile 等等。

這樣我們就只需要專注于開發(fā)業(yè)務邏輯即可。

因為我前段時間給 https://github.com/open-telemetry/opentelemetry-operator 貢獻過兩個 feature,所以就以這個 Operator 為例:

它有一個 CRD: kind: Instrumentation,在這個 CRD 中可以將 OpenTelemetry 的 agent 注入到應用中。

apiVersion: opentelemetry.io/v1alpha1  
kind: Instrumentation  
metadata:  
  name: instrumentation-test-order
  namespace: test  
spec:  
  env:  
    - name: OTEL_SERVICE_NAME  
      value: order
  selector:  
    matchLabels:  
      app: order  
  java:  
    image: autoinstrumentation-java:2.4.0-release  
    extensions:  
      - image: autoinstrumentation-java:2.4.0-release  
        dir: /extensions  
  
    env:  
      - name: OTEL_RESOURCE_ATTRIBUTES  
        value: service.name=order  
      - name: OTEL_INSTRUMENTATION_MESSAGING_EXPERIMENTAL_RECEIVE_TELEMETRY_ENABLED  
        value: "true"  
      - name: OTEL_TRACES_EXPORTER  
        value: otlp  
      - name: OTEL_METRICS_EXPORTER  
        value: otlp  
      - name: OTEL_LOGS_EXPORTER  
        value: none  
      - name: OTEL_EXPORTER_OTLP_ENDPOINT  
        value: http://open-telemetry-opentelemetry-collector.otel.svc.cluster.local:4317  
      - name: OTEL_EXPORTER_OTLP_COMPRESSION  
        value: gzip  
      - name: OTEL_EXPERIMENTAL_EXPORTER_OTLP_RETRY_ENABLED  
        value: "true"

它的運行規(guī)則是當我們的 Pod 在啟動過程中會判斷 Pod 的注解中是否開啟了注入 OpenTelemetry 的配置。

如果開啟則會將我們在 CRD 中自定義的鏡像里的 javaagent 復制到業(yè)務容器中,同時會將下面的那些環(huán)境變量也一起加入的業(yè)務容器中。

要達到這樣的效果就需要我們注冊一個回調(diào) endpoint。

mgr.GetWebhookServer().Register("/mutate-v1-pod", &webhook.Admission{  
    Handler: podmutation.NewWebhookHandler(cfg, ctrl.Log.WithName("pod-webhook"), decoder, mgr.GetClient(),  
       []podmutation.PodMutator{  
          sidecar.NewMutator(logger, cfg, mgr.GetClient()),  
          instrumentation.NewMutator(logger, mgr.GetClient(), mgr.GetEventRecorderFor("opentelemetry-operator"), cfg),  
       }),})

當 Pod 創(chuàng)建或有新的變更請求時就會回調(diào)我們的接口。

func (pm *instPodMutator) Mutate(ctx context.Context, ns corev1.Namespace, pod corev1.Pod) (corev1.Pod, error) {  
    logger := pm.Logger.WithValues("namespace", pod.Namespace, "name", pod.Name)
    }

在這個接口中我們就可以拿到 Pod 的信息,然后再獲取 CRD Instrumentation 做我們的業(yè)務邏輯。

var otelInsts v1alpha1.InstrumentationList  
if err := pm.Client.List(ctx, &otelInsts, client.InNamespace(ns.Name)); err != nil {  
    return nil, err  
}


// 從 CRD 中將數(shù)據(jù)復制到業(yè)務容器中。
pod.Spec.InitContainers = append(pod.Spec.InitContainers, corev1.Container{
 Name:      javaInitContainerName,
 Image:     javaSpec.Image,
 Command:   []string{"cp", "/javaagent.jar", javaInstrMountPath + "/javaagent.jar"},
 Resources: javaSpec.Resources,
 VolumeMounts: []corev1.VolumeMount{{
  Name:      javaVolumeName,
  MountPath: javaInstrMountPath,
 }},
})

for i, extension := range javaSpec.Extensions {
 pod.Spec.InitContainers = append(pod.Spec.InitContainers, corev1.Container{
  Name:      initContainerName + fmt.Sprintf("-extension-%d", i),
  Image:     extension.Image,
  Command:   []string{"cp", "-r", extension.Dir + "/.", javaInstrMountPath + "/extensions"},
  Resources: javaSpec.Resources,
  VolumeMounts: []corev1.VolumeMount{{
   Name:      javaVolumeName,
   MountPath: javaInstrMountPath,
  }},
 })
}

不過需要注意的是想要在測試環(huán)境中測試 operator 是需要安裝一個 cert-manage,這樣 webhook 才能正常的回調(diào)。

要使得 CRD 生效,我們還得先將 CRD 安裝進 kubernetes 集群中,不過這些 operator-sdk 這類根據(jù)已經(jīng)考慮周到了。

我們只需要定義好 CRD 的結(jié)構體:

然后使用 Makefile 中的工具 make bundle 就會自動將結(jié)構體轉(zhuǎn)換為 CRD。

參考鏈接:

  • https://github.com/VictoriaMetrics/operator。
  • https://github.com/prometheus-operator/prometheus-operator。
責任編輯:姜華 來源: crossoverJie
相關推薦

2024-03-05 10:34:33

KubernetesPod云原生

2013-04-17 11:18:11

編程語言

2023-05-06 08:00:00

KubernetesK8s數(shù)據(jù)服務自動化

2022-11-01 12:16:47

Nginx微服務編譯

2023-12-27 06:48:49

KubernetesDevOpsHTTP

2022-08-04 08:00:54

安全管理服務器

2024-01-29 01:15:11

HelmKubernetesKustomize

2024-01-01 21:57:41

kubernetesCRDOperator

2024-05-06 08:08:31

2025-04-29 10:00:00

Kubernete云原生Helm

2022-03-29 09:35:15

FirefoxUI瀏覽器

2023-11-10 15:05:08

Kubernetes云計算

2020-12-03 14:03:29

中臺數(shù)智化架構

2018-12-21 11:01:05

存儲大數(shù)據(jù)RAID

2019-09-02 13:57:07

Helm Chart工具Kubernetes

2009-06-01 10:11:55

路由器DIR-685D-Link

2023-10-09 08:14:10

Helm管理應用

2020-08-13 17:18:20

Kubernetes邊緣容器

2023-08-28 16:10:00

容器化DockerKubernetes

2019-03-29 09:00:31

Kubernetes開發(fā)者工具
點贊
收藏

51CTO技術棧公眾號