マニフェスト

kubernetes では kubectl に様々コマンドがあるが、基本的には kubectl create/delete/apply コマンドと マニフェスト とよぶ YAML/JSON ファイルを使用することで、リソースの作成/削除/更新できる。

マニフェストの雛形
共通事項
Deployment
Pod
Service
DaemonSet
ConfigMap / Secret
Job / CronJob
その他のリソース

1. マニフェストの雛形

ドライラン（ kubectl run/create --dry-run=client ）と yaml 表示（ -o yaml or --output=yaml を）組み合わせるとマニフェストの雛形を標準出力できる。

$ kubectl run sample --image=nginx --dry-run=client -o yaml

apiVersion: extensions/v1beta1
kind: Deployment
metadata:
  creationTimestamp: null
  labels:
    run: sample
  name: sample
spec:
  replicas: 1
  selector:
    matchLabels:
      run: sample
  strategy: {}
  template:
    metadata:
      creationTimestamp: null
      labels:
        run: sample
    spec:
      containers:
      - image: nginx
        name: sample
        resources: {}
status: {}

pod
- kubectl run mypod --image=nginx --labels=app=mypod --dry-run=client -o yaml
  - --restart=Never を付けなくても Pod になるっぽい
  - --expose オプションをつけると ClusterIP も作成される
deployment
- kubectl create deployment mydeploy --image=nginx --replicas=4 --dry-run=client -o yaml
job
- kubectl create job sample --image=busybox --dry-run=client -o yaml -- /bin/sh -c 'echo "Hello. Hololive"'
cronjob
- kubectl create cronjob sample --image=busybox --schedule='*/1 * * * *' --dry-run=client -o yaml -- /bin/sh -c 'echo "Hello. Hololive"'
service / ClusterIP
- kubectl create svc clusterip myapp --tcp=80 --dry-run=client -o yaml
  - これだと selector は作成されない
- kubectl expose pod redis --port=6379 --name redis-service --dry-run=client -o yaml # default で ClusterIP
  - こうすると selector も勝手に作成してくれる
service / NodePort
- kubectl expose deployment hr-web-app --type=NodePort --port=8080 --name=hr-web-app-service --dry-run=client -o yaml
- --type は他に LoadBalancer と ExternalName もサポートする
configmap
- kubectl create cm mycm --from-literal mykey=myval --dry-run=client -o yaml
- --from-file でファイルを指定した場合ちゃんとインデントしてくれる
- kubectl create cm mycm --from-file myfile.yaml --dry-run=client -o yaml
secret
- 値は base64 エンコードされているので編集に注意
- kubectl create secret generic mysecret --from-literal=ID=id --from-literal=PASSWORD=pass --dry-run=client -o yaml
serviceaccount
- kubectl create serviceaccount mysc --dry-run=client -o yaml
clusterrolebinding
- kubectl create clusterrolebinding myclusterrolebinding --clusterrole=edit --serviceaccount default:mysc --dry-run=client -o yaml
rolebinding
- kubectl create rolebinding cluster-admin-binding --role=edit --serviceaccount default:mysc --dry-run=client -o yaml
poddisruptionbudget
- kubectl create pdb my-pdb --selector=app=nginx --min-available=1 --dry-run=client -o yaml

なお、マニフェストの項目についてコマンドで調べたい場合は kubectl explain コマンドを利用するとよい。

# Pod マニフェストの概要
$ kubectl explain pods

# Pod マニフェストの詳細（いっぱい出過ぎる）
$ kubectl explain pods --recursive

# grep で絞るとよい（ -A 3 はヒット行から 3 行取得の意）
$ kubectl explain pods --recursive | grep image -A 3

2. 共通事項

apiVersion: v1
kind: Pod
metadata:
  name: sample-pod
spec:
  containers:
    - name: nginx
      imege: nginx:1.7.9
      ports:
        - containerPort: 80

全てのマニフェストには以下の項目が含まれる。

apiVersion
- API のバージョン
kind
- リソースの種類
metadata
- リソースのメタデータ

Pod の場合は spec 以下に Pod の内容を定義する。

$ kubectl create -f sample-pod.yaml
pod "sample-pod" created

$ kubectl apply -f sample-pod.yaml
pod "sample-pod" configured

$ kubectl delete -f sample-pod.yaml
pod "sample-pod" deleted

kubectl apply は マニフェストに変更がある場合のみ変更処理を行う 。
削除済みのマニフェストに対しても差分を検出するため、新規作成でも apply を使用するほうがよい。
また、マニフェストには複数のリソースを同時に記述することができ、 --- で区切る。

---
apiVersion: v1
kind: Pod
metadata:
  name: sample-pod
spec:
  containers:
    - name: nginx
      imege: nginx:1.7.9
      ports:
        - containerPort: 80
---
apiVersion: v1
kind: Service
# LBの追加など

また、複数のマニフェストファイルを一気に適用したい場合は、ディレクトリにまとめ -f で指定して実行することができる。
その際、ファイル名辞書順で実行されることに注意。

2.1. metadata

metadata: # https://kubernetes.io/docs/reference/generated/kubernetes-api/v1.21/#objectmeta-v1-meta
  annotations:  # 任意のメタデータを保存および取得する。外部ツールなどによって設定・変更・保存される箇所でもある。
    key: value
  labels:       # ReplicaSet、Service の selector で利用。
    key: value
  name:         # namespace 内で一意なオブジェクトの名前。
  namespace:    # 名前空間名。空は default と同じ。 DNS_LABEL である必要があり、変更できない。

Label と Annotation は key-value 形式（ key: value ）でデータを保持する仕組みであるが、用途が異なる。

2.2. Label

各リソースの metadata で設定する
あるリソースが 1 つ以上のリソースを管理する場合、 selector にて Label を指定することにより対象リソースを発見する
- ReplicaSet が Pod を管理する場合
- Deployment が ReplicaSet を管理する場合
- Service が受けた通信の転送先 Pod を指定する場合、など

2.3. Annotation

リソースオブジェクトに関する不特定の情報を保存する方法
- オブジェクトの変更理由の記録
- 特別なスケジューラへの、特別なスケジュールポリシーの伝達
- リソースを更新したツールと、それがどのように更新したかの情報の付加
- 他のツールからの更新検知などのため
- Deployment オブジェクトによるロールアウトのための、ReplicaSet の追跡情報の保存、など

2.4. namespace

namespace は k8s クラスタ上で論理的にシステムを分割する仕組み。
namespace リソース（ kind: Namespace ）を作成し、各リソースの metadata にラベル付け（ namespace: test ）して利用する。

3. Deployment

リソースには色々あるが、理解すべきリソースは少ない。そのうちの一つ。
（その他は、Service、DaemonSet、CronJobくらい？）

apiVersion: app/v1
kind: Deployment
metadata: # https://kubernetes.io/docs/reference/generated/kubernetes-api/v1.21/#objectmeta-v1-meta
  annotations:  # 任意のメタデータを保存および取得する。外部ツールなどによって設定・変更・保存される箇所でもある。
    key: value
  labels:       # ReplicaSet、Service の selector で利用。
    key: value
  name:         # namespace 内で一意なオブジェクトの名前。
  namespace:    # 名前空間名。空は default と同じ。 DNS_LABEL である必要があり、変更できない。
spec: # https://kubernetes.io/docs/reference/generated/kubernetes-api/v1.21/#deploymentspec-v1-apps
  replicas: # Pod のリプリケーション数。
  selector: # ReplicaSet が Pod を選択するための Label Selector 。
    matchLabels:
      <key1>: <value1>   # ReplicaSet の対象セレクタ。Pod 定義 の metadata.labels に一致させる。
    matchExpressions: # https://kubernetes.io/docs/reference/generated/kubernetes-api/v1.21/#labelselectorrequirement-v1-meta
                      # Label Selector のリスト。 AND で評価される。
    matchLabels:      # key-value 形式の Label Selector のリスト。 AND で評価される。matchExpressions の方が複雑な表現が可能。
  strategy: # https://kubernetes.io/docs/reference/generated/kubernetes-api/v1.21/#deploymentstrategy-v1-apps
            # 新しいポッドに置き換えるため展開戦略。現状は単純な再配置とローリングアップデートのみ。
    rollingUpdate: # https://kubernetes.io/docs/reference/generated/kubernetes-api/v1.21/#rollingupdatedeployment-v1-apps
      maxSurge:       # Pod のレプリケーション数を超えて作成できるコンテナの最大数。数か割合で表現。
      maxUnavailable: # Pod のレプリケーション数を下回って利用できなくする最大数。数か割合で表現。
    type: # Recreate か RollingUpdate 。デフォルト RollingUpdate 。
  template: # https://kubernetes.io/docs/reference/generated/kubernetes-api/v1.21/#podtemplatespec-v1-core
            # 作成する Pod の定義
    metadata: # 先の metadata に同じ。
    spec: # https://kubernetes.io/docs/reference/generated/kubernetes-api/v1.21/#podspec-v1-core
      affinity:   # https://kubernetes.io/docs/reference/generated/kubernetes-api/v1.21/#affinity-v1-core
      containers: # https://kubernetes.io/docs/reference/generated/kubernetes-api/v1.21/#container-v1-core
        command:                  # ENTRYPOINT 配列。
        env:                      # 環境変数のリスト。
        envFrom:                  # 環境変数を設定するソースのリスト。
        image:                    # Docker イメージ名。
        imagePullPolicy:          # Docker イメージの pull ポリシー。 Always（常にpull）, Never（ローカルのみ）, IfNotPresent（ローカルに無ければpull）。
        livenessProbe:            # コンテナ死活の定期的な調査。
        name:                     # コンテナ名。DNS_LABEL となる。
        ports:                    # コンテナの公開ポートのリスト。
        readinessProbe:           # コンテナサービスの準備状況の定期的な調査。
        securityContext:          # Pod を実行するセキュリティオプション。
        volumeMounts:             # コンテナのファイルシステムにマウントするポッドボリューム。
      initContainers:     # Pod に属する初期化コンテナのリスト。コンテナが開始される前に順番に実行される。
      nodeName:           # Pod を特定のノードへスケジューリング場合、明示的に指定する。
      nodeSelector:       # Pod を配置するノードのセレクタ。
      schedulerName:      # Pod を管理する kube-scheduler を明示的に指定する場合に設定。
      securityContext:    # https://kubernetes.io/docs/reference/generated/kubernetes-api/v1.21/#podsecuritycontext-v1-core
                          # Pod レベルのセキュリティ属性。
      serviceAccountName: # Pod の実行に使用する ServiceAccount 名。
      tolerations: # https://kubernetes.io/docs/reference/generated/kubernetes-api/v1.21/#toleration-v1-core
                   # Pod を特定のノードに配置する際に利用。 nodeSelector の方が古い。
      volumes: # https://kubernetes.io/docs/reference/generated/kubernetes-api/v1.21/#volume-v1-core
               # マウントできるボリュームのリスト。

ケースによっては追加で以下を意識する必要がある。

spec.strategy
spec.template.spec.affinity : 参考

livenessProbe、readinessProbe についてはこちら。

また、 Pod の spec.nodeName を指定することで、スケジューラに任せず手動で Pod の配置ノードを指定することができる。

4. Pod

apiVersion: core/v1
kind: Pod
metadata: # 先の metadata に同じ。
spec:     # 先の Deployment の spec.template.spec に同じ。

pod のマニフェストに以下を足したものが ReplicaSet 。

spec:
  replicas: <integer>
  selector:
    matchLabels:
      <key1>: <value1>
  template:
      <podの定義に同じ>

なお、 ReplicaSet はマニフェスト上はほぼ Deployment に同じ。

4.1. Taints, Tolerations

Taints / Tolerations は Node Affinity と逆の機能。
Taints は「汚れ」、 Tolerations は「寛容」といった意味になる。
Taints は Node に付与し、 Tolerations は Pod に付与する。
つまり、 Nodeに「汚れ」をつければ、それに「寛容」な Pod しかスケジュールされないということ。
注意したいのは、スケジュールされることを 許容するだけで引きつけるわけではない ということ。
Taints / Tolerations は以下の項目で設定できる。

Key-Value
- Labels と同様
Effect
- 以下のような効果がある
  - NoSchedule ：TaintとTolerationがマッチした場合にのみに、PodがNodeにスケジューリングされる。
  - PreferNoSchedule ： NoSchedule の緩いバージョン。どうしても行き場のなくなった Pod は受け入れる。
  - NoExecute ：基本的に NoSchedule と同じだが、条件に合わない Pod がすでに実行中の場合は追い出す。

Node に Taints を付与する場合は以下のコマンドを実行する。

$ kubectl taint nodes node1 key1=value1:NoSchedule

# ちなみに最後に（ - ）をつけるとその taint を削除できる
$ kubectl taint nodes node1 key1=value1:NoSchedule-

Pod に Tolerations を付与する場合はマニフェストの spec.tolerations に以下を記述する。

tolerations:
- key: "key1"
  operator: "Equal"
  value: "value1"
  effect: "NoSchedule"

4.2. Node Selectors

Pod を特定の Node にスケジュールしたい場合 Node Selectors を利用する。
Node に Labels を付与し、 Pod の nodeSelector にその Labels を付与することで設定できる。
Node に Labels を付与するコマンドは以下の通り。

# USAGE: kubectl label nodes <node-name> <label-key>=<label-value>
$ kubectl label nodes node-1 size=Large

また、 Pod のマニフェストの spec.nodeSelector に以下を設定する。

nodeSelector:
  size: Large

Node Selectors は size=Large もしくは size=Middle のどちらか、といった柔軟性のあるスケジュールはできない。
こういう場合は Node Affinity を使う。

4.3. Node Affinity

Node Affinity は Pod に対して設定し、 Node Selector と同様 Node に付与された Labels を見る。
Pod のマニフェストの spec.affinity に以下の設定をする。

affinity:
  nodeAffinity:
    requiredDuringSchedulingIgnoredDuringExecution:
      nodeSelectorTerms:
      - matchExpressions:
        - key: size
          operator: In
          values:
          - Large

3 行目の長ったらしいのは NodeAffinityType。以下の種類がある。
（ DuringScheduling と DuringExecution に required / preferred / Ignored が修飾されていることに注目。）

requiredDuringSchedulingIgnoredDuringExecution
- 必ず Affinity の通りにスケジュールされるが、すでに実行中のものは再スケジュールされない
preferredDuringSchedulingIgnoredDuringExecution
- できるだけ Affinity の通りにスケジュールされるが、すでに実行中のものは再スケジュールされない
requiredDuringSchedulingRequiredDuringExecution
- 必ず Affinity の通りにスケジュールされ、さらに、すでに実行中のものは再スケジュールされる

4.4. Resource Requirements

spec.containers.resources を設定することで、 Pod に割り当てるリソース（ CPU/Mem/Disk ）の要求について記載することができる。

resources:
  requests:
    cpu: 100m
    memory: 64Mi
  limits:
    cpu: 2
    memory: 1Gi

resuests は下限、 limits は上限と理解すればいい。
なお、デフォルトでは、 requests は CPU=0.5 / Mem=256Mi 、 limits は CPU=1 / Mem=512Mi となる。 CPU=1 は 1 vCPU や 1 core や 1 Hyperthread を意味し、 CPU=1=1000m となる。
また、 Mem については以下の通り。

1G = 1,000,000,000 bytes
1M = 1,000,000 bytes
1K = 1,000 bytes
1Gi = 1,073,741,824 bytes
1Mi = 1,048,576 bytes
1Ki = 1,024 bytes

4.5. Static Pod

Kubernetes の Master Nodes の機能がなかった場合でも、 kubelet は単独で Pod を起動することができる。（ DaemonSet や Service など Pod 以外は出来ない）
この Pod を Static Pod と呼ぶ。 Static Pod の作成方法は以下の通り。

kubelet.service プロセス実行時のオプションに --pod-manifest-path というオプションがあり、このパスに Pod のマニフェストを配置することにより Static Pod を実行することができる。
- /etc/Kubernetes/manifest あたり
もしくは、kubelet.service プロセス実行時のオプションに --config オプションがあり、ここで指定された設定の yaml ファイルの中の staticPodPath という設定項目になる
上記で確認した Path にマニフェストファイルを配置すれば自動で作成される（作成されなければ systemctl restart kubelet で再起動）
作成された Static Pod は「-」というふうに suffix にノード名が付与される

Master Nodes が機能している場合、 kubelet は自動的に各 Static Pod に対応する mirror pod を kube-apiserver 上に作成するため、 kubectl get などでも見ることができる。
Master Nodes が機能していない場合、作成された Static Pod は docker ps コマンドで確認できる。
Master Nodes が機能している・いないにかかわらず、 Static Pod に対する変更は各 Static Pod が配置されている Node のマニフェストファイルを変更する他ない。
kube-apiserver に何らかの問題が発生しても機能継続できるように、 Master Nodes のコンポーネントで Static Pod により構成されているものがある。

4.6. Multiple Scheduler

kube-scheduler は複数起動することができる。
複数のスケジューラがある場合、 Pod のマニフェストにて spec.schedulerName でスケジューラ名を指定することにより目的のスケジューラによって処理させることができる。
スケジューラを起動する際、以下のオプションを指定することで、スケジューラに命名およびリーダーの選出が可能になる。

    spec:
      containers:
      - name: kube-second-scheduler
        image: gcr.io/my-gcp-project/my-kube-scheduler:1.0
        command:
        - /usr/local/bin/kube-scheduler
        - --address=0.0.0.0
        - --leader-elect=false          # リーダー選出対象外
        - --scheduler-name=my-scheduler # スケジューラの命名

4.7. Lifecycle / Lifecycle Events / Lifecycle Handler

Pod にはのライフサイクルがり、 status.phase は Pod のライフサイクルにおけるフェーズを表しており、 Pod の状態を確認する上で重要となる。

値	概要
Pending	PodがKubernetesシステムによって承認されが、コンテナの作成が完了していない状態。スケジュール・イメージダウンロード中などの状態。
Running	PodがNodeにバインドされ、少なくとも 1 つのコンテナが作成され、開始・実行・再起動中の状態。
Succeeded	JobなどのPod内のすべてのコンテナが正常に終了し、再起動も発生していない状態。
Failed	Pod内のすべてのコンテナが終了し、少なくとも1つのコンテナが異常終了した状態。コンテナはゼロ以外のステータスで終了したか、システムによって終了された状態。
Unknown	何らかの理由により、通常はPodのホストとの通信にエラーが発生したために、Podの状態を取得できなかった。

上記のようなフェーズを決定するために、 Kubernetes では以下の 2 種類の ヘルスチェック がある。

Liveness Probe
- Pod が正常に動作しているかの確認
- 失敗した場合、 Pod は再起動される
Readiness Probe
- Pod がサービスインする準備が出来ているかの確認
- 失敗した場合、 Pod にトラフィックが流れず、再起動されることもない（サービスインされるまで待つ）

上記の設定はデフォルトではされておらず、通常は Service/LoadBalancer から Node への ICMP による簡易的なチェックしか実施されていない。
そのため、 Pod の状態に応じたサービスの健全性を保つために上記の設定が必要になる。
Liveness/Readiness Probe の双方で以下の 3 種類のヘルスチェックを設定できる。
ヘルスチェックは kubelet からコンテナ毎に行われ、どれか 1 つのコンテナでも失敗した場合には Pod 全体が失敗とみなされる。

exec

コマンドを実行し、終了コードが 0 でなければ失敗
例

readinessProbe:
  exec:
    command: ["ls", "/usr/sbin/nginx"]
  initialDelaySeconds: 10 # 初回チェックの Delay
  periodSeconds: 5        # チェック間隔
  failureThreshold: 8     # チェック NG の場合のリトライ回数

httpGet

HTTP GET リクエストを実行し、 Status Code が 200 〜 300 でなければ失敗
例

libenessProbe:
  httpGet:
    path: /health
    port: 80
    scheme: HTTP
    host: web.example.com
    httpHeaders:
    - name: Authorization
      value: Bearer TOKEN
  initialDelaySeconds: 10 # 初回チェックの Delay
  periodSeconds: 5        # チェック間隔
  failureThreshold: 8     # チェック NG の場合のリトライ回数

tcpSocket
- TCP セッションが確立できなければ失敗
- 例
```
linenessProbe:
  tcpSocket:
    port: 80
```

また、コンテナが開始された際とPodが削除される際にHookして任意の処理を実行することが出来る以下の Lifecycle Events がある。

postStart
- コンテナが作成された後、即座に実行される
- このHandlerが失敗した場合終了させ、 restartPolicy に従い再起動させる
preStop
- コンテナが終了される前に実行される
- コンテナのルートプロセスに対して SIGTERM が送出される前にこのHandlerが実行される

postStart や preStop に指定できる Lifecycle Handler の種類は以下の通り。

exec : コンテナ内でコマンドを実行
httpGet : HTTPのGETリクエストを発行

先の probe と同様だ。

5. Service

apiVersion: v1
kind: Service
metadata: # 先の metadata に同じ。
spec: # https://kubernetes.io/docs/reference/generated/kubernetes-api/v1.20/#servicespec-v1-core
  clusterIP:
  externalIPs:
  externalName:
  externalTrafficPolicy:
  healthCheckNodePort:
  loadBalancerIP:
  loadBalancerSourceRanges:
  ports:
  publishNotReadyAddresses:
  selector:
  sessionAffinity:
  sessionAffinityConfig:
  type: # ExternalName 、 ClusterIP （デフォルト）、 NodePort 、および LoadBalancer 。

色々設定があるが、 ClusterIP の場合は以下くらいでいい。

apiVersion: v1
kind: Service
metadata:
  annotations:
    <key>: <value>
  labels:             # Service の Label
    <key>: <value>
  name: <string>      # Service 名
  namespace: <string> # Service の namespace
spec:
  selector:
    <key>: <value>    # 通信を流す Pod の Label をセレクタで指定
  ports:
  - protocol: TCP     # Service が受信するプロトコルとポートマッピング
    port: 80          # Service が受信 Port
    targetPort: 9376  # Pod の Port

Service の selector の設定が正しく Pod を捉えているかどうかは kubectl get pods --selector="app=monolith,secure=enabled" などのコマンドで対象の Pod を取得できるか、で検査できる。
さらに、ネットワーク疎通する場合は nc -v <host/IP> <port> コマンドで確認するのがよい。（ curl は busybox に default で入ってない、、、）
curl が利用できる環境の場合は curl <endpoint:port> -I でヘッダ情報（ HTTP Status など）のみ確認できる。

6. DaemonSet

各 Node に 1 Pod ずつ配置する。
Monitoring/Logging Agent などを仕込むのに最適。（ kube-proxy は DaemonSet で配置されているものもある）
DaemonSet のマニフェストは ReplicaSet のそれに酷似している。
なお、 DaemonSet や ReplicaSet は kubectl create コマンドでは作成できないので、下記のような Deployment 作成コマンドでマニフェストの雛形を作成し、その後 kind を修正するなどして DaemonSet のマニフェストを作成してから apply するとよい。

$ kubectl create deployment elasticsearch --image=k8s.gcr.io/fluentd-elasticsearch:1.20 --namespace=kube-system --dry-run=client -o yaml > fluent.yaml

7. ConfigMap / Secret

7.1. ConfigMap

ConfigMap は以下の通りコマンドで作成するか、マニフェストを作成する。

# コマンドのみで作成
# USAGE: kubectl create configmap <config-name> --from-literal=<key>=<value>
$ kubectl create configmap app-config --from-literal=APP_COLOR=blue --from-literal=APP_MOD=prod

# マニフェストファイルを利用する場合
# USAGE: kubectl create configmap <config-name> --from-file=<file-name>
$ kubectl create configmap app-config --from-file=app_config.properties

APP_COLOR: blue
APP_MOD: prod

apiVersion: v1
kind: ConfigMap
metadata:
  name: app-config
data:
  APP_COLOR: blue
  APP_MOD: prod

Pod のマニフェストからは以下のように参照する。

spec:
  containers:
  - name: hoge
    image: hoge
    envFrom:
    - configMapRef:
        name: app-config

なお、 Pod から ConfigMap を参照する方法は大きく 3 パターンある。

ConfigMap の内容の一部を環境変数へ

例

apiVersion: v1
kind: Pod
metadata:
  name: test-pod
spec:
  containers:
    - name: test-container
      image: k8s.gcr.io/busybox
      command: [ "/bin/sh", "-c", "echo $(SPECIAL_LEVEL_KEY)" ] # コマンドで使用する場合は「 $() 」
      env:
        - name: SPECIAL_LEVEL_KEY # 環境変数
          valueFrom:
            configMapKeyRef:
              name: special-config # 参照する ConfigMap 名
              key: special.how     # ConfigMap 内の key

ConfigMap の内容を全て直接環境変数へ

例

apiVersion: v1
kind: Pod
metadata:
  name: test-pod
spec:
  containers:
    - name: test-container
      image: k8s.gcr.io/busybox
      command: [ "/bin/sh", "-c", "env" ]
      envFrom: # ここ
      - configMapRef:
          name: special-config

Volume に追加する

例

apiVersion: v1
kind: Pod
metadata:
  name: dapi-test-pod
spec:
  containers:
    - name: test-container
      image: k8s.gcr.io/busybox
      command: [ "/bin/sh", "-c", "ls /etc/config/" ]
      volumeMounts:
      - name: config-volume
        mountPath: /etc/config
  volumes:
    - name: config-volume
      configMap:
        name: special-config

3 つ目の Volume に追加するパターンが少しややこしい。
上記の special-config が kubectl create cm special-config --from-literal=id=hoge --from-literal=password=hogehoge のように作られた場合、コンテナ内の /etc/config ディレクトリ内には、 hoge と記載された名前が id のファイルが 1 つ、 hogehoge と記載された名前が password のファイルが 1 つ作成される。
これだと具合が悪いので、ファイルとして配置する ConfigMap の記載方法がある。

apiVersion: v1
kind: ConfigMap
metadata:
  name: nginx-file
data:
  envfile: |-
    id=hoge
    password=hogehoge

apiVersion: v1
kind: Pod
metadata:
  name: nginx
spec:
  containers:
  - image: nginx
    name: nginx
    volumeMounts:
    - name: config-volume
      mountPath: /etc/config
  volumes:
  - name: config-volume
    configMap:
      name: nginx-file
      items:
        - key: envfile
          path: envfile.txt

上記で作成した Nginx の /etc/config ディレクトリには envfile.txt が作成されており、その中身は以下の通りだ。

id=hoge
password=hogehoge

7.2. Secret

Secret は以下の通りコマンドで作成するか、マニフェストを作成する。（ generic が付くのに注意）

# コマンドのみで作成
# USAGE: kubectl create secret generic <secret-name> --from-literal=<key>=<value>
$ kubectl create secret generic app-secret --from-literal=APP_COLOR=blue --from-literal=APP_MOD=prod

# マニフェストファイルを利用する場合
# USAGE: kubectl create secret generic <secret-name> --from-file=<file-name>
$ kubectl create secret generic app-secret --from-file=app_secret.properties

APP_COLOR: blue
APP_MOD: prod

apiVersion: v1
kind: Secret
metadata:
  name: app-secret
data:
  APP_COLOR: blue
  APP_MOD: prod

ただし、マニフェストファイルに環境変数を記載する際は、 value 値を base64 コマンドなどで Base64 化する必要がある。（デコードは base64 --decode ）
Pod のマニフェストからは以下のように参照する。

spec:
  containers:
  - name: hoge
    image: hoge
    envFrom:
    - secretRef:
        name: app-secret

8. Job / CronJob

8.1. Job

Job を利用しなくても Pod で restartPolicy: Always を設定すれば似たようなことができる。

apiVersion: v1
kind: Pod
metadata:
  name: math-pod
spec:
  containers:
  - name: math-add
    image: ubuntu
    command: ['expr', '3', '+', '2']
  restartPolicy: Always

restartPolicy で小細工をせず、 ReplicaSet と同じレイヤで Pod をコントロールするのが Job だ。
Job のマニフェストは spec の下に template を挟む以外は Pod とほぼ同じだ。

apiVersion: batch/v1
kind: Job
metadata:
  name: math-pod-job
spec:
  template:
    containers:
    - name: math-add
      image: ubuntu
      command: ['expr', '3', '+', '2']
    restartPolicy: Never

Job は kubectl get jobs で取得でき、Job が実行した Pod は通常通り kubectl get pods で取得できる。

$ kubectl get jobs
NAME          DESIRED  SUCCESSFUL  AGE
math-add-job  1        1           38s

$ kubectl get pods
NAME                READY  STATUS     RESTARTS  AGE
math-add-job-l87pn  0/1    Completed  0         2m

なお、 Job は ReplicaSet とは違い、バッチ処理などに有効な機能がある。

apiVersion: batch/v1
kind: Job
metadata:
  name: math-pod-job
spec:
  completions: 3
  parallelism: 3
  backoffLimit: 6
  template:
    containers:
    - name: math-add
      image: ubuntu
      command: ['expr', '3', '+', '2']
    restartPolicy: Never

spec.completions
- 指定した回数 Job から起動した Pod の処理が成功（ Completed ）するまで Pod をシーケンシャルに起動する
spec.parallelism
- Pod を冗長化して起動する個数
spec.backoffLimit
- Pod の処理が失敗した際のリトライ上限

8.2. CronJob

Job に crontab の機能をつけたものが CronJob 。
マニフェストは spec.jobTemplate 配下に Job の spec をもってくればよい。

apiVersion: batch/v1
kind: CronJob
metadata:
  name: reporting-cron-job
spec:
  schedule: "*/1 * * * *"
  jobTemplate:
    spec:
      completions: 3
      parallelism: 3
      template:
        containers:
        - name: math-add
          image: ubuntu
          command: ['expr', '3', '+', '2']
        restartPolicy: Never

なお、 spec.schedule に記載する crontab の指定方法は以下の通り。

# （行頭の # マークはコメント行を示す）
# +------------ 分 (0 - 59)
# | +---------- 時 (0 - 23)
# | | +-------- 日 (1 - 31)
# | | | +------ 月 (1 - 12)
# | | | | +---- 曜日 (0 - 6) (日曜日=0)
# | | | | |
# * * * * * 実行されるコマンド

例	意味
0 0 1 1 *	1 月 1 日 0:00 に年に 1 回実行される
0 0 1 * *	毎月 1 日 0:00 に月に 1 回実行される
0 0 * * 0	毎週日曜 0:00 に週に 1 回実行される
0 0 * * *	毎日 0:00 に日に 1 回実行される
0 * * * *	毎時 0 分に 1 時間に 1 回実行される

9. その他のリソース

基本的なリソース以外に以下について記載する。

9.1. HPA（HorizontalPodAutoscaler）

HPA は pod の負荷に応じて自動的に pod の数を水平スケールさせるリソース。
Deployment, ReplicaSet, ReplicationController, StatefulSetはscaled resource objectと呼ばれ、これらがauto scalingの対象リソースとなる。

kind: HorizontalPodAutoscaler
metadata:
  name: php-hpa
  namespace: default
spec:
  scaleTargetRef: # ここでautoscale対象となる`scaled resource object`を指定
    apiVersion: apps/v1
    kind: Deployment
    name: php-deploy
  minReplicas: 1 # 最小レプリカ数
  maxReplicas: 5 # 最大レプリカ数
  metrics:
  - type: Resource
    resource:
      name: cpu
      targetAverageUtilization: 50 # CPU使用率が常に50%になるように指定

参考

9.2. PBD（PodDisruptionBudget）

kubectl drain によって対象 Node から Pod を退去でき、以降も Pod がスケジューリングされないように出来る
- Node のメンテナンス(reboot)などを行う必要がある場合に kubectl drainを行うと Node で動いている Pod について gracefully に terminate される。また、ReplicaSet を使っていれば別の Node で Pod が自動的に起動される。メンテナンス完了後、kubectl uncordonを行うことで再度 Pod がスケジューリングされる状態になる。
注意点として上記だけでは対象 Node 上で起動している Pod は一度に evicted され、一度に退去させられる可能性がある。例えば ReplicaSet 2 で drain 対象の Node に 2つの Pod が起動していた場合、両方の Pod に対して evicted され、一つも Pod が起動していない時間帯がある可能性が出来てしまう
PodDisruptionBudget(PDB)を定義することで上記を防ぐことが出来る

apiVersion: policy/v1beta1
kind: PodDisruptionBudget
metadata:
  name: myapp
spec:
  maxUnavailable: 1
  selector:
    matchLabels:
run: myapp

参考