当前位置: 开发笔记 > 编程语言 > 正文

逃脱只会部署集群系列——Kubeadm部署与ETCD操作

作者：我系懒懒懒猫 | 来源：互联网 | 2023-09-13 19:03

一、Kubeadm部署1、基本操作https:segmentfault.coma1190000019465098https:segmentfault.coma11900000194

一、Kubeadm部署

1、基本操作

2、补充

二、ETCD常用操作

1、kubernetes自动补全：

2、拷贝etcdctl命令行工具：

3、etcdctl常用操作：

1 查看etcd集群的成员节点：

2 查看etcd集群节点状态：

3 设置key值:

4 etcd数据快照与恢复

5 etcd生产级别的备份方案

一、Kubeadm部署

1、基本操作

https://segmentfault.com/a/1190000019465098https://segmentfault.com/a/1190000019465098

2、补充

基本操作就不详述了，网上找找很多，其中flannel地址访问不到，我直接拿出来了，以前我一直很疑惑apiserver用v1还是v1brta1，kubectl explain pod或者直接-oyaml解决。

--- apiVersion: policy/v1beta1 kind: PodSecurityPolicy metadata: name: psp.flannel.unprivileged annotations: seccomp.security.alpha.kubernetes.io/allowedProfileNames: docker/default seccomp.security.alpha.kubernetes.io/defaultProfileName: docker/default apparmor.security.beta.kubernetes.io/allowedProfileNames: runtime/default apparmor.security.beta.kubernetes.io/defaultProfileName: runtime/default spec: privileged: false volumes: - configMap - secret - emptyDir - hostPath allowedHostPaths: - pathPrefix: "/etc/cni/net.d" - pathPrefix: "/etc/kube-flannel" - pathPrefix: "/run/flannel" readOnlyRootFilesystem: false runAsUser: rule: RunAsAny supplementalGroups: rule: RunAsAny fsGroup: rule: RunAsAny allowPrivilegeEscalation: false defaultAllowPrivilegeEscalation: false # Capabilities allowedCapabilities: ['NET_ADMIN', 'NET_RAW'] defaultAddCapabilities: [] requiredDropCapabilities: [] # Host namespaces hostPID: false hostIPC: false hostNetwork: true hostPorts: - min: 0 max: 65535 # SELinux seLinux: # SELinux is unused in CaaSP rule: 'RunAsAny' --- kind: ClusterRole apiVersion: rbac.authorization.k8s.io/v1 metadata: name: flannel rules: - apiGroups: ['extensions'] resources: ['podsecuritypolicies'] verbs: ['use'] resourceNames: ['psp.flannel.unprivileged'] - apiGroups: - "" resources: - pods verbs: - get - apiGroups: - "" resources: - nodes verbs: - list - watch - apiGroups: - "" resources: - nodes/status verbs: - patch --- kind: ClusterRoleBinding apiVersion: rbac.authorization.k8s.io/v1 metadata: name: flannel roleRef: apiGroup: rbac.authorization.k8s.io kind: ClusterRole name: flannel subjects: - kind: ServiceAccount name: flannel namespace: kube-system --- apiVersion: v1 kind: ServiceAccount metadata: name: flannel namespace: kube-system --- kind: ConfigMap apiVersion: v1 metadata: name: kube-flannel-cfg namespace: kube-system labels: tier: node app: flannel data: cni-conf.json: | { "name": "cbr0", "cniVersion": "0.3.1", "plugins": [ { "type": "flannel", "delegate": { "hairpinMode": true, "isDefaultGateway": true } }, { "type": "portmap", "capabilities": { "portMappings": true } } ] } net-conf.json: | { "Network": "10.244.0.0/16", "Backend": { "Type": "vxlan" } } --- apiVersion: apps/v1 kind: DaemonSet metadata: name: kube-flannel-ds namespace: kube-system labels: tier: node app: flannel spec: selector: matchLabels: app: flannel template: metadata: labels: tier: node app: flannel spec: affinity: nodeAffinity: requiredDuringSchedulingIgnoredDuringExecution: nodeSelectorTerms: - matchExpressions: - key: kubernetes.io/os operator: In values: - linux hostNetwork: true priorityClassName: system-node-critical tolerations: - operator: Exists effect: NoSchedule serviceAccountName: flannel initContainers: - name: install-cni-plugin image: rancher/mirrored-flannelcni-flannel-cni-plugin:v1.2 command: - cp args: - -f - /flannel - /opt/cni/bin/flannel volumeMounts: - name: cni-plugin mountPath: /opt/cni/bin - name: install-cni image: quay.io/coreos/flannel:v0.15.0 command: - cp args: - -f - /etc/kube-flannel/cni-conf.json - /etc/cni/net.d/10-flannel.conflist volumeMounts: - name: cni mountPath: /etc/cni/net.d - name: flannel-cfg mountPath: /etc/kube-flannel/ containers: - name: kube-flannel image: quay.io/coreos/flannel:v0.15.0 command: - /opt/bin/flanneld args: - --ip-masq - --kube-subnet-mgr resources: requests: cpu: "100m" memory: "50Mi" limits: cpu: "100m" memory: "50Mi" securityContext: privileged: false capabilities: add: ["NET_ADMIN", "NET_RAW"] env: - name: POD_NAME valueFrom: fieldRef: fieldPath: metadata.name - name: POD_NAMESPACE valueFrom: fieldRef: fieldPath: metadata.namespace volumeMounts: - name: run mountPath: /run/flannel - name: flannel-cfg mountPath: /etc/kube-flannel/ volumes: - name: run hostPath: path: /run/flannel - name: cni-plugin hostPath: path: /opt/cni/bin - name: cni hostPath: path: /etc/cni/net.d - name: flannel-cfg configMap: name: kube-flannel-cfg

二、ETCD常用操作

1、kubernetes自动补全：

自动补全k8s常用的资源变量，提高效率

yum install -y bash-completion source /usr/share/bash-completion/bash_completion source <(kubectl completion bash) echo "source <(kubectl completion bash)" >> ~/.bashrc

2、拷贝etcdctl命令行工具：

etcd类似redis命令，两者用法有很多相似之处，都是键值对数据库

$ kubectl -n kube-system exec etcd-k8s-master which etcdctl $ kubectl -n kube-system cp etcd-k8s-master:/usr/local/bin/etcdctl /usr/bin/etcdctl

3、etcdctl常用操作：

1 查看etcd集群的成员节点：

# 刚开始会出现该报错，需要调整版本至V3 WARNING: Environment variable ETCDCTL_API is not set; defaults to etcdctl v2. Set environment variable ETCDCTL_API=3 to use v3 API or ETCDCTL_API=2 to use v2 API. $ export ETCDCTL_API=3 # 因为每次etcdctl命令都需要附加证书，直接做个别名 $ alias etcdctl='etcdctl --endpoints=https://[127.0.0.1]:2379 --cacert=/etc/kubernetes/pki/etcd/ca.crt --cert=/etc/kubernetes/pki/etcd/healthcheck-client.crt --key=/etc/kubernetes/pki/etcd/healthcheck-client.key' $ etcdctl member list -w table [[email&＃160;protected] ~]# etcdctl member list -w table +------------------+---------+------------+----------------------------+----------------------------+ | ID | STATUS | NAME | PEER ADDRS | CLIENT ADDRS | +------------------+---------+------------+----------------------------+----------------------------+ | 49c374033081590d | started | k8s-master | https://192.168.0.121:2380 | https://192.168.0.121:2379 | +------------------+---------+------------+----------------------------+-----------------

2 查看etcd集群节点状态：

$ etcdctl endpoint status -w table $ etcdctl endpoint health -w table

3 设置key值:

# 类似redis，手动设置键值对 $ etcdctl put luffy 1 $ etcdctl get luffy

查看所有key值： $ etcdctl get / --prefix --keys-only # 我们知道etcd一直处于监听状态，所以集群任何变动都能及时同步到etcd中去，实际上etcd监视着集群所有资源，目录结构为：/registry/资源类型/命名空间/对象ID/,例如监听pod状态，执行会得到key为目录名，value为pod的yaml内容。 $ etcdctl watch 目录名或者对象名 $ /registry/pods/kube-system/coredns-5644d7b6d9-7gw6t $ etcdctl get /registry/pods/kube-system/coredns-5644d7b6d9-7gw6t --prefix

查看具体的key对应的数据： $ etcdctl get /registry/pods/jenkins/sonar-postgres-7fc5d748b6-gtmsb

4 etcd数据快照与恢复

添加定时任务做数据快照 $ etcdctl snapshot save `hostname`-etcd_`date +%Y%m%d%H%M`.db

恢复快照：停止etcd和apiserver 移走当前数据目录 $ mv /var/lib/etcd/ /tmp 恢复快照 $ etcdctl snapshot restore `hostname`-etcd_`date +%Y%m%d%H%M`.db --data-dir=/var/lib/etcd/

集群恢复 https://github.com/etcd-io/etcd/blob/master/Documentation/op-guide/recovery.md

5 etcd生产级别的备份方案

# 生产级别利用cronjob定时备份 # etcd-db-bak:/var/lib/etcd_backup # etcd-cert:/etc/etcd/pki # stcd-bin:pod-name/usr/local/bin/etcd # firewalld:/usr/lib/firewalld/services/etcd-client.xml # yaml:/home/install/k8s-self/template/master/k8s-etcd-backup.yaml # shell:/home/install/k8s-self/scripts/etcd/afterInstall.sh 36-zhu # 这是定时备份etcd数据的任务 --- apiVersion: batch/v1beta1 kind: CronJob metadata: name: k8s-etcd-backup-0 namespace: kube-system spec: # timezone is same as controller manager, default is UTC # 国际标准时间18点换算为北京时间2点 schedule: "12 18 * * *" concurrencyPolicy: Replace # #并发调度策略：Allow运行同时运行过个任务。Forbid：不运行并发执行。Replace：替换之前的任务 failedJobsHistoryLimit: 2 # 为失败的任务执行保留历史记录数，默认为1. successfulJobsHistoryLimit: 2 # 为成功执行的任务保留历史记录，默认值为3；所以可以看到6个运行完成的cronjob生成的pod startingDeadlineSeconds: 3600 # 因为各种原因缺乏执行作业的时间点导致的启动作业错误的超时时长，会被记入错误历史记录； jobTemplate: # Job控制器模板，用于为CronJob控制器生成Job对象 spec: template: metadata: labels: app: k8s-etcd-backup spec: tolerations: # Taints（污点），Tolerations（容忍）aints定义在Node节点上，声明污点及标准行为，Tolerations定义在Pod，声明可接受得污点。当前容忍度为允许没有污点的master节点执行任务，通过kubectl describe node nodename | greo Tains结果为none - key: node-role.kubernetes.io/master operator: Exists effect: NoSchedule affinity: nodeAffinity: requiredDuringSchedulingIgnoredDuringExecution: # 硬亲和性：实现的是强制性规则，是Pod调度时必须满足的规则，否则Pod对象的状态会一直是Pending nodeSelectorTerms: # #nodeSelectorTerms可以定义多条约束，只需满足其中一条。 - matchExpressions: # matchExpressions可以定义多条约束，必须满足全部约束。 - key: kubernetes.io/hostname # 强制绑定到label标签kubernetes.io/hostname的value是k8s-hostname-node1的node上 operator: In # In：label的值在某个列表中 values: - k8s-hostname-node1 # 每个job和node一对一亲和绑定 containers: - name: k8s-etcd-backup image: harborIP/kubernetes/etcd:3.4.3-0 imagePullPolicy: IfNotPresent resources: requests: cpu: "0" memory: "0" limits: cpu: 1000m memory: 1Gi env: - name: ENDPOINTS value: "https://k8s-node1:2379" command: - /bin/sh - -c - | set -ex # -e 脚本中的命令一旦运行失败就终止脚本的执行 -x 用于显示出命令与其执行结果debug模式 rm -rf /data/backup/tmp mkdir -p /data/backup/tmp && test -d /data/backup/tmp || exit 1; #判断 export backupfilename=`date +"%Y%m%d%H%M%S"`; # 设置环境变量 test -f /certs/ca.pem || (rm -rf /data/backup/tmp && exit 1);test -f /certs/client.pem || (rm -rf /data/backup/tmp && exit 1);test -f /certs/client-key.pem || (rm -rf /data/backup/tmp &&exit 1);\ # 确认是否存在证书文件 ETCDCTL_API=3 /usr/local/bin/etcdctl \ --endpoints=$ENDPOINTS \ --cacert=/certs/ca.pem \ --cert=/certs/client.pem \ --key=/certs/client-key.pem \ --command-timeout=1800s \ snapshot save /data/backup/tmp/etcd-snapshot.db && \ # etcd数据备份命令 cd /data/backup/tmp; tar -czf /data/backup/etcd-snapshot-${backupfilename}.tar.gz * && \ cd -; rm -rf /data/backup/tmp if [ $? -ne 0 ]; then # 如果运行失败则exit1 exit 1 fi # delete old file more than 7 count=0; for file in `ls -t /data/backup/*tar.gz` do count=`expr $count + 1` if [ $count -gt 7 ]; then rm -rf $file fi done volumeMounts: # 容器目录 - name: master-backup mountPath: /data/backup - name: etcd-certs mountPath: /certs - name: timezone mountPath: /etc/localtime readOnly: true volumes: # 映射到宿主机的目录 - name: master-backup # 备份文件目录 hostPath: path: /var/lib/etcd_backup - name: etcd-certs hostPath: path: /etc/etcd/pki # cert文件目录 - name: timezone hostPath: path: /etc/localtime # 系统时区文件 restartPolicy: Never # 重启策略，job执行完毕自动退出无需重启 hostNetwork: true --- apiVersion: batch/v1beta1 kind: CronJob metadata: name: k8s-etcd-backup-1 namespace: kube-system spec: # timezone is same as controller manager, default is UTC schedule: "12 19 * * *" concurrencyPolicy: Replace failedJobsHistoryLimit: 2 successfulJobsHistoryLimit: 2 startingDeadlineSeconds: 3600 jobTemplate: spec: template: metadata: labels: app: k8s-etcd-backup spec: tolerations: - key: node-role.kubernetes.io/master operator: Exists effect: NoSchedule affinity: nodeAffinity: requiredDuringSchedulingIgnoredDuringExecution: nodeSelectorTerms: - matchExpressions: - key: kubernetes.io/hostname operator: In values: - k8s-hostname-master containers: - name: k8s-etcd-backup image: harborIP/kubernetes/etcd:3.4.3-0 imagePullPolicy: IfNotPresent resources: requests: cpu: "0" memory: "0" limits: cpu: 1000m memory: 1Gi env: - name: ENDPOINTS value: "https://k8s-master:2379" command: - /bin/sh - -c - | set -ex rm -rf /data/backup/tmp mkdir -p /data/backup/tmp && test -d /data/backup/tmp || exit 1; export backupfilename=`date +"%Y%m%d%H%M%S"`; test -f /certs/ca.pem || (rm -rf /data/backup/tmp && exit 1);test -f /certs/client.pem || (rm -rf /data/backup/tmp && exit 1);test -f /certs/client-key.pem || (rm -rf /data/backup/tmp &&exit 1);\ ETCDCTL_API=3 /usr/local/bin/etcdctl \ --endpoints=$ENDPOINTS \ --cacert=/certs/ca.pem \ --cert=/certs/client.pem \ --key=/certs/client-key.pem \ --command-timeout=1800s \ snapshot save /data/backup/tmp/etcd-snapshot.db && \ cd /data/backup/tmp; tar -czf /data/backup/etcd-snapshot-${backupfilename}.tar.gz * && \ cd -; rm -rf /data/backup/tmp if [ $? -ne 0 ]; then exit 1 fi # delete old file more than 7 count=0; for file in `ls -t /data/backup/*tar.gz` do count=`expr $count + 1` if [ $count -gt 7 ]; then rm -rf $file fi done volumeMounts: - name: master-backup mountPath: /data/backup - name: etcd-certs mountPath: /certs - name: timezone mountPath: /etc/localtime readOnly: true volumes: - name: master-backup hostPath: path: /var/lib/etcd_backup - name: etcd-certs hostPath: path: /etc/etcd/pki - name: timezone hostPath: path: /etc/localtime restartPolicy: Never hostNetwork: true --- apiVersion: batch/v1beta1 kind: CronJob metadata: name: k8s-etcd-backup-2 namespace: kube-system spec: # timezone is same as controller manager, default is UTC schedule: "12 20 * * *" concurrencyPolicy: Replace failedJobsHistoryLimit: 2 successfulJobsHistoryLimit: 2 startingDeadlineSeconds: 3600 jobTemplate: spec: template: metadata: labels: app: k8s-etcd-backup spec: tolerations: - key: node-role.kubernetes.io/master operator: Exists effect: NoSchedule affinity: nodeAffinity: requiredDuringSchedulingIgnoredDuringExecution: nodeSelectorTerms: - matchExpressions: - key: kubernetes.io/hostname operator: In values: - k8s-hostname-node2 containers: - name: k8s-etcd-backup image: harborIP/kubernetes/etcd:3.4.3-0 imagePullPolicy: IfNotPresent resources: requests: cpu: "0" memory: "0" limits: cpu: 1000m memory: 1Gi env: - name: ENDPOINTS value: "https://k8s-node2:2379" command: - /bin/sh - -c - | set -ex rm -rf /data/backup/tmp mkdir -p /data/backup/tmp && test -d /data/backup/tmp || exit 1; export backupfilename=`date +"%Y%m%d%H%M%S"`; test -f /certs/ca.pem || (rm -rf /data/backup/tmp && exit 1);test -f /certs/client.pem || (rm -rf /data/backup/tmp && exit 1);test -f /certs/client-key.pem || (rm -rf /data/backup/tmp &&exit 1);\ ETCDCTL_API=3 /usr/local/bin/etcdctl \ --endpoints=$ENDPOINTS \ --cacert=/certs/ca.pem \ --cert=/certs/client.pem \ --key=/certs/client-key.pem \ --command-timeout=1800s \ snapshot save /data/backup/tmp/etcd-snapshot.db && \ cd /data/backup/tmp; tar -czf /data/backup/etcd-snapshot-${backupfilename}.tar.gz * && \ cd -; rm -rf /data/backup/tmp if [ $? -ne 0 ]; then exit 1 fi # delete old file more than 7 count=0; for file in `ls -t /data/backup/*tar.gz` do count=`expr $count + 1` if [ $count -gt 7 ]; then rm -rf $file fi done volumeMounts: - name: master-backup mountPath: /data/backup - name: etcd-certs mountPath: /certs - name: timezone mountPath: /etc/localtime readOnly: true volumes: - name: master-backup hostPath: path: /var/lib/etcd_backup - name: etcd-certs hostPath: path: /etc/etcd/pki - name: timezone hostPath: path: /etc/localtime restartPolicy: Never hostNetwork: true

推荐阅读

default
k8s容器内获取Pod信息和资源限制

文章目录1.获取pod信息1.1一个简单示例1.2可以获取那些信息2.获取容器资源限制前言：从容器内获取容器的IP端口namespace等信息，以及k8 ... [详细]

蜡笔小新 2023-10-12 18:03:11
default
Kubernetes集群：命名空间（Namespace）

一、什么是Namespace?你可以认为namespaces是你kubernetes集群中的虚拟化集群。在一个Kubernetes集群中可以拥有多个命名空间，它们在逻 ... [详细]

蜡笔小新 2023-10-12 14:00:19
get
Kubernetes 1.21.0如何部署管理界面Dashboard 2

这篇文章主要讲解了“Kubernetes1.21.0如何部署管理界面Dashboard2”，文中的讲解内容简单清晰，易于学习与理解，下面请大家跟着小编的思路慢 ... [详细]

蜡笔小新 2023-10-12 13:14:04
runtime
如何清除Eclipse中SVN用户的设置

本文介绍了如何清除Eclipse中SVN用户的设置。首先需要查看使用的SVN接口，然后根据接口类型找到相应的目录并删除相关文件。最后使用SVN更新或提交来应用更改。 ... [详细]

蜡笔小新 2023-12-12 14:42:31
uri
SpringBoot整合SpringSecurity+JWT实现单点登录

SpringBoot整合SpringSecurity+JWT实现单点登录,Go语言社区,Golang程序员人脉社 ... [详细]

蜡笔小新 2023-12-11 08:21:41
text
开发笔记:MyBatis学习之逆向工程

篇首语：本文由编程笔记#小编为大家整理，主要介绍了MyBatis学习之逆向工程相关的知识，希望对你有一定的参考价值。转载：http://w ... [详细]

蜡笔小新 2023-10-17 14:24:02
range
k8snamespace配置cpu最大和最小限额

世界上并没有完美的程序，但是我们并不因此而沮丧，因为写程序就是一个不断追求完美的过程。问：如何为namespace配置最大和最小限额&#x ... [详细]

蜡笔小新 2023-10-16 15:44:18
get
docker+k8s+git+jenkins

docker+k8s+git+jenkins,Go语言社区,Golang程序员人脉社 ... [详细]

蜡笔小新 2023-10-15 19:06:23
get
kubelet配置cni插件_Kubernetes新近kubectl及CNI漏洞修复，Rancher 2.2.1发布

今天，Kubernetes发布了一系列补丁版本，修复新近发现的两个安全漏洞CVE-2019-1002101(kubectlcp命令安全漏洞)和CVE-2 ... [详细]

蜡笔小新 2023-10-14 11:35:37
runtime
使用和代码示例：org.osgi.service.blueprint.reflect.BeanMetadata.getDependsOn()方法详解与示例展示

本文整理了Java中org.osgi.service.blueprint.reflect.BeanMetadata.getDependsOn()方法的一些代码示例，展示 ... [详细]

蜡笔小新 2023-10-13 23:52:15
default
（七）k8s集群调度

一、调度说明1.1、简介Scheduler ... [详细]

蜡笔小新 2023-10-13 13:41:03
get
物理机异常断电，linux虚拟机系统磁盘mount失败，导致无法启动; kubectl 连接失败

虚拟机CentOS7挂载文件系统失败上周五下班前没有关闭虚拟机和物理机，今天周一开了虚拟机之后，发现操作系统启动失败。原因跟这篇文章描述的一模一样。解决操作系统的文件系统挂载的问题 ... [详细]

蜡笔小新 2023-10-13 11:51:37
default
minikube 安装过程附带报错解决办法

minikube安装过程介绍minikubeMinikube是一个可以在本地轻松运行Kubernetes的工具。Minikube会在您的笔记本电脑中的虚拟机上运行一个单节点的Kub ... [详细]

蜡笔小新 2023-10-12 18:18:50
default
数据库技术:Oracle Database 12c SQL面试题：externaltable外部表的题解

q3.whichstatementistrueregardingexternaltablesa.thedefaultrejectlimitforext ... [详细]

蜡笔小新 2023-10-14 15:53:44
default
R for data science ||使用readr进行数据导入

使用R包提供的数据是学习数据科学工具的好方法，但是在某个时候，您希望停止学习，开始使用自己的数据。在本章中，您将学习如何将纯文本矩形文件读入r。在这里，我们只讨论数据导入的皮毛，但 ... [详细]

蜡笔小新 2023-10-14 13:35:44

我系懒懒懒猫

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章