环境准备:
master 192.168.8.128
node1 192.168.8.129
k8s版本:
一:安装etcdctl工具
1.1下载安装包:
wget https://github.com/etcd-io/etcd/releases/download/v3.4.13/etcd-v3.4.13-linux-amd64.tar.gz
1.2解压:
tar xf etcd-v3.4.13-linux-amd64.tar.gz
1.3移动到sbin下:
mv etcd-v3.4.13-linux-amd64/etcdctl /usr/local/sbin/
1.4查看版本:
etcdctl version
二:开始备份
2.1首先查看所需要的认证文件:
kubectl describe pod etcd-k8smaster -n kube-system #查看etcd pod的详细信息
2.2备份命令:
ETCDCTL_API=3 etcdctl --endpoints=https://127.0.0.1:2379 --cacert=/etc/kubernetes/pki/etcd/ca.crt --cert=/etc/kubernetes/pki/etcd/server.crt --key=/etc/kubernetes/pki/etcd/server.key snapshot save /etcd-backup/etcddata_$(date +%F-%T).db
/etcd-backup/etcddata_$(date +%F-%T).db #指向备份到哪里以及定义名字
# --cacert= 后面的文件就是上面截图中--trusted-ca-file=后面的文件
# --cert=后面的文件就是上面截图中--cert-file=后面的文件
#--key=后面的文件就是上面截图中--key-file=后面的文件
/etc/kubernetes/pki/ca.crt
:CA 证书,用于验证 etcd 服务器的身份。/etc/kubernetes/pki/etcd/server.crt
:etcd 服务器的客户端证书。/etc/kubernetes/pki/etcd/server.key
:etcd 服务器的私钥。
可以看到已经备份成功。
三:恢复
3.1恢复之前先查看一下现有的pod:
kubectl get pod
删除这三个pod,模拟意外丢失
kubectl delete deploy test #这三个pod是由deployment控制器创建的所以直接删除test控制器
已经删除。
3.2开始恢复
恢复之前要停止apiserver controller-manager scheduler etcd这些组件
原因:可以防止在恢复操作期间对 etcd 进行的任何写入操作,从而确保恢复过程的准确性和完整性。
由于etcd是通过静态Pod方式部署的,你可以通过重命名/etc/kubernetes/manifests/目录来停止所有由该目录下的YAML文件启动的服务
mv /etc/kubernetes/manifests/* /opt/backup/ #移动到其他目录
这时显示无法和apiserver建立连接了说明已经停止了。
将etcd的数据目录改名备份一下:
[root@k8smaster1 etcd-backup]# mv /var/lib/etcd /var/lib/etcd-bakcup
原因: 一会恢复的话会指定恢复的目录,以防止会冲突
现在我们就可以进行恢复了
ETCDCTL_API=3 etcdctl snapshot restore /etcd-backup/etcddata_2024-12-19-16\:43\:45.db --name etcd-master01 --data-dir /var/lib/etcd --initial-cluster etcd-master01=https://192.168.8.128:2380 --initial-cluster-token etcd-cluster-token --initial-advertise-peer-urls https://192.168.8.128:2380
-
--initial-cluster etcd-master01=https://192.168.8.128:2380
:设置 etcd 的初始集群集信息,包括 etcd 服务器的地址。 -
--initial-cluster-token etcd-cluster-token
:指定用于加入集群集的令牌(token)。这个令牌用于验证加入集群的 etcd Pod。 -
--initial-advertise-peer-urls https://192.168.8.128:2380
:设置 etcd Pod 作为集群集成员时,其他 etcd Pod 如何发现并与之通信的初始对等 URL。
执行完之后需要将之前转移走的yaml文件转移回之前的目录:
mv /opt/backup/* /etc/kubernetes/manifests/
查看pod
kubectl get pod
可以看到已经恢复成功了,原先我们删除的pod也回来了